AI書房
本でAIを読む
金京鎮弁護士のAI・法律・産業・歴史・政治・文化をテーマにしたオンライン書籍を収録しています。各書きは目次・序文・章・エピローグで構成され、連続読書が可能です。
[AI書房] 第16章 AlphaFold革命
デミス・ハサビス、Google人工知能の父
第6部 デジタル生物学
第16章 AlphaFold革命
金京鎮
それは、ある晩秋の日のことでした。科学界の視線は、Zoomの画面へと注がれていました。タンパク質構造予測の学術大会であるCASP(Critical Assessment of Structure Prediction)の、第14回結果発表の場でした。
この大会は1994年から始まった、生物学界のオリンピックとも言える行事であり、実験では解明されていないタンパク質の三次元構造を、コンピュータがいかに正確に予測できるかを競う戦場です。主催者であるジョン・モルト(John Moult)教授が、画面に一つのグラフを表示しました。そのグラフには、過去数十年にわたり科学者たちが少しずつ積み上げてきた緩やかな成長の傾斜が描かれており、その終端には、突如として垂直に突き抜ける一つの点が打たれていました。
その点こそが、「AlphaFold 2」でした。モルト教授は震える声で宣言しました。「これは、50年来の難題が解決されたことを意味します」
この瞬間は、単にコンピュータプログラムが人間に勝利した出来事ではありませんでした。AlphaGoがイ・セドル九段に勝利したとき、世界は驚きと恐怖を同時に感じましたが、AlphaFoldが生物学の難題を解いたとき、科学者たちは驚嘆と安堵を感じたのです。デミス・ハサビスにとって、この瞬間はAlphaGoの対局よりもさらに重要な、彼の生涯のミッションが証明された刹那でした。
ゲームを征服した知能が、ついに現実世界の最も複雑な問題である「生命の秘密」を解き明かし始めたのです。その幕開けは、2年前の2018年、CASP13大会まで遡ります。当時、DeepMindは「AlphaFold 1」を携えて、初めてこの舞台に登場しました。当時、生物学界は、GoogleのAI研究所からやってきた異邦人たちを、半信半疑の眼差しで見つめていました。
生物学的な知識が不足しているコンピュータ・エンジニアたちが、タンパク質の複雑さを理解できるはずがないと考えられていたからです。しかし、AlphaFold1は43の課題のうち25の課題で最高スコアを記録し、優勝を果たしました。2位のチームがわずか3つの課題で最高スコアを獲得したことと比較すると、圧倒的な差でした。
AlphaFold1は、タンパク質の距離を画像のピクセルのように処理する方法を採用しました。コンピュータ・ビジョンが猫の写真を認識するように、アミノ酸配列間の距離マップを画像として学習し、構造を推論したのです。しかし、ハサビスは満足しませんでした。
優勝はしたものの、AlphaFold1の精度が、実際の実験室で使用できるレベルには達していなかったからです。GDT(Global Distance Test)スコアに換算すると60点台という水準で、おおよその形状は捉えられるものの、詳細な原子の位置が誤っていることが多々ありました。ハサビスはチームを集めてこう告げました。
「私たちは1位を取るためにこのプロジェクトを始めたのではありません。問題を解決するために始めたのです」。彼はAlphaFold1のコードを完全に破棄し、ゼロからやり直すという大胆な決断を下しました。この時、プロジェクトの運命を変える人物が登場します。
それが、ジョン・ジャンパー(John Jumper)です。シカゴ大学で化学とコンピュータ・サイエンスを専攻した彼は、タンパク質シミュレーションに深い造詣を持つ研究者でした。ジャンパーはディープマインドに合流した後、AlphaFoldチームを率い、ハサビスのビジョンを技術的に具現化する司令官の役割を担いました。
ハサビスが「何を(What)」解明すべきかを定義した一方で、ジャンパーは「どのように(How)」解くかを設計しました。二人は単なる上司と部下の関係を超え、科学的なパートナーとして信頼を築き上げていきました。ジャンパーは、AlphaFold 1が採用していた画像認識手法であるCNN(畳み込みニューラルネットワーク)の限界を指摘しました。
タンパク質は固定された画像ではなく、互いに相互作用しながら絶えず動き続ける三次元的なグラフ構造である、というのが彼の洞察でした。2019年、ディープマインドの研究室の灯が消えることはありませんでした。彼らは「アテンション(Attention)」メカニズムという、新しいAI技術を導入したのです。
これは主に言語翻訳に用いられていた技術でした。ジャンパーと彼のチームは、アミノ酸配列を一つの文章のように扱いました。文章の中の単語が文脈に応じて関係を持つように、遠く離れたアミノ酸同士がどのように引き合い、退け合うのかを、AIが自ら学習できるようにしたのです。
これは生物学的な直感とAIエンジニアリングが完璧に融合した瞬間でした。彼らはこれを「Evoformer(エボフォーマー)」と名付けました。ハサビスはこの過程を見守りながら、「私たちはAIに生物学の教科書を読ませているのではなく、AIが自ら生物学の原理を悟るようにしているのだ」と表現しました。
開発の道のりは決して平坦ではありませんでした。CASP14大会を数ヶ月後に控えた時点でも、新しいモデルは不安定な状態でした。チームのメンバーは疲弊し、失敗への恐怖が押し寄せていました。
この時、ハサビスは彼特有のリーダーシップを発揮しました。彼は夜遅くに研究室を訪れては、研究員たちとチェスをしたりお茶を飲んだりしながら、彼らのメンタルケアを行いました。彼は「私たちは今、人類が数十年にわたって待ち望んできた発見の入り口に立っている」と語り、チームの士気を高めました。
ついに大会を数週間後に控えた頃、AlphaFold2は指数関数的な性能向上を見せ始めました。そして2020年、CASP14の結果は衝撃的なものでした。AlphaFold2は、100点満点中、平均92.4点というスコアを記録したのです。
通常、90点以上であれば、実験的な誤差範囲内において実際の構造と同一であるとみなされます。つまり、AIが予測した構造と、X線結晶構造解析やクライオ電子顕微鏡といった数十億円もする高価な装置を用いて数年かけて分析した構造を重ね合わせたとき、区別がつかないほどに一致していることを意味します。特に、最も困難であるとされる「自由モデリング」のカテゴリーにおいても、AlphaFold2は圧倒的な正確度を示しました。
結果が発表されると、チャット欄やTwitter(現X)は世界中の科学者たちの驚愕の声で埋め尽くされました。ノーベル賞受賞者であり構造生物学の権威であるヴェンキ・ラマクリシュナン(Venki Ramakrishnan)氏は、「これは私の生涯において解決されるとは予想していなかった問題だった」と告白しました。ドイツのマックス・プランク研究所のアンドレイ・ルパス(Andrei Lupas)教授は、「構造生物学は、今やAlphaFoldの前後で分断されることになるだろう」と述べ、「これは地震のような変化である」と評価しました。
この勝利は、単なる技術的な達成ではありませんでした。それは、「知能を解き明かし、他のあらゆる問題を解決する」という彼の生涯の哲学が真であることを証明する、最初の強力な証拠でした。ゲームという仮想世界で訓練されたAIが、現実世界の物理法則や生物学的な複雑さを理解し、人類の知性の限界を拡張できることを示したのです。
彼はロンドンの自宅からZoomで発表を見守りながら、静かに微笑んでいました。4歳の時にチェス盤を前に感じた知的好奇心、10代の頃にゲームを開発しながら夢見たシミュレーションの可能性、そして大人
になり、神経科学とAIを融合させようとしたすべての努力が、この一つの頂点へと収束していく瞬間でした。AlphaFold2の成功は、2024年に彼とジョン・ジャンパーがノーベル化学賞を共同受賞する決定的な契機となりました。ハサビスは、賞そのものよりも、このツールがもたらす未来の変化こそが、より大きな報酬であると信じていました。
これにより、人類は生命のレゴブロックを組み立てるための説明書を手に入れたのです。2億個以上のタンパク質構造データベースの公開――AlphaFold2がCASP14で収めた圧倒的な勝利の後、デミス・ハサビスの野心は、大会の優勝トロフィーに留まることはありませんでした。彼は、DeepMindがGoogleに買収された当初から守り続けてきた鉄則、すなわち「最も強力な技術は、最も広く使われるべきである」という信念を実行に移す準備を進めていました。
技術を独占して製薬会社にライセンスを販売したり、莫大な利益を生み出したりする道もありました。実際に、多くの投資家や起業家はそのようなモデルを予想していました。しかし、ハサビスとDeepMindのチームは別の選択をしました。彼らは、人類が持つ生物学的知識の地平を一気に拡張することに決めたのです。
2021年7月、DeepMindは欧州分子生物学研究所(EMBL)と協力し、「AlphaFoldタンパク質構造データベース(AlphaFold Protein Structure Database)」を世界に向けて無料で公開しました。最初は、ヒトゲノムに含まれる約2万個のタンパク質構造を公開することから始まりました。それだけでも、生物学の教科書を書き換えなければならないほどの、凄まじい分量でした。
かつて、一人の博士課程の学生が学位を取得するために4〜5年を費やして、たった一つの、あるいは二つのタンパク質の構造を解明していたことと比較すれば、AIはわずか数日で人類のあらゆるタンパク質の地図を描き出したことになります。真の衝撃は、その1年後の2022年に訪れました。ディープマインドはデータベースを更新し、地球上に存在するほぼすべての既知のタンパク質の構造を公開したのです。
その数は、なんと2億個を超えていました。植物、細菌、動物、真菌など、科学が名を付けたほぼすべての生命体のタンパク質が含まれていました。ハサビスはこれを「生物学のGoogle Earth」と表現
しました。私たちがGoogle Earthを通じて地球の裏側の路地裏まで覗き込むことができるようになったように、今や科学者たちはモニターの前で数回のクリックにより、生命現象の最も深い場所にある分子レベルの機械を、3次元で回転させながら観察できるようになったのです。データベースの公開は、科学研究のスピードを根本から変えてしまいました。
それは、暗闇の中で懐中電灯一つを頼りに洞窟を探索していた科学者たちに、突如として洞窟全体を照らし出す照明設備が整ったようなものでした。世界190カ国から200万人以上の研究者がこのデータベースにアクセスしました。これは、世界中の生物学者の大多数に相当する数字です。
実験室のベンチでピペットを手に苦闘していた研究者たちは、今やAlphaFoldの予測結果に基づいて仮説を立て、実験を設計し、失敗の確率を劇的に減らすことができるようになりました。実用的な応用事例は、即座に、そして爆発的に現れました。最も劇的な事例の一つは、マラリアワクチンの研究でした。
オックスフォード大学の研究チームは、長年にわたりマラリア原虫のタンパク質構造の解明に努めてきましたが、技術的な限界により進展が見られずにいました。しかし、AlphaFoldが公開されると、彼らは直ちに研究対象のタンパク質構造を検索し、わずか数分で長年探し求めていた答えを得ることができたのです。これにより、彼らは新たなワクチン候補物質の設計という次の段階へ、即座に移行することが可能になりました。
これは、AIがいかにして「時間」という科学者にとって最も貴重な資源を授けたかを示す、象徴的な場面です。プラスチックごみは人類の大きな課題ですが、ポーツマス大学の科学者たちは、プラスチックを分解する酵素(PETase)の研究を行っていました。彼らはAlphaFoldを利用してこの酵素の進化プロセスを追跡し、より迅速かつ効率的にプラスチックを分解できるよう、酵素の構造を改良することに成功しました。
これは、分解に500年かかるとされるプラスチックを、わずか数日で分解できる可能性を切り拓いたものであり、ハサビスが夢見た「AIを通じて気候危機や環境問題を解決する」というビジョンが具体化した事例でした。抗生物質耐性の問題や希少遺伝疾患の研究においても、AlphaFoldは不可欠なツールとなっています。コロラド大学の研究チームは、抗生物質耐性菌の構造を分析して新たな治療法を模索し、ノルウェーの研究者たちは、ミツバチの免疫システムを理解するためにこのデータを活用しました。
さらに、絶滅危惧種の保護や、気候変動に強い作物の開発を行う農業分野においても、AlphaFoldのデータは種となり、新たな発見の芽を育んできました。ハサビスは、この膨大なデータの公開がもたらす波及効果を、「デジタル生物学(Digital Biology)」の始まりであると定義しました。彼は、生物学が今や情報科学の領域へと足を踏み入れたのだと信じていたのです。
生命とは、結局のところ情報の複雑な処理プロセスであり、AIはその情報を解釈するための最も優れた道具であるということです。彼はあるインタビューで、次のように語っています。「私たちが2億もの構造を公開したとき、それは人類へ贈るプレゼントでした。」
さらに重要なのは、これが始まりに過ぎないという点です。私たちは今、タンパク質の形状を知る段階を超え、それらがどのように相互作用し、どのように新薬となり、どのように病を治すのかを予測する段階へと進まなければなりません。」こうした成果は、2024年ノーベル化学賞受賞の最も強力な根拠となりました。
ノーベル委員会は、AlphaFoldが単に技術的に優れたソフトウェアであるからではなく、世界中の科学者に強力な研究ツールを提供することで、科学の進歩を加速させた功績を高く評価しました。ハサビスとジョン・ジャンパーは、このツールを私物化せず共有することで、科学が本来持つ価値である「知識の共有と拡散」を、シリコンバレー流の手法ではなく、最も古典的かつ学術的な方法で実現したのです。「生物学のグーグル・アース」は、ハサビスが12歳の時に投げかけた「この知能をより良いことに使えないだろうか?」という問いに対する、最も壮大な答えでした。
チェス盤の64マスを超え、宇宙のように広大な生命の微視的世界を人類の目の前に広げて見せました。これは一人の天才の勝利ではなく、その天才が作り出したツールを通じて、何百万人もの科学者がそれぞれの場所で勝利できるようにした、真の意味での「集団知性の勝利」でした。
AlphaFoldによる予測構造(青)と実験構造(緑)の比較
