AI書房
本でAIを読む
金京鎮弁護士のAI・法律・産業・歴史・政治・文化をテーマにしたオンライン書籍を収録しています。各書きは目次・序文・章・エピローグで構成され、連続読書が可能です。
[AI書房] 第15章 タンパク質フォールディング問題
デミス・ハサビス、Google人工知能の父
第6部 デジタル生物学
第15章 タンパク質フォールディング問題
金京鎮
1994年、CASP大会の始まり。1972年12月、ストックホルムの冬はとりわけ寒かったものの、ノーベル賞授賞式の会場の熱気は高まっていました。壇上に上がったアメリカの生化学者、クリスチャン・アンフィンセンは、人類の科学史に残る大胆な仮説を世界に公表しました。彼は、タンパク質という生命の微細な機械がどのようにして作られるのかについて、非常にシンプルでありながら本質的な原理を提示したのです。
「タンパク質の三次元的な立体構造は、完全にアミノ酸配列によって決定される」。これこそが、後に『アンフィンセンのドグマ(Anfinsen's Dogma)』と呼ばれることになる命題です。この宣言は、生物学界に巨大な課題を投げかけました。
もしアンフィンセンの言葉が正しければ、私たちは理論上、一次元的なアミノ酸配列の情報さえ分かれば、それがどのように絡み合い、折りたたまれて三次元の形を成すのかを完璧に予測できなければなりませんでした。しかし、自然はそれほど容易なものではありませんでした。アミノラン酸の鎖が折りたたまれる場合の数は、宇宙に存在するすべての原子の数よりも多かったからです。
サイラス・レビンタール(Cyrus Levinthal)という科学者は、これを計算すると、たった一つのタンパク質が可能なすべての構造をランダムに試行するだけで、宇宙の年齢よりも長い時間がかかるという『レビンタールのパラドックス(Levinthal's Paradox)』を提起しました。自然界はこのプロセスを1000分の1秒で完了させるのに対し、人間のスーパーコンピュータは数十年間計算し続けても正解を見つけられないという状況が生じたのです。この難題を解決するために、科学者たちは1994年、非常にユニークな実験を開始しました。
それはまさに「タンパク質構造予測学術大会(CASP, Critical Assessment of Structure Prediction)」です。メリーランド大学のジョン・モルト(John Moult)教授によって創設されたこの大会は、一種の「ブラインドテスト」でした。研究室ですでに構造が解明されているものの、まだ公表されていないタンパク質の課題が出題され、世界中のコンピュータ科学者や生物学者がそれぞれのアルゴリズムを用いてその構造を予測し、回答を提出するという方式でした。2年に一度開催されるこの大会は、生物学界のオリンピックのような存在でした。
大会が繰り返されるにつれ、科学者たちの表情は暗くなっていきました。1994年から2016年までの約20年間、予測精度は
停滞していました。100点満点中40点前後を彷徨う成績表は、人類の知性の限界を示しているかのようでした。科学者たちは、次第に疲弊していきました。
まさにその時、ロンドンのある研究所に、この問題を全く異なる視点から捉える一人の男が登場しました。「タンパク質が『ルートノード(Root Node)』問題である理由:生命科学のボトルネック」。デミス・ハサビスにとって、世界は一つの巨大な情報処理システムでした。彼がDeepMindのミッションを「知能を解く(Solve Intelligence)」と定めたとき、単に囲碁が上手だったり、チャットが上手だったりするAIを夢見ていたのではありません。
彼は、科学的発見の速度を画期的に高めることができる「メタ・ソリューション(Meta-solution)」を求めていました。ハサビスは、科学における数多くの難題を木の枝に例えました。気候変動、病気の治療、新素材の開発といった問題は、枝の先にぶら下がる葉や果実なのです。
これらの個別の問題を一つずつ解決するには、膨大な時間と費用がかかります。ハサビスは考えました。「枝を一本ずつ剪定する代わりに、これらすべての問題が伸びてくる根、つまりルートノード(Root Node)を見つけて解決できないだろうか?」と。彼にとって、生物学のルートノードこそが「タンパク質折り畳み(Protein Folding)」でした。
私たちの体のあらゆる機能は、タンパク質によって動いています。目が光を感知することも、筋肉を動かすことも、ウイルスと戦う抗体も、すべてはタンパク質です。タンパク質の機能はその「形」に由来します。鍵が鍵穴にぴったり合って初めて扉が開くように、タンパク質も特定の三次元構造を持たなければ、病という鍵を解くことはできないのです。
新薬開発がこれほどまでに困難で高価な理由は、薬が作用すべき標的タンパク質の形状が正確に分かっていないため、数万回もの試行錯誤を繰り返さなければならなかったからです。ハサビスは、もしAIがタンパク質の構造を予測できれば、それは生物学という学問を、純粋な実験科学からデータサイエンスへと転換させる契機になると確信していました。これは、ディープマインドが単なるゲーム会社ではなく、科学探究集団であることを証明するための完璧な課題でした。
ゲームから科学への転換:ゲーム『Foldit』から得たインスピレーション。ハサビスがタンパク質問題に対して確信を持つに至った決定的なきっかけは、意外にも「ゲーム」にありました。
2008年、ワシントン大学のデビッド・ベイカー(David Baker)教授のチームによって開発された『Foldit』というゲームがありました。このゲームは、複雑なタンパク質構造を三次元パズルとして画面上に表示し、一般のプレイヤーがマウスを使ってあれこれと捻ったり折り畳んだりしながら、最も安定した構造を作り上げるという仕組みでした。驚くべきことは、その次に起こりました。
科学者たちが10年以上にわたってスーパーコンピュータを稼働させても解けなかったエイズ関連酵素の構造を、Folditをプレイしていたゲーマーたちが、わずか3週間で解き明かしたのです。彼らは生物学の博士号を持たない、ごく普通の一般の人々でした。ただ、3次元空間における物体のパターンを認識し、直感的にパズルを解く能力に長けていたに過ぎません。このニュースに触れたハサビスの脳裏に、稲妻のようなインスピレーションが走りました。
人間のゲーマーが直感を利用して巨大な探索空間(Search Space)を絞り込んでいくのであれば、AlphaGoが成し遂げたことこそ、まさにそれではないか?」 囲碁もまた、宇宙の原子の数よりも多い組み合わせが存在しますが、AlphaGoはすべての手を計算する代わりに、「価値ネットワーク」と「方策ネットワーク」という直感を通じて、勝利への道を見つけ出しました。ハサビスにとって、タンパク質の折り畳みは、もはや生物学の問題ではなくなっていたのです。
それは「空間最適化ゲーム」であり、「パターン認識問題」でした。生物学的な知識がなくとも、データと報酬(Reward)さえあれば、AIが人間のゲーマーよりもはるかに優れた成果を出せる領域でした。ゲーム開発者の出身である彼にとって、科学の難問は攻略すべき「ボスモンスター」のように見え始めたのです。
AlphaFoldプロジェクトの始まり:「これは灯台プロジェクトである」 2016年、AlphaGoがイ・セドル九段に勝利した直後、DeepMindの内部では「次は何か?」を巡って激しい議論が交わされました。StarCraftのような、より複雑なゲームを征服すべきだという意見もあれば、ロボット工学へ進出すべきだという意見もありました。しかし、ハサスビスは静かに、しかし断固として、科学チームの結成に着手し始めました。
彼はこのプロジェクトを「灯台プロジェクト(Lighthouse Project)」と名付けました。それは、大海原で道に迷った船に光を照らすように、AIが人類に対して実質的な助けとなり得ることを証明するための指標となるべきだ、という意味が込められていました。
しかし、その始まりは決して平坦なものではありませんでした。DeepMindの核心を担うエンジニアたちでさえ、「生物学は不確実性が高すぎる」、「データが乱雑でAIの学習には適さない」と、懐疑的な反応を示したのです。ハサビスは、彼特有の説得力をもってチームを鼓舞しました。
彼は、20代後半の若き研究者ジョン・ジャンパー(John Jumper)をはじめとする少数の精鋭を集め、「AlphaFold(アルファフォールド)」チームを結成しました。目標は明確でした。「囲碁の盤上で手にした勝利を、生命というキャンバスの上へと移し替えること」です。
ハサビスは、もしこのプロジェクトが失敗すれば、DeepMindは単なる「ゲームに強い機械を作る会社」として記憶されることになり、逆に成功すればノーベル賞級の発見となることを直感していました。これは、科学者としてのハサビスと、経営者としてのハサビスが同時に投じた、最大の一手でした。タンパク質の三次元的な折りたたみ構造……
