AI書房
本でAIを読む
金京鎮弁護士のAI・法律・産業・歴史・政治・文化をテーマにしたオンライン書籍を収録しています。各書きは目次・序文・章・エピローグで構成され、連続読書が可能です。
[AI書房] 第9章 DeepMindの誕生
デミス・ハサビス、Google人工知能の父
第4部 DeepMind
第9章 DeepMindの誕生
金京鎮
ユニバーシティ・カレッジ・ロンドン(UCL)のギャツビー計算神経科学ユニットは、世界中から集まった最も聡明な変わり者たちが、数学を用いて人間の脳の謎を解き明かそうと奮闘する激戦の場でした。ジェフリー・ヒントンによって設立されたこの研究所で、デミス・ハサビスは自身の脳科学博士課程の締めくくりを迎えていました。ハサビスが研究所の廊下で出会った、背が高く物静かなニュージーランド人、シェーン・レグは、その場の空気と不思議に調和しながらも、どこか異質な存在感を放っていました。
レグはすでにスイスのIDSIA研究所にて、ユルゲン・シュミットフーバーの指導の下、理論的な人工知能モデルについて深く研究していました。当時、学界において「人工知能」という言葉はタブーに近いものであり、多くの研究者は「統計学」や「機械学習」といった、より安全な用語の背後に身を隠し、特定の課題を解決するための限定的なAI(Narrow AI)にのみ没頭していました。しかし、レグは違いました。
彼は、ハサビスが胸に抱いていた言葉、すなわち「AGI(汎用人工知能)」という言葉を、恐れることなく口にする数少ない人物の一人でした。二人は昼食時になると、研究所の近くのベンチやロンドンのパブに腰を下ろし、人間の知能をいかに数学的に定義できるか、そしてもし機械が人間のように考えられるようになったら世界はどう変わるかについて、何時間も議論を交わしました。ハサビスが直感的かつ神経科学的なアプローチを好んだのに対し、レグは論理的で数学的な厳密さを重視していました。
二人の出会いは、まるで火と氷が結びつくかのように、互いの欠けた部分を補い合うものでした。レグは後に、人工知能が人類にもたらす超知能の危険性を警告し、安全装置を構築する上で極めて重要な役割を担うことになります。
この知的な結合に現実的なエネルギーを吹き込んだのは、ムスタファ・スレイマン(Mustafa Suleyman)でした。スレイマンは科学者ではありませんでした。彼はハサビスの弟であるジョージ・ハサビスの親友であり、幼い頃からハサビス家を自分の家のように出入りしていた「近所の弟分」でした。
オックスフォード大学で哲学と神学を学び中退した彼は、10代の頃からイスラム団体やロンドン市長のアドバイザーとして活動するほど、社会問題の解決に深い関心を持つ活動家でした。ハサビスとレグが研究室の中で知能の本質を探求していたとき、スレイマンは社会の外側で、この技術が社会をどのように変えるのか、そしてこの壮大な夢を実現するためにいかにして人材と資本を集めるべきかを考えていました。スレイマンはハサビスに対し、科学的なビジョンと同じくらい重要なのは「物語」と「説得」であるということを再認識させたのです。
彼は、DeepMindが単なる研究所を超え、世界に影響を与える企業になるべきだと主張しました。そして後に、Googleとの買収交渉や「DeepMind Health」プロジェクトを主導し、そのビジネス手腕を発揮することになります。ここに、もう一人の人物が加わります。ハサビスのケンブリッジ大学の同窓生であり、彼と共に「Elixir Studios」でゲーム開発の興亡を共にしたデビッド・シルバー(David Silver)でした。
シルバーは、Elixirが閉鎖された後、アカデミアに戻り、強化学習(Reinforcement Learning)の分野で独自の地位を築いていました。ハサビスは、DeepMindの核心となるアルゴリズムが、脳の学習方法である「強化学習」になると直感しており、この分野の権威となった旧友を逃すわけにはいきませんでした。シルバーの加入は、DeepMindの技術的基盤を完成させる最後のパズルのピースとなりました。
彼は後に、AlphaGo(アルファ碁)の主任研究員として、世界を驚愕させる勝利へと導くことになります。2010年11月、彼らはロンドンのラッセル・スクエアの近くに小さなオフィスを構え、「DeepMind Technologies(ディープマインド・テクノロジーズ)」という看板を掲げました。当時のスタートアップ業界は、ソーシャルメディアやモバイルアプリの開発に熱中していました。シリコンバレーの投資家たちは、「写真共有アプリを作れば6ヶ月以内に利益を出せるのに、なぜ20年かかるか分からない人工知能の研究をするのか」と皮肉を言ったものです。
しかし、ハサビスと共同創業者たちは揺らぎませんでした。彼らのミッションは明確でした。「知能を解明する(Solve Intelligence)」。そして、「その知能を使って、他のあらゆる問題を解決する(Use it to solve
everything else)」。これは企業の社訓というよりも、科学革命のための宣言文に近いものでした。彼らは、1960年代に人類を月へと送り出した「アポロ計画」のように、最高の才能と資本を一箇所に集中させ、知能という未知の領域を征服するという野心的な計画を立てたのです。
ハサビスはベンチャー投資家たちに収益モデルを説明する代わりに、人工知能が病を治療し、気候変動を防ぎ、新たな科学的発見をもたらす未来について語りました。ピーター・ティール(Peter Thiel)のような先見の明を持つ投資家たちが、彼らの無謀とも思える夢に魅了されたのは、まさにこの「スケールの大きさ」ゆえでした。DeepMindの誕生は、単に新たなテクノロジー企業が誕生したということではなく、人工知能の冬(AI Winter)を終わらせ、新たな春を告げる号砲だったのです。
ハサビス、レグ、スレイマンという3人のユニークな組み合わせは、科学的な厳密さと哲学的な思索、そして現実的な突破力が一つに融合し、AGIという巨大な目標に向かって突き進むエンジンとなりました。学術界とスタートアップ文化の融合――デミス・ハサビスがDeepMindを設立するにあたって最も深く追求したのは、「どのような組織を作るか」ということでした。彼はケンブリッジ大学やUCLでのアカデミックな生活を通じて、大学の研究室が持つ長所と短所を身をもって理解していました。
大学は人類の歴史において、最も自由な想像力、すなわち「ブルー・スカイ・シンキング(Blue Sky Thinking)」が可能な場所でした。目先の利益や成果に縛られることなく、根本的な問いを投げかけることができる唯一の空間でした。しかし、同時に大学は動きが遅かったのです。
教授たちは研究費を獲得するために膨大な書類作業に追われ、研究者たちは自身の狭い専門分野に閉じこもり、隣の部屋の同僚が何をしているかさえ知らないことも珍しくありませんでした。対照的に、ハサビスが10代の頃から経験してきたゲーム会社やスタートアップは、正反対の世界でした。そこには目標に向かって猛烈に突き進むスピードとエネルギーがあり、成果を出さなければならないという切迫感がイノベーションを呼び起こしていました。
しかし、深い研究を行うには、その呼吸はあまりに短すぎました。ハサビスは、これら二つの世界の長所だけを組み合わせた「ハイブリッド組織」を夢見ました。彼のロールモデルは、20世紀半ばにトランジスタやレーザー、情報理論を生み出したアメリカの「ベル研究所(Bell Labs)」でした。ベル研究所のように、最高の天才たちが集まり自由に議論しながらも、スタート
アップのように明確な目標と期限を持って動く組織、それこそがDeepMindの設計図でした。まず、人材を集める手法からして異なっていました。ハサビスは、世界中の機械学習、神経科学、数学、物理学の分野における博士級の人材を、自ら探し歩いたのです。
当時はまだ、GoogleやFacebookのようなビッグテック企業がAI研究者を独占するような時代ではありませんでしたが、有望な学者たちを不安定なスタートアップへと引き入れることは容易なことではありませんでした。ハサビスは彼らに、金銭ではなく「ミッション」を提示したのです。「大学では論文の実績に追われ、小さな問題ばかりを解いてはいないか? 私たちと一緒に、知能そのものという謎を解き明かそう。ここには研究費の心配も、講義の義務もない」
この言葉は、知的な渇望を抱いていた天才たちの心を射抜きました。彼は単にコーディングに長けたエンジニアを採用したのではなく、「考える機械」を作りたいと願う科学者たちを集めたのです。組織文化の設計において、ハサビスは「融合」を強制しました。
彼は、研究員たちが自身の専門分野という「サイロ(Silo)」に閉じこもることを警戒していました。そのために、オフィスの構造から変えたのです。神経科学者とコンピュータ工学者が隣同士に座るように配置し、決まった時間には全員が集まってティータイムを持ち、研究内容を共有させました。「ブロック崩し」ゲームを行うAIを見せながら、それが脳のドーパミン・システムとどのように関連しているのかを神経科学者が説明し、それを数学者が数式で整理し、エンジニアがコードで実装するという手法をとったのです。
このような環境の中で、「強化学習(Reinforcement Learning)」と「ディープラーニング(Deep Learning)」の結合という、DeepMindの核心となるアイデアが誕生しました。アカデミアでは異なる学会に参加していたため、出会うことさえなかった分野が、DeepMindという溶鉱炉の中で混ざり合い始めたのです。また、ハサビスはスタートアップ特有の「スピード感」を研究に移植しました。
一般的な学術研究が数年をかけて進められるのに対し、DeepMindはプロジェクトの単位を短く区切り、迅速にプロトタイプを作成して検証する手法を採用しました。「失敗してもいい、早く失敗せよ(Fail fast)」というシリコンバレーの格言を、科学研究に適用したのです。しかし、それは単なる無条件のスピード競争ではありませんでした。
彼は研究者たちに論文発表の自由を保障しました。企業の秘密主義によって研究成果が世に出ることができないのを、学者たちが懸念していたからです。ただし、一つだけ条件がありました。
論文を書く前に、まずは社内で技術を証明しなければならない、というものでした。これは研究者たちに健全な競争心を促し、DeepMindが後に『Nature』や『Science』といった最高権威の学術誌に表紙論文を次々と掲載する基盤となりました。このようなハイブリッドな文化は、初期には多くの試行錯誤を伴いました。自由奔放な学者たちは会社の規律を窮屈に感じ、成果を重視する経営陣は進展のない基礎研究を待つことを困難に感じていたのです。
しかし、ハサビスはその間で緩衝材の役割を自ら買って出ました。彼は研究者たちには「私たちは科学を行っているのだ」と鼓舞する一方で、投資家たちには「この科学が、最終的には巨大なビジネスになるのだ」と説得しました。DeepMindは、大学の知性と企業の野性が共存する、奇妙な空間でした。
深夜3時までアルゴリズムについて議論する熱気、ホワイトボードを埋め尽くす数式、そして片隅で稼働する高性能なゲーム機。この独特な文化的土壌の上で、人類史上最も強力な人工知能であるAlphaGoが誕生しようとしていました。ハサビスが作り上げたのは、単なる会社ではなく、知能を製造する新しい形態の「工場」でした。ハサビスの一日は二つのシフトに分かれています。昼間はCEOとして会議や経営を行い、夜は「セカンド・シフト(second shift)」と呼ばれる時間に、論文を読み、アイデアを整理します。
深夜3時まで続くこのパターンは、2,000編を超える研究論文とh指数83という、学術的な成果の背景でもあります。
DeepMind ロンドン・オフィス



