AI書房
本でAIを読む
金京鎮弁護士のAI・法律・産業・歴史・政治・文化をテーマにしたオンライン書籍を収録しています。各書きは目次・序文・章・エピローグで構成され、連続読書が可能です。
[AI書房] 第2章 チェス盤の神童
デミス・ハサビス、Google人工知能の父
第1部 子供時代、思考について考える
第2章 チェス盤の神童
金京鎮
4歳でチェスを始め、13歳でマスター級(Elo 2300)に到達。父と叔父の対局を見て学ぶ。1980年、北ロンドンのハサビス家では、ごく平凡な夕方の風景が流れていました。父のコスタスと叔父が、リビングのテーブルにチェス盤を広げ、駒を動かしていました。二人ともプロではなく、あくまで余暇を楽しむアマチュアのレベルでした。
4歳のデミスは、その光景をじっと見つめていました。子供の目には、64マスの白黒の格子の上で繰り広げられる静かな戦いが映っていました。デミスは自分もやってみたいと言いました。
父と叔父は、幼い子供の好奇心を微笑ましく思っているだけでした。駒の名前や動きの方向さえ教えれば、すぐに興味を失うだろうと考えていたのです。しかし、その予想は外れました。
ルールを覚えてからわずか2週間で、4歳の子供が父親に勝ち始めました。叔父に対しても同様でした。ハサビスは後に、このように回想しています。
「チェスは、もともとできることだったのだと思います。4歳で学びましたが、学んだ記憶すらありません」。コスタスは、息子には特別な何かがあることを直感しました。
おもちゃ屋を営み、歌を書き、教師の仕事を転々として常に新たな挑戦を続けていたこのギリシャ系キプロス人の父親は、すぐに息子を地元のチェスクラブへと連れて行きました。「すべてはそこから始まりました」と、ハサビスは淡々と語ります。そうして始まったチェスの人生は、驚くべき速さで展開していきました。
5歳で全国の舞台に立ち、6歳にはロンドンの8歳以下大会で優勝トロフィーを手にしました。チェスクラブの大大人たちは、この小さな少年が盤面を読み解く手法に驚愕しました。彼は単に次の手を計算していたのではありません。
盤面全体の流れを察知し、相手の意図を読み取り、数手先の状況を頭の中に描き出す能力は、同年代の子供たちとは一線を画していました。少年は常に自分より年上の相手と対局し、その中で急速に成長していきました。チェス盤を前にした集中力は、少年の日常を一変させたのです。
放課後の時間、週末、そして休暇のすべてがチェスで埋め尽くされました。学校を休み、海外の大会へ遠征することも珍しくなくなりました。両親は息子の試合結果に敏感でした。勝利すれば喜び、ミスをしたり敗北したりすると、深く落胆しました。
幼いハサビスにとって、チェスは純粋な遊びであると同時に、家族の期待が背負わされた重い使命でもありました。父と叔父のチェス盤の上で偶然始まったゲームは、すでに少年の人生全体を規定する軸として、その地位を確立していたのです。
あのリビングのチェス盤がなければ、DeepMindも存在しなかったでしょう。AlphaGoも、AlphaFoldも存在しなかったはずです。4歳の子供が父親に「僕もやりたい」と言ったその瞬間は、40年後のノーベル化学賞へと続く長い旅の、最初の一手でした。
イングランドのジュニア代表チームのキャプテンに、わずか9歳でイングランドのU-11代表チームのキャプテンに就任しました。普通の子供たちがまだチェスの基礎や定跡を学んでいる年齢で、ハサビスは国を代表する立場に就いたのです。その後も、イングランドのジュニア代表チームのキャプテンを務め続けました。
彼自身の言葉を借りれば、「常に同年代の代表チームのキャプテンであり、その多くは自分よりずっと年上の選手たちと対戦していました」となります。ジュニア代表のキャプテンという称号は、チェスの実力だけで与えられるものではありません。大会の現場でチームを率い、戦略的な配置を議論し、仲間の選手の心理的な安定を図る役割までも含まれます。10代前半の子供がこの役割を果たしていたということは、ハサビスにとってチェス盤上の計算能力だけでなく、人を読み、状況を管理する能力がすでに育っていたことを意味しています。
後にDeepMindで2,000人以上の研究者を率いるリーダーシップの最初の練習は、ジュニア・チェス代表チームのキャプテンという役職から始まっていたのです。13歳、ハサビスはイロレーティング(Elo rating)2300に到達しました。イロレーティングは、チェスプレイヤーの実力を数値化する国際標準のシステムです。
一般的なアマチュアクラブのプレイヤーが1200〜1400の間であり、1800であればかなりの強手として認められます。2000を超えると「候補マスター(Candidate Master)」、2200以上であれば公式に「マスター(Master)」の称号に該当します。13歳の少年が2300に到達したということは、ほとんどの成人クラブプレイヤーを圧倒するレベルに達したことを意味しています。
その時点で、ハサビスの14歳以下の世界ランキングは2位でした。1位はハンガリーのユディット・ポルガー(Judit Polgár)でした。ポルガーのレーティングは2335で、ハサビスより35点高い数値でした。
ユディット・ポルガーは、その後、女子チェス史上最も偉大なプレイヤーへと成長し、15歳で史上最年少グランドマスターの記録を打ち立て、ガルリ・カスパロフを破ったことでも知られる伝説的な人物です。ハサビが世界2位に位置していた時期、そのすぐ上にいた人物がこれほどの
天才であったという事実は、逆説的にハサビス自身の才能がいかに素晴らしいものであったかを示しています。この時期、ハサビスの日常はチェスに完全に占領されていました。学期中であっても頻繁に学校を休み、ヨーロッパ各地で開催される国際大会に参加していました。夏休みやクリスマス休暇も、すべて大会のスケジュールで埋め尽くされていました。
それ以外の時間には、オープニングの理論を学び、棋譜を分析し、エンドゲームのパターンを暗記しました。世界チャンピオンになることが、当時の彼の計画でした。その目標を達成するためには、人生のすべてをチェスに捧げなければならないことも、彼は理解していました。
しかし、まさにこの時期に、興味深い逆説が芽生え始めます。チェスに深くのめり込めばのめり込むほど、ハサビスはチェスが教えてくれることの範囲が狭まっていくことに気づいたのです。序盤において、チェスが彼に授けてくれたものは、汎用的な思考力でした。
問題を分解し、パターンを認識し、数手先を見通す能力。しかし、マスターの域に達するにつれ、必要とされるものは次第にチェスに特化した専門知識へと変わっていきました。特定のオープニングにおける20手目の変化や、特殊なエンドゲームの局面における勝敗理論といったものです。こうした知識は、他の分野には全く役に立ちませんでした。世界第2位という数字は栄光でしたが、同時にそれは、分かれ道を示す標識でもありました。
一方の道は、チェスに人生を賭け、世界第1位を目指して突き進む道。そしてもう一方の道は、チェスで培った思考力を携えて、より広い世界へと踏み出す道でした。13歳の少年はまだ決断を下してはいませんでしたが、心の中ではすでに問いが芽生えていました。チェスが教えてくれたメタスキル:戦略的思考とパターン認識、複雑なシステムを理解し、先を読む能力の養成。ハサビスは、チェスを「精神のジム(mental gym)」と呼びました。
ジムでバーベルを持ち上げる人の目的は、バーベルそのものではありません。目的は筋力を鍛えることであり、その筋力は日常のあらゆる活動へと転移されます。ハサビスにとって、チェスはまさにそのような役割を果たしました。64マスの盤上で鍛え上げた思考力は、チェスの世界を離れた後も、彼の人生全体を貫く道具となりました。
チェスが教えてくれた最初のメタスキルは、複雑なシステムを全体的に把握する能力です。チェス盤には初期配置の状態で32個の駒が置かれており、可能な局面の数は約10の120乗に達します。この数字は、観測可能な宇宙に存在する原子の数(約10の80乗)よりも圧倒的に大きいものです。この巨大な可能性の空間の中で最善の一手を見つけ
出すためには、すべてのケースを一つひとつ計算する方法では不可能です。その代わりに、盤全体の構造を読み解かなければなりません。どこに力が集中しているのか、どこが弱点なのか、そして相手の戦略的な意図が何であるのかを察知する必要があるのです。
それは、一本一本の木ではなく、森全体を見渡す能力です。ハサビスは幼い頃から、この能力を繰り返し訓練してきました。次の一手を打つ前に、その手が盤面全体の均衡にどのような影響を与えるかを推し量る習慣、個別の事象ではなくシステム全体の力学を読み解く習慣が、彼にとって身体に染み付いた思考様式となりました。
この能力は、後にディープマインドで強化学習アルゴリズムを設計する際、数千人の研究者からなる組織を経営する際、そして「タンパク質の折り畳み」という生物学の難問に挑む際にも、同じように機能しました。二つ目のメタスキルは「パターン認識(pattern recognition)」です。マスター級のチェスプレイヤーは、盤上の駒の配置を見た瞬間に、特定のパターンを認識します。
認知心理学者アドリアン・デ・グルート(Adriaan de Groot)の研究によれば、チェスのマスターは、約5万から10万ものパターンを記憶の中に蓄積しています。これらのパターンが即座に活性化されることで、マスターは初心者が10分かけて分析するような状況を、わずか数秒で把握します。ハサビスが4歳から13歳までの9年間、毎日欠かさず行ってきたことこそが、まさにこの「パターンのライブラリ」の構築でした。
パターン認識能力は、チェス盤の外でも強力な武器となります。科学研究においてデータの中の規則性を見出すこと、ビジネスにおいて市場の潮流を読み解くこと、ゲームデザインにおいてプレイヤーの行動パターンを分類すること、これらはすべて本質的にパターン認識の作業です。ハサビス自身も、このことを明確に理解していました。
「チェスを高いレベルでプレイすることで、実際に研ぎ澄まされるのはメタスキルです。問題解決、想像力、創造的思考、戦略的思考。これらを科学やビジネスといった他の分野に応用することができるのです」。三つ目のメタスキルは、数手先までを見通す「計画能力」です。
チェスでは、一手を指す前に少なくとも3〜5手先を読みます。マスター級になると10手以上先を見通します。ここで必要とされるのは、単なる計算ではなく、「もし自分がこう指せば、相手はこう応じてくるだろう、そうなれば自分にはこのような選択肢が生まれるが、その中でどれが5手後に最も有利な局面につながるか」を判断する条件付き推論です。
これは本質的に、頭の中に意思決定ツリー(decision tree)を構築し、探索する作業であり、後にディープマインドがAlphaGoに適用したモンテカルロ木探索(Monte Carlo Tree Search)の人間版でもあります。
ハサビスは、システム思考、パターン認識、計画的な先見性というこれら3つのメタスキルを、チェス盤の上で9年間にわたり過酷に鍛え上げました。これら3つは、後に彼が設計した人工知能システムの核心的な構成要素と正確に対応しています。ディープラーニングはパターン認識を、強化学習はシステム内における最適行動の探索を、木探索アルゴリズムは未来の分岐を見通す計画立案を担っています。
4歳の少年が父のチェス盤から始めた訓練が、30年後、人類史上最も強力な人工知能の設計原理として結実したのです。チェス盤はハサビスにとって、単なるゲーム以上の存在でした。それは、知能そのものを理解するための最初の実験室だったのです。
12歳、リヒテンシュタイン大会。1989年の春、アルプス山脈に囲まれた小さな国リヒテンシュタインで、国際チェスオープン大会が開催されました。当時12歳のデミス・ハサビスが、その大会に参加していました。会場は数百人の選手で埋め尽くされていました。
各国から集まったチェスの達人たちが、緊張感の中で駒を動かしていました。ハサビスの対戦相手は、ドイツのFIDEマスター、カーステン・ピーパーエムデンでした。対局は長く、激しいものでした。
10時間を超える間、二人はチェス盤の前から立ち上がることができませんでした。中盤戦が過ぎ、終盤戦(エンドゲーム)に入ると駒の数は減り、ゲームはキングとクイーン対キング、ルーク、ビショップ、ナイトという複雑な終盤へと進んでいきました。60手を越え、70手を過ぎ、77手まで続きました。12歳の少年の集中力と体力は、限界に達しようとしていました。
決定的な瞬間が訪れました。ハサビスは敗北を宣言しました。ところが、相手が立ち上がり、劇的なジェスチャーを見せたのです。
もしハサビスがクイーンを犠牲にしていれば、ステイルメイト、つまり引き分けにできる手順が残っていたというのです。相手は最後の瞬間に安易なトリックを仕掛け、疲れ果てていた12歳の少年は見逃してしまいました。「胃がひっくり返るような思いでした」と、ハサビスは回想しています。
ハサビスは大会会場を後にし、リヒテンシュタインの野原を歩きました。アルプスの山々が周囲を囲み、美しい景色が広がっていました。散策の途中、12歳の少年の頭の中に、一つの考えが浮かび上がりました。
思考の中で大会会場のホールを見下ろしたとき、何百人もの優れた頭脳が、互いに打ち勝つために駒を動かしている光景が目に飛び込んできました。「あの部屋は驚くほど優秀な人々で満たされています。しかし、彼らは自分の知能を、互いに競い合い、打ち勝つためだけに費やしているのです」。
「もし、これらすべての頭脳を一つのシステムに繋げることができれば、病気を治療することもできるのではないでしょうか。その時間とエネルギーをより良い場所へ向けることができれば、世界のために、もっと素晴らしいことを成し遂げられるのではないでしょうか」。12歳の少年の直感でした。それは論理的な推論というよりも、確信に近いものでした。
10時間に及ぶ過酷な対局の後、初歩的なミスで敗北し、精神的にどん底にいた瞬間に湧き上がった根本的な問いでした。チェスは愛している、しかし、これが人生のすべてであっていいのだろうか。これほど優れた頭脳が、互いに勝ち合うためだけに費やされることが最善なのだろうか。もし、この知的能力を集結させて、人類の真の課題に投入することができたなら。この瞬間を境に、ハサビスの方向転換が始まりました。もちろん、すぐにチェスを辞めたわけではありません。その後も数年間は大会に参加し、ケンブリッジ大学のオックスブリッジ対抗戦にも3年連続で出場しました。
しかし、「世界チャンピオンになる」という目標は、リヒテンシュタインの散歩道で静かに手放されました。代わりに、新たな問いがその場所を占めることになったのです。チェスで鍛え上げたこの思考力を、より大きな問題に活用することはできないだろうか。ハサビスが後にディープマインドを設立した際に掲げたミッション、「知能を解明すれば、残りの問題はすべて解決する(Solve intelligence, and then use that to solve everything else)」は、まさにこの12歳の直感を、大人の言葉へと翻訳したものなのです。
リヒテンシュタインの大会会場で、数百人もの知性がチェス盤だけに縛り付けられているのを見て感じた惜しさ、その知的能力をがん治療や気候変動といった人類の課題に役立てることができればという願い。これが20年後、「汎用人工知能(AGI)」という概念として具体化されます。数百人のチェスマスターの代わりに、数万台のコンピュータが単一の学習アルラゴリズムのもとでタンパク質構造を予測し、新薬候補物質を探索し、気象パターンを分析する世界。ハサビスが夢見たのは、まさにそれでした。リヒテンシュタインでの散策は、この伝記の原点です。
10時間に及ぶ敗北がもたらした悟いがなければ、ハサビスは優れたチェスのグランドマスターとして生涯を終えていたかもしれません。しかし、12歳の少年はチェス盤の向こう側を見据えており、その視線は最終的に科学の歴史を変えるところまで到達したのです。
最初のコンピュータ(ZX Spectrum 48K)とプログラミング、Commodore AmigaでのオセロAI開発。1984年のある午後、ロンドンのチェス大会会場で、8歳の少年デミス・ハサビスが優勝トロフィーを手にしました。少年の手には、賞金である200ポンドが握られていました。同年代の子供たちが、おもちゃ屋へ駆け込んでいくような金額です。
しかし、デミスの足は家電量販店へと向かいました。彼がそこで選んだ品は、黒い本体に虹色のストライプが刻まれた小さな機械、シンクレア ZX Spectrum 48K(Sinclair ZX Spectrum 48K)でした。それは、1982年にサー・クライヴ・シンクレア(Sir Clive Sinclair)によって発売された8ビットの家庭用コンピュータでした。
ゴム製の平らなキーボード、リビングのテレビに接続しなければ画面が映らない無骨な構造、カセットテープからプログラムを読み込むという低速な方式。スペックだけを見れば貧弱なものでしたが、この機械が持つ真の力は価格にありました。125ポンドから175ポンドという価格設定は、イギリス全土の平凡な家庭にコンピュータを普及させる革命をもたらしました。500万台以上を売り上げたこの小さな箱は、イギリスのIT産業の種となり、数千人もの少年少女たちを、いわゆる「ベッドルーム・コーダー(Bedroom Coders)」へと変貌させた立役者でした。
デミスの家庭には、コンピュータに詳しい大人は一人もいませんでした。父コスタスと母アンジェラは、自らを「テクノフォブ(機械嫌い)」と呼ぶほど、機械とは無縁な人々でした。しかし、家に教えを示す大人がいないことは、少年にとって不利な条件ではなく、むしろ祝福となりました。
彼は自ら道を切り拓かなければなりませんでした。少年は父の手に引かれ、ロンドンのチャリング・クロス・ロード(Charing Cross Road)に位置する大型書店「フォイルズ(Foyles)」へと向かいました。そして、コンピュータ・プログラミングの棚の前に座り込み、本を広げたのです。
ハサビスは後に、当時のことをこう回想しています。「父と一緒にフォイルズへ行き、プログラミングコーナーに座って、ゲームで無限の命を得る方法を学んだものです。当時のコンピュータの驚くべき点は、電源を入れた瞬間にすぐにプログラミングを開始できることでした。
私は直感的に、この機械が創造力を存分に解き放つことができる魔法の道具であると理解したのです」。ZXスペクトラムにはBASICインタプリタが内蔵されていたため、電源を入れた瞬間にコーディングを始めることができました。キーボードの各キーには最大6つの機能が割り当てられており、『J』キーを一つ押すだけで『LOAD』という命令が自動的に入力される設計になっていました。」
少年は雑誌に印刷された数十行、時には数百行にも及ぶコードを一文字ずつ打ち込みながら、プログラミングの文法を身につけていきました。
当時のイギリスでは、『Your Sinclair』、『Crash』、『Sinclair User』といったコンピュータ雑誌が、毎月ゲームやユーティリティのソースコードを誌面に掲載していました。読者はそのコードを自ら打ち込んで実行していました。たった一つの打ち間違いでもプログラムは停止してしまい、エラーを見つけて修正する過程を通じて、子供たちは自然と論理的思考とデバッグの基礎を習得していったのです。
デミスにとって、このプロセスは苦痛ではなく、一種のゲームでした。チェス盤の上で相手の手を読む行為と、コードの中からバグを追跡する行為は、本質的に同じ能力、すなわちパターンを認識し、論理的な経路を辿る能力を必要としたからです。成長とともに、彼が使う道具も進化していきました。
ZX Spectrumの48キロバイトというメモリ容量と、モノクロに近いグラフィックスは、やがて少年の野心を支えきれなくなりました。デミスは、より強力な性能を備えた「Commodore Amiga」へと機種を切り替えました。Amigaは、当時としては画期的なカラーグラフィックスとステレオサウンドを備えた16ビットコンピュータでした。
新しいマシンを前にして、デミスは自らの人生を貫くことになる根本的な問いを、初めて自分自身に投げかけました。「コンピュータを、自分のように考えさせることができるだろうか?」この問いの答えを探るための最初の実験対象は、ボードゲームの「オセロ」でした。
ハサビスは、自分がオセロをプレイする際に頭の中で行われる判断プロセスを分解しました。現在の局面の有利さをどのように評価するか、相手が次にどこに石を置くかをどのように予測するか、数手先を読む際にどの枝を優先的に探索し、どの枝を切り捨てるか。彼はこの思考プロセスをアルゴリズムへと移し替えました。ゲームツリーの枝を効率的に切り捨てる「アルファ・ベータ法(Alpha-Beta Pruning)」のような探索手法の基礎を独学で習得したのも、この時期のことです。
完成したプログラムは、弟に勝てるほど十分に優れたものでした。ハサビスは後に、アカデミー・オブ・アチーブメント(Academy of Achievement)のインタビューで、この経験を次のように回想しています。「私が覚えている最初のプログラムの一つは、リバーシ、イギリスではオセロと呼ぶゲームをプレイするプログラムでした。」
かなり上手でした。弟に勝つことができましたから」。この小さな成功の中には、巨大な原型が隠されていました。
人間の思考プロセスを観察し、それをアルゴリズムへと翻訳し、機械が自律的に最善の決定を下せるようにする。この三段階の流れは、20年後のディープマインドがアタリのゲームを攻略し、囲碁の神を超え、タンパク質の構造を予測していく過程と、正確に同じ骨組みを共有しています。8歳のチェス少年が賞金200ポンドで手に入れた黒い箱は、人類の未来を変える40年余りの旅の出発点となったのです。遊びがそのまま研究へと変わっていった時期、デミス・ハサビスの幼少期には、遊びと研究の境界線は存在しませんでした。
普通の子供たちにとってゲームは学校や宿題からの逃避でしたが、デミスにとってゲームは、精密に解体し、再構築すべきシステムでした。新しいゲームを手に入れると、彼はまずそれを楽しみ、それから分解しました。画面の中のキャラクターがなぜあのように動くのか、スコア体系にはどのような論理が設計されているのか、難易度の曲線はなぜこの地点で変化するのか。少年の部屋に置かれたコンピュータは、単なる娯楽機ではなく、世界で最も精巧な実験室でした。
1980年代のイギリスは、このような少年が育つのにふさわしい土壌を備えていました。ZXスペクトラムやBBCマイクロが普及した教室や家庭では、数千人ものティーンエイジャーがコーディングを学んでいました。マシュー・スミスは17歳で『マニック・マイナー(Manic Miner)』を作り上げ、デビッド・ブレイブンとイアン・ベルは大学の寮で宇宙探索ゲーム『エリート(Elite)』を完成させました。
オリバー・ツインズは、自らの部屋で『ディジー(Dizzy)』シリーズを誕生させました。まさに「ベッドルーム・プログラマー」の黄金時代でした。専門的な訓練を受けていない青少年たちが、自室でコードを書き、その成果物を出版社に売って小遣いを稼いでいた時代。デミスはその時代の潮流の真っ只中にいました。
しかし、その少年は、同時代の他の天才たちとは微妙に異なる場所を見つめていました。多くの若きプログラマーたちが、より華やかなグラフィック、より速いスピード、より刺激的なゲームプレイに情熱を注いでいた一方で、デミスの関心は、ゲーム内の存在たちの「行動そのもの」にありました。「敵キャラクターは、なぜ常に同じパターンで動くのだろうか。もし、このキャラクターがプレイヤーの行動を観察し、そこから学び、次には異なる戦略をとるとしたらどうなるだろうか。『仮想世界の登場人物に、いかにして知能を授けるか』」
この問いは、当時10歳前後だった少年が抱くにはあまりに巨大なものでしたが、チェスの対局を通じて人間の知性の深淵を探求してきた子供にとっては、自然な次のステップでした。デミスの家に帰ると、彼はすぐにコンピュータの前に座りました。
チェス盤の上で数万回と繰り返した経験が、コードへと変換される時間でした。指し手の一つひとつに対して三手、五手先を読む習慣は、プログラミングにおける条件分岐や再帰関数を設計する感覚へとつながりました。駒の相対的な価値を瞬時に計算する直感は、ゲームAIの評価関数(Evaluation Function)を構築する基礎となりました。
勝利したときの報酬と、敗北したときの代償を数千回も体験した記憶は、後に強化学習(Reinforcement Learning)の報酬体系を理解する上での決定的な糧となりました。これらすべてのつながりは、意識的に設計されたものではありませんでした。少年はただ、楽しいからコードを書き、楽しいからゲームを分析していただけなのです。
この時期に形成された、ハサビス特有の習慣があります。それは、一つの問題を多角的な視点から同時に捉える「融合的思考」です。彼はゲームを開発しながら、人間の心理を観察していました。
なぜあるゲームは何時間も人を惹きつけ続ける一方で、あるゲームはわずか5分で退屈させてしまうのか。彼は人工知能を設計する過程で、自身の脳がどのように機能しているのかに好奇心を抱きました。チェスにおいて直感的に「良い手」を思いつく瞬間、脳のどの部分が活性化しているのだろうか。機械は疲れを知らずにすべての局面を探索しますが、人間には大半の可能性を無視して、一気に核心へと飛び込む能力があります。この二つの世界の長みを結合することはできないだろうか。少年は自らを「思考について考える子供」と定義しました。
「メタ認知(Metacognition)」という学術用語こそまだ知りませんでしたが、彼はすでにそれを実践していました。彼の部屋はプログラミングの書籍やフロッピーディスク、チェスの棋譜集、ゲーム雑誌で埋め尽くされていました。外で走り回る時間よりも、画面の中のデータが自分の意図通りに反応する様子を見守る時間の方が長いものでした。
他人には孤独に見えたかもしれないこの時間は、少年にとってはパズルのピースを一つずつ埋めていく、最も幸せな没頭の時間でした。ゲームという安全で制御された環境の中で知能の本質を探求する手法は、DeepMindの核心的な哲学となりました。2013年、DeepMindがAtariのゲーム『Breakout』に対し、ルールを一切教えず画面のピクセルだけを見せて自律学習させた実験、2016年、人間の棋譜なしに自己対局のみで囲碁の神へと登り詰めた「AlphaGo Zero」、2020年、50年来の難問であったタンパク質構造予測を解明した「AlphaFold」のプロセス。
これらすべての原型は、北ロンドンのある部屋で少年がオセロのAIを作りながら抱いた、シンプルな問い、「コンピュータは私のように考えることができるだろうか?」から始まりました。チェスの賞金200ポンドを懸けた黒い箱の前に座る8歳の少年の部屋は、単なる幼少期の空間ではありませんでした。それは、知能を解き明かし人類の難題を解決しようとする、40年にわたるクエストの最初のステージだったのです。チェスのトーナメントに出場した少年……
