AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第25章 什么是AGI?
德米斯·哈萨比斯,谷歌人工智能之父
德米斯·哈萨比斯,谷歌人工智能之父
第25章 什么是AGI?
金京镇
哈萨比斯的定义与达里奥·阿莫代伊的定义比较。2026年1月,达沃斯世界经济论坛的一个舞台上,两个人并排而坐。谷歌DeepMind的德米斯·哈萨比斯,和Anthropic的达里奥·阿莫代伊。主持人问道:「你们认为AGI是什么?它什么时候会到来?」
两人的回答指向同一个方向,却在细微处分道扬镳。这种差异里,藏着AI产业最根本的争论。哈萨比斯这样回答。
「AGI是一个能够实现人类所展现的所有认知能力(all the cognitive capabilities humans can exhibit)的系统。」这个定义里,关键词是『所有』和『认知』。它涵盖推理、创造力、规划、问题求解,以及对物理世界的理解。
哈萨比斯在2025年与Lex Fridman的对话中,把这个定义进一步具体化了。AGI不是在某一个领域表现突出的系统。它必须在所有认知领域中,一致地展现出人类水平以上的表现。他说,要达到「一个专家团队花上几个月测试,也难以找到漏洞」的程度。
哈萨比斯强调的是「一致性(consistency)」。当下的AI系统,一边能解出数学奥林匹克金牌级别的题目,一边却在五岁孩子轻松完成的日常判断中翻车。他把这称为「参差不齐的智能(jagged intelligence)」。
如果是AGI,这种参差就不该存在。它要能下棋,能写诗,能提出新的物理学假说,还能在一间从没去过的厨房里做出饭来。哈萨比斯更进一步,提出了一个独特的思想实验作为AGI的试金石。
「把这个系统放到1900年,只给它当时已有的物理学知识,它能不能自己发现相对论?」或者,「它能不能自己发明一种像围棋那样深邃而优雅的游戏?」这就是哈萨比斯心目中真正通用智能的标准。
达里奥·阿莫代伊的思路不同。他不太喜欢AGI这个词本身。2024年10月,他发表了一篇一万五千字的长文「爱的恩典之机器」
(Machines of Loving Grace),文中他刻意用「强大的AI(powerful AI)」来替代AGI。阿莫代伊的定义是这样的:「在几乎所有相关领域,比诺贝尔奖得主还聪明的AI。」
生物学、编程、数学、工程、写作,不分领域,全面超越顶尖专家的系统。他把它比作「住在数据中心里的天才之国」。两人的差异在哪里呢?哈萨比斯以人类大脑的架构为基准,也就是大脑作为通用学习机器所能执行的全部功能。
这是一个理论性的、结构性的定义。阿莫代伊则以成果和结果为标准。在特定领域超越人类顶尖专家的实际表现,才是他的尺度。
如果说哈萨比斯的定义回答的是「它应该能做什么」,那阿莫代伊的定义回答的是「它应该做到多好」。这种差异也影响到了时间表。阿莫代伊认为2026年或2027年,满足他标准的AI就可能出现。哈萨比斯更为审慎。
他的估计是:到2030年,有50%的概率。这个差距源于定义的不同。阿莫代伊的标准聚焦于特定任务上的超人类表现,沿着当前的扩展轨迹似乎就能抵达。
哈萨比斯的标准要求在所有认知领域保持一致的通用性,这就需要突破现有技术的根本局限,需要新的突破口。有意思的是,两人都没有完全否定对方的观点。达沃斯的舞台上,哈萨比斯说「我们的看法其实没有太大分歧」。
阿莫代伊也在2026年的文章「技术的青春期(The Adolescence of Technology)」中承认,「强大的AI可能一两年内就来,但也可能要更久」。关于最终的目标,两人有共识。只是对抵达那里的路径和速度,解读不同罢了。
这场争论之所以重要,是有原因的。AGI如何定义,决定了安全研究的优先级,决定了监管介入的时间节点,也影响着数万亿美元规模的投资决策。像哈萨比斯那样设定高标准,传递的信息是「路还很长」。
像阿莫代伊那样设定以性能为中心的标准,传递的则是「它就快来了」的警告。无论哪一方正确,两种定义都有一个共同前提:我们正在创造的,是人
类历史上前所未有的东西,而要理解它的意义,需要精确的语言。编程、数学、自然科学、物理AI(机器人)。2025年5月,谷歌I/O大会的炉边对话。哈萨比斯身旁坐着谷歌联合创始人谢尔盖·布林。当主持人问到当前AI系统的局限时,哈萨比斯画出了一条明确的分界线。
「如果90%的人做不到的事,AI做到了,那在经济上很重要,在产品层面也是一个重要里程碑。但不要把它叫AGI。它应该被称为'典型人类智能(typical human intelligence)'水平。」这番话展现了AGI的范围有多广。哈萨比斯构想的AGI,贯穿多个认知领域。
编程是其中进展最快的领域。截至2025年,AI已经承担了Anthropic自身产品开发中大部分的编程工作,谷歌DeepMind内部也在大规模使用AI进行代码生成和调试。哈萨比斯承认,在编程和数学领域,AI的「自我改进循环(self-improvement loop)」有可能启动。
AI写出更好的代码,那些代码再造出更好的AI,这种循环已经开始了。但他明确表示,仅凭这一点不能称之为AGI。数学是第二条战线。
DeepMind的AlphaProof和AlphaGeometry已经解出了国际数学奥林匹克(IMO)级别的题目。AlphaEvolve更进一步,开启了AI自行设计算法的时代。哈萨比斯为这些成果感到自豪,同时也清醒地认识到其局限。
当前的系统擅长证明已有的猜想,但还不具备自己提出新猜想的能力。把围棋下到世界冠军水平,和发明围棋这个游戏本身,是完全不同维度的智能。哈萨比斯把后者,也就是创造性发明的能力,视为AGI的核心基准。
自然科学是第三个领域,也是离哈萨比斯内心最近的领域。AlphaFold解决了困扰学界50年的蛋白质折叠问题,证明了AI可以成为科学发现的工具。AlphaGenome开始绘制基因编码与功能之间的关系图谱,GNoME发现了超过220万种新材料的晶体结构。
然而,尽管取得了这些成就,当前的AI仍然是「辅助」科学家的工具,而不是一个能自己提出假说并加以验证的「科学家」。哈萨比斯在2025年12月谷歌DeepMind播客中提出的AGI两大前提条件之一,正是「自动化实验(automated experimentation)」,原因就在这里。AI必须能够提出问题、设计实验、解读结果,再修正假说,形成一个完整的科学研究闭环。DeepMind宣布将于2026年在英国建立首个全自动化研究实验室,正是这一愿景的落地。
第四个领域最具挑战性。物理AI,也就是机器人。哈萨比斯在达沃斯舞台上说:「我对AGI的定义,包括物理AI、机器人,所有这些。」当前的大语言模型在数字世界里运行。
它们能读文本,能分析图像,能生成代码。但在真实世界中拿起一个杯子、在一间第一次去的厨房里做饭、走过崎岖不平的地面,需要的是完全不同的智能。重力、摩擦力、惯性、柔性物体的形变,这些物理现象必须被实时理解和回应。这就是哈萨比斯把「世界模型(World Model)」列为AGI另一大前提条件的原因。DeepMind的Genie能从文字提示生成可交互的3D环境,SIMA则能在这些环境中搬移物体、避开障碍、寻找目标。
Veo视频模型以惊人的精度再现流体运动、光线反射和材质纹理,表明AI仅通过观看YouTube视频这样的被动观察,就能发展出对物理学的「直觉理解(intuitive physics)」。这一发现挑战了AI研究中长期占主导地位的假设,即要理解物理世界,就必须有一个像机器人一样拥有身体的行为体(embodied agent)。用哈萨比斯的话说:「AGI的前提条件不是变得更聪明,而是能做更多的事。」
聊天机器人再怎么流利地对话,如果无法观察世界、理解世界、并真正地改变世界,它就不是通用智能。从编程到数学,从自然科学到物理世界,贯穿所有这些领域的一致能力,才是哈萨比斯描绘的AGI全貌。要完成这幅画,还有空白需要填补。
哈萨比斯:AGI有可能在「5到10年内」到来。到2030年AGI实现的概率为50%。作为一位拥有神经科学博士学位的研究者,哈萨比斯偏好概率性的语言。「50%。」2025年7月,哈萨比斯在Lex Fridman播客中表示,AGI在未来5年内,即2030年前后出现的概率为50%。
一半对一半。2025年12月,在Axios AI+峰会上,他重申了这一预测。「AGI,也许是人类历史上最具变革性的时刻,已经出现在地平线上了。」
要理解这一预测的分量,需要了解背景。在AI行业,时间表预测本身就是一种策略性发言。说得太近,能吸引投资,但如果没能兑现就会失去信誉。
说得太远,虽然安全,但市场的关注度会降温。哈萨比斯的「50%,5到10年」恰好落在这个光谱的正中间。这是刻意为之的。
对比一下。Anthropic的达里奥·阿莫代伊给出的时间是2026年或2027年。特斯拉的伊隆·马斯克预测2025年就会出现超越个体人类的AI,到2030年前后则会出现超越全人类总和的AI。OpenAI的萨姆·奥特曼用了「合理的近未来」这种模糊措辞。Meta的马克·扎克伯格说,12到18个月内大部分代码将由AI编写。
另一边,百度的李彦宏预测「10年以上」,Meta的杨立昆(Yann LeCun)则坚持「至少10年,可能远不止」,并主张需要全新的科学发现。哈萨比斯处于中间。他与其他CEO的区别在于,他给预测附加了条件。50%这个数字建立在「当前轨迹得以延续」这个前提上。同时,他也保留了「可能存在我们尚未察觉的障碍」这一不确定性。这是科学家的语言。
不用确信说话,而是用概率说话的习惯。哈萨比斯做出这一预测的依据是什么?他提到了几个具体的进展。Gemini系列的快速发展是其中之一。2025年7月与Lex Fridman的对话中,哈萨比斯说:「Gemini 3绝对是一个令人惊叹的模型,完全符合我的预期,也与过去几年我们所走的轨迹完全吻合。」
推理能力的改善、多模态理解的拓展,以及智能体系统的发展,是他指出的具体进步。
DeepMind的DeepThink并行运行多条推理过程,然后让它们相互交叉验证。哈萨比斯把这称为「打了类固醇的推理(reasoning on steroids)」。测试时计算(test-time compute),即在AI生成答案时投入额外算力的方法,是DeepMind从AlphaGo时代就开始探索的路径。
在围棋中落子之前模拟数千种局面的原理,现在也被应用到了语言模型上。哈萨比斯50%的预测中,包含一个重要的保留。另外的50%,即2030年前AGI不会到来的概率,同样大。
原因也很明确。当前的系统在推理、记忆、物理世界理解和创造性发明这些根本能力上,仍然存在缺失。2025年1月,在与Alex Kantrowitz的访谈中,哈萨比斯断言「今年没有任何研究机构能达到AGI」,同时批评了那些对技术过度包装的人。作为诺贝尔奖得主和行业最前沿的研究者,他的这番话,在过热的AGI争论中是一种难得的克制之声。
2025年12月,哈萨比斯的预测在一个细节上有了更新。在达沃斯的舞台上,当阿莫代伊给出「2026到2027年」时,哈萨比斯回应说「我们的分歧并不大」。随后补了一句:「我的时间表稍长一些。」
这种微妙的靠拢,是在竞争压力与科学审慎之间寻求平衡的尝试。市场希望时间表更短,投资者想要确定性,但研究的现实随时可能推翻预测。归根到底,哈萨比斯50%的预测说的是这件事:
AGI会来。问题不是「会不会(if)」,而是「什么时候(when)」。这个「什么时候」可能是5年后,可能是10年后,也可能更久。
「还需要一两个变压器级别或AlphaGo级别的突破」。2025年5月的谷歌I/O上,哈萨比斯用一句话概括了通往AGI的距离。「要真正实现AGI那样的东西,可能还需要一两个新的突破(to get all the way to something like AGI may require one or two more new breakthroughs)。」7月在Lex Fridman播客中,他重复了这个想法。
「要获得通用智能应有的、跨所有领域的一致性,我们在推理、记忆,或许还有世界模型这些方向上,还需要一两项东西。」这话听起来谦逊,但其中蕴含的信息量是巨大的。哈萨比斯参照了两个历史先例。
一个是2017年谷歌大脑团队发表的Transformer架构。一篇题为「Attention Is All You Need」的论文彻底改写了自然语言处理的格局,成为GPT系列和Gemini在内的现代AI模型的基石。另一个是2016年的AlphaGo。
深度神经网络、强化学习与蒙特卡洛树搜索的结合,这种前所未有的组合攻克了围棋这座不可逾越的堡垒。两个案例都不是渐进式改良,而是跨越既有范式的质变。哈萨比斯说「还需要一两个突破」,那么这些突破的候选方向在哪里?他反复提及的领域有三个。
第一个是推理(reasoning)。当前的大语言模型基于模式识别来生成回答。它们看起来能解数学题、进行逻辑推理,但这一过程是否与人类的逻辑思维以同样的方式运作,仍然不清楚。
DeepMind的DeepThink是应对这一问题的一种路径。并行探索多条推理路径并相互验证,这种方式是AlphaGo搜索棋步方法的延伸。哈萨比斯将其称为「突破的一部分」。
言下之意是,这还不是全部。推理的下一阶段,即自主生成新假设并加以验证的能力,仍是尚未抵达的领域。第二个是记忆(memory)。当前的AI模型在对话结束后就会遗忘对话内容。
每一次交互都从空白状态开始。人类的智能建立在持续学习(continual learning)之上,不断积累经验,将过去的学习应用于新的情境。要弥合这一差距,可能需要一种整合情景记忆、语义记忆和程序记忆的全新架构。
哈萨比斯的神经科学背景恰好在这一点上展现出价值。他博士论文的研究主题,海马体(hippocampus)与情景记忆,正是AI至今未能复现的大脑核心功能。第三个是世界模型(world model)。2025年12月,哈萨比斯在谷歌DeepMind播客中明确提出了实现AGI的两个前提条件。其中第一个就是世界模型,即AI真正理解物理规律和空间的能力。如果语言模型能够讲述故事,
那么世界模型就能构建环境。然而,让AI真正参与现实的决定性一步在于实验。Genie根据情境实时生成场景,SIMA在其中执行任务,无论成功还是失败,结果都成为AI自身的学习素材,形成循环。这就是哈萨比斯所构想的认知闭环(cognitive closed loop)。
对于哈萨比斯的这一判断,也有人持怀疑态度。有效利他主义(Effective Altruism)论坛2025年12月的一篇分析提出了尖锐的问题:「哈萨比斯列举的那些未解研究课题,分层强化学习、世界模型、持续学习、创造性想法生成,其实都是存在了几十年的老问题。搜索学术数据库,从1990年代初就能找到分层强化学习的论文。
凭什么确信这些老问题能在三到五年内解决?」这一批评切中了要害。当前AI产业的投资大部分集中在大语言模型的规模扩展上,而哈萨比斯认为必不可少的新科学发现,获得的资源相对少得多。
哈萨比斯用「两件事同时做」的原则来化解这种张力。在把现有技术推到极致的同时,也为六个月到一年后将到来的下一次创新做准备。这和棋手的思维方式一样:把眼前这一步走到最好,同时在脑中预演十步之后的棋局。
AlphaGo身上也印证了同样的策略。一边把已知的招法研究到底,一边大胆抛出谁都没想到的新手。谢尔盖·布林在这里引出了一个有趣的历史类比。
「回顾N体问题模拟的历史,算法变聪明带来的进步,比计算机性能提升带来的进步更大。而现在,两者在同时进步。」哈萨比斯认为不可或缺的突破,恰恰就在算法这一侧。不是把数据中心建得更大,不是堆更多GPU,而是对智能如何运作这一根本问题获得全新的领悟。
这「一两个突破」会在何时、何地、以何种面貌出现,没有人知道。2015年没有人预见到Transformer论文会在2017年问世。也没有人事先想到AlphaGo的第37手。哈萨比斯也承认这种不可预测性。
但他同时表示,他的团队「准备了好几个很有前景的想法,希望把它们汇入Gemini的主流」。纵观科学史,突破总是降临在有准备的人身上。哈萨比斯已经为此准备了四十年。
棋盘前萌生的那个问题,「这种智能能不能用在更好的地方?」如今已走到了末尾的关口。通向AGI的路线图
人工智能专家 金京镇律师
AI法律政策专家 · 前国会议员 · 著作等身
如果这本书曾在您身边短暂停留,请支持我们,让下一个故事得以面世。
(自愿捐助账户:农协 302-1096-0948-81 户名:金京镇)
