AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第4章 17岁的游戏开发者
德米斯·哈萨比斯,谷歌人工智能之父
德米斯·哈萨比斯,谷歌人工智能之父
第4章 17岁的游戏开发者
金京镇
命运之会 1992年,伦敦北部一栋房子里,一个16岁的少年正在翻阅游戏杂志。他就是德米斯·哈萨比斯。比同龄人提前两年完成高中课程(A-Level)的他,已经收到了剑桥大学的录取通知书,但校方的回复出人意料。
「你太小了。去外面积累一年社会经验再来吧。」在英国,这种休学期叫做「间隔年(Gap Year)」。大多数学生选择背包旅行来度过这段时光,德米斯却决定用一种截然不同的方式。他手中拿着的杂志,是当时引领欧洲游戏文化的月刊《Amiga Power》。
杂志的一个角落里刊登着一则小型竞赛广告:「赢得在牛蛙工作的机会(Win-a-job-at-Bullfrog)!」牛蛙制作公司(Bullfrog Productions)是一家位于英国萨里郡吉尔福德(Guildford)的游戏开发商。
这家公司由彼得·莫利纽(Peter Molyneux)和莱斯·埃德加(Les Edgar)于1982年联合创立,凭借《上帝也疯狂(Populous)》和《权力贩子(Powermonger)》,已在欧洲游戏界占据了独一无二的地位。德米斯提交了自己的代码参赛,没过多久就收到了前往吉尔福德办公室的通知。看到面试现场出现的那个少年的瞬间,彼得·莫利纽的记忆历经数十年依然清晰。
他后来在接受《时代(TIME)》杂志采访时这样回忆:「像《指环王》里的精灵一样。在街上擦肩而过都不会注意到的瘦小孩子,但眼里闪烁着智慧的火花。」
真正抓住莫利纽的不是外表,而是紧接着展开的对话。决定性的时刻发生在去参加公司圣诞派对的巴士上。从吉尔福德到派对场地的往返路程中,16岁少年和欧洲游戏界的巨匠不停地交谈。用莫利纽的话说,那是「人生中最具智识刺激的对话」。
两人谈论着游戏的哲学。人类心理中的求胜欲从何而来?能否将这种欲望植入机器?智能的本质是什么?莫利纽说他在整个对话过程中不断默念:「这不过是个孩子啊!」
但他直觉感到这个孩子将走向非凡之处。两人迅速走近。在德米斯入学剑桥前于牛蛙度过的那个夏天,莫利纽和德米斯一有空就一起玩桌游和电脑游戏。
莫利纽曾自豪地说自己在策略游戏中大多能赢德米斯,但这种优势并没有持续多久。两人为了探索新卡牌游戏的机制,共同设计了一款叫「Dummy」的游戏,德米斯在这款游戏中以35连胜击败了莫利纽。在这个竞争心强、模式识别能力卓越的少年面前,游戏界的传奇人物也束手无策。
但这次相遇的真正价值在于互补。莫利纽是一个感性而即兴的愿景家。他开创了「上帝游戏(God Game)」这一类型,是那种赋予玩家神之视角、推动大胆构想落地的领导者。
德米斯则是能用精密代码将梦想变为现实的冷静设计师。德米斯从对方身上学到了愿景如何打动人心,莫利纽则从德米斯身上目睹了缜密逻辑如何拆解复杂问题。这段关系后来延续到在狮头工作室(Lionhead Studios)的重逢,成为贯穿德米斯整个职业生涯的导师关系的起点。
用代码和对话而非背包旅行来填充间隔年的这个选择,是将国际象棋神童转变为虚拟世界设计师的第一个转折点。「辛迪加(Syndicate)」关卡设计参与 加入牛蛙后,德米斯·哈萨比斯接到的第一项任务是《辛迪加(Syndicate)》的游戏测试。这款1993年发售的游戏,以企业取代国家的反乌托邦未来为背景,玩家指挥一支半机械人特工队伍征服世界,是一款即时策略游戏。
令人联想到《银翼杀手》的阴暗颓废都市景观,等距视角(isometric)俯瞰的街道,武装特工与市民群像在画面上穿梭移动。
对16岁的新人来说,游戏测试就是反复游玩、寻找漏洞、检查难度平衡的工作。对大多数人而言这是枯燥乏味的,但对德米斯来说,这个过程是从底层解剖游戏这一复杂系统内部结构的机会。他不满足于报告错误。
他深度参与了关卡设计阶段,分析每个任务的空间布局、敌方特工的移动路线、市民的反应模式,并提出改进方案。《辛迪加》的任务结构与德米斯的思维方式高度契合。每个任务提出暗杀、策反特工、绑架线人等不同目标,玩家可以选择隐秘执行,也可以正面突破。
这种开放式设计允许的不是「唯一正确答案」,而是「多条策略路径」。德米斯专注于构建能将这种多样性最大化的关卡。对他而言,关卡设计不是画漂亮的地图。而是解一道精密的联立方程,其中敌人配置、地形高低、市民动线密度、武器可达性等数十个变量彼此咬合运转。
在这段经历中深深吸引德米斯的概念是「智能体(Agent)」。游戏中的城市里,特工和市民各自按照自己的规则活动。市民听到枪声就逃跑,警察感知到骚乱就赶往现场。
这些反应并非开发者逐一指示的结果,而是从植入每个角色的条件规则(if-then logic)中自动产生的。各个元素相互咬合、生成出无法预测的局面,这种现象与后来复杂系统理论中所说的「涌现(Emergence)」是同一原理。德米斯在这座虚拟城市中那些如同活物般反应的小点身上,发现了智能最原始的形态。当时的游戏开发还不是今天这样数百人参与的大规模产业。
牛蛙的员工不过35人左右,少数程序员和美术通宵达旦完成一款游戏的年代。在这种高密度的环境中,德米斯不仅学会了编程,还自然而然地领会了游戏设计的哲学、项目管理的节奏、团队沟通的方式。凭借完美主义的性格,他指出了游戏引擎中的低效之处,提出了更好的编码方案。同事们偶尔对这个年轻新人毫不客气的发言感到
错愕,但面对他拿出的成果,只能信服。《辛迪加》给德米斯·哈萨比斯留下了两样东西。一是技术能力。
如何在有限的硬件上实时驱动多个智能体,如何平衡一个关卡中数十个变量,他都是在这款游戏中用身体学会的。另一样是问题。这些特工只在我设定的规则内才显得聪明。
如果不需要规则也能自己学习呢?这个问题还没有答案,但已作为一粒明确的种子植入少年的脑海。而这粒种子,将在下一个项目《主题公园》中萌发第一根嫩芽。传奇游戏「主题公园(Theme Park)」联合设计 数百万份销量与模拟沙盒类型的诞生 在证明了实力之后,彼得·莫利纽交给德米斯·哈萨比斯一个更大的课题。
建造并运营游乐园的模拟游戏《主题公园(Theme Park)》的联合设计与首席编程。17岁就成为公司核心项目的首席程序员,这本身就是破例之举。开发周期约为一年半。
莫利纽提出整体愿景和设计方向,德米斯负责将其转化为代码的引擎核心。莫利纽后来这样解释这款游戏的诞生背景:他判断经营模拟这一类型有潜力,想在不重蹈之前经营游戏《企业家(The Entrepreneur)》覆辙的前提下,做出一款人们乐于游玩的作品。他想让玩家亲手建造梦中的游乐园。
对德米斯来说,这个愿景是完美的挑战。因为从空地上放置游乐设施、开设小卖部、铺设道路到制定门票价格,所有环节都必须作为一个巨大系统相互咬合。1994年发售的《主题公园》取得了爆发性的成功。全球销量超过1500万份。
在日本,PlayStation版发售几周内就售出了8万5千份;在欧洲,它占据了畅销榜的头部位置。游戏获得了金摇杆奖(Golden Joystick Award),《PC Gamer》杂志将其评为1994年6月的「月度游戏」,并将其成瘾性与《模拟城市2000》相
提并论。《Edge》杂志的评测者在肯定游戏复杂性的同时,高度赞扬了其细节与沉浸感。这款游戏的真正价值在于「类型的创造」。
《主题公园》之前的游戏,大多是击败敌人或沿着既定剧情推进的线性结构。《主题公园》给予玩家空白空间和工具,做什么完全由玩家决定。这种「沙盒(Sandbox)」理念后来成为《过山车大亨》、《主题医院》、《模拟人生》等模拟游戏的先祖。
实际上,《主题公园》的相当一部分代码被后续作品《主题医院》复用,这款游戏的动画编辑器也被马克·韦伯利(Mark Webley)发展成了「复合引擎(The Complex Engine)」。德米斯在设计这款游戏时,执着地钻研经济模型的内在逻辑。提高薯条的含盐量,游客口渴了会多买饮料,但同时恶心值上升,公园地面变脏。不雇清洁工的话满意度下降,最终离园的人增多。这条因果链在当时的玩家看来精密得令人震惊。
莫利纽本人也承认,编程中最困难的部分是游客的行为。而真正将这个难题用代码解决的人,正是17岁的德米斯。商业成功教会了德米斯技术与市场的关系。再精巧的算法,如果人们不喜欢就没有意义;当技术赢得大众的喜爱时才算真正完成。他在这段经历中领悟了这些道理。
同时,他的目光投向了华丽销售数字的背后。在公园内走动的数千名虚拟人类所展现的行为模式,以及隐藏在这些模式中的智能原型,牢牢吸引着他的视线。对用户做出反应的模拟世界 将《主题公园》铸成传奇的核心要素,不是华丽的游乐设施,而是在公园里行走的游客的「大脑」。
德米斯·哈萨比斯作为首席程序员,在当时硬件的限制内设计了一套系统,让数千名游客各自独立地判断和行动。每个NPC(Non-Player Character)都被赋予了一个内部状态,其中饥饿、口渴、疲劳、快乐、恶心这五项核心欲望数值在实时计算。这套设计的核心是「自下而上(Bottom-up)方法」。
不是由开发者逐一指示所有行为,而是只给角色植入基本的欲望和反应规则,其余部分在与环境的互动中自然产生。饿了的游客会找最近的餐厅。价格离谱就生气离开公园。排队太长就放弃转向别处。路过喷泉心情变好,走过垃圾堆积的区域则不快感上升。这些个体决策累积到数千人的规模时,游乐园整体的运营状态这一宏观现象就自动形成了。从个体的微观规则中涌现出整体的宏观秩序,科学上将这种现象称为「涌现(Emergence)」。德米斯在这个过程中获得了关于智能本质的重要直觉。
在编写游客看到排队时决定等待还是放弃的算法时,他正在将人类在不确定情况下追求收益最大化的决策转化为公式。「采取什么行动能获得最大回报?」这个问题,与后来成为DeepMind核心研究方法的「强化学习(Reinforcement Learning)」最根本的问题完全重合。17岁的德米斯不知道这个术语,但已经在虚拟世界中实验着这一原理。当然,这个AI有明显的局限。
在TV Tropes等游戏文化网站上,《主题公园》游客的「人工愚蠢(Artificial Stupidity)」被幽默地记录着。游客卡在U形地形里出不来、走进池塘停住不动、清洁工只在干净区域转圈而脏区域无人理会,这些现象频繁出现。如果不指定巡逻路线,清洁工甚至会巡逻排队通道内侧这种不可能产生垃圾的
地方。对德米斯来说,这些局限不是失败,而是教训。他观察着这些虚拟生命看起来聪明的瞬间与荒谬愚蠢的瞬间之间的分界线,切身体会到了基于规则的AI的根本制约。
「真正的智能,应该能在我没有教过的情境中自行判断。」这个想法从此再未离开他的脑海。《主题公园》的游客终究只能在开发者设定的规则范围内「装聪明」。
面对规则之外的新情况就无能为力。德米斯开始确信,要突破这个局限,必须超越游戏代码,去研究人类大脑这一原始硬件。他后来在剑桥大学主修计算机科学,又回到UCL攻读认知神经科学博士的旅程,其种子正是在这座游乐园的虚拟人类之间播下的。
《主题公园》的NPC对哈萨比斯而言,是同时展示了「人工智能的可能性」与「能自主学习的智能这一下一个目标」的镜子。间隔年收入支付大学学费 德米斯·哈萨比斯的间隔年不仅是智识上的成长,在经济上也创造了惊人的成果。
《主题公园》是全球销量超过1500万份的超级大作,17岁的首席程序员也获得了相应的报酬。版税加奖金的总收入,是同龄学生靠打工无法想象的规模。他用这笔钱自己支付了剑桥大学的全部学费。
有了钱之后,德米斯做的事情之一是买了一辆当时少年们梦寐以求的跑车。他购入了一辆保时捷(Porsche)。间隔年结束后,他开着这辆车出现在剑桥大学的新生欢迎周(Fresher's Week)。
当其他学生乘坐父母的车或搭火车抵达校园时,德米斯驾驶着用自己创造的虚拟世界赚来的钱买的车亲自到来。这个场景是哈萨比斯传记中从不缺席的著名轶事。光鲜的情节背后,藏着冷静的自我认知。
他已经确认了一个事实:自己的智力是一种能在市场上创造具体价值的资本。
国际象棋神童的头衔吸引了人们的关注,但《主题公园》的成功证明了这种关注可以转化为实质性的经济成果。买了保时捷之后,剩余的钱他也没有挥霍。
他将其储备为未来研究和创业的资金,这个习惯在后来创办Elixir Studios和成立DeepMind的过程中,降低了对外部资本的依赖。间隔年结束时,德米斯·哈萨比斯已经是积累了多重经历的人。全球大作的首席程序员、参与了价值数百万英镑项目的商业贡献者、靠自己的力量支付大学学费的独立成年人。他熄灭了保时捷的引擎,走进了皇后学院(Queens' College)古老的图书馆。
此时他手中握着的,不再是游戏手柄,而是算法、离散数学以及承载人工智能未来的专业书籍。这个曾经创造虚拟世界的少年,如今迈入了学术殿堂,去破解那个世界中智能的秘密。「主题公园」(Theme Park)游戏画面,1994
人工智能专家 金京镇 律师
AI法律政策专家 · 前国会议员 · 著有多部作品
如果这本书曾在您身边停留片刻,请支持我们,让下一个故事得以问世。
(自愿赞助账户:农协 302-1096-0948-81 户名:金京镇)
