AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第15章 蛋白质折叠问题
德米斯·哈萨比斯,谷歌人工智能之父
德米斯·哈萨比斯,谷歌人工智能之父
第15章 蛋白质折叠问题
金京镇
1994年CASP大赛的起点 1972年12月,斯德哥尔摩的冬天格外寒冷,诺贝尔奖颁奖大厅里却热气腾腾。走上领奖台的美国生物化学家克里斯蒂安·安芬森,向世界宣布了一个足以载入人类科学史的大胆假说。他为蛋白质这种生命的微型机器如何被制造出来,给出了一条极其朴素却直击本质的原理。
「蛋白质的三维立体结构,完全由氨基酸序列决定。」这就是后来被称为「安芬森法则(Anfinsen's Dogma)」的命题。这一宣言给整个生物学界抛出了一道巨大的课题。
如果安芬森说得没错,那么理论上,我们只要知道一维的氨基酸序列信息,就应该能完美预测它扭转、折叠后形成的三维形状。可自然界没那么好对付。氨基酸链可能折叠出的构型数量,比整个宇宙中所有原子的总数还要多。
科学家赛勒斯·列文塔尔(Cyrus Levinthal)算了一笔账:一个蛋白质如果随机尝试所有可能的构型,所需时间比宇宙年龄还长。这就是「列文塔尔悖论(Levinthal's Paradox)」。自然界在千分之一秒内就完成了这个过程,人类的超级计算机算上几十年却找不到正确答案。为了攻克这道难题,科学家们在1994年启动了一项独特的实验。
那就是「蛋白质结构预测学术竞赛(CASP,Critical Assessment of Structure Prediction)」。马里兰大学的约翰·莫尔特(John Moult)教授创办了这项比赛,它本质上是一场「盲测」:出题方拿出实验室已经解析出结构、但尚未公开发表的蛋白质作为考题,全球的计算机科学家和生物学家各自用自己的算法预测结构,提交答卷。每两年举办一届的CASP,堪称生物学界的奥运会。
随着比赛一届届办下来,科学家们的表情越来越凝重。从1994年到2016年,大约二十年间,预测精
度始终原地踏步。满分100分的成绩单上,分数在40分上下徘徊,仿佛在宣告人类智识的天花板。科学家们渐渐疲了。
就在这时,伦敦一家研究所里出现了一个用全新视角审视这道难题的人。蛋白质为何是「根节点(Root Node)」问题:生命科学的瓶颈 在德米斯·哈萨比斯眼中,世界是一个庞大的信息处理系统。他把DeepMind的使命定为「解决智能(Solve Intelligence)」时,脑子里想的并不是做一个下棋厉害或聊天流畅的AI。
他想要的是一种能大幅提升科学发现速度的元解决方案(Meta-solution)。哈萨比斯把科学界的众多难题比作树的枝干。气候变化、疾病治疗、新材料开发,这些问题就像挂在树枝末梢的叶片和果实。
逐一解决这些具体问题,耗费的时间和金钱惊人。哈萨比斯想:「与其一根一根地修剪枝条,不如找到所有问题共同延伸出去的那条根,也就是根节点(Root Node),把它解决掉呢?」在他看来,生物学的根节点正是「蛋白质折叠(Protein Folding)」。
我们身体的一切功能都由蛋白质驱动。眼睛感知光线、肌肉产生运动、抗体对抗病毒,靠的全是蛋白质。蛋白质的功能取决于它的「形状」。就像钥匙必须与锁孔严丝合缝才能开门,蛋白质也必须拥有特定的三维结构,才能打开疾病这把锁。
新药研发之所以如此艰难、如此昂贵,正是因为不清楚药物需要作用的靶标蛋白质长什么样,只能经过数万次试错去摸索。哈萨比斯坚信:如果AI能预测蛋白质结构,那将成为把生物学从纯粹的实验科学转变为数据科学的契机。这个课题,正好可以证明DeepMind不是一家游戏公司,而是一个科学探索团队。
从游戏到科学的转变 来自游戏「Foldit」的启发 让哈萨比斯对蛋白质问题建立起坚定信心的关键契机,竟然来自一款「游戏」。
2008年,华盛顿大学的大卫·贝克(David Baker)教授团队开发了一款叫「Foldit」的游戏。它把复杂的蛋白质结构以三维拼图的形式显示在屏幕上,普通玩家用鼠标拖拽、扭转、折叠,尝试拼出最稳定的构型。接下来发生的事令人震惊。
科学家用超级计算机运算了十多年都没能解出的一种艾滋病相关酶的结构,被Foldit玩家们仅用三周就破解了。这些人没有生物学博士学位,就是普通人。他们只不过擅长在三维空间中识别物体的规律,凭直觉拼拼图罢了。哈萨比斯看到这条新闻,脑中闪过一道灵光。
「人类玩家靠直觉缩小庞大的搜索空间(Search Space),这不正是AlphaGo做过的事吗?」围棋的可能走法同样多过宇宙中的原子数,但AlphaGo没有穷举所有棋步,而是通过「价值网络」和「策略网络」这种直觉找到了通往胜利的路。在哈萨比斯眼里,蛋白质折叠不再是生物学问题。
它是一场「空间优化游戏」,一道「模式识别题」。即便没有生物学知识,只要有数据和奖励信号(Reward),AI就能做得比人类玩家好得多。对于游戏开发者出身的他来说,科学难题开始像是一头等待被攻略的「Boss怪物」。
AlphaFold项目的启动:「这是灯塔项目」 2016年AlphaGo击败李世石九段后,DeepMind内部围绕「下一步做什么」展开了激烈讨论。有人主张征服星际争霸之类更复杂的游戏,有人提议进军机器人领域。哈萨比斯却安静而果断地开始组建科学团队。
他把这个项目命名为「灯塔项目(Lighthouse Project)」。就像灯塔在茫茫大海上为迷航的船只投射光芒,这个项目要成为一个标杆,证明AI能给人类带来切实的帮助。
起步并不顺利。连DeepMind的核心工程师都持怀疑态度:「生物学不确定性太大了」「数据太脏,AI很难学」。哈萨比斯用他一贯的说服力鼓舞团队。
他召集了二十多岁的年轻研究员约翰·江珀(John Jumper)等少数精锐,组建了「AlphaFold」团队。目标一句话就能说清:「把棋盘上的胜利,搬到生命这块画布上来。」
哈萨比斯心里清楚:如果这个项目失败,DeepMind将只被记住为一家「做了个会下棋的机器」的公司;如果成功,那将是诺贝尔奖级别的发现。这是科学家哈萨比斯和企业家哈萨比斯同时押下的最大赌注。蛋白质的三维折叠结构
人工智能专家 金京镇律师
AI法律政策专家 · 前国会议员 · 著作等身
如果这本书曾在您身边短暂停留,请支持我们,让下一个故事得以问世。
(自愿赞助账户:韩国农协银行 302-1096-0948-81 户名:金京镇)
