AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第7章 大爆炸时刻
黄仁勋的故事
第7章 大爆炸时刻
金京镇
历史的河流改变方向的瞬间,往往悄无声息地降临。
没有盛大的号角,也没有预告。在某个小小的实验室角落,或是一个安静午后的对话中,改变人类命运的火种开始燃烧。2012年就是这样。
那一年,人们还在为智能手机的进步欢呼。游戏玩家沉醉于越来越炫目的画面。然而在加拿大多伦多大学的一间实验室里,后来被称为人工智能大爆炸的事件,正在悄然孕育。
2012年,AlexNet改变世界的那一天
故事从一场叫做ImageNet挑战赛的比赛说起。
ImageNet是计算机视觉识别领域的竞赛。
给计算机看一张照片,让它分辨那是猫还是狗,就是比赛的课题。对人类来说,这个判断如同呼吸般自然;对由0和1构成的机器来说,却像一道不可逾越的高墙。
几十年来无数天才发起挑战,识别准确率却始终提不上去。
当时计算机视觉领域的科学家们举步维艰。他们试图由人工编写算法来定义什么是猫、什么是狗的特征。耳朵尖就是猫,吐舌头就是狗,大致是这个思路。可世界上的猫和狗千差万别。固定的规则根本无法涵盖所有情况。
这时,多伦多大学的Geoffrey Hinton教授和他的学生们把目光投向了另一条路。
Alex Krizhevsky和Ilya Sutskever,这两个年轻人在导师的指导下尝试了一种激进的方法。他们重新拿起了一个古老的理论:模仿人脑神经网络的深层神经网络,也就是深度学习。
深度学习这个概念本身早已存在。它的核心是用计算机实现一种结构,让大量神经元像人脑一样相互连接、自主学习。理
论上很出色,现实中却有一个难题。处理如此庞大的运算需要惊人的算力。用传统的CPU方式,训练可能要花几个月甚至几年。正因如此,深度学习被挤到了学界的角落。
在这里,一个命运般的选择发生了。
研究团队决定不用超级计算机。他们把目光转向了龙山电子商城或百思买里谁都能买到的游戏显卡:英伟达的GeForce GTX 580。价格不过500美元出头。这块本来为渲染华丽游戏画面而生的芯片,竟会成为人工智能的钥匙,当时没人想到。
Alex把两块GTX 580并联起来,用黄仁勋六年前免费发布的编程语言CUDA来训练神经网络。训练是在Alex父母家的卧室里完成的。不是几百台服务器,而是桌上一台电脑,做了一场改变世界的实验。
用CPU要算好几个月的运算,短短几天就跑完了。因为GPU的数千个核心同时运转,并行处理矩阵运算。神经网络的核心计算与GPU的并行架构,契合得近乎完美。
2012年9月30日,ImageNet大赛结果揭晓。
他们打造的AlexNet一举将图像识别错误率从原来的26%拉到了15%左右。与第二名的差距超过10个百分点。这不是渐进式的进步。在计算机视觉专家们几十年来为降低0.1%而苦苦挣扎的年代,三个研究者用游戏显卡重写了历史。
会场陷入震惊。
纽约大学的Yann LeCun教授宣称,这一刻是计算机视觉史上一个清晰的转折点。人们追问AlexNet是怎么创造奇迹的。答案很明确:深层神经网络加GPU。沉睡了几十年的深度学习理论,遇上了英伟达显卡这台强劲的引擎,终于睁开了眼睛。
黄仁勋听到这个消息,浑身战栗。
他没有把这当成一条普通的比赛获奖新闻。他看到的是计算范式的根本性转变。他凭直觉意识到,AlexNet不只是一个图像识别工具。只要有输入和输出数据,它就能在无需人类编程的情况下自行学习其间的复杂关系。
只要数据充足,一台能学会世间一切规律的通用学习机器就此诞生。
他立刻下了结论:这就是未来。
周五晚上,他给全体员工发了一封邮件。我们不再是一家图形公司。我们现在是一家人工智能公司。
周一早上,英伟达以人工智能公司的身份重新出发。
只有做好准备的人才能抓住机会
有句话说,幸运女神只向有准备的人微笑。
AlexNet的成功看起来像是偶然,但背后浸透了黄仁勋近十年的汗水与泪水。正如前面章节所述,黄仁勋在2006年发布CUDA时,押上了公司的命运。
CUDA是一种编程工具,能让原本用于图形处理的GPU芯片做通用计算。黄仁勋相信,GPU不只是处理屏幕上的像素,还能用于科学运算和复杂的数学计算。但当时没人认可这个判断。
华尔街的投资者冷嘲热讽。
批评声纷至沓来:一家游戏公司,为什么要把大笔资金砸进只有科学家才用得上的超级计算编程语言?
CUDA虽然免费,用户却寥寥无几。
在英伟达内部,CUDA甚至被叫做「CUDA税」,被当作蚕食公司利润的累赘。股价一路跳水,CUDA发布次年的2007年暴跌了70%。
黄仁勋每次见投资者都会被追问同一个问题:你到底打算怎么靠这东西赚钱?他回答:现在还不知道。但我相信,它会改变计算的未来。
黄仁勋没有动摇。
他作为领导者做出了孤独的决断。哪怕放弃眼前的利润,也要为未来的计算环境铺好平台。他向全世界的大学和研究机构捐赠英伟达的GPU,教他们用CUDA。像一个播种的农夫,等待着有朝一日会在这个平台上绽放花朵的某个人。
他常说这样一句话:我们不建好,他们就来不了。
在没有客户的地方造一样东西,他的逻辑是:没有客户的地方也没有竞争者。凭着终有一天这项技术将攻克不可能问题的信念,他扛了整整十年。
借用他自己的话说,那是痛苦与磨难的十年。
黄仁勋观察到摩尔定律正在逼近极限。晶体管数量在增加,性能提升和能效改善却在放缓。他判断,以传统的CPU为中心的方式无法应对未来的计算需求。唯一的出路,是用并行方式处理任务的加速计算。
所以AlexNet团队能选用GTX 580绝非偶然。因为黄仁勋已经在全球铺设了数以亿计支持CUDA的GPU。Hinton教授的学生们等不起国家超算中心的排队配额。他们用街边商店买来的显卡,重写了人工智能的历史。
假如没有CUDA这个生态系统会怎样?研究者们恐怕还在跟复杂的硬件语言较劲,根本没底气去实现创新算法。正因为有文档、有示例代码、有开发者社区,他们才学会了CUDA。
黄仁勋将这一刻视为有准备之人的胜利。
他常说,自己要在没有市场的地方创造市场。这不是吹牛。在人工智能这个庞大市场尚未成形之前,他已经提前打造并打磨好了这个市场所需要的工具。2012年的大爆炸并非突如其来的爆发,而是长久积蓄的能量越过临界点后迸发出的必然结果。
想想罗马将军凯撒跨过卢比孔河的那一刻。他没有回头。
黄仁勋也一样。确认了人工智能的可能性之后,他做出了一个大胆的决定:把公司所有资源转向人工智能计算。
不仅是现有的显卡产品线,他还启动了专门为人工智能运算设计的数据中心芯片开发。
这等于宣告:抛弃游戏公司的身份,以人工智能计算公司的面貌重新诞生。
员工们也受到了巨大的冲击,但黄仁勋把整个组织对齐到了同一个目标上。他心里清楚,如果现在抓不住这个机会,英伟达就会永远只是一家零部件公司。
后来他这样回忆:搭建CUDA平台并转型为今天的计算平台,花了将近20年。5年、10年、20年,对我来说并不算长。
十年孤独的投入和准备,与2012年人工智能大爆炸相遇,英伟达由此驶上了爆发式增长的轨道。黄仁勋长久怀揣的那份有据可依的希望,终于变成了现实。
亲手把DGX-1送到OpenAI的人
时间来到了2016年。
人工智能研究已经走出大学实验室,成了硅谷巨头们争夺的战场。谷歌、Facebook、亚马逊在争夺人工智能霸权。而处于风暴中心的,是埃隆·马斯克和萨姆·奥特曼联合创立的非营利研究机构OpenAI。
OpenAI怀有一个宏大的目标:打造对全人类有益的安全人工智能。
但资源极其匮乏。旧金山一间简陋的办公室里,几名研究员聚在一起工作,说到底不过是个小型创业公司。他们需要巨大的算力,可谷歌和Facebook垄断了数千块GPU,留给他们的资源少得可怜。
黄仁勋精准地看到了他们的需求。
英伟达当时正在开发一台堪称全球首台人工智能专用超级计算机的设备:DGX-1。这台机器将8块顶级GPU高速互联,提供170万亿次浮点运算能力。重量达32公斤,零部件超过3.5万个。仅开发费用就投入了超过20亿美元,是英伟达技术的结晶。
他在GTC大会的舞台上首次展示DGX-1时,反应冷淡。黄仁勋这样回忆当时的情景:没有掌声,没有关注,只有百分之百的困惑。人们只是问「这是什么」「能装Windows吗」。
12.9万美元的价格、庞大的体积、陌生的用途,没人下单。就在那时,一只手举了起来。
是埃隆·马斯克。他对黄仁勋说:我们用得上。黄仁勋笑着回忆道:我的第一个客户竟然是非营利组织,听到这话的时候,感觉脸上的血色一下子全没了。
但黄仁勋没有犹豫。
他把第一台出厂的DGX-1亲自搬上了自己的车,驶向旧金山的OpenAI办公室。他没有派快递员。因为他不想以送货员的身份出现,而是要以这项技术的创造者身份,亲手把它交到最能发挥其价值的创新者手中。
他把自己比作DoorDash的外卖员:我提着一个箱子,一路开到旧金山,亲手交给了埃隆。
2016年8月,OpenAI办公室。
埃隆·马斯克、萨姆·奥特曼、格雷格·布罗克曼和伊利亚·苏茨克维正在等着。
伊利亚·苏茨克维,就是四年前打造AlexNet、引爆人工智能大爆炸的那位年轻人。如今他已是OpenAI的核心研究员。
黄仁勋穿着皮夹克出现了。他手里握着一支银色马克笔,在DGX-1的机箱上写下了这样一段话。
致埃隆和OpenAI团队。为了计算与人类的未来。赠上全球首台DGX-1。
记录下这一幕的照片,成为了科技史上的经典画面。穿皮夹克的黄仁勋在签名,双臂交叉、满脸欣慰注视着的埃隆·马斯克,还有围在一旁的研究团队。每个人都像孩子收到圣诞礼物一样兴奋。
这次送货绝非一次普通的设备交付。
如果说过去的计算是忠实执行人类输入指令的计算器,那么从这一刻起,计算扮演的角色变了:它成了催生能自主学习、自主推理的智能体的助产士。黄仁勋卖出去的不是一台机器,而是送给未来研究者们的一份时间。
有了DGX-1,OpenAI的研究速度飞跃式地加快了。
据伊利亚·苏茨克维的证言,研究实验被提前了好几周。以前不可能做的实验变成了可能。训练时间从数月缩短到了数天。
研究员们用这台机器训练了早期的语言模型。一位名叫安德烈·卡帕西的研究员在当时的视频中说:我们计划用DGX来训练大规模语言模型。总有一天,我们能像人一样和计算机对话。
他的预言成真了。六年后的2022年,OpenAI向全世界发布了ChatGPT。席卷全球的生成式人工智能时代由此开启。这项技术的胚胎,正是孕育于2016年黄仁勋送出的那台超级计算机之中。
黄仁勋记得那天那间简陋的办公室。
一个小房间里,聚着几位天才。他们在憧憬未来,而我想把他们需要的工具交到他们手上。
他从不把客户看成购买商品的消费者,而是把他们视为一起开创新产业的战友,视为能证明英伟达技术极限在哪里的先行者。
后来在采访中,他谈到自己亲手打造的工具被交到那些改变世界的天才手中时的那种激动。
DGX-1在当时售价高达12.9万美元。但黄仁勋透过它看到的是10年、20年之后的未来。他卖出的不是一件硬件,而是把「人工智能工厂」这个概念植入了世界。
借用他自己的话:我们想把超级计算机缩小到一块芯片里。而现在,我们正在让整个数据中心像一块芯片一样运转。
历史还在继续。
2025年10月,黄仁勋再次亲自给埃隆·马斯克送货。这回是在得克萨斯州Starbase火箭发射场。在全世界最大的火箭旁边,他递上了全世界最小的超级计算机DGX Spark。
他开了个玩笑:把最小的超级计算机,送到最大的火箭旁边。
2016年的那次送货和2025年的这次送货之间,隔了9年。
2016年,那是对未来的投资。2025年,那是一个掌控当下的帝国的模样。英伟达的市值已突破4万亿美元,全球所有企业都在排队抢购英伟达的芯片。
但连接这两个时刻的,是同一种哲学:如果有开发者说需要GPU,回答必须是Yes。
2012年AlexNet的发现,2016年与OpenAI的合作,这两个时刻称得上英伟达历史上的大爆炸。
这是一个完美的例子,展示了一个有准备的人遇到机遇时,能释放出怎样惊人的能量。
华尔街的嘲笑声里,黄仁勋没有停下对未来的投入。那些隐忍的岁月,最终把他从硅谷的边缘推向了人工智能革命的核心。
他不再是那个做游戏配件的公司老板了。他成了即将到来的人工智能时代的基础架构师,成了新一轮工业革命的引擎供应商。
他这样说:我们为这一刻准备了三十年。我们相信加速计算终有一天会改变世界的一切,凭着这一个信念,熬过了那些痛苦的日子。现在,那个未来到了。
历史,就这样在一个有准备的人指尖被重新书写。
