AI书房
用书来读懂AI
这里收录金京镇律师的AI、法律、产业、历史、政治、文化主题在线书。每本书都按目录、序言、章节、尾声整理,方便连续阅读。
[AI书房] 第6章 十年的孤独投资
黄仁勋的故事
第6章 十年的孤独投资
金京镇
历史上每一次伟大的转折,都从一个人孤独的决断开始。凯撒渡过卢比孔河时,连他的军团士兵都没有真正理解这个决定意味着什么。他们眼前只有冰冷的水流和对岸的黑暗。
对黄仁勋来说,2006年就是他的卢比孔河。彼时他刚刚在玩家的欢呼声中登上显卡王座不久,却把公司的船头转向了一个没有人想去的方向。
GeForce 256成功之后,英伟达面前是一条坦途。
更炫的画面,更快的帧率,更多的玩家。光凭这些,公司就能持续增长。但黄仁勋的目光穿过了屏幕里巨龙喷出的火焰,落在了更远的地方。他看到的,是一片叫做「通用计算」的未知领域。
CUDA:华尔街嘲笑的豪赌
2006年末,黄仁勋做出了一个足以载入硅谷史册的决定,,发布一款软件平台,把GPU这个图形处理器从游戏专用设备改造成通用计算设备。
它的名字叫CUDA(Compute Unified Device Architecture,统一计算设备架构)。
要理解CUDA是什么,得先看看当时计算机的世界。那时候,电脑里有两种「大脑」。一种叫CPU,中央处理器,像班里什么科目都不错的班长。写作文也行,做算术也行,画画也行。但一次只能干一件事。
另一种叫GPU,图形处理器,像美术课上画画飞快的那个同学。GPU内部有几百、几千个小工人,能同时把无数个点、线和色彩撒到屏幕上。
黄仁勋想的是这件事:这几千个为画画而聚在一起的工人,如果同时去做数学题,会怎样?比起班长一个人一题一题地算,几千人一起上,不是快得多吗?
可这里有个问题。
要让几千个「美术工人」去做数学题,就得用他们听得懂的语言下命令。CUDA就是那套语言。
它相当于一个翻译官,让程序员用自己熟悉的C语言,就能指挥GPU里成千上万的小工人干活。
问题在于,这个决定眼下会给公司带来亏损。
黄仁勋决定,英伟达生产的每一块显卡,不管是给玩家的还是给专业用户的,全部内置CUDA功能。这在当时看来极其反常。
做芯片的时候,多加一项功能,芯片面积就会变大。
芯片变大,制造成本就上升,发热加剧,功耗也跟着涨。对打游戏的人来说,科学计算功能毫无用处。他们只想把怪物看得更逼真,并不想算分子结构。
可黄仁勋偏偏把这个看似多余的功能塞进了玩家购买的平价显卡里。
华尔街的反应已经不是冷淡,接近于愤怒了。
证券分析师们翻着英伟达的财报直摇头。
从2006年到2017年,大约120亿美元投进了研发。折合人民币超过一千亿元。
2014年,营收的30%以上流进了研发部门。其中相当一部分用来构建CUDA相关的软件生态。
投资者不停地追问黄仁勋:「这技术到底谁在用?市场在哪里?」在他们眼中,CUDA就是一头只吃钱不产出的怪兽。
股价一路下跌。2008年全球金融危机又撞了上来,英伟达的股价一度从高点暴跌超过80%。
董事会里也有人公开表达不满:「为什么不把这块业务砍掉?光做游戏,我们已经够成功了。」
分析师在报告里这样写:「CUDA只是一个成本中心,收益未经验证。英伟达应当回归游戏显卡这一核心业务。」
2009年到2015年,英伟达的市值在85亿到100亿美元之间徘徊。增长几乎停滞。华尔街给CUDA的估值是零,,认为它毫无价值。
黄仁勋没有退让。
他在会议室里反复说同一句话:「未来的计算是加速计算。光靠CPU跟不上速度。我们不走这条路,迟早会有别人走。」
黄仁勋看的是另一个时间尺度。CPU的性能提升正在逼近物理极限。半导体电路越做越小,也快到头了。曾经被奉为金律的摩尔定律,那个说计算机性能每隔一两年翻一番的规则,正在放慢脚步。
黄仁勋确信,突破这一极限的唯一办法是并行计算,也就是让成千上万个小计算单元同时工作。
那是一个孤独先知的呐喊。没有人相信他。但他正像罗马人在帝国各处铺设道路一样,提前修好了未来数据奔跑的高速公路。眼下这条路上还没有马车。
但他相信,终有一天,全世界的信息都会在这条路上飞驰。
把超级计算机交到科学家手里
华尔街嘲笑英伟达的时候,黄仁勋在见一群完全不同的人。他
们不是那些出入奢华派对的富豪。
他们是蹲在大学实验室角落里熬夜的穷科学家,是为研究经费叹气的研究生,是明明有理论想验证却苦于没有工具、只能干着急的年轻学者。
要理解他们的处境,得先看看当时科学计算的世界是什么样子。
假设有一位研究天气预报的科学家。要知道明天下不下雨,需要做极其复杂的计算,,大气温度、湿度、气压、风向和风速,全部代入数学公式去算。这些计算有多复杂呢?用普通电脑,跑好几天都算不完。
所以科学家们会用超级计算机。超级计算机是把几千台电脑连在一起、以惊人速度运算的机器。问题是,它贵得离谱。几亿元、有时几十亿元一台。只有国家或大企业才买得起。
没有钱的研究者怎么办?
他们向国家超算中心递交使用申请,然后等上好几个月。轮到自己的时候,能在有限的时间里借用一下。那还得算运气好。如果研究方向太冷门,或者所在机构的支持力度弱,排队号可能永远轮不到。
黄仁勋从这里看到了机会。
如果他造的一块GPU,算力能抵得上一台价值上亿元的超级计算机呢?如果在电脑城花几千块钱买一张显卡,就能做到过去要去国家超算中心排队才能做的事呢?
那就是计算力的民主化。
英伟达开始向全球大学和研究机构捐赠GPU,或以低价供应。同时免费发布了一款名为CUDA的软件。这就像罗马在征服的土地上修建引水渠,把水送到每一个角落。
水流过之后,荒地里冒出了嫩芽。
全世界研究生院的实验室里,开始整夜响起显卡风扇转动的声音。
研究分子结构的化学家、分析基因序列的生物学家、解读地震波的地质学家、探索宇宙起源的物理学家,纷纷买下了英伟达的芯片。
以前要花一周才能完成的计算,一天就跑完了。过去要等好几个月的模拟实验,现在可以在自己房间的书桌上运行。
黄仁勋回忆那段时期时说过这样一句话:「我们不是把显微镜递到科学家手里,而是让他们自己变成了望远镜。」
英伟达内部常常这样形容CUDA:
「CUDA,就是把你桌子底下那块游戏显卡变成一台低价超级计算机的开关。」
这句话背后的含义很深。
做研究不再需要等国家批准,不再需要去说服科研经费评审委员。
只要有一块显卡和CUDA,昨天还觉得不可能的事情,今天就能着手去做。
黄仁勋对这个还赚不到钱的社群倾注了全力支持。全球200多所大学开设了CUDA课程。他派工程师去帮开发者解决遇到的问题,还一个接一个地为研究者添加程序库,也就是预先编写好的代码工具包。
连英伟达自己的员工都感到困惑。
「我们为什么要帮物理学家解决问题?」
黄仁勋的回答斩钉截铁:「因为他们正在创造未来。」
他卖的不是硬件,而是在播种一个生态系统。
习惯了CUDA这门语言的科学家,很难再转用其他公司的芯片。
那不只是不方便的问题,而是意味着研究的中断。
这个生态系统后来成了英伟达坚固的护城河。护城河就是城堡外面挖的水沟,用来抵御敌人入侵。当竞争对手还在拼命追赶芯片性能的时候,英伟达已经建起了一个数十万科学家熟练使用的生态体系。
据说有一位量子化学家对黄仁勋说过这样的话:「Jensen,多亏了你的技术,我终于能在有生之年完成毕生的课题了。」黄仁勋听后深受触动。他后来回忆道:「如果这句话打动不了你,那你跟死人没什么两样。」
那是一次对使命感的确认,确认技术能够拓展人类知识的边界。在华尔街的嘲笑声中,支撑他坚持下去的,正是这样的时刻。
把一切押在市值为零的领域
商学院教科书里有这样一句话:
做市场需要的产品。调查需求,然后供应匹配需求的商品。这是商业的基本功。
黄仁勋做了一个正面违背这条原则的决定。
2006年CUDA刚推出时,用GPU做通用计算的市场规模是零。
没有人买这种东西。没有人认为自己需要它。黄仁勋偏偏把公司的命运押在了这个市值为零的领域。
他把它叫作「零亿美元市场」,然后说了这样一段话:
「我们决定在没有客户的地方造东西。因为没有客户的地方,也没有竞争者。」
这是一个极其吊诡的逻辑。
一般的企业家冲进竞争激烈的市场厮杀,想方设法抢别人的客户,围绕市场份额打得头破血流。黄仁勋却说:「我们不为市场份额而战。我们创造市场。」
这条路的痛苦难以言表。
2010年代初期,智能手机时代到来,移动芯片市场爆发式增长。英特尔、高通这样的公司在移动领域赚得盆满钵满。
很多人劝英伟达也去做移动芯片。英伟达确实做过一款叫Tegra的移动芯片,但黄仁勋最终决定从那个市场撤出。
「我们不是一家为了把别人都在做的事做得更好而存在的公司。我们存在,是为了去做别人做不了的事。」
他放弃了已经杀成一片红海的移动市场,选择了一块没人正眼瞧的荒地,叫AI计算。隔壁灯火通明、觥筹交错,他却独自一人在地里默默耕田。大概就是那种心境。
他的策略可以归结为三件事。
一是让硬件和软件一起进化。
每一代新GPU推出的时候,CUDA也随之升级。
Tesla、Fermi、Kepler、Maxwell、Pascal……GPU架构每向前迈一步,CUDA就同步扩展,去驾驭更多核心、更复杂的内存结构、更高的带宽。
二是构建生态系统。
不只是提供一门编程语言,而是做出科学家拿来就能用的工具,免费发放。线性代数库、深度学习库、图像处理库……一片在CUDA上运行的软件森林,就这样长了出来。
三是投入教育。
在大学、研究所、开发者大会上教CUDA。通过开发者论坛和示例代码,让一个人也能自学上手。
从账面上看,这些事全是亏本买卖。但黄仁勋盯着的,是积蓄中的势能。
需要并行运算的问题年年在增多。互联网上的数据量呈指数级增长。仿真、分析,以及一个当时连名字都还没叫响的领域(人工智能),正在吞噬越来越多的算力。
CUDA只是还没被点燃而已。黄仁勋做的事,是提前挖好一条水渠,等那股巨大的需求一涌而入。
终于,那个时刻来了。
2012年,加拿大多伦多大学发生了一件令人震惊的事。
Geoffrey Hinton教授的两名学生Alex Krizhevsky和Ilya Sutskever,在ImageNet人工智能大赛中取得了压倒性的胜利。他们打造的人工智能叫AlexNet。
AlexNet是一个能辨认照片中物体的人工智能。
在此之前,第一名和第二名的差距不过1到2个百分点。AlexNet却把第二名甩开了10个百分点以上,大获全胜。错误率从26%一下子降到了15%。
关键在于AlexNet是怎么训练出来的。
Krizhevsky在父母家的卧室里,用两块英伟达的游戏显卡GTX 580完成了AlexNet的训练。原本需要数千台CPU才能完成的计算,两块GPU就搞定了。他用的工具,正是CUDA。
计算机视觉领域的知名学者Yann LeCun评价这件事时说:「这是计算机视觉历史上一个明确的转折点。」
黄仁勋听到这个消息,凭直觉判断:「就是它。我们等的那一刻到了。」他立刻将公司的全部力量转向人工智能。「我们不再是一家图形公司,我们是一家人工智能公司。」
一夜之间,全球IT企业开始把目光投向英伟达。谷歌、Facebook、微软纷纷抢购GPU,用于人工智能研究。曾经被视为科学家玩具的东西,在这一刻变成了第四次工业革命的心脏。
2016年,黄仁勋又推出了一套划时代的系统:DGX-1,世界上第一台人工智能超级计算机。它将8块GPU连为一体,提供170万亿次浮点运算的能力,这在当时几乎难以想象。售价129,000美元,折合人民币约90万元。
黄仁勋在GTC开发者大会的舞台上首次发布这台机器时,观众的反应很冷淡。「没有掌声,没有兴趣,百分之百的困惑。」人们问:「这东西能装Windows吗?」
然而,有一个地方,旧金山的一家小型初创公司,看到了这台机器的价值。
那家公司叫OpenAI。当时由Elon Musk和Sam Altman领导的OpenAI,不过是一个非营利研究机构。但他们迫切需要DGX-1。
黄仁勋亲自把这台超级计算机装上车,送到了OpenAI的办公室。他自嘲是「DoorDash送货员」,亲手将机器交给了Elon Musk和Sam Altman。
这次配送不是一笔普通的设备交付。它是将建设未来人工智能帝国的种子交到对方手中。OpenAI用这台DGX-1训练了早期的语言模型,这成为日后ChatGPT诞生的关键起点。
假如十年前,黄仁勋顶不住华尔街的批评、放弃了CUDA,会怎样?假如他只顾追逐眼前的利润、一心扑在提升游戏性能上,今天的人工智能革命也许根本不会发生。又或者,它会晚很多年,从另一个人手里开始。
黄仁勋的十年,不是咬牙硬撑那么简单。
那是种子在黑暗的泥土里扎根的时间。表面上看不到任何变化,但在地底下,一个庞大的网络正在成形。由科学家、研究员、学生组成的英伟达军团,正在全球各个角落悄悄生长。
罗马不是一天建成的,英伟达的帝国也不是靠一颗华丽的芯片造就的。它建立在十年时光中、顶着嘲笑构筑起来的软件生态之上,建立在对未来坚定不移的信念这块基石之上。
黄仁勋这样说过:
「我们用三十年为这一刻做准备。看起来像是一夜成功,其实花了三十年。」
他那段孤独的投资,如今已化为人工智能工厂这场新工业革命的心脏,正在强劲跳动。没有英伟达的GPU,我们今天所享有的人工智能奇迹,或许根本不会存在。
这是技术的胜利。但在技术之上,它是一种忍受痛苦的人格的胜利。
正如黄仁勋自己所说:「伟大不是来自天赋,而是来自承受痛苦的性格。」把一切押注在市场价值为零的领域,这份近乎鲁莽的勇气,最终变成了改变世界的革命,回到了他身边。
准备工作已经结束。世界正如黄仁勋预见的那样,被一股巨大的漩涡卷入那个未来,势不可挡。
