

听1.0x
在 hark 上听更多故事
又一天,又一个号称优于所有先前 AI 大型语言模型的新产品。当我开始写这个故事时,埃隆·马斯克的 xAI 刚刚发布了 Grok 3,该公司 声称 在广泛的基准测试中表现优于竞争对手。在我修改这篇文章时,Anthropic 发布了 Claude 3.7 Sonnet,它 声称 超过 Grok 3。到您读到这篇文章时,谁知道呢?也许已经出现了全新的 LLM。毕竟,在 1 月,AI 世界被中国发布的一个低成本、高性能的 LLM 暂时震动,它被称为 DeepSeek-R1。一个月后,人们 已经在猜测 DeepSeek-R2 何时才会推出。
探索2025年5月号
查看更多内容,找到你的下一个阅读故事。
大型语言模型之间的竞争可能难以追踪,但对于英伟达公司——这家设计了许多大型语言模型训练所使用的计算机芯片或图形处理单元(GPU)的公司——来说,这同时也是极其赚钱的。截至本文写作时,英伟达是世界上第三大最有价值的公司(仅次于苹果和微软),这家公司是由一群希望为游戏玩家制作显卡的工程师三十年前创立的。它如何演变成为人工智能淘金热提供几乎所有工具的公司,是斯蒂芬·威特所著的《思考机器》一书的核心故事。 思考机器这本书被框定为对英伟达有史以来唯一的 CEO 黄仁勋的传记,它也是更有趣和揭示性的:一个窗口,展示了导致超级强大人工智能出现的知识、文化和经济生态系统。
当然,这个生态系统的中心是硅谷,黄仁勋在那里度过了他成年后的大部分时间。他出生在台湾,是化学工程师和教师的儿子。5岁时,全家搬到了泰国,几年后,他的父母为了躲避政治动荡,将他和他哥哥送到了美国。最终,他的父母也搬到了美国,黄仁勋在俄勒冈州波特兰的郊区长大。20世纪80年代初,他在俄勒冈州立大学主修电气工程(当时该校没有计算机科学专业),之后在超威半导体公司找到了一份工作。这家公司——当时是芯片巨头英特尔贫穷的表亲——总部位于加利福尼亚州的桑尼维尔,靠近101号美国国道,这条公路从圣何塞延伸到斯坦福。从那时起,黄仁勋的职业生涯都在那间办公室五英里范围内展开。
黄仁勋很快离开了 AMD,加入了一家名为 LSI Logic Corporation 的公司,该公司为芯片架构师开发软件设计工具,然后在 1993 年离开 LSI,与芯片设计师库尔特·普里姆和克里斯·马拉克夫斯基一起创办了英伟达:他正是“到三十岁前创办一家公司”的目标,正如他之前告诉他们他想那样做一样。该公司正进入一个拥挤的市场,用于开发显卡,这是一种用于渲染图像和视频的计算机硬件。英伟达没有真正的商业计划,但黄仁勋在 LSI 的老板向他推荐了红杉资本。红杉资本是山谷里最重要的一家风险投资公司,帮助该公司起步。
显卡业务建立在永无止境的升级周期之上,迫使开发人员进入一场永无止境的性能提升游戏:一家公司的好坏取决于其最新的显卡。在那些早期,英伟达在某个时刻差点破产,其非正式的座右铭变成了“我们的公司再过三十天就要倒闭了。”
给人一种印象,黄仁勋喜欢这样。他说他在压力下心率会下降,而称他为不知疲倦的工作者则是对情况有所低估。“我应该确保自己从工作中得到足够的疲惫,以至于没有人能在深夜把我叫醒,”他曾经说过。他的阅读范围包括商业书籍(他很快就啃完了)。他没有明显的政治倾向(或者至少从不讨论它们)。他不是一个浮夸的慈善家。虽然他致力于家庭,但他也很诚实:“洛里,”他谈起自己的妻子,“他们两个孩子的养育有百分之九十是她负责的。”在过去30年里,他的生活显然围绕着英伟达旋转。
黄仁勋不愿谈论自己,这让维特很难将他栩栩如生地呈现出来。但英伟达的员工几乎都称呼他的名字,他们热情洋溢。维特写道:“他们崇拜他——我相信如果他在摩天大楼的窗户上看到市场机会,他们会跟着他跳下去。”他后来补充说,他们把黄仁勋“不仅看作是领导者,还看作是先知。黄仁勋是一个预言家,他做出了关于某些事情的预言。然后那些事情都实现了。”他脾气暴躁——在公司里被称为“黄仁勋的愤怒”——而且因公开长时间斥责犯了错误或未能达标的员工而臭名昭著。但他很少解雇人,实际上,他激发了强烈的忠诚。他的一位关键下属说:“我有时害怕黄仁勋。但我也知道他爱我。”
黄仁勋作为 CEO 最大的优势在于他愿意在机会出现时做出大胆且冒险的赌注。第一次机会出现在他改变英伟达芯片的架构,从串行处理改为并行处理。Witt 称此举为“一场激进的赌博”,因为在那时之前,没有公司能够将并行处理芯片的销售变成一个可行的生意。
串行计算是您计算机中央处理器的工作方式:它一次执行一条指令,非常非常快。Witt 将其比作告诉一辆送货卡车按顺序递送包裹。相比之下,“英伟达的并行 GPU 更像是一队摩托车在城市中散开,”司机们大致同时递送每个包裹。实现并行处理所需的编码要复杂得多,但如果你能做到,你就能获得巨大的计算能力。
最初,这些强大的功能主要用于让电脑游戏看起来和运行得更好。但后来黄仁勋又冒了另一个大风险,重新设计了英伟达的 GPU,使其也能够处理科学家可能会使用的大规模数据集。正如一位英伟达高管所说:“你这边有一张视频游戏卡,但它上面有一个开关。所以你一拨这个开关,把卡翻过来,突然之间这张卡就变成了一台超级计算机。”
这个决定中最有趣的是,黄仁勋不知道可能会有谁想要以图形卡的名义购买一台超级计算机,也不知道这样的人有多少。他只是赌了一把,如果你把强大的工具提供给人们,他们会找到这些工具的用途,并且规模足以证明数十亿美元投资的合理性。
那项使用——而且规模很大——最终被证明是人工智能,特别是神经网络技术。正如维特所说,正如并行处理正在改变计算,一场类似的革命正在人工智能研究中发生——尽管英伟达的任何人都没有注意到这一点。人工智能经历了一系列繁荣与萧条的周期,研究人员尝试了不同的技术,所有这些最终都失败了。其中一种方法是神经网络,它试图模仿人脑,并允许人工智能自行进化新的学习规则。当你用包含大量图像和文本的数据库训练这些网络时,随着时间的推移,它们可以识别模式并变得更聪明。神经网络长期以来一直处于边缘,部分原因是它们是黑匣子(你无法解释人工智能是如何学习的,或者它为什么这样做),部分原因是制造高性能神经网络运行所需的计算能力遥不可及。
并行处理 GPU 改变了这一切。突然间,如果 AI 研究人员能够编写出充分利用芯片的软件,他们就能获得足够的计算能力,使神经网络以惊人的速度发展。2009 年,AI 研究领域的先驱之一杰夫·辛顿(Geoff Hinton)在一场机器学习专家会议上告诉与会者去买英伟达的显卡。2012 年,辛顿的一名学生亚历克斯·克里希夫斯卡亚(Alex Krizhevsky)将两块英伟达 GPU 连接起来并构建和训练了 SuperVision(后来他将其更名为 AlexNet)。这是一个能够首次以惊人的准确率识别图像的 AI 模型,这主要是因为,用威特的话说,“GPU 在半分钟内完成的工作,需要一台英特尔机器一个小时才能完成,而需要生物学上百万年才能完成。”
黄仁勋并没有立刻意识到发生的事情的重要性。当他在 2013 年发表在英伟达年度 GPU 技术大会的演讲中时,他从未提到神经网络,而是谈论了气象建模和计算机图形。但几个月后,在英伟达研究员布莱恩·卡塔扎罗向他直接推销人工智能的重要性之后,黄仁勋经历了沃特所说的“大马士革启示”:他在一个周末里下了一笔大赌注,基本上将英伟达从一家图形公司转型为一家人工智能公司。这笔赌注比他早期的赌注风险要小,因为尽管英伟达有竞争对手也在制造 GPU,但它们中没有任何一家真正设计它们的 GPU 用于超级计算机。尽管如此,全力以赴是富有远见的——像大型语言模型这样的发展尚未起飞——这也是将英伟达变成一家近 3 万亿美元公司的原因。
那个周末感觉像是英伟达故事的浓缩高潮,但这并非经验之谈。随后的 12 年充满了非凡的事件,也带来了惊人的利润,因为英伟达不断改进其芯片,满足了由 LLMs 出现而引发的无法满足的计算能力需求,并抵御着竞争对手(其中许多是英伟达的顾客, 现在正在构建自己的芯片 )。但当黄仁勋决定根据他的 AI 洞察采取行动时,为这一转型以及所有后续事件奠定基础的条件已经成熟。
那些基础, 思考机器明确指出,并非由英伟达单独奠定。事实上,Witt 的关键贡献之一是表明,英伟达的成功不能脱离硅谷的文化和经济(以及更广泛的技术)。以自由劳动力市场这一简单事实为例。正如学者 AnnaLee Saxenian 所著名论述的那样,硅谷成功的一个催化剂是一种自由奔放、敢于冒险的文化,这种文化鼓励工人离开公司去竞争对手那里或创办自己的公司。而这部分依赖于加利福尼亚州非竞争条款不可执行的事实。英伟达的历史证明了这一点:不仅是黄仁勋的流动性,他早期雇员的流动性也是如此。后来,该公司最喜欢的一种策略是挖走竞争对手的最佳工程师和程序员——也许不太道德,但是一种好的商业策略。
英伟达也受益于政府和大学进行的研究投资。例如,在解锁并行计算能力方面取得的一项关键突破,是一种名为 Brook 的开源编程语言,由一位游戏玩家和斯坦福大学研究生 Ian Buck 于 2003 年与一组研究人员开发,并依靠国防部拨款。Alex Krizhevsky 和他的合伙人 Ilya Sutskever(后来帮助创立了 OpenAI)在 Krizhevsky 设计 AlexNet 时,都是多伦多大学的研究生。该模型展示其准确性的比赛,ImageNet 挑战赛,是由一位名为 Fei-Fei Li 的斯坦福大学计算机科学家设计的。正如这个阵容所展示的那样(Krizhevsky 和 Sutskever 出生于苏联,Li 出生于中国),移民不仅是英伟达的历史核心,也是人工智能普遍的历史核心。
生态系统的实际经济特征也同样重要。最重要的是独立芯片代工厂的兴起:这些工厂服务于许多不同的公司,并根据订单生产芯片。英伟达与台湾半导体制造公司(这些工厂中最著名的一家)的合作,使其通过专注于为其芯片设计和编写软件,成为主导者;英伟达不必投资实际生产,这将需要巨额资本。
最后,英伟达受益于耐心,以及其董事会愿意将长期思维置于短期利润之上。由于游戏市场,英伟达几乎总是盈利的公司,但其股价两次下跌了近90%;在互联网泡沫破裂后,它花了整整10年才升值,而公司正在花费数十亿美元将其显卡变成超级计算机。美国资本主义的熟悉指责之一是它过于关注短期。至少在科技行业,英伟达(以及其他许多公司)的轨迹表明,这是一种恶毒的诽谤。
毋庸置疑,黄仁勋本人对英伟达的成功至关重要:他基本上独自领导着公司(正如维特所说,他“没有副手,没有管家,没有第二指挥官”),并且他做出了大胆的决策。更重要的是,他似乎毫无疑虑地这样做。人工智能行业中的许多人——包括训练 LLMs 的人——都表达了对人工智能危险的担忧,但黄仁勋不是其中之一。维特写道,对他来说,“人工智能是一种纯粹的进步力量”。黄仁勋不担心它可能会夺走我们所有的就业岗位,或者取代艺术家,或者失控并决定消灭人类。
事实上,当维特因对人工智能将如何改变世界而感到存在主义焦虑时,他询问黄仁勋是否值得考虑其中的一些担忧,黄仁勋便受到了他传奇般抨击之一:
“它会摧毁就业岗位吗?”黄仁勋问道,他的声音愤怒地逐渐升高。“计算器会摧毁数学吗?这种对话太老了,我真是受够了,”他说。“我不想再谈论它了……我们使事物的边际成本在每个世代后都变为零,而这场对话每次都会发生!”
你可以将其视为厄普顿·辛克莱的名言“当一个人的薪水取决于他不理解某事时,很难让他理解这件事!”的一个例子。但黄仁勋以“边际成本”来谈论人工智能,这不应被简化为单纯的投机:它与他在 Nvidia 创业之初就展现出的那种对性能的专注一脉相承。在某个时刻,威特称黄仁勋为“有远见的发明家”。然而,黄仁勋所痴迷的愿景,似乎与其说是宏伟的未来目标,不如说是工具——关于如何尽可能高效地制造最快、最强大的芯片。“生存风险”在他的愿景中毫无立足之地。黄仁勋对人工智能毫不掩饰的立场,以其独特的方式令人振奋,尤其是在与许多人工智能领袖的公开担忧形成鲜明对比时,他们一边为 LLMs 的危险而忧心忡忡,一边又继续开发它们。但实际上,他正在做出有史以来最大、风险最高的赌注——不仅是为了 Nvidia,也是为了我们所有人。希望他是对的。
本文发表于《2025年5月》印刷版,标题为“科技新王”。
当您通过此页面上的链接购买书籍时,我们会获得佣金。感谢您支持 《大西洋》。