上周,正值中国农历新年即将开始,中国大部分地区将关闭七天之际,官方媒体向科技初创公司 DeepSeek 致意,该公司发布了一款名为 R1 的新低成本、高性能人工智能模型,引发了华尔街科技股的大幅抛售。中央电视台播放了 DeepSeek 戴眼镜的创始人梁文锋与中国政府排名第二高的官员李强会面的画面。几天前,由中国共产党运营的英文新闻网站《中国日报》赞扬了 DeepSeek 的成功,其成功打破了美国对用于训练人工智能模型的高性能半导体芯片出口的限制,称其为“并非孤立现象,而是中国人工智能生态系统整体活力的反映”。仿佛为了强化这一点,周三,在蛇年第一天,中国科技巨头阿里巴巴发布了其自己的新人工智能模型,该公司声称该模型“几乎在各个方面都优于”来自 OpenAI 和 Meta 等美国公司的竞争产品。
阿里巴巴的声明尚未得到独立验证,但受 DeepSeek 启发的库存抛售引发了许多评论,讨论了该公司如何取得突破、美国在人工智能领域的领导地位是否持久,以及试图通过限制高科技出口来减缓中国科技产业的智慧——这一政策既是特朗普第一任政府也是拜登政府都遵循的。在世界经济论坛达沃斯分论坛上,微软首席执行官萨提亚·纳德拉将 R1 描述为“非常令人印象深刻”,并补充说,“我们应该非常非常认真地对待中国的发展。”而在硅谷,反应则不那么热烈。OpenAI 表示它正在“审查 DeepSeek 可能不当提炼我们模型的迹象”。这家中国公司声称,它只花了 560 万美元的计算能力来训练其新模型之一,但 Anthropic 的首席执行官达里奥·阿莫迪,另一家美国人工智能公司,将这一成就描述为仅仅是“持续成本降低曲线上的一个预期点”,美国公司很快就会赶上来。 阿莫迪承认中国公司“率先展示了预期的成本降低”的新颖性,他还认为,DeepSeek 的进展使“出口管制政策比一周前更加具有生存意义”。
这些评论表明,你如何看待 DeepSeek 的故事部分取决于你的视角。为了从太平洋的另一边获得一个非官方的观点,我安排了一个 Zoom 通话,与路易斯-文森特·加夫(Louis-Vincent Gave)进行,他是香港一家金融服务公司 Gavekal 的联合创始人,是一位长期观察中国的专家。加夫今年五十岁,原本来自法国,于 1997 年移居香港,当时英国刚刚将这个前殖民地交还给中国。他一直住在这里,分析并撰写关于中国如何成为世界第二大经济体以及最大商品出口国的非凡转型。周一,当一家美国半导体公司英伟达(Nvidia)——其生产的高端芯片是美国大多数人工智能公司所依赖的——市值缩水超过五千亿美元时,加夫向其公司的客户——包括全球的投资银行、对冲基金和保险公司——散发了一篇题为“又一个斯普特尼克时刻”的评论文章。 (“斯普特尼克时刻”这一说法最早是由硅谷风险投资家马克·安德森斯对 DeepSeek 提出的。)鉴于中国在计算机工程和基础科学研究方面的强大实力,盖文的文章称,“与中国进行技术战总是显得目光短浅。”在我们的对话中,他重申了这一观点,并表示对中国实施出口限制是一个大错误,因为“这迫使它们非常专注。”
获取新闻与政治简报
来自华盛顿及其他地区的最新消息,涵盖时事、经济等内容,由我们的专栏作家和通讯员撰写。
盖夫提到的这场斗争始于 2018 年,当时特朗普政府以国家安全为由,禁止向一家中国电信公司和芯片制造商出口某些关键的半导体组件。拜登政府多次加强这些限制,特别是针对英伟达制造的最强大的芯片。在上个月宣布最新一套规则时,就在特朗普第二次就职典礼前一周,时任商务部长吉娜·雷蒙多表示,“美国现在在人工智能领域领先世界,无论是在人工智能开发还是人工智能芯片设计方面,保持这种领先地位至关重要。”然而,到了那时,DeepSeek 已经发布了其 V3 大型语言模型,并且即将发布其更专业的 R1 模型。该公司表示,它使用的是不会违反美国出口禁令的低端英伟达芯片来开发这两个模型的。
“DeepSeek 是顺应了限制,还是因为限制才发生的?”盖问道。为了回答自己的问题,他追溯到了过去,提到了虎式 1 型坦克,这是二战期间德国部署的坦克,尽管其汽油发动机比英国和美国使用的柴油发动机功率更低、燃油效率更低,但仍优于英美军型。“我想你可以从历史上找到数百个例子,说明需要是发明的母亲,”他说。“你建一道十英尺高的墙;我会建一道十一英尺长的梯子。中国就是这样做的,而且每个人都感到惊讶。”
来自《纽约客》的视频
Swift Justice: 一个塔利班法庭的会话
美国科技行业的一些人也发表了类似的评论。在 X 平台上,前英特尔首席执行官帕特·盖尔辛格写道:“工程学就是关于约束。中国工程师资源有限,他们必须找到创造性的解决方案。”这些变通方法似乎包括限制 DeepSeek-R1 相对于同类模型的计算次数,以及利用中国公司现有的芯片以最大限度地发挥其性能。在 X 平台的另一篇帖子中,OpenAI 联合创始人、前特斯拉人工智能主管的著名计算机科学家安德烈·卡帕西表示,DeepSeek 通过在一个“小气”的预算上训练一个“前沿级”的大型语言模型 ,“让它看起来很容易”。
尽管“施加资源约束能激发创新”的理论并非普遍接受,但它确实得到了其他行业和学术研究的部分支持。一项2014年对瑞士制造商的研究发现了支持这一假设的证据。最近,在一项于12月发表的对美国软件初创公司的研究中,哈佛商学院和德克萨斯大学奥斯汀分校的两名研究人员发现,那些在发展后期才获得外部资金的公司往往“在技术上进行了更多实验,并且更有可能对其技术栈进行更重大的改变”。
证据远未确凿;直观的反驳观点是,拥有充足的技术和金融资源比资源匮乏的条件更能促进实验。但是,无论如何,Gave 坚持认为许多西方人极大地低估了中国企业创新的能力,而不仅仅是模仿。他说这种趋势现在在许多行业都很明显,包括核能、铁路、太阳能电池板和电动汽车 ,其中总部位于深圳的比亚迪已经取代特斯拉成为全球最大的电动汽车生产商。事实上,Gave 将人工智能与汽车行业进行了直接比较。“我听到了所有那些批评,如果没有 OpenAI,DeepSeek 就不可能发生,但你也可以对汽车公司说同样的话,”他说。“比亚迪如果没有特斯拉就不会在这里。当然,当然。但事实仍然是比亚迪在这里。” “而且,这是一款更便宜的车。” 埃隆·马斯克可能会激烈地反对这个最后的断言,但毫无疑问,DeepSeek 的突然出现,紧随比亚迪和其他中国电动汽车制造商崛起之后,引发了一些尴尬的问题。“这是一个给西方的警钟,没有哪个行业是百分之百安全的,”Gave 说。他接着说,在美国人工智能产业,人们曾认为如果你在人工智能硬件上投入足够多,你就能创造一个巨大的护城河和持久的垄断。“这种信念也被打破了,”Grave 补充道。
我问了他将向华盛顿的新政府提供什么样的政策指导。“我的工作不是告诉政策制定者该做什么,”他说。“我的工作是说,好吧,这种情况正在发生,我们如何从中赚钱?”尽管如此,Gave 还是提供了一些间接的建议。“第一件事是承认中国现在在各个行业正超越西方的现实,”他说。在他看来,这种成功反映了这个国家的一些基本特征,包括它培养的数学、科学和工程学生人数是前五个西方国家总数的两倍;它拥有庞大的国内市场;并且它的政府为工业企业提供广泛的支持,例如,依靠该国的银行向它们提供信贷。“他们说,‘不再向房地产贷款。我们需要成为一个工业强国。’”
Gave 的论点是,这一策略已经成功,DeepSeek 的出现是最新也是最戏剧性的证据。在我们交谈期间,他的态度严肃但也带着一丝戏谑。他提到,当他偶尔在 YouTube 上发布关于中国经济发展的论点时,评论中会有人指责他在散布中共的 Propaganda。这似乎让他感到好奇而不是担心。“谈到中国,有一种情感反应让人们难以接受简单的事实,”他说。 ♦