DeepSeek’s ‘Tech Madman’ Founder Is Threatening US Dominance in AI Race

这家公司的突然崛起表明,尽管华盛顿试图放缓其发展速度,但中国的人工智能产业依然蓬勃发展。

DeepSeek创始人Liang Wenfeng 2月份在北京会见国家主席习近平 DeepSeek创始人Liang Wenfeng 2月份在北京会见国家主席习近平。 摄影师: Florence Lo/Reuters

FacebookXLinkedInEmailLink 礼品 FacebookXLinkedInEmailLink 礼品 By Bloomberg Businessweek 2025年5月13日 晚上9:00 UTC 加入书签保存

Liang Wenfeng 身材瘦削,风格内敛,在会议上可能会显得有些害羞,甚至有些紧张。作为 DeepSeek 的创始人——这家中国初创公司最近颠覆了人工智能领域——他说话时容易结巴,也经常长时间沉默。但新员工很快就会明白,不要把他的安静沉思误认为是胆怯。一旦 Liang 理解了讨论的要点,他就会提出关于模型架构、计算成本以及 DeepSeek 人工智能系统其他复杂之处的精确且难以回答的问题。

员工们称 Liang 为 lǎo bǎn,即“老板”,这是在中国对商业上级表示尊重的常见方式。不寻常的是,他们的 lâobân 如何授权年轻研究人员,甚至实习生承担大型实验项目,习惯性地到他们的办公桌旁询问最新情况,并推动他们考虑不寻常的工程路径。“技术性越强的对话越好,特别是如果它能带来真正的性能提升,Liang 还会亲自在他们的内部 Lark 消息频道上分享这些里程碑。”一位前 DeepSeek 员工说,像许多接受本文采访的人一样,他要求匿名,因为他们没有获得公开发表关于公司的言论的授权。“他是一个真正的书呆子,”这位前 DeepSeek 员工说。“有时,我觉得他比他的研究人员更了解研究。”

今年 1 月,Liang 和他的年轻公司一鸣惊人,发布了 R1,这款 AI 模型给人一种爆炸性突破的感觉。R1 在通常用于评估 AI 性能的几项标准化测试中击败了占据主导地位的西方公司,但 DeepSeek 声称其基础模型的构建成本仅为 OpenAI 的 ChatGPT 基础模型 GPT-4 估计成本的 5% 左右。

测试结果引发了美国市场 1 万亿美元的抛售,并引发了关于美国利用出口管制来减缓中国在 AI 领域进展的战略的棘手问题。Amazon 和 Microsoft 竞相将 DeepSeek 的模型添加到他们的云服务中,同时还添加了 Meta 和 Mistral AI 的竞争对手的模型。“基本上在一个周末,对 DeepSeek 的兴趣猛增,以至于我们立即采取了行动,”负责 Amazon.com Inc. 语言模型市场的 Atul Deo 说。

DeepSeek 拨开了笼罩在美国人眼中大部分中国 AI 景象的迷雾:笼罩在神秘之中,更容易被视为被夸大的幽灵,但很可能比他们愿意承认的更令人生畏。在这家初创公司出现之前,许多美国公司和政策制定者都持有令人欣慰的观点,认为中国仍然大大落后于硅谷,这让他们有时间为最终的平起平坐做准备,或者阻止中国实现这一目标。

现实情况是,DeepSeek 所在的杭州和其他中国高科技中心一直在涌现出小型 AI 巨头,正如 AI 初创公司通常被称为的那样。来自中国本土初创公司(例如 MiniMax 和 Moonshot AI)的先进聊天机器人迅速普及,包括在美国。Alibaba Group Holding Ltd. 的 Qwen 大型语言模型系列 始终在 Google 和 Anthropic 的 LLM 中名列前茅;Baidu Inc. 的首席执行官 Robin Li 在 4 月份吹嘘说,由于其新的超级计算机(由内部芯片组装而成),该搜索巨头可以开发出与 DeepSeek 一样好但 甚至更便宜的模型。Huawei Technologies Co. 也因其旨在与 Nvidia Corp. 的设备竞争的产品而广受赞誉,Nvidia Corp. 的图形处理单元 (GPU) 为美国和欧洲最先进的 AI 模型提供动力。

不久前,中国共产党还在 削减 它认为失控的科技行业的翅膀。反垄断调查和数据合规审查已经启动,像 Alibaba 联合创始人 Jack Ma 这样的知名人士 淡出公众视野,并且对社交媒体、零工经济和游戏应用实施了新的法规。现在,为了应对外国的干扰,中国共产党正在支持其国内科技行业。国家主席习近平正在调集资源用于 AI 和半导体,鼓励中国的高技能劳动力,并呼吁建立“独立、可控和协作”的软件和硬件生态系统。

具有讽刺意味的是,旨在减缓其 AI 发展势头的地缘政治限制也在推动中国最近的进步。Counterpoint Technology Market Research 的分析师 Wei Sun 表示,美国和中国之间的 AI 差距现在以月为单位衡量,而不是以年为单位衡量。“在中国,有一种集体道德和愿意努力工作的意愿,这导致了卓越的执行力,”Sun 说,他指出,Nvidia 芯片的强制稀缺性催生了新颖的 AI 创新。“这种动态创造了一种达尔文式的压力:生存属于那些能以更少的资源做更多事情的人。”

在中国看到创新的地方,美国的许多人仍然怀疑存在不法行为。众议院一个两党委员会在 4 月份发布的一份报告中声称,DeepSeek 与中国政府之间存在“重大”联系,并得出结论认为该公司非法窃取了 OpenAI 的数据,并对美国国家安全构成了“严重威胁”。Anthropic 首席执行官 Dario Amodei 呼吁美国加强出口管制,他在一篇 3,400 字的博客文章 中辩称,DeepSeek 肯定走私了大量的 Nvidia GPU,包括其最先进的 H100。(彭博新闻社 最近报道 说,美国官员正在调查 DeepSeek 是否通过新加坡的第三方购买了被禁止的芯片来规避出口限制。)

展开 Dario Amodei Anthropic 首席执行官 Dario Amodei 以 DeepSeek 为例,呼吁对中国实施更严格的芯片出口限制。摄影师:Chesnot/Getty Images

中国大使馆驳斥了众议院委员会的说法,称其“毫无根据”。Nvidia 表示,DeepSeek 的芯片符合出口规定,更多的限制可能会使中国半导体受益。这家芯片制造商的一位发言人表示,强迫 DeepSeek 使用更多来自中国的芯片和服务将“提振 Huawei 和外国 AI 基础设施提供商”。

这场辩论中心的这家公司仍然是一个谜。DeepSeek 以开源其 AI 技术为荣,但对其内部运作或意图却完全不公开。它在公开论文中披露了其研究的超具体细节,但不会提供有关构建其 AI 的一般成本、其 GPU 的当前构成或其数据来源的基本信息。

“我们不知道 DeepSeek 的真实动机是什么。它有点像一个黑匣子”

长期以来,Liang 本身就以天生不善交际而闻名,以至于中国 AI 领域的一些领导人私下称他为“技术疯子”,这是专门用于形容具有远大抱负的古怪企业家的一个绰号。在过去的 10 个月中,他没有接受过一次媒体采访,并且很少有人知道他长什么样,直到最近中国国务院总理 Li Qiang 举行听证会时,他那张孩子气、戴着眼镜的脸的照片才浮出水面。Liang 和他的同事没有回应本文的多次置评请求,只有一位员工发出了自动回复,称该询问正在处理中:“感谢您对 DeepSeek 的关注和支持!”她的电子邮件补充道。

展开 Liang Wenfeng Liang 在 1 月份。来源:Zuma Press

为了进一步了解该公司的运作方式以及它如何融入该国更广泛的 AI 雄心,Bloomberg Businessweek 采访了 Liang 的 11 位前员工,以及 30 多位与中国 AI 行业关系密切的分析师、风险投资家和高管。

缺乏公开露面让 Amodei 和 OpenAI 负责人 Sam Altman 等批评人士得以通过诽谤来填补空白,这与那些容易将中国技术视为阴暗威胁的美国受众产生了共鸣。但是,即使是那些对 DeepSeek 保持警惕的人也不得不努力应对其 AI 不可否认的实力。Perplexity AI Inc. 首席商务官 Dmitry Shevelenko 表示,他的公司(该公司生产由 AI 驱动的搜索产品)中没有一个人能够与 DeepSeek 的任何同行进行沟通。尽管如此,Perplexity 还是接受了 DeepSeek 的技术,仅将其托管在美国和欧洲的服务器上,并在训练后对其进行了后处理,以删除任何表明中国共产党审查制度的数据集。Perplexity 将其命名为 R1 1776(指的是美国成立的年份),Shevelenko 将其描述为对自由的致敬。“我们不知道 DeepSeek 的真实动机是什么,”他说。“它有点像一个黑匣子。”

DeepSeek 预计其 AI 可能会在国外引起担忧。在 2024 年 3 月 Nvidia 开发者大会上的一次被忽视的虚拟演示中,DeepSeek 的深度学习研究员 Deli Chen 谈到了价值观应该如何从 LLM 中“分离”出来,并适应不同的社会。在一张冷酷的逻辑幻灯片上,Chen 展示了一个 DeepSeek 原型,用于自定义由具有各种背景的人员使用的聊天机器人中内置的道德标准。只需轻轻一点按钮,开发人员就可以设置赌博、安乐死、性工作、枪支所有权、大麻和代孕等问题的合法性。“他们需要做的就是选择适合他们需求的选项,然后他们就可以享受专门针对他们的价值观量身定制的模型服务,”Chen 解释说。

找到如此有效的方法一直是 DeepSeek 的文化规范。在 2000 年代中期,Liang 和他的朋友们在浙江大学学习了各种技术领域——机器学习、信号处理、电子工程等——并且显然是为了好玩(并且,你知道,为了赚钱),开发了计算机程序来在全球金融危机期间交易股票。

毕业后,Liang 继续独自构建量化交易系统,赚了一小笔钱,然后于 2015 年与他在杭州的几位大学朋友联手,成立了后来被称为 High‑Flyer Quant 的公司。

早期的招聘广告吹嘘从 Google 和 Facebook 吸引顶尖人才,并寻找具有情景喜剧《The Big Bang Theory》中笨拙的主角 Sheldon 的“古怪才华”的数学和编码“怪才”。他们承诺提供免费零食、Herman Miller 椅子、扑克之夜、认可 T 恤和拖鞋的办公室文化,以及一剂金融科技兄弟文化,有机会与“1990 年代出生的可爱、轻声细语的女孩”和“从 Wall Street 回来的精明女神”一起工作。

展开 DeepSeek 的北京办事处。摄影师:Peter Catterall/AFP/Getty Images

正如 DeepSeek 的情况一样,High-Flyer 培养了一种神秘感——它的第一篇社交媒体帖子只称 Liang 为“L 先生”——同时致力于一种让我证明它的透明度。每周五,High-Flyer 都会在中国超级应用程序 WeChat 上发布其 10 只原始基金业绩的图表。在 2016 年夏季仅向注册投资者提供每周数据之前,该投资组合的平均年化回报率为 35%。

数十亿美元最终流入 High-Flyer 的投资组合,其投资和研究团队增加到 100 多名员工。Liang 于 2019 年开始认真招聘 AI 部门的人员,旨在挖掘庞大的数据集,以发现被低估的股票、高频交易的微小价格波动以及特定行业投资者错过的宏观趋势。到 Covid-19 大流行开始时,他和他的团队已经构建了一个由互连处理器并行运行的高性能计算系统,这种设置被称为集群。High-Flyer 表示,为此集群,它已购买了 1,000 个 Nvidia 2080Ti 芯片(通常由游戏玩家和 3D 艺术家使用)和额外的 100 个 Volta 系列 GPU。(Volta GPU,又名 V100,是 Nvidia 的第一个 AI 优化处理器。)High-Flyer 以前较小的计算架构需要两个月才能训练一个新的经济分析模型,而其新设备需要不到四天的时间来处理相同的工作负载。

这些金融模型令人印象深刻,但比 OpenAI 等美国公司正在构建的通用模型小得多。Liang 推动构建一个由 Nvidia 当时新的 A100 GPU 组成的更大的超级计算机,A100 GPU 是 V100 的升级版。参与该项目的前 High-Flyer 工程师表示,Liang 是不断增长的集群的“最大用户”,估计用于开发模型的计算机处理能力的 80% 都分配给了他的用户名。这位前工程师表示,Liang 似乎对深度学习着迷,称其为“他昂贵的爱好”。将数亿美元投入到此类 AI 基础设施中对于一家量化公司来说可能有点过分,但 Liang 已经创造了足够的利润来负担得起。“当时对 Liang 来说是小钱,”这位工程师回忆道。“更多的计算能力、更好的模型、更多的交易收益。”

至少这是希望。High‑Flyer 当时管理着大约 141 亿美元的资产,在 2021 年 12 月致利益相关者的一封信 中对其令人失望的回报表示歉意。该公司将下滑归咎于其 AI 系统,称这些系统选择了聪明的股票,但未能熟练地把握在疫情波动期间退出这些交易的时机。即便如此,它还是决定在 AI 领域加倍投入:2022 年 1 月,High-Flyer 在社交媒体上发布消息称,它已经积累了 5,000 个 Nvidia A100,每个通常花费数万美元。3 月,它宣布该集群已扩展到 10,000 个,仅仅在 Nvidia 警告美国新的限制可能会影响此类芯片向中国的出口六个月之前。

目前尚不清楚最终有多少基础设施是用于量化交易,有多少是用于 Liang 昂贵的爱好。第二年春天,大约在 OpenAI 推出 ChatGPT 五个月后,他将 DeepSeek 分拆出来,作为一个独立的研究实验室。在杭州和北京的独立办公室里,金融不再是重点。在一份充满陈词滥调的未署名宣言中,High-Flyer 发誓要避开平庸,并迎接 AI 革命中最艰巨的挑战。它的最终目标:通用人工智能。

展开 Bloomberg Businessweek May 2025 Issue cover 刊登在 2025 年 6 月号的 Bloomberg Businessweek 上。立即订阅。插图:731

在 2023 年全年,DeepSeek 实验室竞相构建 AI 代码助手、通用知识聊天机器人和文本到 3D 艺术生成器。Liang 从 High-Flyer 带来了工程师,并从 Microsoft Corp. 的北京办事处和中国领先的科技公司和大学招募了更多的人。Bo “Benjamin” Liu 于 9 月份加入,担任学生研究员,之后开始攻读博士学位,他说 Liang 经常给实习生分配重要的工作,而在其他地方,这些工作将分配给高级员工。“以我为例:当我进入公司时,没有人从事 RLHF 基础设施的工作”——支持一种名为人类反馈强化学习的重要技术所需的基础设施——“所以他就让我做了,”Liu 说。“他会信任你去做以前没有人做过的事情。”(这种信任给 DeepSeek 带来了次要的好处:它向实习生支付相当于每天 140 美元的报酬,每月提供 420 美元的住房补贴,这在中国是一笔丰厚的报酬,但大约是美国 AI 公司实习生收入的三分之一,而且只是硅谷全职工程师收入的一小部分。)

据两位前 DeepSeek 研究人员称,Liang 很早就对稀疏性进行了巨大的押注,这是一种通过将 LLM 分解为专业来更有效地训练和运行 LLM 的技术。当你向最初的 ChatGPT 提出问题时,它的整个 LLM 大脑都会被激活,以确定理想的答案,无论你要求 2 + 2 的总和还是馅饼食谱。相比之下,稀疏模型可以通过划分为“专家”来更好地利用资源,只有相关的专家会在响应任何特定提示时被激活。

稀疏方法可以大大节省计算成本,但它变得极其复杂。如果问题没有被大脑的足够回路处理,或者被发送到错误的大脑叶,答案质量将会下降。(例如,数学大脑会知道如何在公式中使用 pi,但不知道馅饼食谱中包含什么。)Liang 从 Google 和 法国独角兽 Mistral 看到的进展,该公司于 2023 年 12 月发布了一个稀疏模型,该模型分为八个专家,每个查询根据上下文激活两个最相关的专家。他召集他的团队设计具有更多专家的模型,这种技术可能会增加幻觉并分散 AI 的知识。“这引发了重大的内部辩论,”这位前 DeepSeek 员工说。

更多的突破接踵而至,每一个都在公开场合分享,并越来越引起中国竞争对手的注意。然后,在 2024 年末,DeepSeek 发布了 V3,这是一款通用 AI 模型,比 Meta Platforms Inc. 的同类产品大约大了 65%,后者当时是最大的开源 LLM。但在 DeepSeek 发布 R1 推理模型进入更广泛的意识之前大约一个月,是 冗长的 V3 研究论文 真正引起了 Google、OpenAI 和 Microsoft 高管的注意。从 PDF 中跳出的一个令人震惊的统计数据:DeepSeek 暗示 V3 的整体开发成本仅为 560 万美元。这个数字可能仅指最终的训练运行——一个数据提炼过程,将模型的先前原型转换为完整的产品——但许多人认为这是一个极低的整个项目的预算。相比之下,最先进的前沿模型的累积训练成本可能达到 1 亿美元或更多。Anthropic 的 Amodei 甚至预测(在 DeepSeek 崛起之前),下一代模型的训练成本将在 100 亿美元到 1000 亿美元之间。

流行的 AI 平台 Hugging Face Inc.(LLM 排名就在此网站上)的研究主管 Leandro von Werra 表示,DeepSeek 的“架构创新”并不是其模型最引人注目的地方。他从其研究论文中获得的最大启示是,该公司肯定开发了高质量的数据——要么巧妙地从网络上清理干净,要么通过其他方式提取——从而使 V3 得以实现。“如果没有非常强大的数据集,模型将缺乏性能,”von Werra 说。“从报告中可以非常清楚地看出,DeepSeek 拥有 LLM 最佳的训练数据集之一。不幸的是,该报告在 50 页中用半页的篇幅介绍了数据集。”

DeepSeek 展示了其快速的进步,因为 Liang 将 开源精神 视为其理念不可或缺的一部分。他认为,隐藏专有技术并为强大的模型收费——包括 OpenAI 和 Google 在内的美国顶级实验室采用的方法——优先考虑短期优势,而不是更持久的成功。使其模型完全可供公众访问,并且基本上是免费的,这是 DeepSeek 加速采用并让初创公司和研究人员在其技术上进行构建的最有效方式。希望这将创建一个产品消费和反馈的飞轮。正如 DeepSeek 在近两年前发布其首个公开 LLM 时所写的那样,引用开源操作系统 Linux 的发明者的话:“空谈无益,给我看代码。”

“基本上他们不需要钱。凭借对六小龙的所有炒作,人们都在向他们扔钱”

四月一个多云的星期天,在杭州熙熙攘攘的萧山国际机场,宣传来自 Alibaba、ByteDance 和 Huawei 的 AI 服务的数字广告牌迎接抵达的乘客。一个蓝色头发的人形机器人在现代化的航站楼内挥手欢迎乘客。在外面,一家自动驾驶汽车初创公司一直在测试小型自动驾驶卡车,用于在停机坪周围运输货物。尽管围绕 DeepSeek 的喧嚣声很大,但西方人似乎忘记了它只是中国众多硅谷同类产品中崛起的众多 AI 巨头之一。仅在拥有 1250 万人口的特大城市杭州,DeepSeek 就属于被称为六小龙的精英科技初创公司。

在风景秀丽的西湖区,有 Game Science,这是 热门游戏 Black Myth: Wukong 背后的炙手可热的工作室,这款畅销动作游戏因使用机器学习技术使其计算机角色更加逼真而广受赞誉。不远处有两家机器人巨头和一家专注于 3D 空间软件的独角兽公司。附近还有浙江强脑科技有限公司,该公司被称为 BrainCo,最好被理解为中国支持的 Neuralink Corp. 版本。它可以追溯到由中国出生的博士生 Bicheng Han 在 Harvard University 孵化的一家初创公司,现在正在其杭州的附属实验室开发仿生肢体和用于大脑活动控制计算机的技术。BrainCo 的一只 AI 动力假肢目前在中国 AI 小镇(杭州另一个新兴技术中心)的一个展览中心展出。

据一位参加过会议的人士透露,最近几周,BrainCo 的领导人一直在参观展览。与会者经常想投资,但显然这些天才对外部资本的需求并不那么迫切。“基本上他们不需要钱,”一位参加过参观的基金经理说。“凭借对六小龙的所有炒作,人们都在向他们扔钱。”

所有这些初创公司的背后都站着国家主席习近平的政府。生成式 AI、机器人技术和其他高科技雄心壮志正在推动一项高于一切的国家议程,正如习近平在最近的一次政治局会议上所说的那样,该议程旨在实现国内“自力更生和自强”,据中国官方 Xinhua News Agency 报道。“我们必须认识到差距,并加倍努力,全面推进技术创新、产业发展和 AI 赋能应用。”

巨头们正在倾听,并非所有巨头都那么小。拥有 3000 亿美元资产的 Alibaba 集团的主要园区是一个庞大的物业,拥有自己的湖泊,位于杭州西部距西湖约 40 分钟车程的地区。该公司最近承诺在未来三年内投资 530 亿美元用于建设更多的 AI 数据中心,据说其最新的 Qwen3 旗舰模型在性能和成本效益方面与 DeepSeek 的产品相媲美。在中国境外,Alibaba 通常被认为是一家电子商务企业,但其发展速度更快的 AI 和云部门于 2022 年分拆到杭州郊外的一个独立中心。在其会议室中,大屏幕上闪烁着“行业洞察快报”,每 72 小时更新一次,详细介绍了 DeepSeek 和 OpenAI 等竞争对手的最新成就。甚至在洗手间里还有一个每周更新的版本,提醒人们,即使在人类技术人员需要方便的时候,AI 竞赛也在继续进行。

今年 4 月,在中共对中国科技行业进行打击期间几乎消失了五年的难以捉摸的 Alibaba 联合创始人 Ma 重新出现在公司园区,以庆祝其云部门成立 15 周年。据几位看到讲话的人士透露,在一次罕见的讲话中,Ma 表示他希望 AI 为人类服务,而不是统治他们。与会者还收听了来自香港和东京办事处的直播,他们表示对 Ma 的凯旋归来感到非常兴奋。

这提醒人们,像 Ma 这样的科技摇滚明星显然又重新获得了中共的青睐——并且加入了像 Liang 这样的后起之秀——即使美国科技领导人的光芒正在消退。在中国,民族自豪感正在增强,他们渴望表明自己可以克服西方的障碍。政策顾问 Asia Group LLC 驻香港的董事总经理 George Chen 表示,在中国 Trump 政府的敌意是一部分原因,但他们也被一种感觉所吸引,即真正的行动可能正在向东转移。“硅谷不再是中国人才有吸引力的工作场所,”Chen 说。

另一家中国独角兽公司 01.AI 的创始人 Kai-Fu Lee 更进一步。Lee 本身也是 Apple、Google 和 Microsoft 的资深人士,他说下一代人才并没有遵循他先在美国公司工作,然后在在中国建立自己的公司。他说:“这些年轻的 AI 工程师基本上是本土培养的。”“DeepSeek 的成功以及其他新的 AI 初创公司的成功正在激励更多年轻人才加入中国的 AI 复兴。”

展开 Liang Wenfeng(中间)在二月份在北京的一个研讨会上。 Liang(中间)在二月份在北京的一个研讨会上。摄影师:Florence Lo/Reuters

如今,在中国没有任何一家科技公司能像 DeepSeek 那样唤起如此多的自豪感。4 月份,来自加拿大的 27 岁计算机科学家 Kirby Fung 与家人一起访问杭州时,带着家人参观了 Liang 的母校浙江大学。Fung 在那里参加了一个交流项目,并想向他的祖父母和弟弟表明他与 Liang 在同一所学校学习。“向我在加拿大的朋友解释说,制造 DeepSeek 的人上了我的学校,这真是太酷了,”Fung 说。

游客和社交媒体影响者也经常光顾 DeepSeek 的总部,该总部位于俯瞰中国著名京杭大运河的四塔建筑群中。游客们在当地商店寻找 Liang 的踪迹,包括 DeepSeek 大楼内一家高档火锅店,员工有时会在那里吃饭。(女服务员不得不告诉他,他从不光顾。)

认识 Liang 的人说,他将时间分配在杭州和 DeepSeek 的北京办事处之间,该办事处位于当地科技中心一座玻璃塔的五楼。在那里,二十多岁的程序员在高度可调节的办公桌上努力工作,储藏室里储备着能量饮料、康师傅方便面和辣条。有一块白板,员工可以在上面潦草地写下对额外食物的要求。“在那里吃了几​​个月的午餐和晚餐后,我变得有点胖了,”一位最近离职的研究员说。

Liang 很少同意与外人会面,有时甚至在他接受的少数会议中以全息投影的形式出现。他拒绝了 今年有影响力的巴黎 AI 行动峰会 的邀请,OpenAI 的 Altman、Alphabet Inc. 和 Google 首席执行官 Sundar Pichai 以及许多总理和总统都参加了此次活动。

虽然中国庆祝 DeepSeek,但美国却将其视为一种陌生的生物,它神秘地出现在供水中,并检查其是否良性或恶性。批评人士 指责 DeepSeek 受中共控制从美国竞争对手那里窃取训练数据,并为一些更大的间谍活动或心理战做出贡献,以破坏硅谷的 AI 霸权。“DeepSeek 是从美国科技行业到中国共产党监控国家的直接管道,不仅威胁到美国公民的隐私,也威胁到我们的国家安全,”负责调查 DeepSeek 的美国众议院委员会的一位发言人说。

然而,DeepSeek 将自己定位为与任何热门初创公司没有什么不同——这是“纯粹的车库能量”的产物,它在 2 月份的一篇 X 文章中说。毕竟,它与 Google 在同一个北京园区运营,距离 Burger King 和两家 Tim Hortons 不远。仅仅是因为更广泛的 AI 行业到现在才开始关注 DeepSeek 并不意味着幕后发生了什么不正当的事情。VC 公司 Alpha Intelligence Capital(已投资 OpenAI 和 SenseTime)的合伙人 Arnaud Barthelemy 表示:“AI 界没想到 DeepSeek 会出现。”“他们应该想到。”

Barthelemy 说,从 DeepSeek 中获得的真正经验是,中国科技公司如何有效地将它们所面临的限制转化为优势。“中国有很多聪明的人,他们在计算要求低得多的情况下进行了很多聪明的创新,”他说。

事实上,巧合的是,在 DeepSeek 成立的同一个月,即 2023 年 5 月,Nvidia 首席执行官 Jensen Huang 告诉 Businessweek,美国对中国过度监管只会激励它超越那些阻碍它的人。他将经济影响力描述为一种有效的国家安全工具,强调政府干预的意外后果将是严重的。“被剥夺技术产业市场的三分之一必须是灾难性的,”他说,指的是限制美国技术出口到中国的风险。“他们将在没有竞争的情况下蓬勃发展。他们将蓬勃发展,并将其出口到欧洲、东南亚。”

“你必须注意你将竞争推到什么程度,”Huang 继续说道。“突然之间的反应非常不可预测。一无所有的人会以相当令人惊讶的方式做出反应。”

展开 Jensen Huang 在三月份的 Nvidia 会议上发表讲话。 Nvidia 的 Jensen Huang 认为,出口管制最终可能会加强中国。摄影师:Davi