硅谷震惊：DeepSeek或彻底改变游戏规则

短短一个月内，中国 AI 初创公司深度求索（DeepSeek）先后发布了 DeepSeek-V3 和 DeepSeek-R1 两款大模型，成本价格低廉，性能与 OpenAI 相当，让硅谷震惊，甚至引发了 Meta 内部的恐慌，工程师们开始连夜尝试复制 DeepSeek 的成果。

Scale AI 创始人 Alexander Wang 在 1 月 24 日的采访中表示，DeepSeek 在他们的测试里是表现最好的，与美国最好的模型相当。

此前，Alexander Wang 评价说，DeepSeek-V3 是中国科技界带给美国的苦涩教训。"当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。"

此外，中国 AI "刷屏"国外各大媒体，它们认为中国大模型的新进展为硅谷敲响了警钟。

在 5000 亿美元的"星际之门"计划公布之际，DeepSeek 以极低的价格建立了一个突破性的 AI 模型，而且没有使用尖端芯片，这让人们质疑，AI 行业数千亿美元资本的巨额投入真的是最有效的方法吗？

一、Meta 进入恐慌模式，试图复制 DeepSeek

1 月 24 号，一条发布在匿名平台 teamblind 上的帖子疯传。一名 Meta 员工称，现在 Meta 内部因为 DeepSeek 的模型，已经进入恐慌模式。

这位 Meta 员工写道：

"一切源于 DeepSeek-V3 的出现，它在基准测试中已经让 Llama 4 相形见绌。更让人难堪的是，一家‘仅用 550 万美元训练预算的中国公司’就做到了这一点。

工程师们正在争分夺秒地分析 DeepSeek，试图复制其中的一切可能技术。这绝非夸张。

管理层正为 GenAI 研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个 DeepSeek V3 的成本，而且这样的高管还有数十位，他们该如何向高层交代？

DeepSeek-R1 的出现让情况更加严峻。具体细节属于机密，不便透露，不过很快就会公开了。"

去年 12 月 27 日，DeepSeek 推出开源模型 DeepSeek-V3。当时，聊天机器人竞技场（Chatbot Arena）显示，DeepSeek-V3 在所有模型中排名第七，在开源模型排第一。而且，DeepSeek-V3 是全球前十中性价比最高的模型。

不到一个月之后，今年 1 月 20 日，DeepSeek 正式开源 R1 推理模型，允许所有人在遵循 MIT License（注：被广泛使用的一种软件许可条款）的情况下，蒸馏 R1 训练其他模型。

1 月 24 日，DeepSeek-R1 在聊天机器人竞技场综合榜单上排名第三，与顶尖推理模型 o1 并列。

在高难度提示词、代码和数学等技术性极强的领域，DeepSeek-R1 拔得头筹，位列第一。

在风格控制方面，DeepSeek-R1 与 o1 并列第一，意味着模型在理解和遵循用户指令，并按照特定风格生成内容方面表现出色。

在高难度提示词与风格控制结合的测试中，DeepSeek-R1 与 o1 也并列第一，进一步证明了其在复杂任务和精细化控制方面的强大能力。

Artificial-Analysis 对 DeepSeek-R1 的初始基准测试结果也显示，DeepSeek-R1 在 AI 分析质量指数中取得第二高分，价格是 o1 的约三十分之一。

二、AI 大佬惊叹：中国 AI 已追上美国

去年 12 月 DeepSeek-V3 发布后，AI 数据服务公司 Scale AI 创始人 Alexander Wang 就发帖称，DeepSeek-V3 是中国科技界带给美国的苦涩教训。"当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。"

著名投资公司 A16z 的创始人马克 · 安德森 1 月 24 日发文称，Deepseek-R1 是他见过的最令人惊叹、最令人印象深刻的突破之一，而且还是开源的，它是给世界的一份礼物。

1 月 24 日，A16z 合伙人、Mistral AI 董事会成员 Anjney Midha 表示："从斯坦福到麻省理工，DeepSeek-R1 几乎一夜之间成为美国顶尖大学研究人员的首选模型。"

对于中国 AI 为何能有如此快速的进展，诺奖得主、" AI 教父"杰弗里 · 辛顿在 1 月 21 日接受博主 Curt Jaimungal 专访中表示，中国的 STEM（科学、技术、工程、数学）教育比美国更好，拥有更多受过良好教育的人才，这将为 AI 的发展提供坚实的基础。尽管美国试图通过限制（如英伟达芯片）来减缓中国的发展，但这只会促使中国加速发展自己的技术，"他们可能会落后几年，但最终会赶上"。

三、DeepSeek 或彻底改变游戏规则"大力出奇迹"还有效吗？

斯坦福大学和 Epoch AI 的研究人员在 2024 年年中发表的一项研究表明，到 2027 年，最大型的模型的训练成本将超过 10 亿美元。Gartner 预测，到 2028 年 Google、Microsoft 和 AWS 等超大规模企业仅在 AI 服务器上的支出就将高达 5000 亿美元。

但 DeepSeek 完全不同，它的训练成本并不昂贵。Noah's Arc 资本管理公司表示，DeepSeek-V3 模型有可能彻底改变训练和推理领域的游戏规则。

特别是在 5000 亿美元的"星际之门"计划公布后，DeepSeek 更让人怀疑，巨额投入这种"大力出奇迹"的办法真是最有效的方法吗？

美股大 V " THE SHORT BEAR " 1 月 24 日在 X 上发文称，DeepSeek 给 AI 巨头们带来了痛苦时刻，投资者必须对此敲响警钟。

他说："如果击败 OpenAI 只需要 5500 万美元，那么这个行业的商业化会比很多人预想的要快很多。"

他还指出："根据红杉，美国 AI 公司每年必须产生约 6000 亿美元收入来支付其 AI 硬件费用。现在看来，这种冒险行为变得越来越无利可图。"

著名财经记者 Holger Zschaepitz 1 月 25 日表示，DeepSeek 以极低的价格建立了一个突破性的 AI 模型，而且没有使用尖端芯片，这让人们质疑该行业数千亿美元资本支出的效用。

有投资者甚至认为，美股芯片股的股价也会面临挑战。

投资者 Geiger Capital 表示，Deepseek 和 OpenAI 一样好，甚至更好，而且价格只有后者的 3%…… 而美国公司却投入了数千亿美元。那么 …… 纳斯达克会怎样呢？

值得注意的是，DeepSeek-V3 发布后，英伟达股价下跌了 2%。而 DeepSeek-R1 引发海外大讨论后，1 月 24 日英伟达股价又大跌了 3.12%。

四、外媒集体刷屏：给硅谷敲响警钟

如果说 DeepSeek-V3 只是掀起了波澜，那么 DeepSeek-R1 则是引发了轰动。最近四天，国外媒体纷纷聚焦 DeepSeek，并一致认为中国大模型的新进展为硅谷敲响了警钟。

1 月 22 日，美国媒体 Business Insider 报道称，DeepSeek-R1 模型秉承开放精神，完全开源，为美国 AI 玩家带来了麻烦。开源的先进 AI 可能挑战那些试图通过出售技术赚取巨额利润的公司。

1 月 24 日，美国媒体 CNBC 推出了长达 40 分钟的节目，邀请了 Perplexity CEO Aravind Srinivas 来分析为何 DeepSeek 会引发人们对美国在 AI 领域的全球领先地位是否正在缩小的担忧。

英国《金融时报》1 月 25 日报道称，中国小型 AI 初创公司 DeepSeek 震惊硅谷。报道聚焦资源更丰富的美国 AI 公司能否捍卫自己的技术优势。

报道援引加州大学伯克利分校 AI 政策研究员 Ritwik Gupta 称，DeepSeek 最近发布的模型表明" AI 能力没有护城河"。Gupta 补充说，中国的系统工程师人才库比美国大得多，他们懂得如何充分利用计算资源来更便宜地训练和运行模型。

上一篇：没有了

下一篇：【高考数学】2025年复习核心题型讲与练09 函数的对称性

推荐资讯