DeepSeek 融资，梁文锋的 “现实主义” 转身

摘要：理想需要标价，要钱更要人心

来源：朝阳资本论

作者：沙华

AI 行业的竞争，已经从模型技术之争，演进为算力、人才、产品与生态的全面战争。

在这场战争面前，任何试图独善其身的 “技术乌托邦”，都走进了围城之中。

2026 年 4 月，国内 AI 明星公司 DeepSeek 被曝出启动首次外部融资，计划以不低于 100 亿美元的估值筹集至少 3 亿美元资金。

消息一出，市场震动。

“不差钱” 的 DeepSeek 开口要钱了。

这一举动，打破了创始人梁文锋此前 “拒绝融资、保持独立性” 的理想主义叙事。

但耐人寻味的是，100 亿美元的估值，放在智谱 AI 和 MiniMax 港股上市后动辄数千亿港元的市值面前，简直 “便宜得离谱”。

3 亿美元的募资规模，放在今天的大模型赛道里，甚至比不上同行一轮融资的零头。

况且，DeepSeek 账上并不缺钱，幻方量化每年数亿美元利润持续输血，梁文锋也曾公开表示 “VC 的钱是负担”，为什么突然在这个时间点，以这样一个金额和估值，拥抱资本市场？

技术理想国的困境

2025 年春节，DeepSeek 凭借 R1 模型以 560 万美元的训练成本炸穿了中美 AI 圈对大模型研发的常识。美国风投家马克·安德森称之为 AI 领域的 “斯普特尼克时刻”。

比技术突破更让市场记住的，是梁文锋对资本的拒绝。

腾讯、阿里的入股邀约被他一一回绝，市面上几乎每一家顶级风投都在他的闭门羹列表里。他的理由很直白：VC 都是帮 LP 管钱的，都得赚钱，所以谈不到一块去。

在梁文锋的理想里，DeepSeek 不应该被任何人的商业化时间表绑架，要追 AGI、做开源，让技术本身说话。

这份底气来自母公司幻方量化。

据私募排排网数据，2025 年幻方量化平均收益率高达 56.6%，管理规模超 700 亿元。有业内人士估算，仅 2025 年一年幻方就为梁文锋带来了超过 7 亿美元的收入。这就是 DeepSeek 的 “无限弹药”。

DeepSeek 不需要向任何外部资本低头，不需要在任何一个季度交出一份漂亮的商业化报表。

可到了 2026 年春天，这个故事续写不下去了，变化最先出现在产品端。

DeepSeek 已有 15 个月没有大版本更新，突然踩下了刹车。原计划于 2026 年 2 月春节前后发布的旗舰模型 V4，发布时间从 1 月传到 4 月，一次次把开发者吊到嗓子眼。同期，OpenAI 和 Anthropic 却进入了 “月更模式”。

比产品节奏放缓更致命的是人才的流失。

据公开资料，2025 年下半年至今，DeepSeek 至少有 5 名核心研发成员确认离职。第一代大语言模型核心作者王炳宣去了腾讯；V3 核心贡献者罗福莉被雷军千万年薪挖至小米；R1 核心研究员郭达雅以传闻近亿元总包入职字节跳动 Seed 团队；OCR 系列核心作者魏浩然和多模态成果核心贡献者阮翀也先后离开。

DeepSeek 总共不到 200 人，核心研究团队 100 多人，基模架构团队仅小几十人。在这个极度依赖个人能力的小团队里，每一个核心研究员的流失都意味着整条技术线的停顿。

DeepSeek 的内困，在外部压力下被放大。

被捧上神坛的公司，正在被时间一点点拉回地面。

智谱和 MiniMax 已在港股上市，市值分别站上 4000 亿港元和 2700 亿港元。在海外，Anthropic 更是凭借智能体产品年化收入突破 300 亿美元、一举反超 OpenAI。

Anthropic、智谱和 MiniMax 的 ARR 狂飙，揭示行业竞争进入围绕算力、人才、产品和生态的商业化竞速阶段。

纯粹的技术理想，已不足以支撑一家 AI 公司在产业化进程里持续领跑，更无法让顶尖人才坚定留下来的信心。

DeepSeek 需要一个锚点，为 “理想” 标价

人才为何流失？

薪酬数字的账最直白。

DeepSeek 的绝对薪资在同业中并不低，但竞争对手开出的条件 “翻 2 到 3 倍问题不大”，部分甚至给出八位数总包。比如，罗福莉的出走背后，雷军以千万年薪亲自下场加码招募。

这背后是 AI 行业正在经历的一场深刻的人才通胀。猎聘 2025 年报告指出，中国 AI 人才缺口已突破 500 万。麦肯锡曾预测，2030 年中国对 AI 专业人员的需求将增至 2022 年的 6 倍。

图源：猎聘 2025 年度人才供需趋势报告

资本巨头们正在以近乎疯狂的速度为顶级大脑定价，用经过验证的人才对冲自身的研发不确定性。

但巨头高薪抢人还只是第一层原因，比薪酬数字更致命的是期权本身 “无法定价” 带来的不确定性。

DeepSeek 面临的挑战并不仅仅是基数差距，更关键的是其期权缺少一个可对标的市场化价格基准。

DeepSeek 从成立至今从未接受过任何外部融资，员工手中的期权完全依赖内部估值。在没有外部机构以真金白银确认价格之前，这种账面财富在顶级 AI 人才眼中缺乏足够的流通性和溢价锚点。没有上市预期、没有股权变现通道、没有可对标的估值锚点，这纸期权就是一张无法兑现的期票。

梁文锋或许不需要 VC 的钱来维持公司运转，但他缺一个经过市场验证的 “价格锚点”。

有了这个锚点，DeepSeek 的期权就从一个虚无缥缈的概念变成了一个有公允价值的金融资产，组织激励机制也从理想主义落地为市场逻辑。

3 亿美元，放在今天的 AI 赛道里，不是什么大数字。对于 DeepSeek 更是仅仅付出 3% 的股权，换取市场价值认可，重构 DeepSeek 的人才激励机制。在 AI 行业 “人才即一切” 的铁律下，这可能是比任何技术突破都更务实的一步。

除此之外，梁文锋把这笔钱花在哪儿，比融资本身更能说明问题。

从研究机构到生态玩家，V4 与国产算力的赌注

V4 延期的真正原因，从来不是技术瓶颈。

此前，路透社报道披露了一个细节：DeepSeek R1 发布后，有关部门鼓励公司采用华为昇腾处理器。

一位知情人士对媒体表示，过去几个月，DeepSeek 的工程师们一直在做一件吃力不讨好的事，即把 V4 从英伟达的 CUDA 生态，整体迁移到华为昇腾的 CANN 架构。

为此，DeepSeek 要重写底层代码，调整通信库和训练框架，对模型在不同硬件上的输出做精度对齐。但这是一次不得不做的战略转向。

为什么非做不可？

从产业链的逻辑看，在美国对高端芯片实施出口管制的情况下，这是长期安全稳定发展的保证。

英伟达 CEO 黄仁勋在近期采访中直言不讳：“基于国产硬件平台的新模型对美国而言可能是一个糟糕的结果。” 他担心一旦顶尖 AI 模型被优化到在国产芯片上表现更好，英伟达多年构建的生态护城河将不再牢固。

美国不断加码出口管制，导致英伟达在中国高端 AI 芯片市场的份额，从曾经的 95% 直接跌至零。

如果 V4 成功跑通，它将成为全球首个不依赖英伟达的前沿大模型。

值得一提的是，光有前沿模型还不够，今天的 AI 竞争早已不是 “谁参数最大谁赢” 的单点游戏。

一位业内人士用一句话概括了当下的格局：谁能在应用层构建完整的生态闭环，谁才能真正活下来。

对此，字节跳动的打法是把 AI 能力拆解为可复用的 “积木”，嵌入抖音、即梦、飞书等产品线，形成 “产品矩阵 +AI 中台” 的积木式布局。而腾讯直接把手伸进坐拥 12 亿用户的微信，推出 ClawBot 插件，用户无需跳转即可调用 AI 智能体。就连智谱 AI 也在 Coding 赛道上实现了规模化收入，GLM-5.1 发布后，配套的 Coding Plan 订阅一度 “瞬间断货”。

相比之下，DeepSeek 的短板清晰可见。

DeepSeek 缺乏一个像抖音或微信那样的超级应用入口，也缺乏一个被大规模验证的商业化闭环。强大的模型和开源社区的声望是它的护城河，但在终端产品、多模态能力和 Agent 生态上，它明显滞后。

换句话说，DeepSeek 仍在用模型时代的思维去打生态时代的仗，这不只是慢半拍，而是跑错了赛道。

从长期竞争的角度考虑，融资的深层战略意图，是宣告 DeepSeek 正式加入 AI 生态的 “下半场” 竞争。

引入外部资本，意味着 DeepSeek 的公司治理结构将走向规范化，成为一个要面对市场检验、要向投资人交代的商业主体。

这一步，是 DeepSeek 从研究机构转型为产业级玩家的入场券。

V4 能否在国产算力上证明自己，融资能否撬动它补齐应用层的短板，将决定它从一匹 “技术黑马” 蜕变为一个 “生态玩家” 的可能性。而这场蜕变，需要的远不止 3 亿美元。

新的风暴，刚刚出现。