朝阳资本论
2026.04.20 08:19

DeepSeek 融资,梁文锋的 “现实主义” 转身

摘要:理想需要标价,要钱更要人心

来源:朝阳资本论

作者:沙华

AI 行业的竞争,已经从模型技术之争,演进为算力、人才、产品与生态的全面战争。

在这场战争面前,任何试图独善其身的 “技术乌托邦”,都走进了围城之中。

2026 年 4 月,国内 AI 明星公司 DeepSeek 被曝出启动首次外部融资,计划以不低于 100 亿美元的估值筹集至少 3 亿美元资金。

消息一出,市场震动。

“不差钱” 的 DeepSeek 开口要钱了。

这一举动,打破了创始人梁文锋此前 “拒绝融资、保持独立性” 的理想主义叙事。

但耐人寻味的是,100 亿美元的估值,放在智谱 AI 和 MiniMax 港股上市后动辄数千亿港元的市值面前,简直 “便宜得离谱”。

3 亿美元的募资规模,放在今天的大模型赛道里,甚至比不上同行一轮融资的零头。

况且,DeepSeek 账上并不缺钱,幻方量化每年数亿美元利润持续输血,梁文锋也曾公开表示 “VC 的钱是负担”,为什么突然在这个时间点,以这样一个金额和估值,拥抱资本市场?

技术理想国的困境

2025 年春节,DeepSeek 凭借 R1 模型以 560 万美元的训练成本炸穿了中美 AI 圈对大模型研发的常识。美国风投家马克·安德森称之为 AI 领域的 “斯普特尼克时刻”。

比技术突破更让市场记住的,是梁文锋对资本的拒绝。

腾讯、阿里的入股邀约被他一一回绝,市面上几乎每一家顶级风投都在他的闭门羹列表里。他的理由很直白:VC 都是帮 LP 管钱的,都得赚钱,所以谈不到一块去。

在梁文锋的理想里,DeepSeek 不应该被任何人的商业化时间表绑架,要追 AGI、做开源,让技术本身说话。

这份底气来自母公司幻方量化。

据私募排排网数据,2025 年幻方量化平均收益率高达 56.6%,管理规模超 700 亿元。有业内人士估算,仅 2025 年一年幻方就为梁文锋带来了超过 7 亿美元的收入。这就是 DeepSeek 的 “无限弹药”。

DeepSeek 不需要向任何外部资本低头,不需要在任何一个季度交出一份漂亮的商业化报表。

可到了 2026 年春天,这个故事续写不下去了,变化最先出现在产品端。

DeepSeek 已有 15 个月没有大版本更新,突然踩下了刹车。原计划于 2026 年 2 月春节前后发布的旗舰模型 V4,发布时间从 1 月传到 4 月,一次次把开发者吊到嗓子眼。同期,OpenAI 和 Anthropic 却进入了 “月更模式”。

比产品节奏放缓更致命的是人才的流失。

据公开资料,2025 年下半年至今,DeepSeek 至少有 5 名核心研发成员确认离职。第一代大语言模型核心作者王炳宣去了腾讯;V3 核心贡献者罗福莉被雷军千万年薪挖至小米;R1 核心研究员郭达雅以传闻近亿元总包入职字节跳动 Seed 团队;OCR 系列核心作者魏浩然和多模态成果核心贡献者阮翀也先后离开。

DeepSeek 总共不到 200 人,核心研究团队 100 多人,基模架构团队仅小几十人。在这个极度依赖个人能力的小团队里,每一个核心研究员的流失都意味着整条技术线的停顿。

DeepSeek 的内困,在外部压力下被放大。

被捧上神坛的公司,正在被时间一点点拉回地面。

智谱和 MiniMax 已在港股上市,市值分别站上 4000 亿港元和 2700 亿港元。在海外,Anthropic 更是凭借智能体产品年化收入突破 300 亿美元、一举反超 OpenAI。

Anthropic、智谱和 MiniMax 的 ARR 狂飙,揭示行业竞争进入围绕算力、人才、产品和生态的商业化竞速阶段。

纯粹的技术理想,已不足以支撑一家 AI 公司在产业化进程里持续领跑,更无法让顶尖人才坚定留下来的信心。

DeepSeek 需要一个锚点,为 “理想” 标价

人才为何流失?

薪酬数字的账最直白。

DeepSeek 的绝对薪资在同业中并不低,但竞争对手开出的条件 “翻 2 到 3 倍问题不大”,部分甚至给出八位数总包。比如,罗福莉的出走背后,雷军以千万年薪亲自下场加码招募。

这背后是 AI 行业正在经历的一场深刻的人才通胀。猎聘 2025 年报告指出,中国 AI 人才缺口已突破 500 万。麦肯锡曾预测,2030 年中国对 AI 专业人员的需求将增至 2022 年的 6 倍。

图源:猎聘 2025 年度人才供需趋势报告

资本巨头们正在以近乎疯狂的速度为顶级大脑定价,用经过验证的人才对冲自身的研发不确定性。

但巨头高薪抢人还只是第一层原因,比薪酬数字更致命的是期权本身 “无法定价” 带来的不确定性。

DeepSeek 面临的挑战并不仅仅是基数差距,更关键的是其期权缺少一个可对标的市场化价格基准。

DeepSeek 从成立至今从未接受过任何外部融资,员工手中的期权完全依赖内部估值。在没有外部机构以真金白银确认价格之前,这种账面财富在顶级 AI 人才眼中缺乏足够的流通性和溢价锚点。没有上市预期、没有股权变现通道、没有可对标的估值锚点,这纸期权就是一张无法兑现的期票。

梁文锋或许不需要 VC 的钱来维持公司运转,但他缺一个经过市场验证的 “价格锚点”。

有了这个锚点,DeepSeek 的期权就从一个虚无缥缈的概念变成了一个有公允价值的金融资产,组织激励机制也从理想主义落地为市场逻辑。

3 亿美元,放在今天的 AI 赛道里,不是什么大数字。对于 DeepSeek 更是仅仅付出 3% 的股权,换取市场价值认可,重构 DeepSeek 的人才激励机制。在 AI 行业 “人才即一切” 的铁律下,这可能是比任何技术突破都更务实的一步。

除此之外,梁文锋把这笔钱花在哪儿,比融资本身更能说明问题。

从研究机构到生态玩家,V4 与国产算力的赌注

V4 延期的真正原因,从来不是技术瓶颈。

此前,路透社报道披露了一个细节:DeepSeek R1 发布后,有关部门鼓励公司采用华为昇腾处理器。

一位知情人士对媒体表示,过去几个月,DeepSeek 的工程师们一直在做一件吃力不讨好的事,即把 V4 从英伟达的 CUDA 生态,整体迁移到华为昇腾的 CANN 架构。

为此,DeepSeek 要重写底层代码,调整通信库和训练框架,对模型在不同硬件上的输出做精度对齐。但这是一次不得不做的战略转向。

为什么非做不可?

从产业链的逻辑看,在美国对高端芯片实施出口管制的情况下,这是长期安全稳定发展的保证。

英伟达 CEO 黄仁勋在近期采访中直言不讳:“基于国产硬件平台的新模型对美国而言可能是一个糟糕的结果。” 他担心一旦顶尖 AI 模型被优化到在国产芯片上表现更好,英伟达多年构建的生态护城河将不再牢固。

美国不断加码出口管制,导致英伟达在中国高端 AI 芯片市场的份额,从曾经的 95% 直接跌至零。

如果 V4 成功跑通,它将成为全球首个不依赖英伟达的前沿大模型。

值得一提的是,光有前沿模型还不够,今天的 AI 竞争早已不是 “谁参数最大谁赢” 的单点游戏。

一位业内人士用一句话概括了当下的格局:谁能在应用层构建完整的生态闭环,谁才能真正活下来。

对此,字节跳动的打法是把 AI 能力拆解为可复用的 “积木”,嵌入抖音、即梦、飞书等产品线,形成 “产品矩阵 +AI 中台” 的积木式布局。而腾讯直接把手伸进坐拥 12 亿用户的微信,推出 ClawBot 插件,用户无需跳转即可调用 AI 智能体。就连智谱 AI 也在 Coding 赛道上实现了规模化收入,GLM-5.1 发布后,配套的 Coding Plan 订阅一度 “瞬间断货”。

相比之下,DeepSeek 的短板清晰可见。

DeepSeek 缺乏一个像抖音或微信那样的超级应用入口,也缺乏一个被大规模验证的商业化闭环。强大的模型和开源社区的声望是它的护城河,但在终端产品、多模态能力和 Agent 生态上,它明显滞后。

换句话说,DeepSeek 仍在用模型时代的思维去打生态时代的仗,这不只是慢半拍,而是跑错了赛道。

从长期竞争的角度考虑,融资的深层战略意图,是宣告 DeepSeek 正式加入 AI 生态的 “下半场” 竞争。

引入外部资本,意味着 DeepSeek 的公司治理结构将走向规范化,成为一个要面对市场检验、要向投资人交代的商业主体。

这一步,是 DeepSeek 从研究机构转型为产业级玩家的入场券。

V4 能否在国产算力上证明自己,融资能否撬动它补齐应用层的短板,将决定它从一匹 “技术黑马” 蜕变为一个 “生态玩家” 的可能性。而这场蜕变,需要的远不止 3 亿美元。

新的风暴,刚刚出现。

The copyright of this article belongs to the original author/organization.

The views expressed herein are solely those of the author and do not reflect the stance of the platform. The content is intended for investment reference purposes only and shall not be considered as investment advice. Please contact us if you have any questions or suggestions regarding the content services provided by the platform.