Report: NVIDIA will launch a "new inference chip" incorporating Groq LPU design at next month's GTC conference

华尔街见闻
2026.02.28 03:58
portai
I'm PortAI, I can summarize articles.

英伟达即将推出的推理芯片系统整合了 Groq 的 “语言处理单元”(LPU)技术,采用与传统 GPU 截然不同的架构,通过更广泛的 SRAM 集成和 3D 堆叠技术,专门针对大模型推理中的延迟和内存带宽瓶颈进行优化。该新品可能基于下一代 Feynman 架构设计,从而大幅降低 AI 智能体运行的能耗与成本。OpenAI 承诺采购并投资 300 亿美元。

英伟达计划在下个月的 GTC 开发者大会上发布一款整合了 Groq“语言处理单元”(LPU)技术的全新推理芯片,代表着英伟达正加速向推理计算领域转型,以应对客户对高效能、低成本计算方案的迫切需求。

据华尔街日报报道,这款被英伟达首席执行官黄仁勋称为 “世界从未见过” 的全新系统,专为加速 AI 模型的查询响应而设计。该产品的推出预计将重塑当前的 AI 算力市场格局,直接影响正在寻找更具成本效益替代方案的云服务提供商和企业级投资者。

作为市场对该技术初步认可的重要标志,ChatGPT 开发商 OpenAI 已同意成为该新处理器的最大客户之一,并宣布将向英伟达购买大规模的 “专用推理产能”。这一举动不仅稳固了英伟达的核心客户盘,也向市场发出了明确信号:支持自主 AI 智能体的底层基础设施正从大规模预训练转向高效推理。

在面临谷歌、亚马逊以及众多初创公司激烈竞争的背景下,英伟达正在突破传统图形处理器(GPU)的单一依赖。通过引入新的技术架构以及探索纯中央处理器(CPU)的部署模式,该公司试图在 AI 产业演进的下一阶段继续巩固其市场统治地位。

整合 LPU 设计,直击大模型推理瓶颈

随着 AI 行业从模型训练向实际应用部署转移,推理计算成为核心焦点。AI 推理主要分为预填充(pre-fill)和解码(decode)两个阶段,其中大型 AI 模型的解码过程尤其缓慢。针对这一技术瓶颈,英伟达选择通过外部技术整合来突破物理极限。

据华尔街日报报道,英伟达去年底斥资 200 亿美元获得了初创公司 Groq 的关键技术许可,并在一场大规模的 “核心聘用” 交易中吸纳了包括创始人 Jonathan Ross 在内的高管团队。Groq 所设计的 “语言处理单元”(LPU)采用了与传统 GPU 截然不同的架构,在处理推理功能时表现出极高的效率。

业内分析认为,即将发布的新品可能涉及具备颠覆性的下一代 Feynman 架构。据华尔街见闻此前文章,Feynman 架构可能采用更广泛的 SRAM 集成方案,甚至通过 3D 堆叠技术将 LPU 深度整合其中,专门针对延迟和内存带宽这两大推理瓶颈进行优化,从而大幅降低 AI 智能体运行的能耗与成本。

拓展纯 CPU 部署,提供多元化计算选择

在引入 LPU 架构的同时,英伟达也在灵活调整其传统处理器的使用方式。英伟达以往的标准做法是将 Vera CPU 与其强大的 Rubin GPU 捆绑在数据中心服务器中,但在处理某些特定的 AI 智能体工作负载时,这种配置被证明成本过高且能效不足。

部分大型企业客户发现,纯 CPU 环境在运行特定 AI 任务时更为高效。顺应这一趋势,英伟达本月宣布扩大与 Meta Platforms 的合作,进行了首次大规模的纯 CPU 部署,以支持 Meta 的广告定向 AI 智能体。这一合作被市场视为英伟达战略调整的早期窗口,表明公司正超越单一的 GPU 销售模式,试图通过多元化的硬件组合来锁定 AI 市场的不同细分领域。

市场需求换挡,竞争态势持续升级

这种底层硬件设计的演进,直接源于科技行业对 AI 代理应用需求的爆发。许多构建和运营 AI 智能体的公司发现,传统的 GPU 成本过于昂贵,且在实际运行模型时并非最佳选择。

OpenAI 的动向凸显了这一趋势。除了承诺采购英伟达的新系统以改进其快速增长的 Codex 工具外,OpenAI 上个月还与初创公司 Cerebras 达成了一项价值数十亿美元的计算合作。据 Cerebras 首席执行官 Andrew Feldman 称,其专注于推理的芯片在速度上超越了英伟达的 GPU。此外,OpenAI 还签署了使用亚马逊 Trainium 芯片的重大协议。

不仅是初创公司,主要云服务商也在加紧自研芯片步伐。被广泛视为自动编码市场领导者的 Anthropic Claude Code,目前主要依赖亚马逊 AWS 和 Alphabet 旗下谷歌云设计的芯片,而非英伟达的产品。面对竞争对手的围剿,黄仁勋在接受 wccftech 采访时强调,英伟达正从单纯的芯片供应商向涵盖半导体、数据中心、云和应用的完整 AI 生态系统构建者转型。对于投资者而言,下个月的 GTC 大会将是检验英伟达能否在推理时代延续其 90% 市场份额神话的关键节点。