汽车之心
2026.04.25 14:01

AI 座舱大战,火山引擎独开一桌

智能座舱战场,第一次弥漫出「群雄环伺」的杀气。

AI 座舱的主旋律之下,不止一家企业喊出「龙虾」、「Agent」上车,也不止一家企业自称造出「中国版 Grok」。

但至少一点,智能座舱终于成了「主菜」,它与智能驾驶、动力电池层级并列,构成智能汽车新「三大件」。

只不过,大多数人都不知道这道「主菜」究竟该怎么做。

不是堆砌复杂的车控指令,也不是接入大量娱乐生态就够了;更不是把 AI 应用塞进车机就叫 AI 原生。这些充其量只是浅层功夫。

好比裹着糖衣的药丸,糖衣一溶化,用户就不愿、也难以再吞下去。

如果智能座舱的目标,是让用户在「第三空间」里真正享受生活,它的核心命题应该是,用「真实人格」留住用户。

这也构成了火山引擎在 AI 座舱方向上的底层判断。

北京车展首日,火山引擎推出一套基于 Agentic AI 架构的新一代汽车智能解决方案。

其核心是一个「AI 大脑」,直接颠覆了上一代「意图分域 + 多 Agent 协同」的语音助手架构,并首次横向打通车控、导航、智能驾驶等关键功能域。

产品形态分为两条路径:

  • AI 座舱套件。在既有、已规模量产的「豆包大模型」座舱能力基础上,完成向 Agentic 架构的升级。车企可以按需组合能力模块,更像是在调用一套可编排的 AI 基础设施。
  • 豆包座舱助手方案。一种更接近「交付即用」的产品形态,与豆包 App 实现能力与数据的互通,使车内外体验形成连续体,并通过统一模型持续迭代。

这套架构背后,是一整套从感知、推理到执行、记忆、学习的系统级闭环。既打通了整车数据链路,也让模型具备长期学习与稳定控制能力。

火山引擎围绕行业首个全链路端到端 AI 座舱架构展开探索,并以「AI 大脑」的思路推进 AI 原生座舱的系统化落地,率先在这一方向完成了能力卡位。

01、「糖衣」失效,智能座舱的内核是「人格」

过去三年,智能座舱的发展,有点像在原地打转。

车企的打法倒是很统一,在一块中控大屏上,加一套语音系统,然后不断往里叠加功能,包括车控指令、娱乐 APP、在线服务等。

对外叙事也固化了。

找一辆上世纪生产的经典 BBA 作对比,过去机械按键密集、交互复杂,现在一块中控屏管所有,语音可以调温度、座椅和音乐。

最后粗暴得出结论,BBA 已经过时,这才叫智能座舱。

现在看,这套逻辑只能成立一半。

用户确实摆脱了早期车机的迟钝和封闭,但新问题在于,这套以大屏和语音为核心的体系,用户并没有真正高频使用。

市研机构 J.D. Power 发布的《2025 中国智能座舱评选白皮书》提供了一个 C 端视角。

在用户满意度排序中,语音助手已经落到倒数第四名。排在前面的,是智能座椅、充电体验,以及更偏「物理感受」的功能。

一个直观结论,相比可对话,用户更在意可感知、可兑现的实际体验。

在火山引擎副总裁杨立伟看来,如果智能驾驶大约在 80 分水平,那么智能座舱只能得 45 分。

问题出在解题思路上,过去主流厂商的思路是用加法解决问题,功能不断叠加,但交互逻辑没有本质变化:

第一,触控板菜单变成语音版菜单。

语音系统的能力在增强,但使用方式没有改变。用户仍然需要组织明确指令,甚至接近「标准句式」。一旦表达偏离预设路径,系统就会出现识别失败或响应迟缓。

第二,生态无效扩充。

视频、游戏、K 歌等内容被持续引入车机系统,以为能用互联网内容提升用户使用时长。

但低估一点,车机并不是一个内容优先的设备,手机完成生态积累与用户习惯培养后,车机很难在同一维度竞争,就像用户绝对不会因为在车里能刷短视频就放下手机。

大多时候,车机更像是手机的一个替代选项,而非首选入口。

第三,无意义的 AI 外挂。

去年初一波「DeepSeek 上车」热潮,后续水花减弱。本质原因就是除了能落地对话功能,也难以做出新花样。

AI 存在于界面中,却没有进入系统深层,更像是 AI 套壳座舱。

三条路径虽扩展能力边界,却没有改变交互核心,还是需要用户主动发起操作。

功能新鲜感的「糖衣」褪去后,用户很难对一个「没有感情」的工具产生粘性,更何况,工具还不好用。

事实上,今天 AI 浪潮的走向,已经明示了产生用户粘性的最佳答案。

一波是「豆包」热,QuestMobile 数据显示,截止到 2026 年 3 月,AI 原生 APP 月活用户规模已达到 4.4 亿,单豆包月活用户规模就占到 3.45 亿,断档第一。

而豆包脱颖而出的核心原因,在于其交互门槛足够低,可玩性足够强,用户只需表达模糊意图,都能开启对话,并支持图文、语音、视频多模态输入。

另一波是「龙虾」潮,这类智能体可以直接接管电脑完成任务,捅破了从建议到执行的最后一层窗户纸,进而席卷整个 AI 科技圈。

如果把两条路径拆开来看,会更清楚一些。前者解决的是「怎么交流」,强调自然语义和推理能力。而龙虾解决的是「怎么完成」,强调目标驱动和执行能力。

两者都具备更强的「人格特征」,也就是理解、记忆和行动。用户的信任和依赖,往往建立在这三点之上。

把这个逻辑放到座舱里,其实就是 AI 座舱的正确解法。

顺应着这条思路,火山引擎发布了新一代豆包座舱助手,需要强调两点:

一是基于底层的大模型基座,只有火山引擎可以造出豆包 APP 同级智力的座舱系统。

二是相比「龙虾」,豆包座舱助手不仅交互更为「拟人」,还没有失控隐患,在安全和隐私上保持更高约束。

准确而言,火山引擎不是把这些能力简单拼接起来,而是用一个「AI 大脑」整合全部能力,统一处理信息,再去驱动整车各个模块,这样逻辑更顺,也更接近 AI 原生座舱该有的形态。

02、从「拼凑智能」到「整车大脑」,豆包座舱助手改变了什么?

目前测试语音助手是否好用,一个常见方法是连续输入多条指令,观察系统能否稳定响应。

这是个有效方法,但还不够。很多测试场景,本质还是单一领域,比如连续车控,底层依然是同一套模块在执行。

如果需求变成「先导航到机场,再把空调调到 23 度,播放收藏的博客」,多数系统要么漏执行,要么明显卡顿。

原因在于系统架构的限制。

主流车载语音方案,大多延续了移动互联网时期的设计思路。语音先进入 NLU 模块,被拆解为结构化意图,再按领域分发:导航、车控、媒体、闲聊,各自对应独立模块处理。

跨域任务需要调度系统串联完成,但模块之间缺乏统一语境,只能靠规则拼接,一旦链路变长,就容易出错。

这就使得,多轮对话难以跨域延续,所谓「长期记忆」也多停留在用户画像层。

要改变这点,底层架构得彻底颠覆。

这也是为什么,火山引擎的方法论是「AI 大脑」,相当于用更原生的 Agentic AI 方式,构建汽车 AI。

在这种新的系统组织方式上,原有的分域调度被收敛进一个统一中枢,语音、视觉、位置和车辆状态等信息,被集中到同一模型中完成融合推理,由目标驱动引擎、对话推理引擎、学习成长引擎三大引擎推动。

效果如何?

在面向媒体开放的工程车体验中,能清楚看到,豆包座舱助手跳出了点单、导航、对话的传统座舱评价体系,构建出新的能力标尺——控制整车。

整车不单指车控,还包括导航、智驾、车载娱乐等原生车内场景,所以,座舱真的可以「办事」了。

第一层能力是长程任务与推理。

类似「下班先接孩子,顺路加电,再去超市,回家路上放轻音乐,下车前提醒我带走车上的东西。」这类多步骤、跨场景的任务可以完整执行。

这种能力恰恰反映出 AI 的思考逻辑更加深刻。其它座舱思路是响应动作,但豆包座舱助手会理解意图,即思考用户为什么提出这一问题,当下车内环境是什么,再去决定如何处理。

所以同样是哄娃,传统座舱往往只是播放儿歌。豆包座舱助手会根据情绪状态,组合不同方式,比如音乐、动画和故事,形成一套更完整的安抚方案。

第二层能力是舱驾融合。

豆包座舱助手可以用「嘴」开车,比如一句「把车开到前面那个穿蓝衣服的外卖小哥旁边。」,系统可以自主泊车。具体而言,它完成了三件事:识别目标、理解语义、转化为驾驶动作。

类似的能力,在特斯拉 Grok 中也有体现,通过自然语言参与导航决策,更像一个「副驾」。

只不过,豆包大模型这一「副驾」不仅知道用户想怎么开,还知道该如何正确开。它会结合导航信息、路况信息影响具体路径决策,比如凌晨夜间市区行驶时,为规避高架封路开错,会主动提醒用户开启导航,同步前方路况信息。

而再往下挖一层,豆包座舱助手「办事」聪明的能力,是被足够自然的交互支撑起来的。

用两个词概括,一是鲜活,二是普适。

鲜活,指的是交互接近真实对话。支持多人发言、随时打断、临时补充。语音和反馈是同步进行的,而不是一问一答的等待机制。

而普适则是降低使用门槛。没有固定指令规则,说方言也能识别,上手成本接近于「直接开口」。

另外,由于豆包座舱助手可以多模态感知,具备更敏锐、更稳定、更安全的视觉理解能力,但又严格保障用户隐私数据本地处理,隐私不出车。

值得注意的是,这一套体系,并没有把重点放在「生态数量」上。

一方面,简单堆叠应用,很难解决核心问题。

另一方面,生态本身并不是壁垒。无论是字节系内容,还是第三方服务,火山引擎都可以接入。

豆包座舱助手的重点其实是回到一件更基础的事情上:车能不能帮你把事高效办好。

从这个角度着眼,AI 大脑的意义其实更清晰了,一个可以统一理解、决策的系统,才是座舱做到「活人感」的核心基础。

而当语音交互不再围绕指令设计,而是围绕目标展开,智能座舱才具备进一步演进的基础。

03、火山引擎,后发者占领 AI 座舱高地

相比还停留在 Demo 展示阶段的方案,火山引擎更早把重心放在落地。

目前,搭载豆包大模型的智能汽车已经超过 700 万台,覆盖 50 多个品牌、145 个车型,日均座舱交互次数超过 3000 万,位居行业一位。

座舱能力是否成立,关键是用户是否愿意持续使用,显然,火山引擎这点立住了。

合作名单也提供了一个侧面。从特斯拉、奔驰这样的头部品牌,到国内主流车企,豆包大模型已经进入不同层级的产品体系,部分合作甚至深化到汽车云层面。

这种趋势在车展上更加直观。「豆包含量」将成为高频词汇。

这届车展上,梅赛德斯 - 奔驰纯电 GLC、上汽奥迪 E7X、上汽大众 ID. ERA 9X、奇瑞星途 EX7、一汽红旗 HS6 PHEV、别克至境 E7、荣威新序列 “家越” 等新车型,都搭载了豆包大模型。

背后对应的是两条能力线在同时推进。

一条是座舱本身的智能化能力;另一条,则是围绕座舱展开的服务接入能力。

火山引擎这次给出的方案,也对应这两条路径。

一层是「豆包座舱助手」,作为应用级产品直接输出。车企可以获得一套完整的交互能力和体验体系,缩短从集成到落地的周期。

另一层是「AI 座舱套件」,输出的是大模型底层能力。

包括模型推理、工具调用、多模态感知等模块,车企可以根据自身需求进行定制开发。

两套方案对应的是行业内不同的技术策略。

一部分厂商希望快速获得成熟体验,降低开发成本;另一部分则更关注长期能力积累,希望保留更多自研空间。火山引擎相当于扮演了一个能力平台角色。

回看火山引擎在 AI 座舱的布局路径,可以看到一个相对清晰的节奏。虽然是后来者,但每一步都具备前瞻性。

从 2023 年入局开始,没有跟风优先做界面或交互包装,而是先处理底层能力。

第一步,是让模型具备工具调用能力。

车内上千个功能接口,需要被理解并正确调度。

第二步,是引入对环境和车辆状态的感知。

车速、位置、电量、驾驶模式等信息,被纳入决策体系。

第三步,再是将这些能力整合为统一模型,形成「AI 大脑」。

重构底层架构,是豆包座舱助手实现能力「涌现」的关键。

从行业视角看,智能座舱正在从「配置项」转向「决策项」。系统是否理解用户、能否在关键时刻做出判断,开始直接影响体验。

这也意味着,座舱的终局很难是一个「应用商店」。应用分发依赖用户主动选择,而车内场景更需要减少操作。

更合理的形态,是一个具备长期记忆、持续学习能力,并能主动提供服务的系统。它更聪明,也更接近「人」。

当座舱走到这一步,对车企的意义也会改变。从附加卖点,成为建立差异化的关键区域,甚至直接影响用户的购车决策。

因此,一个像「豆包座舱助手」一样,能够理解用户、持续提供帮助的系统,其价值不止于体验提升,大概率会成为用户购车的关键理由。

$Thundersoft(300496.SZ) $SeeWay.ai(002405.SZ) $SAIC Motor(600104.SH)

The copyright of this article belongs to the original author/organization.

The views expressed herein are solely those of the author and do not reflect the stance of the platform. The content is intended for investment reference purposes only and shall not be considered as investment advice. Please contact us if you have any questions or suggestions regarding the content services provided by the platform.