一年烧百亿:国产手机卷入大模型战争

Wallstreetcn
2023.11.21 06:17
portai
I'm PortAI, I can summarize articles.

一年烧百亿:国产手机卷入大模型战争。华为、小米、vivo、OPPO 等头部手机厂商加入大模型竞争,投入动辄数十亿元。手机厂商部署大模型主要有两种路径,一是手机端侧大模型,一是云、端协同的架构设计。小米和荣耀主攻手机端侧大模型,已经推出了大模型版本。荣耀自研的端侧大模型参数规模达到 70 亿。大模型或许成为手机行业突破自身创新窘境和模式局限性的一个机遇。

在 “百模大战” 席卷硬科技赛道后,基于不同场景的应用成为大模型竞争的又一发力点,这一次,拥有庞大用户基数的头部手机厂商也扣动了扳机。

自今年 8 月起,华为、小米、vivo、OPPO、荣耀都透露了大模型的相关信息,并表示新一代旗舰手机会率先接入大模型。

据《深网》统计,华米 OV 的语音助手将具备端侧大模型能力,语音助手在不联网情况下也有语言理解、图片生成等功能。

在大模型备案审核通过后,各家的语音助手也将拥有类似 ChatGPT 的深度对话、编程等能力。

与文心一言等以 App 形式存在的大模型不同,接入端侧大模型的手机语音助手交互形式更多样,例如 vivo 的蓝心小 V 不仅可以语音生成图片,还可以直接转发至朋友圈。

当然,自研大模型是个 “无限烧钱” 的竞争,投入动辄数十亿元起。投入大模型需要强大资金储备做后盾,以大模型驱动手机软、硬件的每一次进化背后都是 “钞能力”。

但无可否认,在智能手机出货量持续下滑的行业态势下,大模型或许会成为手机行业突破自身创新窘境和模式局限性的一个机遇。

把大模型装进手机的两种路径

手机厂商部署大模型主要有两种路径,一是做轻量化和本地部署的手机端侧大模型;二是采用云、端协同的架构设计,即在云端部署百亿、千亿级别的大模型训练模型,在手机端侧部署十亿级别的大模型,推出大模型矩阵。

主攻手机端侧大模型的手机厂商以小米和荣耀为主。

今年 4 月,小米组建了 AI 大模型团队,并训练出 13 亿和 60 亿参数规模的大模型。“小米大模型技术的主力突破方向为轻量化、本地部署,小米考虑的是优先在手机上实现端侧跑通,让每个人都能更好在手机上使用大模型。” 小米董事长雷军在年度演讲上透露。

目前,小米手机的智能语音助理小爱同学已经升级了大模型版本,并开启了邀请测试。

与小米相比,荣耀自研大模型主要搭载了骁龙 8Gen3 这一快车。

2023 年 10 月 25 日,高通发布新一代移动处理平台骁龙 8 Gen3。与上一代产品骁龙 8Gen2 相比,骁龙 8 Gen3 不仅 GPU、NPU 性能大幅提升,更重要的是,它可以在终端侧运行 100 亿参数的模型。

荣耀 CEO 赵明在高通骁龙峰会上透露,荣耀自研的端侧大模型参数规模达到 70 亿。“荣耀通过自研 70 亿参数的端侧大模型,可以很好地划分个人隐私与人类知识库的边界,让用户隐私得到更好保护,这也是荣耀未来重点的创新方向,荣耀 Magic6 将接入自研大模型。”

与小米、荣耀主攻端侧大模型不同,华为、vivo、OPPO 自研大模型采用 “云、端协同” 路径,其推出的大模型矩阵覆盖十亿、百亿、千亿多个参数量级。

与 ChatGPT 等通用人工智能大模型不同,华为的盘古大模型是一个面向垂直行业的大模型系列,目前已经迭代到 3.0 版本。据公开资料显示,盘古 3.0 可以为客户提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化基础大模型。

在手机层面,华为 P60 和 Mate60 系列手机的小艺智慧助手已经接入盘古大模型,并开启了公测。

同样采用大模型矩阵的,还有 vivo 自研的蓝心大模型(BlueLM)和 OPPO 自主训练的安第斯大模型(AndesGPT)。其中,蓝心大模型覆盖 10 亿、70 亿、700 亿、1300 亿、1750 亿模型参数 5 个版本;安第斯大模型包含十亿至千亿以上多种不同参数规模的模型规格。

图为蓝心大模型矩阵

图为安第斯大模型(AndesGPT)架构

对于为何要推出大模型矩阵的原因,vivo 副总裁、AI 全球研究院院长周围在接受采访时透露,“主要受大模型形态、用户需求及算力成本的影响”。一是矩阵模式可以解决多模态大模型不同研发阶段的需求;二是可以让用户在云上使用大模型的同时在端侧本地化运行关键数据,满足隐私及安全需求;三是可以有效平衡云端算力成本过高的问题。

无法停止的烧钱游戏

虽然大模型的训练、推理和逻辑能力受模型框架、数据质量、训练方法等多重因素的影响,但现有大模型的智能水平主要取决于算力投入程度。

业内一种公认说法是,做好 AI 大模型的算力门槛是 1 万枚英伟达 A100 芯片。

有行业人士给《深网》算了一笔帐,搭建一个算力集群的成本就在几十亿元。“此前一台计算服务器的成本大约在 5 万块钱左右,现在满配的 GPU 服务器价格在 100 万-200 万元之间,一个算力集群一般要配备 500 台服务器。”

购买 AI 芯片仅是手机厂商自研大模型成本之一。由于大模型训练一次的成本极高(例如 GPT4 一次训练成本就要 6300 万美元),所以在模型训练之前,手机厂商需要对原始数据进行纠错、价值观把控等,数据清洗也是一块不小的支出。

“现在应用一次云端大模型的成本大概在 1.2-1.5 分左右,vivo 国内 3 亿用户每天用十次,一年算下来也有百亿左右的支出。” vivo 副总裁周围透露。

周围表示,数据和算力成本仅占自研大模型投入的一半,人员成本占了一半。自 2017 年组建 AI 全球研究院至今,vivo 每年在人工智能上的投入保守估计在 20 到 30 亿元。

算力、数据、人员成本仅是 vivo 等头部手机厂商部署云端大模型的必要成本之一。与百度、阿里巴巴等互联网公司主要在云端部署大模型不同,头部手机厂商自研大模型的最终目的是服务用户,让手机拥有大模型能力。

但在手机端侧运行大模型受手机存储空间、耗电等一系列技术的影响,参数量越大,大模型在手机上越难跑通。

“10 亿参数模型要占用手机 1GB 内存,70 亿占有 4GB,130 亿占用 7GB,所以我们优先考虑的是 10 亿模型擅长做什么,再慢慢把其他功能做起来。” vivo AI 解决方案中心总监谢伟钦对《深网》解释。

大参数要占用大量的存储空间,这意味着要在手机上跑通大模型就要同步升级内存、SoC 芯片等硬件,这对手机厂商来说,又是一笔不菲的投入。

手机行业急需一场颠覆性的创新

在 ChatGPT 点燃通用人工智能之前的很长一段时间里,手机行业的创新集中在通讯、摄影、屏幕大小和形态等老生常谈的领域。

在消费电子寒冬下,手机厂商 “挤牙膏式” 的改变很难激起用户的购买欲望,换机周期一度从 2021 年的 28 个月延长至现在的 43 个月。而大模型的智能涌现能力恰巧让手机行业看到了颠覆性创新的可能性。

“大模型是颠覆性的技术范式转变,和蒸汽机、电力及计算机一样,对人类进步具有里程碑的意义。” 多位手机品牌的创始人都曾在公司内部如此给大模型定调。

一加创始人、OPPO 首席产品官刘作虎表示,AIGC 会为移动生活的体验带来革命性的变化,未来的手机会成为用户的超级助理。

“我们在 2017 年部署大模型时,沈炜(vivo 创始人)就要求我们高规格投入以抓住这个百年难遇的趋势。” 周围透露。

在 vivo、OPPO 等手机厂商的预期里,接入大模型的手机会演化成全新的智能体,成为用户的专属私人助理。

曾有行业人士对《深网》表示,“100 亿-150 亿参数级别的模型可以覆盖绝大多数生成式 AI 的用例。如果终端可以支持这一参数级别,那么运算可全部在终端上进行,无需云端处理运算,届时手机会会成为真正的个人助理。”

华为、vivo、OPPO 自研大模型的最高参数级别已经达到千亿级别,但目前在端侧只能执行语言理解、文本创作、图片生成等简单的操作,涉及到订票、APP 交互、设备控制等操作还是要调动云端大模型能力。

眼下,头部手机厂商在大模型的探索还处于起步阶段。后续,随着模型迭代、创新应用和产品的推出,以大模型为竞争原点的时代正式开启。

本文作者:张睿,来源: (ID:qqshenwang),原文标题:《一年烧百亿:国产手机卷入大模型战争|深网》

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。