随着大模型技术的发展,智能音箱,智能耳机等智能硬件,有望从简单的音频设备,变成软硬件一体 的智能助理载体,从非必需品转为必需品。
1.智能助理是下一个超级应用
ChatGPTPlugin 的发布为智能助理的出现提供了条件。近期 OpenAI 宣布解除 ChatGPT 无法联网的限制,为 ChatGPT 添加对插件的支持,将其与第三方服务集成或允许其访问最新信息的扩展,这使得使 ChatGPT 能访问其他网站并获取实时信息,并且可以通过调度 API 访问相关应用。
ChatGPT 插件的发布,让 ChatGPT 的能力从 NLP,拓展到可以获取实时信息并代替用户执行操作,用户可以直接通过人类语言指挥 ChatGPT 帮自己与各种应用交互,一定程度上 ChatGPT 已经可以当作是人类的智能助理。OpenAI 官网展示的插件的具体功能已经包括了推荐餐厅、制定网上购物、出游、办公、检索、语言教学等,涵盖衣食住行各个方面。
AIOS 时代,智能助理将进入各种应用场景,大模型具备通用性,可以直接或是经过微调后应用于各个领域,在插件生态下,大模型的地位将类似现在的操作系统,同时也是未来流量、用户、数据等的核心入口,各类应用基于 AIOS 展开,智能助理的能力也将渗透到方方面面。
现在我们要制定一个旅游计划,需要自己搜索攻略,查询交通工具和酒店的信息,并经过一系列手动操作下单,基于大模型的智能助理可以直接通过语音分析我们的需求,检索网络信息,为我们做出建议,然后帮助我们操作下单。
GPT-4 目前已经可以在 SAT 和律师资格等多项人类考试中获得理想成绩,并且可以进行角色扮演,设定引导用户思考的风格,智能助理接入音箱和屏幕也可以代替现在的网课,胜任我们的家庭教师。还有繁琐的会议纪要等工作,只要戴上有智能助理功能的耳机就相当于自带了一位秘书能帮你处理。
科幻照进现实,智能助理会持续向贾维斯的方向发展。贾维斯是漫威世界中钢铁侠的 AI 管家,全称是 “只是一个非常智能的系统”(JustARatherVeryIntelligentSystem),他能帮助钢铁侠处理各种事务,可以照顾钢铁侠的饮食起居,分析钢铁侠的身体状况,还能协助钢铁侠战斗等等,是一个全能的助手。
AI 的发展方向,有望是朝着贾维斯这样的通用人工智能的。
AndrejKarpathy 是 OpenAI 的创始成员,曾加入特斯拉担任前 AI 高级总监,2 月回归 OpenAI 后,在推特上表示自己要创立一个 “贾维斯 “。大模型技术打破了 AI 难以用于不同领域的壁垒,多模态的发展将赋予 AI 与现实世界交互的能力,智能助理的发展方向一定是越来越全能,科幻电影中的贾维斯离我们已并不遥远。
2.音箱、耳机、手机是智能助理核心载体,未来 AR 可能出现
音箱是最快进入家庭的智能家居核心。伴随着 chatGPT 带来的 AI 技术进步,有望助力智能家居产品渗透率提升,而其中智能音响是重要抓手。当前,智能音箱已完成初轮用户普及,成为 AIoT 的重要端口。在大模型能力加持下,智能音箱能作为智能家居的管家,通过理解用户意图,调动其它设备比如电视,空调,灯和扫地机器人等,助力智能家居实现多场景之间相互配合。
音箱还是智能座舱的重要部分。智能座舱通过 AI 和沉浸式的音视频带来的人车交互体验,司机不再只是辛劳的驾驶者,乘客不再只能无聊的打发时间。智能座舱的音箱体验是车厂非常重视的亮点。智能助理应用到汽车座舱,通过语言和用户交互也将是未来趋势。
结合大模型技术的音箱已在飞快落地中:4 月 4 日,脱口秀演员鸟鸟在微博展示了一个自己的 AI 嘴替 “鸟鸟分鸟”。这是一个搭载于天猫精灵上的模型,模仿鸟鸟的自己的语调,音色和风格。新浪科技向阿里方面求证获悉,“天猫精灵和达摩院一直在紧密合作,其中包括推进大语言模型、声学模型、语音 AI 等综合应用 “。
阿里方面回应表示,“个性化大模型是公司重要探索方向,天猫精灵智能交互系统(AliGenie)在达摩院大模型的加持下将得到全面提升,给用户带来更好的服务体验。”
继百度官宣类 ChatGPT 项目 “文心一言” 后,小度科技宣布将融合文心一言,打造针对智能设备场景的人工智能模型 “小度灵机”,并且应用到小度全系产品。
在许多场景,耳机是目前最重要的语音交流设备,因为人类物理条件限制,耳机在未来可见维度内都是优质入口。除非脑机接口或其它新技术突破,目前语言依然是人类交流的最通用方式,也是与智能助理交流的最佳方式。除了直接与音箱对话,在户外、旅途等移动场景,或者需要私密性的场景,最合适的语音智能载体还是耳机。
目前有许多智能耳机都具备一定 NLP 能力,如接受语言指令播放音乐,自动翻译和录音转文字等,随着智能助理的发展,耳机也将是智能助理的重要载体。
作为目前最成熟的通信工具,手机为用户提供通讯、端处理与界面,是当前智能助理应用最广泛的终端。现在我们为了各种需求,需要安装许多 APP,然后学习各种 APP 的 UI,才能完成与系统的交互,各家互联网公司的产品经理都需要想方设法降低用户的学习门槛。
随着 ChatGPT 插件的出现,各类 APP 都能接入大模型,从而直接处理用户的语言指令,而不需要用户学会操作 UI。或者会出现同时管理各类 APP 的智能助理,用户提出语言需求后,智能助理自己能寻找对应解决方案的 APP。对于 APP 厂商而言,未来适配智能助理是必备能力。
未来随着硬件技术发展,VR/AR 头盔,眼镜甚至脑机接口,也都可能成为主流的智能助理载体。
3.生态核心:大模型厂商/终端/硬件厂商角逐场景
AIOS 超级时代,大模型厂商/手机终端厂商/智能硬件厂商将各自发挥自己的优势,挖掘智能助理的价值。
大模型厂商可能会针对智能助理做优化,比如推出微调版本的智能助理模型。但预计不会非常深入,因为大模型本身价值就够高,众多下游应用厂商为了提供优质解决方案,必然要接入大模型,对于大模型厂商来说,最重要的还是提升基础模型的能力。
以现在的 OpenAI 为例子,开放 ChatGPT 插件后,OpenAI 的地位类似于 AppStore,众多开发者通过插件实现各类应用,而插件最终还是要通过 OpenAI 的付费 API 才能调用大模型的能力。
手机终端暂时是智能助理最大载体,但可能不是最终载体。目前手机普及率远超过 PC,衣食住行等方面的服务都普遍可以通过 APP 来交互,因此智能助理在手机上通过调用各类 APP,就能很快代替用户使用现有的各种服务。
很可能是手机出厂自带智能助理,要求上架 APP 提供标准接口供智能助理统一管理。但随着未来 AR/VR 等技术的发展,可能会有其它设备代替手机在生活中的地位。
智能硬件厂商或具有较大机会,实现软硬一体,综合场景的机会。音箱,耳机曾经单纯作为音频设备功能比较单一,用户需求有限,附加值不高。随着 AI 发展,智能音箱,智能耳机成为软硬件一体的多功能设备,结合智能家居,智能座舱和移动携带场景,有望成为各场景里的智能助理核心载体设备,从非必需品转为必需品。
本文作者:国盛证券分析师刘高畅(执业:S0680518090001),原文标题:《下一个超级应用:智能助理》