文心一言,百度的新故事?

DoNews
2023.02.11 02:16
portai
I'm PortAI, I can summarize articles.

中国版 ChatGPT 来了

撰文/苏舒

编辑/李信马

尽管百度只是承认了正在做类似 ChatGPT 的项目,以及项目的名字——“文心一言”, 但这个消息依然让百度赚足了眼光。

2 月 7 日,百度公布消息当天,港股股价在一天内大涨 15%,美股股价涨幅也达到了 12%。

(图片来源:腾讯自选股)

此前,当地时间 2 月 6 日,谷歌也公开了正在做类似 ChatGPT 的项目——Bard。2 月 7 日,微软宣布将 ChatGPT 接入到搜索引擎必应中;次日,阿里也传出正在研发 “阿里版” ChatGPT,目前处于内测阶段。

大厂纷纷跟进,将 ChatGPT 的热度抬升到了新阶段。对百度来说,这款产品可能正是他们苦苦追寻的 “荒年之谷”。

01、百度需要 ChatGPT

深耕人工智能多年的百度,绝不会错过眼前的风口。

ChatGPT 被视为人工智能行业的里程碑,百度在 AI 领域的积累——海量数据、算力、算法以及预训练大模型,已经具备了生成类似项目的条件。而 ChatGPT,或者说其 “中国版” 文心一言的商业化前景,也足够吸引人。

首先,文心一言可以和百度的搜索引擎结合。有接近百度人士透露,文心一言落地的首站,将直接接入百度搜索。目前,文心一言的相关功能已陆续在百度搜索内上线或内测,包括多答案回复、智能生成等。

与传统的搜索引擎相比,接入 ChatGPT 后的搜索,可以提供更智能化的单一答案,让用户省去反复点击链接找寻答案的麻烦。这一变化或许会带来互联网广告收入形式的革新,以及出现新形式的增值服务,有不小的想象空间。

(图为新必应搜索截图)

除了和搜索引擎结合之外,百度的公告称,小度将融合文心一言的全面能力,打造针对智能设备场景的人工智能模型「小度灵机」,应用到小度全系产品。

小度背后是 “小度 OS+ 硬件”,除了已经常见的智能家居场景外,还包括以学习机、平板等为主的学习场景,还有百度另一大业务——智能汽车中的车载场景。

赛智产业研究院院长赵刚对 DoNews 表示:“从目前 ChatGPT 来看,百度推出的文心一言背后的技术对于百度全产品线会有很大的提升。ChatGPT 是一种引领性的技术,一种变革性的生产力,它可以带动其他产品围绕着这个方向做出相应的服务模式和商品模式的调整。不止是推动百度的全线产品升级革新,ChatGPT 及其背后技术的出现,甚至于可以推动智能交通、智慧医疗等各个行业的变革。这就像是当年的深度学习算法出现后带动一轮 AI 企业的整体提升,基于 GDP 模型下,新一波人工智能浪潮已然开启。”

2017 年,百度提出 “All in AI” 战略,将业务重心转向人工智能。但商业化落地上,人工智能目前仍未取得突破性进展,ChatGPT 的出现,不仅有可能帮助百度开拓新的商业版图,其对百度的基本盘——搜索引擎——的价值,也是百度不敢忽视的。

02、文心一言能成为中国的 ChatGPT 吗?

将这个问题抛给 ChatGPT,它给出了这样的回答:文心一言有可能成为中国的 ChatGPT。

(图为 ChatGPT 截图)

目前,文心一言还未正式推出。DoNews 试图从 ChatGPT 和文心一言的项目起源、技术路径以及商业化等方面进行比较。

2018 年,Open AI 在 NLP(自然语言处理)领域打造了 GPT 系列模型。2020 年,Open AI 放出了具有 1750 亿参数的预训练模型 GPT-3,横扫文本生成领域,不仅能问答、翻译、写文章,还能做数学计算。

2022 年 12 月,基于 GPT-3.5 预训练大模型的免费对话模型——ChatGPT 正式上线。

而文心一言最早可以追溯到 2019 年,百度推出了产业级知识增强文心大模型 ERNIE。百度放出的 AIGC 能力,包括写作、绘画、写歌等方面的能力,都是基于这一大模型。

据推测,去年 9 月,百度就开始做文心一言,从项目发起时间来看,并没有落后 Open AI 很长时间。

其次,从技术路径上来看,ChatGPT 成功的原因有四点:强大的基座模型能力(InstructGPT)、大参数语言模型(GPT3.5)、高质量的真实数据(精标的多轮对话数据和比较排序数据)、性能稳定的强化学习算法(PPO 算法)。

百度同样具备这些能力。正如百度官宣中所言:百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。

另外,深耕人工智能领域多年的百度,拥有产业级知识增强文心大模型 ERNIE,具备跨模态、跨语言的深度语义理解与生成能力。

“Open AI 的 ChatGPT、百度的文心一言、或者是谷歌的 Bard,这三家从整体的技术路径来看是比较一致的。” 赵刚表示,具体细节上,每家可能对模型有着不同的组合方式来实现创新。

不得不提到的是,文心一言和 ChatGPT 有不同的侧重点,文心一言主要关注文本生成领域,而 ChatGPT 则主要关注自然语言处理和生成领域。

从商业的角度来看,微软的 ChatGPT、谷歌的 Bard 对百度来说没什么威胁性。毕竟在中国市场,百度搜索拥有主导地位和海量的中文数据,占据绝对的优势。微软和谷歌的产品反而可以作为百度技术路径和商业化上的参考对象。目前阿里、腾讯也爆出正在做 ChatGPT 相关项目,但与百度相比,无论是在数据储备还是搜索引擎上,都有明显的差距。

目前来看,距离中国的 ChatGPT 最近的,的确是文心一言,但文心一言能做到什么程度,甚至能否超过 ChatGPT,成为百度期盼已久的 “第二增长曲线”,还有待时间的考验。