一位计算机科学教授表示,免费的 AI 模型现在在性能上 “相当接近” 谷歌和 ChatGPT 开发商 OpenAI 的专有模型,大多数软件开发人员最终将选择使用免费的模型。
今年 2 月,Meta 发布开源大语言模型 LLaMA,开启 AI“安卓时刻”。
几周之内,学术界的一些学者就将这些模型转化为开源软件,为 ChatGPT 和其他专有人工智能软件的免费替代品提供动力。
据 The Information 周一报道,加州大学伯克利分校计算机科学教授 Ion Stoica 表示,免费的 AI 模型现在在性能上 “相当接近” 谷歌和 ChatGPT 开发商 OpenAI 的专有模型,大多数软件开发人员最终将选择使用免费的模型。据悉,Stoica 利用 Meta 的技术帮助开发了一个关键的 AI 开源模型。
这让人想起不久前谷歌的一份泄密文件,谷歌研究员在这份泄密文件中坦言,谷歌没有护城河,OpenAI 也是如此,与开源 AI 竞争将难以占据优势。
文件中提到:
“虽然我们的模型在质量上仍有一点优势,但差距正在以令人惊讶的速度迅速缩小。开源模型训练速度更快,可定制性更强,更私密,而且比同类产品能力更出色。他们正在用 100 美元和 130 亿的参数做一些谷歌 1000 万美元和 540 亿的参数难以企及的事情,而且在短短几周内就能做到,而不是几个月。”
这也就是说,如果以上都为真,开源人工智能可能会颠覆谷歌、OpenAI、微软和其他出售专有模型使用权的公司的商业模式。
分析称,开源人工智能可以让任何人以低廉的成本获得强大的人工智能工具,Meta 也可从中获得回报。
专注于专有模型可能会落后
Stoica 是使用 Meta 的研究开发 Vicuna 的学者之一,Vicuna 是一种开源语言理解模型,于今年 3 月发布。Vicuna 的质量和开源 AI 的快速发展促使谷歌高级工程师 Luke Sernau 在泄密文件中警告同事,他们的公司在追赶 OpenAI 的过程中专注于专有模型可能会落后。
他说,对于用户而言,如果有一个没有使用限制、免费、高质量的替代品,谁还会为谷歌的产品付费呢?他还说,开源 AI 的开发正在 “掠夺我们”,并补充说 “谷歌应该让自己成为开源社区的领导者”,并 “放弃对我们模型的一些控制权”。
这份泄密文件引起了整个行业的共鸣,包括一些谷歌员工,尽管该文件的论点可能夸大了开源人工智能的能力,低估了它的成本和其他风险,但大多数 AI 从业者都同意泄密文件的结论之一,即 Meta 将从发布其模型中获益。Meta 在内部使用 AI 模型进行内容推荐和广告定位,随着开发人员改进 Meta 发布的模型,Meta 将能够将这些改进整合到其内部 AI 中。
谷歌并没有对 AI 软件采取完全专有的方法。早在 ChatGPT 出现之前的 2020 年,它就发布了一个开源语言模型 T5,使开发人员能够构建可以完成翻译和摘要等任务的软件。谷歌随后还发布了一个更高级的版本,Flan-T5。但据 Stoica 和其他从业人员说,Meta 发布的软件使谷歌的模型得到了重大改进,这使得工程师们更有可能选择基于 Meta 软件的模型。
报道:OpenAI 的开源语言模型也要来
据一位知情人士透露,不止是 Meta,谷歌的主要 AI 竞争对手 OpenAI 也正准备向公众发布一种新的开源语言模型,该计划此前从未被报道过。
目前尚不清楚 OpenAI 即将推出的开源软件,是否会抢走使用 Meta 模型开发的软件的风头。但分析称,它不太可能发布一款能与它正在销售的专有模型 GPT 竞争的模型。OpenAI 270 亿美元的私人估值取决于未来,尽管 GPT 的前两个版本是开源的,但 GPT4 不是开源的。
像 Vicuna 这样的开源模型训练成本低至几百美元,让用户可以选择避免向软件提供商支付昂贵的费用。结果是,最近几周,开源替代品激增。
除了基于 Meta 软件的 Vicuna 等模型外,工程师还可以从德国非营利组织 LAION 以及 Databricks 和 Stability AI 等初创公司中选择其他模型。Stoica 创建了一个网站,试图评估那些开源模型与专有模型 (如 OpenAI 的 GPT-4) 的质量。
Stoica 说,与开源软件相比,谷歌仍然有两个优势。1、如果谷歌利用其大量的用户数据,它的模型可以更好地用于某些特殊目的,例如内容推荐。2、谷歌在管理大型计算机基础设施方面的专业知识意味着它将能够以更低的成本运行 AI 软件模型,包括用于其云客户。
与此同时,OpenAI 在从数百万人与 ChatGPT 交互的方式中收集数据方面取得了领先,这无疑有助于它改进 AI 软件,而且 OpenAI 与微软达成了一项私下协议,可以使用微软的计算基础设施。
但开源 AI 模型将允许更多公司使用专有数据自行解决问题。Stoica 说,例如,一家航空公司可以使用其数百万客户服务电话的数据来创建自动响应。彭博社在 3 月份宣布,该媒体使用其数据来训练一种更善于理解金融信息的机器学习模型。