更出色的新一代人工智能来了，能读图、会解题、擅长考试，但 OpenAI 也彻底 “变味儿” 了。

引领全球人工智能热潮的 OpenAI，终于推出了它的新一代多模态模型GPT-4。

新一代模型能够同时接收图像和文本输入，比上一代模型 GPT-3.5（ChatGPT 的技术基座）参数更多、更安全，“比以往更具创造性和协作性”，并且 “由于它有更广泛的常识和解决问题的能力，可以更准确地解决难题。”

这一次的发布，也比以往更加神秘，OpanAI 没有公布 GPT-4 相关技术细节，标志着该公司从非营利性研究实验室向营利性技术公司的全面转变。

更出色的人工智能

GPT-4 在安全性和精确性上都有巨大的提升。

OpenAI 称，GPT-4 比 GPT-3.5 对受限制请求做出回应的可能性低 82%，编造内容的可能性低 60%。

更重要的是，不同于 ChatGPT 仅能接收文本输入，GPT-4 可以响应图片。向它展示一张冰箱里东西的照片，然后问它能做什么饭，GPT-4 会尝试用照片上的原料生成菜谱。

给它一张气球被线拴在地上的图片，然后提问如果把线割断会发生什么，GPT-4 会回答 “气球会飞走”。

此外，OpenAI 的新模型在基本推理方面的表现比 ChatGPT 更好，可以解决更复杂的难题。

据媒体拿到的演示版本，GPT-4 能够用字母 “g” 开头的单词概括 OpenAI 的公司简介：

“GPT-4, groundbreaking generational growth, gains greater grades. Guardrails, guidance, and gains garnered. Gigantic, groundbreaking, and globally gifted.”

GPT-4 在美国律师执照考试（UBE）上的表现也远超 GPT-3.5，GPT-3.5 的得分是倒数 10%，而 GPT-4 是前 10%。

AI 初创公司 Hugging Face 联合创始人 Thomas Wolf 对媒体称，理论上，结合文本和图像的多模态模型能够更好地理解世界：

“它可能能够解决语言模型的传统弱点，如空间推理，”

艾伦人工智能研究所的 Oren Etzioni 对媒体表示：

“GPT-4 现在是评估所有 AI 模型的基准，它在许多方面的提升都非常显著。”

一家变味儿的公司

然而，和之前发布 GPT-3、2 的时候不一样，OpenAI 这次没有透露 GPT-4 有多大，也没说它是如何打造的——没有透露数据、计算能力或训练技术。只是模糊地说，GPT-4 的参数更多，是一个更大的模型。

以前，OpenAI 会公开这些数据，给同行参考，比如 GPT-2 有 15 亿个参数，性能更好的 GPT-3 参数是它的 100 倍。

Wolf 对媒体抱怨道：

“OpenAI 现在是一家完全封闭的公司，科学交流类似于产品的新闻发布，”

竞争变得更加激烈了，Google 旗下 DeepMind 的多模态模型 Flamingo 在急起直追，其他互联网巨头也都正在 AI 上发力。OpenAI 如今是一家背靠微软、寻求赚钱的营利机构，而不是一家纯粹的人工智能研究所了。

GPT-4 的早期版本已经在微软产品中上线。OpenAI 还开放了 API 接口，让机构商用。目前，已经有支付平台 Stripe、语言学习平台多邻国、摩根士丹利和冰岛政府（冰岛试图使用 GPT-4 来保护冰岛语言）等多家机构前来寻求合作。

GPT-4 的访问权限将优先提供给注册过等候名单的用户以及付费购买 ChatGPT 会员的用户，但目前仅限于文本输入。

GPT-4 据说比 ChatGPT 强大，但 OpenAI 不说原因

更出色的人工智能

一家变味儿的公司