OpenAI 公布最新版本 GPT-4 称其能在 SAT 考试中击败 90% 人类

Zhitong
2023.03.14 22:38
portai
I'm PortAI, I can summarize articles.

OpenAI 公布了其主要大型语言模型 GPT 的最新版本 GPT-4,并表示模型在许多专业测试中表现出 “人类水平的性能”

智通财经 APP 获悉,周二,OpenAI 公布了其主要大型语言模型 GPT 的最新版本 GPT-4,并表示模型在许多专业测试中表现出 “人类水平的性能”。

ChatGPT-4 比以前的版本 “更大”,这意味着它已经在更多的数据上进行了训练,它的运行成本也更高。

目前,此领域的许多研究人员认为,人工智能领域的许多最新进展,都来自于在数千台超级计算机上运行越来越大的模型,这些模型的训练过程可能耗资数千万美元。GPT-4 是 “扩大规模” 以获得更好结果的训练方法的一个例子。

OpenAI 表示,它使用的是微软 (MSFT.US) Azure 训练模型,微软已经向这家初创公司投资了数十亿美元。OpenAI 没有公布具体模型大小的细节,也没有公布用来训练模型的硬件,理由是 “竞争情况”。

OpenAI 的 GPT 大型语言模型为许多人工智能演示提供了支持,包括必应的 AI 聊天和 ChatGPT,这些演示在过去六个月里让科技行业的人们惊叹不已。最新版本是新技术的预览,可能会在未来几周内开始整合到聊天机器人等消费产品中。微软周二表示,必应的人工智能聊天机器人将使用 GPT-4。

OpenAI 表示,新模型将产生更少的错误答案,更少地偏离话题,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

OpenAI 称,GPT-4 在模拟律师资格考试中排名第 90,在 SAT 阅读考试中排名第 93,在 SAT 数学考试中排名第 89。

然而,OpenAI 警告说,新软件还不完美,在许多情况下,它的能力不如人类。公司表示,它仍然存在 “幻觉” 或自己编造的主要问题,而且在事实问题上并不可靠。它仍然倾向于在错误的时候坚持自己是正确的。

公司在一篇博客文章中表示:“GPT-4 仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。在闲谈中中,GPT-3.5 和 GPT-4 之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,差异就显现出来了——GPT-4 比 GPT-3.5 更可靠、更有创造力,能够处理更细致的指令。”

新模型将提供给 ChatGPT 的付费用户,也将作为 API 的一部分提供,允许程序员将 AI 集成到他们的应用程序中。OpenAI 将对 750 字左右的指令信息收费 3 美分,对 750 字左右的响应信息收费 6 美分。