更强大的逻辑能力,更新的训练数据,最高一次性输出 3000 多个单词。
Anthropic 是一家专注于人工智能(AI)研究的公司,由 OpenAI 的前首席科学家 Ilya Sutskever 和 Dario Amodei 共同创立。Claude 是 Anthropic 公司发布的基于 transformer 架构的大语言模型,被认为是最接近 ChatGPT 的商业产品。今天,Anthropic 宣布 Claude 2 正式开始上架。
Claude 模型可以在 Slack 中免费使用,一度是我们团队使用的 ChatGPT 的最强替代者,对中文支持很好,意图理解也非常优秀。Claude 2 的发布应该会很快会在 Slack 中体现。本次也推出了Claude Chat 网页版,完全免费,支持直接根据 PDF 总结结果(最高不超过 10MB 的文档,单词数应该是 7.5 万以内都可以)。
-
Claude 模型介绍
-
Claude2 的重要更新总结
-
编码能力提升很大
-
最高支持 10 万 tokens 的输入和 4000 个 tokens 的输出
-
更强大的逻辑能力
-
更新的训练数据
-
-
Claude2 实测总结和免费使用方式
Claude 模型介绍
Claude 是 Anthropic 公司开发的一系列大型语言模型。这些模型使用了 Transformer 架构,并通过无监督学习、人类反馈强化学习(RLHF)进行训练。Claude 模型可以理解和生成人类语言,用于各种任务,如回答问题、写作、编辑和编程。
尽管 Claude API 接受申请,但是很难(我也申请过几次,完全杳无音讯)。不过,在 Slack 中,有免费的 Claude 模型可以使用。大多数人使用 Claude 的感受应该都是它与 ChatGPT 很像,对意图的识别和文本的生成都有很好的支持。相比较免费版本的 ChatGPT(训练数据在 2021 年 9 月之前),Claude 模型中包含更多的最新数据,因此就免费版本来说,Claude 更好。
Claude2 的重要更新总结
Claude 2 和之前的 Claude 模型都是通用的大型语言模型,使用 Transformer 架构。Claude 2 是该公司迄今为止最强大的系统,它代表了从早期的 “有用且无害” 的语言助手模型到现在的连续演进。Claude 2 并没有从先前模型和研究中带来变革性的变化,而是代表了一种连续的演变和一系列小而有意义的改进,这些改进建立在 Anthropic 过去 2 年多的研究基础之上。
Claude 2 有几个非常重要的更新值得关注。
编码能力提升很大
Claude 2 在 Codex HumanEval(一项 Python 编码测试)上的得分从 56.0% 提高到了 71.2%。官方的演示视频中,你可以直接上传一个代码文件(js 库),然后 Claude 就可以自动分析代码并给出这个库的使用方法。
看起来代码理解和生成能力十分厉害。
最高支持 10 万 tokens 的输入和 4000 个 tokens 的输出
尽管很早之前 Anthropic 就生成 Claude 最高支持 10 万 tokens 的输入,但是一直没有发布。今天的 Claude2 宣布正式支持 10 万 tokens 的输入,并且可以一次性输出 4000 个 tokens,大约 3000 多个单词。
这应该是目前最高的上下文限制了(超过 GPT-4 的 32K)。
官方演示视频中上传了一个 84K 的文档给 Claude,然后可以顺利输出文档中的重要部分。还支持以 Markdown 的格式输出其中重要的内容。
更强大的逻辑能力
实话说,我体验 Claude1.3 的时候已经觉得这个模型做的很好了,几乎与 ChatGPT 没有啥区别。但是 Claude 2 宣称它在众多的测试中有更好的表现。
如下图所示,在 GRE、USMLE Medical 测试和 Multistate Bar Exam 中表现都很好。
Claude2 在 Bar exam 的多选得分中从 1.3 版本的 73% 提升到 76.5%。GRE 的阅读和写作中也处在 90 分位数。表现非常好。
更新的训练数据
这一点比 ChatGPT 好,尽管付费版本的 GPT-4 支持插件方式来访问最新的数据。但是插件尤其是网络插件很多时候会出问题。而 Claude2 则是已经使用了2023 年初的新数据来训练模型了。所以,模型本身对 2023 年之前发生的重要事情与内容应该都是知道的。
尽管 ClaudeAI 不支持插件。但是官方说,它是支持与搜索工具连接的,包括网络和数据库等。同时,也可以直接将文档发给 Claude 来分析。
Claude2 实测总结和免费使用方式
本次其实官方推出了一个 Claude2 的聊天工具,完全免费!我已经测试了 Claude 这个模型,速度很快,效果非常好。
上面是我让它总结的 GPT-4 的技术细节文档,识别速度和结果都非常棒。
需要注意的是目前 Claude Chat 仅开放 US 和 UK 地区!
根据此前的合作,它应该很快会在 Slack 上更新。Slack 是一款流行的团队协作工具,可以免费注册,然后引入 Claude APP 即可使用,也是完全免费。
不得不说,Claude 真业界良心啊~大家可以用起来了!
本文来源:DataLearner,原文标题:《最像 ChatGPT 的产品更新:GPT-4 最强竞争模型 Claude2 发布!免费!具有更强的代码能力与更长的上下文!》