重磅!OpenAI 将发布 DALL·E 3,多模态 ChatGPT 来了!

Wallstreetcn
2023.09.21 01:31
portai
I'm PortAI, I can summarize articles.

ChatGPT 在 DALL·E 3 加持下将开启久违的多模态输出模式,用户通过文本就能直接在 ChatGPT 中生成各种类型图片。

9 月 21 日凌晨,OpenAI 在官网宣布,在今年 10 月份将通过 API 向 ChatGPT Plus 和企业版用户提供全新文本生成图片产品——DALL·E 3。

这意味着,ChatGPT 在 DALL·E 3 加持下将开启久违的多模态输出模式,用户通过文本就能直接在 ChatGPT 中生成各种类型图片。

例如,在 ChatGPT 中输入,生成一只可爱的米老鼠、二次元风格、在火星中奔跑、面带惊恐的表情、背着一个火箭背包。如果对生成的图片不满意,可以让其反复生成直到满意为止。

早在 2021 年,OpenAI 基于 GPT-3 大语言模型和变分自编码器(VAE),开发了文本生成图片产品 DALL·E,使用方法和功能与 Midjourney、百度文心一格等产品类似。

该名字来源于艺术家 Salvador Dali 和电影《玩具总动员》中的角色 WALL·E,也反映了该产品的主要技术特性,生成具有创新性和想象力的图片。

在 2022 年 4 月,OpenAI 又发布了 DALL·E 2,在功能、资源消耗方面进行了大幅度优化。

今天宣布的 DALL·E 3,将比前两代功能更加强大并且可集成在 ChatGPT 中使用,使其实现多模态输出。

了增强 DALL·E 3 的数据安全,OpenAI 进行了以下优化。

  • 禁止 DALL·E 3 生成暴力、仇恨、成人等非法内容;
  • 禁止生成偏见、歧视、丑化公众人物的图片;
  • 内置内容来源分类器,用于识别 DALL·E 3 生成的图片,防止用于非法用途;
  • 可以选择 DALL·E 3 是否可以提供特定艺术家风格图片:默认是允许;如果艺术家不允许可以申请将其作品,从训练数据中剔除。

(申请地址:https://share.hsforms.com/1_OuT5tfFSpic89PqN6r1CQ4sk30)

以下是 OpenAI 在官网展示的 DALL·E 3 生成的图片效果。从展示可以看出,DALL·E 3 可以生成写实、二次元、平面、创意、朋克、3D 等多种类型的图片。

 
 
 
 
 
本文来源: AIGC 开放社区(ID:AIGCOPEN),原标题:《重磅!OpenAI 将发布 DALL·E 3,多模态 ChatGPT 来了!
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。