“少数人” 的胜利,Midjourney 走上 AIGC 神坛

Wallstreetcn
2023.04.26 14:33
portai
I'm PortAI, I can summarize articles.

Midjourney 的风格是简单、直接、高效,所有精力集中在模型上,不做 app,也不做网站。

作者|于惠如 编辑|罗丽娟

如今,不知道 Midjourney 这家公司,似乎就不配谈 AIGC。

不久前,AI 绘图工具 Midjourney 发布了第五代 V5 模型,由它生成的一张 “中国情侣” 图片因效果酷似真人而火爆出圈。紧接着,又进一步宣布推出针对二次元、动漫风格的版本。

图源:网络

新版 Midjourney,用户使用风格化命令,就能轻而易举地生成大师级作品。以高频迭代速度不断优化使用体验,一时间,针对 Midjourney 的极简入门法则、使用攻略、进阶玩法、变现指南等在网上被广泛传播。

大量新用户的涌入,再加上 GPU 临时性短缺,导致 Midjourney 付费用户的服务陷入了瘫痪。为此,公司只好叫停免费试用。

有机构用 “产品效果惊艳” 评价 Midjourney。作为文生图领域的 “领跑者”,Midjourney 由 David Holz 创立于 2021 年 8 月,仅拥有 11 名全职员工,成立至今未融过资,却凭借着付费订阅的商业模式,实现年营收 1 亿美元。

资料来源:The information 官网

就是这样一个仅有 11 人的小公司,没有任何外部重金投入,却成为 AI 绘画领域的 “当红明星”,甚至将同类型的公司都甩在其后。

现如今,Midjourney 在聊天软件 Discord 上已经积累了将近 1500 万用户,这家公司也成了了解 AI 绘画无法绕开的公司。

创始人曾两次拒绝苹果

“我们没有压力销售什么东西,也不用成为上市公司,只是为了未来十年能够有一个家,可以从事很多比较有意义的、酷的项目,希望不仅是对我,还是对世界有意义,并且享受乐趣。” 一年半前,Midjourney 创始人 David Holz 在接受媒体采访时表示。

在 David Holz 的蓝图中,他要打造的是一个 “想象力引擎”,他认为想象力是人们在世界上所需东西的重要支柱。而同时,人们可以把 AIGC 变成一种力量,扩展人类的想象力。

图源:Midjourney 官网

Midjourney 官网上,关于 David Holz 的此前经历的介绍非常简洁:Leap Motion 创始人;NASA 和 Max Planck 研究员。

图源:Midjourney 官网

"这很 Midjourney。” 一位 AIGC 领域创业者说,它的风格就是简单、直接、高效,就像他们做产品的思路一样:“所有精力集中在模型上,不做 app,也不做网站。”

高中时期的 David Holz 感兴趣的是设计,也做过设计生意。上大学后,他学了与设计几乎不相干的物理和数学。研究生期间,他希望能选择与现实有关的专业,于是读了应用数学专业。之后,他又攻读了流体力学博士。

创业的想法很偶然。“有一次我不知所措,把所有的事情放在一边。所以我搬到了旧金山,创办了 Leap Motion。” David Holz 曾在接受媒体采访时说。

Leap Motion 成立于 2010 年,彼时 VR、AR 行业还未开始火热。两年后,极具极客气质的 Leap Motion 控制器诞生。这个看起来像 U 盘一般大小的盒子尽管看似毫不起眼,但一经展示便立即吸引了大量的关注。

这个控制器内装有多种传感设备,能追踪到小到 0.01 毫米的动作,当你把手放在它正上方,便可以跟踪十指动作,并借助计算机视觉技术,让你的手部动作投射在虚拟空间中。

这款充满着想象和憧憬的产品推出后,Leap Motion 一炮而红。2013 年经过 B 轮融资之后达到巅峰状态,估值达到 3.06 亿美元。

彼时,苹果的 AR 项目还在初期,希望通过收购将优秀的团队和项目整合到自己的项目中。然而理念的差异让苹果吃了闭门羹。这是 David Holz 第一次拒绝苹果。

五年后的 2018 年,Leap Motion 已没有昔日的名气,但技术实力依然不弱。接到苹果再次邀约之后,双方开始了谈判,但在交易进展到尾声阶段时,收购再一次叫停。

在之后的公开报道中,David Holz 间接解释了拒绝苹果的原因,他认为苹果已经失去了创造力,甚至直言:“我永远不会为那些家伙工作,他们是魔鬼。”

MidJourney 的创始人大卫·霍尔茨 图源:网络

最终在 2019 年,David Holz 以 3000 万美元将 Leap Motion 卖给了竞争对手 UltraHaptics。

Midjourney 是 David Holz 在 AI 艺术领域探索新机会的产物。

后面的这次创业,David Holz 没有融资,但靠 “刷脸” 解决了 Midjourney 算力问题。

据报道,David Holz 给一个云供应商的负责人发邮件,希望对方提供 10000 个 GPU。很快,Midjourney 获得了云供应商的支持,原因便是他们了解到 David Holz,知道他以前的创业经历。

低使用门槛抢占用户心智

“相比其他同类产品,Midjourney 的 Prompt 简短,用户门槛低。” 一家第三方研究机构在其报告中写到。

Midjourney 使用起来极为简单,注册 Discord 账号之后,即可进入 Midjourney 频道,随后可以加入公测服务器。使用时,用户只需要输入命令提示符,就可以生成对应的高品质图形。它可以让用户避开复杂的使用技巧,同时可以用算法让机器想象你输入命令的样子。

这也是 Midjourney 能够脱颖而出的地方。凭借简单的 Prompt,Midjourney 借助 Discord 社区持续迭代,社区用户将近 1500 万。

图源:Discord

一位 Midjourney 使用者告诉全天候科技,Midjourney 给人的感觉是用起来简单而且无约束,“有一种不可思议的力量和流动,就像一款能让我上瘾的游戏。”

而在前述 AIGC 领域从业者看来,Midjourney 拥有游戏的所有元素:能够让你想象任何实物的可靠核心圈层,魔咒一般灵巧的指令符,以及基于社区的开放文化。

Midjourney 生成的人物图 图源:推特账号 Nick St. Pierre

为何不直接做一个 iOS 拍照应用?而是选择 Discord 用户界面。最初其实是因为 Midjourney 团队是一个远程工作的团队,所以建立了一个机器人。

后来,团队用同样的机器人在 Discord 上做了一个用户测试,得到的结果是:用户很喜欢这个实时交流想法,富有想象力的环境。这也让 David Holz 看到了 Discord 体验的神奇之处。

“我们发现人们真的喜欢一起想象,所以我们让 Midjourney 更具社交性。我们有一个巨大的 Discord 社区,用户在这些共享空间中共同想象。” David Holz 曾在公开采访中表示。

他认为,人们想要一起做事情,如果是在 iOS 平台去做,就必须做自己的社交网络,这非常困难。但相反,如果用户想要自己的社交体验,Discord 是很好的选择。

作为一款适用于游戏玩家一体化语音和文字聊天软件,Discord 平台的社交属性也让 Midjourney 抢占了更多的用户心智。“它在 Discord 上更像是一个艺术 AI 的社交空间,能够让它易于迭代、学习、发现和发展。” 上述 AIGC 领域从业者说。

Midjourney 生成的 “卡塔尔世界杯” 画面。图源:小红书博主 Ai 船长

换言之,Discord 社区生态帮助了 Midjourney 的推广。反过来,庞大的用户能够根据自身需求针对性地训练模型并快速迭代产品。

作为 AI 绘画领域的两个 “领头羊”,人们总会把 Midjourney 和 Stable Diffusion 放在一起对比。

对比而言,Stable Diffusio 是一个免费开源的模型,完全免费、不限次数、任何人都可用的。因而,Stable Diffusion 的优势在于其无需任何成本即可使用。

同时还可以在 GitHub 上找到完整的源代码和文档。另外,开源前提下,模型代码迭代的速度也增快,优化效率高于闭源模型。

但缺点也显而易见:如果没有其它护城河,商业化问题难以解决,很容易成为别人前进的垫脚石。

而 Midjourney 则需要付费使用。和大部分软件类应用类似,Midjourney 采用付费订阅的模式,按月向用户收取费用,共有 3 种收费套餐:10 美元/月、30 美元/月、60 美元/月。

图源:Midjourney 官网

相较而言,收费模式容易劝退用户,在社区支持和维护方面也逊于开源的 Stable Diffusion。

然而,相对封闭也成为 Midjourney 构建自身护城河的重要方式。因为没有公开其源代码,因此无法被广泛地研究、改进和应用,Midjourney 积累的数据集具有独家性,可以进行针对性训练。

Midjourney 的成功或许包含了多种因素,比如:清晰的目标定位,快速在一个仍然混沌的市场中找到合适的产品形态;专注在有价值的具体业务方面,迅速形成技术优势;找到一个有充沛流量的场景 Discord,实现低成本获客,低成本营销等。

想象力的空间已经打开,AIGC 的竞争越加激烈,Midjourney 还能赢在未来吗?