Kimi 奇襲百度，文心一言醖釀改名

Kimi 走紅，最大的壓力將給到百度。因為 Kimi 的背後，已站着阿里的身影。隨着阿里通義千問、百度文心一言等宣佈免費開放 200 萬—500 萬甚至 1000 萬字的長文本能力後，kimi 長文本推理能力瞬間被趕超，其 “Kimi 概念股” 的熱度也開始消散。但短期看，已給用户普及了 “長文本推理能力” 的 kimi 是這波流量的贏家。據 similarweb 數據顯示，Kimi Chat 的訪問量已從去年十月的 15.6 萬，增長至 2024 年 2 月的 279 萬。而 3 月 19 日至 3 月 25 日，在月之暗面宣佈把長文本能力從 20 萬字提升至 200 萬字那一週，Kimi 的訪問量達到了 394 萬次，略高於文心一言的 338 萬次，一度躍升為國內網頁端周度訪問量最高的 AI 應用。據 similarweb 數據顯示，整個 3 月 kimi 的訪問量達到 1218.6 萬次。Kimi 走紅的背後，離不開當下阿里激進改革、轉型 AI 的支持。有投資人透露，月之暗面新一輪融資完成後，阿里將成為其持股 40% 的單一大股東。不過，為了保證創始人團隊保有絕對的決策權和控制權，做了 AB 股處理，擁有足夠的投票權。消息稱，最新 10 億美金融資中有 8 億美金來自阿里，部分資金以阿里提供的算力折算。悄然間，阿里在 AI 賽道已有多個棋子的佈局。

Kimi 走紅，最大的壓力將給到百度。因為 Kimi 的背後，已站着阿里的身影。

就在國內大模型競爭處於焦灼狀態時，創業公司月之暗面卻靠着 kimi 智能助手的 “200 萬字長文本” 率先出圈，甚至還催生了 “Kimi 概念股”。

Kimi 的優勢僅領先一個星期。隨着阿里通義千問、百度文心一言等宣佈免費開放 200 萬—500 萬甚至 1000 萬字的長文本能力後，kimi 長文本推理能力瞬間被趕超，其 “Kimi 概念股” 的熱度也開始消散。

但短期看，已給用户普及了 “長文本推理能力” 的 kimi 是這波流量的贏家。據 similarweb 數據顯示，Kimi Chat 的訪問量已從去年十月的 15.6 萬，增長至 2024 年 2 月的 279 萬。

而 3 月 19 日至 3 月 25 日，在月之暗面宣佈把長文本能力從 20 萬字提升至 200 萬字那一週，Kimi 的訪問量達到了 394 萬次，略高於文心一言的 338 萬次，一度躍升為國內網頁端周度訪問量最高的 AI 應用。據 similarweb 數據顯示，整個 3 月 kimi 的訪問量達到 1218.6 萬次。

Kimi 走紅的背後，離不開當下阿里激進改革、轉型 AI 的支持。

有投資人透露，月之暗面新一輪融資完成後，阿里將成為其持股 40% 的單一大股東。不過，為了保證創始人團隊保有絕對的決策權和控制權，做了 AB 股處理，擁有足夠的投票權。

“阿里給了比較苛刻的投資條款，但月之暗面當時要想繼續留在牌桌上，只能有所妥協。本質上，急需新故事的阿里，和急需資金彈藥的月暗各取所需，都得付出部分代價。” 有投資人對《AI 光年》解釋。

消息稱，最新 10 億美金融資中有 8 億美金來自阿里，部分資金以阿里提供的算力折算。

悄然間，阿里在 AI 賽道已有多個棋子的佈局。

4 月 10 日早間，馬雲在阿里內網發表題為《致改革致創新》的帖子，肯定阿里變革一年成效。針對行業未來，馬雲判斷，“三、五年的時間跨度對於互聯網領域而言，猶如一個世紀之久，足以發生翻天覆地的變化，AI 時代剛剛到來，一切才剛開始，我們正當其時。”

而對於起了大早的百度和文心一言而言，Kimi 及阿里將成為當下最重要的競爭對手。

一位行業人士對《AI 光年》透露，百度當下最重要的是力出一孔。“目前文心一言的大模型研發、垂直 To B 應用、To C 產品分別在三個不同的事業羣，負責人也各不相同。”

比如，負責文心一言自然語言處理底層技術的主力團隊是副總裁吳甜，直接向 CTO 王海峯彙報，而百度智能雲的負責人是副總裁朱勇直接向百度智能雲事業羣總裁沈抖彙報。

知情人士對《AI 光年》透露，為了區別文心一言大模型在技術、To C 產品、To B 市場的定位，百度內部高管正討論，是否需要為文心一言更換新的品牌標識。

當然，與百度相比，目前 kimi 在資金、算力和商業化落地方面依然相對弱勢。

“抄近道”

長期看，迴歸大模型根本，長文本推理能力僅是通往 AGI（通用人工智能）的必要技能之一。在實現 AGI 的漫長征程中，長文本並非唯一標準，多模態學習、神經網絡架構創新、應用落地與生態建設、倫理與道德框架構建等各個維度都不可或缺。

雖然 kimi 只做了幾天的 “頂流”，但這也不得不讓行業思考，為何率先普及大模型 “長文本推理能力” 的會是一家創業公司，而非有資本、有算力、有人才、有應用場景的大廠？

kimi 能搶佔用户 “長文本” 的心智並非偶然。在去年多數大模型在 “卷參數、捲開閉源、卷榜單” 忙的不亦樂乎時，2023 年 3 月才成立的月之暗面就以 “抄近道” 的形式在 “百模大戰” 中脱穎而出。

多位投資人對《AI 光年》總結月之暗面能從大廠和眾多創業公司中 “冒尖” 的原因，主要為以下兩點：

一是月之暗面創辦之初就從細分領域找到一個剛需的應用場景，並搶佔了長文本推理能力的用户認知。

“kimi 現在之所以能引爆長文本推理能力是因為他們很早就開始做這件事情了。去年我見楊植麟（月之暗面創始人）時，他就非常明確要做好大模型長文本這件事兒了。他是行業中第一個講 ‘長文本’ 的人，大約兩週後，OpenAI CEO 奧特曼也在某個採訪中才提到這件事。” 月之暗面早期投資人對《AI 光年》解釋。

楊植麟曾在此前的採訪中把長文本比做 “登月的第一步”，是新的計算機內存。用通俗的話説，大模型若要理解複雜的長文本情境，需要足夠大的 “上下文窗口” 或者 “記憶空間” 來容納並處理這些關聯信息，猶如計算機和手機的內存。

去年 10 月，月之暗面推出 Kimi 智能助手時，就在介紹中給自己貼上了 “超大內存” 的標籤。貼標籤僅是第一步，新技術和新範式最好催化劑永遠是用户需求。

從用户的角度看，20 萬—200 萬字的無損上下文能力，可以幫助用户快速解鎖翻譯、專業學術論文、法律文書、金融報告等專業使用場景，這對 “小白” 用户更是剛需。

今年 3 月 18 日，Kimi 智能助手無損上下文擴容到 200 萬字並引發了百度、阿里等大廠的跟進，又進一步加強了用户對 kimi“長文本推理能力” 的認知。

對於阿里、百度等大廠能快速將長文檔處理的文字範圍翻倍，天使投資人郭濤對《深網》解釋，“長文本處理是自然語言處理的一個分支，各大模型在底層技術上的差別不大，關鍵看模型的優化、訓練策略的調整及數據質量等。”

二是楊植麟等創始團隊懂得取捨，提前儲備了足夠的 “資金” 彈藥。

“算力是大模型進化的門檻” 已經成為行業共識。有資料顯示，GPT-3.5 在微軟 Azure AI 超算基礎設施（由 V100GPU 組成的高帶寬集羣）上進行訓練，總算力消耗約 3640PF-days（即每秒一千萬億次計算，運行 3640 天）。

業內一種公認説法是，做好 AI 大模型的算力門檻是 1 萬枚英偉達 A100 芯片。這就決定了，大模型的競爭不僅是科技競爭，也是資金實力的較量。對於創業公司來説，要先於對手融到更多的錢，招聘更優秀的人。

不過，一位月之暗面早期投資人對《深網》表示：“資本和算力對於想做 AGI 的公司來説，是一個必要非充分條件，是公司在不同階段承接用户需求的基礎，但大模型競爭的核心還是公司的技術、產品。技術要保證產品足夠好用、有價值，然後才是資金上的保障。”

對於 “kimi 如何在 5 個月裏用相同成本和設備把模型響應速度提升 3 倍” 的問題，該投資人表示，“技術細節不方便透露。”

“混戰剛剛開始”

無論如何，kimi 的威脅已不容小覷。最先在中國推出類似 ChatGPT 聊天機器人軟件文心一言的百度，要避免 “起了大早，趕了個晚集” 的尷尬。

用户量僅是基礎，迴歸商業本身，檢驗一個模式能否長久，關鍵要看是否有用户及客户願意為商業化落地買單。

“與百度等大廠相比，目前 kimi 在資金、算力資源、應用場景、商業化落地方面還都存在短板。” 天使投資人郭濤對《AI 光年》分析。

月之暗面的算力短板在 kimi“出圈” 時就已顯露。公開資料顯示，3 月 21 日，Kimi Chat 曾因流量激增遭遇了短暫的服務中斷。為此，月之暗面通過算法優化和算力擴容以保證 Kimi Chat 服務的穩定性和響應速度。

據《AI 光年》獲悉，前期火山引擎和阿里雲是 kimi 算力的主要提供方，完成今年 A 輪融資後，Kimi 在未來的推理加速或主要依賴阿里雲。

在商業化落地方面，百度選擇 “兩條腿走路”。在 C 端，文心一言 4.0 版正針對個人用户收費。在 B 端，百度採用大模型 + 雲服務的方式，通過模型即服務（MAAS）等方式在 B 端收費。

“不過，文心一言 4.0 版在 C 端針對個人用户收費，一定程度上不利於用户的積累和數據的迭代，制約其大模型的發展。” 有投資人分析。

在 C 端商業化落地方面，Kimi Chat 目前處於免費的狀態。有投資人透露，Kimi 用户的獲客成本達到 12 元-13 元，近一個月來日均下載量為 17805，每天的獲客成本至少 20 萬元。

在 C 端免費的情況下，Kimi 要向 B 端探索商業化落地。公開資料顯示，掌閲科技、華策影視等公司已和月之暗面在影視劇本創作、讀者互動體驗、內容個性化推薦等方面展開深度合作。對此，二者都沒有正面回應，表示一切以公司公開信息為準。

“月之暗面在商業化落地處於一個早期探索的階段。無論是算力資源、還是應用場景和商業化，百度等大廠比月之暗面等創業公司更有優勢。” 有投資人對《AI 光年》透露。

在該投資人看來，在 Meta 開源 Llama 2、埃隆。馬斯克開源 Grok 的情況下，僅北京、上海發佈的大模型產品就超過 100 多個，國內大模型的混戰才剛剛開始。

對此，一位月之暗面早期投資人對《AI 光年》表示，“獨立創業公司在大模型領域有兩大優勢，人才密度和組織效率。在此基礎上，只要保證算力資源不短缺，創業公司更有機會。”