
The latest valuation of LMArena, which ranks AI large models, is $1.7 billion, tripling in six months

在 AI 模型競爭日趨激烈的背景下,評測平台 LMArena 以 17 億美元的估值完成 1.5 億美元融資,成為行業關鍵的基礎設施。其獨特的 “背靠背” 眾包評測模式,通過數百萬用户匿名比較模型輸出,生成被廣泛引用的排行榜,直接影響了 OpenAI、Google 等巨頭的技術聲譽與市場地位。
在人工智能競爭日益白熱化的背景下,一家專注於大模型性能評估與排名的初創公司 LMArena 正迅速崛起,成為行業內的關鍵基礎設施。
根據公司最新披露,LMArena 已完成新一輪 1.5 億美元融資,投後估值達到 17 億美元。這一數字較其 2025 年 5 月宣佈種子輪融資時的估值增長了近三倍,凸顯了市場對獨立第三方 AI 評估平台的強烈需求。
本輪融資由現有投資者 Felicis 和加州大學投資部門共同領投。所籌資金將主要用於支付算力成本,以支持其為 OpenAI、Google、xAI 和 Microsoft 等客户評估 AI 模型,同時用於擴充技術團隊。作為行業內被廣泛引用的基準,LMArena 通過 “背靠背” 比較的方式,利用數百萬用户的反饋生成模型排名,直接影響着各大科技巨頭在 AI 領域的聲譽與競爭格局。
LMArena CEO 兼聯合創始人 Anastasios Angelopoulos 指出,領先的實驗室正在使用該平台,因為它們面臨着難以客觀評估自身模型優劣的挑戰。這種評估機制不僅幫助開發者在公開發布前獲得早期反饋,也成為 AI 模型開發商對外宣傳其技術實力的核心依據。隨着 AI 模型間的性能差異日益縮小,LMArena 的排行榜已成為衡量行業技術進步的重要標尺。
儘管 LMArena 依靠無償互聯網用户反饋的模式引發了部分關於數據準確性和專業性的爭議,但這並未阻礙其商業化進程的加速。公司披露,上個月其 “年化消費運行率” 已達到 3000 萬美元,表明其基於客户使用量的收入潛力正在快速釋放。
獨特的評估機制與行業影響力
LMArena 的核心競爭力在於其獨特的眾包評估模式。該公司網站邀請全球互聯網用户提問或使用模型進行圖像等內容創作。用户在不知曉模型具體名稱的情況下,從兩個選項中挑選出最佳答案,隨後系統才會揭曉生成該輸出的模型身份。LMArena 將這些結果匯總成不同類別的排行榜,涵蓋 AI 編程、圖像及視頻生成等多個領域。
這種機制使得 LMArena 成為了 AI 行業的 “競技場”。甚至在模型正式向公眾發佈前,該初創公司有時也會託管這些模型,為開發公司提供早期的市場反饋渠道。隨着各家 AI 模型的性能差距逐漸縮小,開發商們越來越依賴 LMArena 的排名來證明其技術優勢。Anastasios Angelopoulos 強調,對於那些試圖在激烈的市場競爭中確立地位的實驗室而言,這種外部驗證至關重要。
商業化進展與用户規模
在財務表現方面,LMArena 展現出強勁的增長勢頭。儘管公司未透露最近具體的營收增速,但在去年 9 月,其年化收入規模已達數百萬美元。而根據其對上個月客户使用量的推算,目前的年化消費運行率已激增至 3000 萬美元。
用户基礎方面,LMArena 表示目前在 150 個國家擁有超過 500 萬月度用户。這一數字既包括訪問網站查看排名的訪客,也可能包括實際參與模型評分的用户。這一龐大的用户羣構成了 LMArena 數據護城河的基礎,為其排名的廣泛性和實時性提供了支撐。
面臨的爭議與競爭挑戰
儘管增長迅速,LMArena 的模式並非沒有爭議。
一些模型製造商批評稱,依靠無償的互聯網用户進行反饋存在缺陷,可能面臨被刷榜的風險,且無法反映專家的深度意見。
這一批評指出了大眾評審與專業評審之間的張力。相比之下,Scale AI 等競爭對手採取了截然不同的路徑,通過聘請律師或教授等專家為模型提供付費反饋,以強調評估的專業性和嚴謹性。LMArena 未來如何在保持規模效應的同時提升評估的權威性,將是其持續獲得市場信任的關鍵。
