隱秘 AI 巨頭 “幻方量化”:大模型,不止用來炒股 | 焦點分析

36Kr
2023.04.20 03:08
portai
I'm PortAI, I can summarize articles.

文|周鑫雨 編輯|蘇建勳 4 月 14 日,千億量化私募巨頭幻方量化公告稱,將集中資源和力量,投身人工智能技術,成立新的獨立研究組織,探索 AGI(通用人工智能)。 當幻方量化的公告捲起 “AI 炒股説” 之時,兩天天后,幻方量化董事總經理陸政哲在朋友圈潑了盆冷水:“我用中文重申一下:AGI 不是用來炒股的,有大得多的用處和大得多的價值。” 自概念誕生之初,量化投資就與 AI 掛了鈎。與人為管理基金產品不同,量化投資仰賴的是數學和統計模型進行預測和風控,並通過計算機技術實現下單交易。 對於量化私募基金而言,準確性和速度是核心競爭力。這也意味着,一家量化私募基金需要在程序化技術上燒大量的錢——其一,需要專業人才搭建效果更優的預測和風控模型,其二,還需要使用處理速度更快的設備和與交易所服務器物理距離更近的服務器,以提升交易速度。 當 “AGI 不是用來炒股的” 一句從幻方量化口中説出,一方面,我們有理由相信,擁有萬張英偉達 A100 顯卡儲備的幻方量化具有訓練出 AGI 的資源儲備;但另一方面,在這一輪 AI 浪潮中,金融領域除了擁抱,別無選擇。

文|周鑫雨

編輯|蘇建勳

4 月 14 日,千億量化私募巨頭幻方量化公告稱,將集中資源和力量,投身人工智能技術,成立新的獨立研究組織,探索 AGI(通用人工智能)。

當幻方量化的公告捲起 “AI 炒股説” 之時,兩天天后,幻方量化董事總經理陸政哲在朋友圈潑了盆冷水:“我用中文重申一下:AGI 不是用來炒股的,有大得多的用處和大得多的價值。”

自概念誕生之初,量化投資就與 AI 掛了鈎。與人為管理基金產品不同,量化投資仰賴的是數學和統計模型進行預測和風控,並通過計算機技術實現下單交易。

對於量化私募基金而言,準確性和速度是核心競爭力。這也意味着,一家量化私募基金需要在程序化技術上燒大量的錢——其一,需要專業人才搭建效果更優的預測和風控模型,其二,還需要使用處理速度更快的設備和與交易所服務器物理距離更近的服務器,以提升交易速度。

當 “AGI 不是用來炒股的” 一句從幻方量化口中説出,一方面,我們有理由相信,擁有萬張英偉達 A100 顯卡儲備的幻方量化具有訓練出 AGI 的資源儲備;但另一方面,在這一輪 AI 浪潮中,金融領域除了擁抱,別無選擇。

非 AI 領域出身的金融機構,也能用大模型打仗

翻閲公開資料就能發現,高算力是不少量化機構宣傳的重點。

比如 2022 年 9 月,頭部量化私募基金明汯投資合夥人、投資總監解環宇就在世界人工智能大會上強調:“2021 年,我們自有的高性能計算集羣已經位居世界超算排名 TOP500 榜單前列。預計到今年(2022 年)底,我們的計算集羣將擁有 1500 張 GPU 卡,3 萬 CPU 核、1Pb 內存以及 5Pb 磁盤存儲,在金融數據的應用場景下 AI 算力達到 400P Flops。”

重算力的特性與長期以來我國的算力資源較為分散不無關係,能夠靠高性能算力集羣支撐起模型訓練的金融機構更是少之又少。

據《財經十一人》介紹,國內 GPU 持有量超過 1 萬張的企業不超過 5 家,即使規模最大的企業也不超過 5 萬枚,而且這裏面有不少都是英偉達中低端數據中心芯片。

但幻方量化擔得起金融領域 “卡王” 之稱。

作為目前國內唯一公開宣稱擁有萬張英偉達 A100 顯卡的企業,幻方量化即便出了金融圈,其算力儲備量在一眾科技公司中也豪不遜色。

2019 年,幻方量化就成立了 AI 公司幻方 AI。從 2020 年官方披露的數據來看,幻方 AI 自研的深度學習訓練平台 “螢火一號” 總投資近 2 億元,搭載了 1100 塊 GPU。

一年後,“螢火二號” 的投入增加到 10 億元,算力約為 “螢火一號” 的 18 倍,搭載了約 1 萬張英偉達 A100 顯卡。數據顯示,“螢火二號” 2022 年全年運行任務 135 萬個,共計 5674 萬 GPU 時。用於科研支持的閒時算力高達 1533 萬 GPU 時,佔比 27%。

用大算力砸出來的模型表現也是亮眼的。私募排排網數據顯示,幻方量化自成立以來的累計收益率為 181.63%,年化收益率達 18.02%。截至 2023 年 3 月 24 日,幻方量化旗下管理的具有歷史數據的 100 只基金中,94 只均為正收益。

大算力固然重要,但多個案例證明,比起算力,大量高質的數據是金融垂直領域跑出高性能模型更關鍵的資源。

即便具有豐富的算力儲備,幻方量化仍然發文表示,數據才是 Alpha(超額收益)的根本來源。截至 2021 年,幻方量化累積的數據量超過了 10PB,每天還在從數十個不同數據源持續更新。

一個更典型的 “薄算力,厚數據” 的案例則發生在最近。

3 月 31 日,金融商業諮詢平台彭博社(Bloomberg)推出了其為金融界打造的大語言模型 BloombergGPT。從官方發佈的技術細節來看,BloombergGPT 的參數規模為 500 億,遠不到 GPT-3 1750 億的參數規模。

在算力上,BloombergGPT 在訓練中備份了 4 個模型,共使用了約 512 塊內存為 40GB 的 A100——這對於不少頭部金融機構而言,是可複製的路徑。

但官方測試的結果顯示,BloombergGPT 對金融任務的執行效果已經超過了現有的通用語言大模型,在通用場景的表現則持平——優異表現的根源在於 Bloomberg 構建了目前規模最大的金融數據集 FINPILE,其中涵蓋了 7000 億預訓練數據量。

這一案例或許也能將不少機構從 “算力焦慮” 中解放,優質開源模型底座 + 優質垂直領域數據的思路,依然可以在垂直領域訓練出專精的大模型。

AI 代替人炒股,仍在征途

不可否認的是,ChatGPT 引起的大模型熱潮,對包括量化在內的金融行業會產生廣泛的影響。

一方面,接入大模型有助於提升投研的效率,以個人智能助手為應用形態的 AI 能夠理解分析師和研究員所輸入的信息,並呈現出經過邏輯分析的檢索結果。

另一方面,AI 可以通過基於大量數據的深度學習,輔助人們做出更準確的投資決策、優化交易策略,以及進行風險管理。

不少業內人士也指出,大模型對金融領域的重要意義在於超越人有限的思維,站在更高的維度對行業進行全面的解構。

“AI 做金融風險評估,不是基於人的規則,因為人的規則容易被破解,需要更高維的 AI 模型來做。” 氪信科技 CEO 朱明傑為 36 氪舉了個例子:比如對交易風險的檢測,銀行每天有上億筆交易,靠專家人力無法一一審核。而通過金融數據和金融專家經驗數據去訓練 AI 模型,就能夠擁有更多的 “專家”。

但相對地,讓 AI 通過深度學習從而產生超越人的思維能力,在現階段是不少金融機構可望而不可即的圖景。

就決定垂直領域模型核心能力的數據而言,出於數據安全等因素的考慮,不同金融機構之間的數據並未打通,這也意味着單一機構的數據資源較有限。尤其對於成立初期、規模有限的中小型金融機構而言,難以具備構建垂直領域模型的能力。

另一亟待完善的層面在於算法。朱明傑認為,目前 ChatGPT 有模仿的能力,但本質上還是人的思維,沒有自主創新的能力,很難應對一些黑天鵝事件,“大模型湧現的能力還很有限”。

一個案例是,隨着 2020 年下半年小票市場行情分化,明汯投資在同年 Q4 調整了選股模型,從而存在過度風格暴露(指基金持有的資產在風格特徵上與某個特定的市場、指數或其他資產組合相關聯的程度)的嫌疑。

2021 年初,招商證券發佈的一篇報告提到,量化投資在未來越來越難以靠 “單純的風格、行業暴露” 來掙錢,一定會在新的賽道展開激烈比拼,包括基本面因子深度挖掘、輿情等另類數據,以及進一步優化模型與提高算力。

量化投資行業與科技行業的縫隙正在縮窄,這也意味着金融機構在研發上依然需要捨得出血。在瞬息萬變的市場環境中,不存在 “躺平數錢” 的時刻。

36kr 製圖