數據安全至上，大模型發佈分秒必爭

大模型開始商業 “廝殺”，AI 將滲透到眾多行業中。

4 月 8 日華為發佈了盤古大模型，引發業內高度關注。盤古 NLP 大模型在三方面實現了突破性進展。

第一、具備先進的語言理解和模型生成能力，盤古 NLP 大模型在權威的中文語言理解評測基準 CLUE 總排行榜及分類、閲讀理解單項均排名第一，刷新三項榜單世界歷史記錄；

第二、在預訓練階段沉澱了大量的通用知識，僅能做到理解又能做到生成，除了像 GPT-3 等基於端到端的生產方式之外，還能夠通過少量樣本學習對意圖進行識別，轉化為知識庫和數據庫查詢。

第三、採用大模型小樣本的調優路線，實現小樣本學習任務上超越 GPT 系列。

華爾街見聞·見智研究認為：人工智能的發展就是從小模型到大模型，未來幾年大模型的研發浪潮將會加速推動 AI 行業的快速發展，並且將滲透到眾多行業中。

專用模型下，數據安全被重視

在細分領域下，行業數據會直接影響到技術迭代速度、商業競爭等，被看作是大模型訓練的 “黃金鑰匙”，這也是為什麼現在各個國家將數據安全提高至最高等級。

此前，三星半導體部門就曾發生數據安全泄露的重大事故。

根據韓國媒體 Economist 的報道，出於擔心可能發生的內部機密信息泄露，三星一直阻止其員工在工作場所使用 ChatGPT。不過從 3 月 11 日起，三星向其半導體部門的員工授予了 ChatGPT 的使用權限（其他部門仍被禁止）。在三星員工使用 ChatGPT 來幫助他們完成工作時，三星的機密數據也不知不覺就泄露了。

所以，行業數據安全在大模型中需要有很高的安全性保證。基於這點來看，也催生出各個領域的巨頭對大模型研發的渴求，畢竟關鍵的數據將直接影響公司商業價值的時間長度。

接下來，多家巨頭都將會宣佈陸續發佈自家的大模型。

（預計）4 月 10 日商湯發佈大模型
（預計）4 月 11 日阿里發佈大模型
（預計）4 月 14 日同花順發布 AI 產品
（預計）5 月 6 日科大訊飛發佈大模型
（預計）5 月騰訊發佈混元大模型

而對於沒有很強資金實力的公司來説，盤古大模型就可以提供很好的數據訓練。

從盤古大模型來看為例，劃分為 L0-L1-L2 三個層級：

L0 層級：包含視覺大模型：部分應用場景成績位居世界第一，包括礦山場景、鐵路作業故障檢測等等；NLP 大模型也就是上文提到的自然語言大模型；圖網絡大模型、多模態大模型以及科學計算大模型。

L1 層級：是基礎模型與行業數據結合後的混合大模型，需要有很高的 know-how 經驗，這也就決定了行業大模型的垂直性，並且還要重點關注模型內的訓練參數質量和安全性。

L2 層級：是把 L1 層級下有業務場景進行部署後生成的細分場景模型，更具有專用性。

見智研究認為：特別是在 L1 和 L2 層級下，盤古大模型能夠極大程度的幫助各行各業進行定製化訓練，並且減少基礎大模型的高昂研發費用，同時還能保證數據安全。

小結：人工智能的時速競賽才剛剛啓程，接下來會是大模型的商業廝殺，誰越早發佈、質量越高、數據安全性越高，就能搶先獲得客户青睞，可謂是分秒必爭的時刻。