
GPT-5 首次曝光後,Altman:現在最重要的事就是 GPT-5

據 Altman 介紹,GPT-5 將是一個多模態模型,支持語音、圖像、代碼和視頻,並在個性化和定製化功能方面實現重大更新,具備更強的推理能力和更高的準確性。當前大模型的通病——幻覺問題也將在 GPT-5 中得到解決。
OpenAI 首席執行官 Sam Altman 週三在達沃斯論壇接受媒體採訪時表示,他現在的首要任務就是推出下一代大模型,這款模型可能被稱為 GPT-5,與現有模型相比,GPT-5 “能做更多、更多的事情”。
OpenAI 從去年開始訓練 GPT-5,幾天前,Altman 在與微軟創始人比爾·蓋茨的對話中,首次曝光了有關 GPT-5 的詳細信息,對其未來的應用前景進行了分享。
據 Altman 介紹, GPT-5 將是一個多模態模型,支持語音、圖像、代碼和視頻,並在個性化和定製化功能方面實現重大更新,具備更強的推理能力和更高的準確性。當前大模型的通病——幻覺問題也將在 GPT-5 中得到解決。
個性化大禮包,真正的多模態模型?
Altman 強調,GPT-4.5 或 GPT-5 預計將在個性化和定製化功能方面實現重大更新,最關鍵的增強部分將圍繞理解個人偏好的能力,比如整合用户信息、電子郵件、日曆、約會偏好,以及與外部數據源建立聯繫。
“人們對 GPT-4 的不滿和希望加強的部分,” Altman 説,“包括不同的風格,不同的假設集,我們將使所有這些成為可能,然後還能讓它使用你自己的數據。”
當前外界對 GPT-5 的瞭解知之甚少,但從當前 Altman 披露的信息,分析預計 GPT-5 將是一個真正的多模態模型,類似於谷歌最近推出的新 Gemini Ultra 模型。
據 Altman 介紹,GPT-5 不僅支持文本輸入,還支持語音、圖像、代碼和視頻。
“輸入語音,輸出語音,圖像、視頻亦是如此,” Altman 表示,“顯然,人們真的希望如此。我們已經支持了圖像和音頻,它的反饋比我們預期的要強烈得多。”
不再出現幻覺,大模型的可靠性邁上新台階
據 Altman 介紹,GPT-5 將具有更強的推理能力、更高的準確性。
當代大模型存在的最大問題——幻覺(胡編亂造)將在 GPT-5 中得到解決,這涉及到大模型的可靠性。
他告訴比爾·蓋茨:“如果你問 GPT-4 大部分問題 10000 次,這 10000 次中可能有一次回答得很好,但它不一定知道是哪一次。而你卻希望每次都能得到這 10000 次中最好的回答,因此可靠性的提升將非常重要。”
通往 AGI 之路,GPT-5 可能是下一步
Altman 告訴比爾•蓋茨,現有 AI 模型都將變成最愚蠢的模型,至少在未來的五年或十年內,這項技術將處於一個非常陡峭的成長曲線上。
他表示:“未來 AI 系統的計算能力將是 GPT-4 的 10 萬倍或 100 萬倍,AI 將影響社會,影響地緣政治力量的平衡,以及其他許多事物。”
眾所周知,OpenAI 等許多大型人工智能實驗室都將通用人工智能 (AGI) 作為最終目標,因此,早期有人認為,GPT-5 可能是某種形式的超級智能。
但根據現有的信息,GPT-5 很可能只是 GPT-4、Claude 2 或 Gemini Ultra 的改進版,它將具備更強的推理能力,不僅在許多學術評估上優於人類,理解能力也在一定程度上超越人類。
不過,GPT-5 也可能是通往 AGI 道路上的下一步。據媒體報道,在上週五的 Y-Combinator W24 活動上,Altman 告訴在場的創始人和企業家,他們應該抱着 AGI 將 “相對較快” 實現的心態。
GPT-5 何時面世?
在達沃斯論壇的媒體採訪中,Altman 並沒有透露 GPT-5 的具體發佈時間。他説:
“我希望我們能夠慢慢來,確保我們能夠推出一個讓我們感到滿意並且對 OpenAI 來書足夠負責任的產品。”
Altman 還説,GPT-5 也可能不會被叫做 GPT-5,因為這並不符合 Altman 發佈產品的風格。
