基座模型圈的迭代已成循環(huán),繼DeepSeek和谷歌進行了一輪模型更新后, OpenAI接替開始發(fā)布新的模型版本。 北京時間6月11日,OpenAI在X上宣布o3-pro正式上線,向Pro和Team用戶開放,企業(yè)、教育用戶將在下周獲得使用權(quán)限。 OpenAI CEO奧爾特曼(Sam Altman)發(fā)文稱,“o3-pro太聰明了!我第一次看到它相對于 o3 的勝率時,簡直不敢相信?!?/p> 根據(jù)OpenAI內(nèi)部測試,o3-pro在數(shù)學基準測試AIME 2024中超越谷歌最強的模型Gemini 2.5 Pro,在博士級科學測試GPQA Diamond中擊敗Anthropic 最強的Claude 4 Opus,展現(xiàn)出推理模型領(lǐng)域的領(lǐng)先性能。 不過,在X上的評論區(qū)有用戶反饋,“o3 pro什么時候能回復我的問題?已經(jīng)加載了45分鐘了?!憋@示出推理模型的回復速度問題。 根據(jù)官方,作為推理模型o3的升級版,o3-pro更加強大,設(shè)計為思考更長的時間,提供最可靠的反應(yīng),適合在數(shù)學、科學和編碼等領(lǐng)域使用這種模型,因此“等待是值得的”。 此外,奧爾特曼還表示將上一代推理模型o3的價格降低了80%。o3 模型從輸入 10 美元/百萬 tokens、輸入 40 美元/百萬 tokens,直接降到了 2 美元和 8 美元。與此同時,o3-pro 每輸入百萬 tokens 收費 20 美元,每輸出百萬 tokens 收費 80 美元,比 o1-pro 便宜 87%。 在宣布o3降價前,有媒體消息稱,OpenAI已與谷歌達成云服務(wù)合作協(xié)議,將利用谷歌的計算資源支撐自身業(yè)務(wù),于今年5月正式敲定。對OpenAI而言,這是擺脫對微軟過度依賴的最新舉措,而對谷歌而言,這是旗下云服務(wù)業(yè)務(wù)的重大勝利。不過,雙方目前均拒絕置評。 模型飛速迭代的背后是對算力永不滿足的渴求。去年9月,OpenAI預計,未來幾年模型訓練的計算成本可能會大幅上升,到2026年將高達一年95億美元,這還不包括大模型研究的前期訓練成本。 今年1月,微軟曾宣布,不再擔任OpenAI的獨家云服務(wù)供應(yīng)商,但保留了“優(yōu)先購買權(quán)”。當時的報道稱, OpenAI高層對微軟建設(shè)新數(shù)據(jù)中心進展緩慢較為不滿。從這一合作看起來,算力的需求比模型領(lǐng)域的競爭對手更為重要。 除了發(fā)布模型迭代和降價,奧爾特曼還久違地更新了一篇博客文章《溫和的奇點》(The Gentle Singularity),談到對未來的設(shè)想。他在X上介紹稱,“這可能是最后一次在沒有任何AI幫助的情況下寫這樣的文章了。”他很自豪自己以老式的方式寫下了”從相對論的角度來看,奇點是一點一點發(fā)生的”。 在文章中,奧爾特曼給出了一個大模型迭代的時間線: 2025年,能夠進行真正認知工作的代理系統(tǒng)將出現(xiàn); 2026年,能夠提出新穎見解的系統(tǒng)可能會出現(xiàn); 2027年,能夠在現(xiàn)實世界中執(zhí)行任務(wù)的機器人可能會出現(xiàn)。 2030年代很可能與以往任何時期都截然不同,智能、能源、創(chuàng)意,以及實現(xiàn)創(chuàng)意的能力將變得異常豐富,有了豐富的智力和能源(以及良好的管理),理論上可以擁有任何其他東西。 “我們已經(jīng)從科學家那里聽說,他們的生產(chǎn)力是人工智能出現(xiàn)之前的兩到三倍。我們也許能夠發(fā)現(xiàn)新的計算基礎(chǔ),更好的算法。如果我們能在一年或一個月內(nèi)完成十年的研究,那么進展的速度顯然會大不相同?!眾W爾特曼說。 隨著數(shù)據(jù)中心生產(chǎn)的自動化,智能的成本最終會趨近于電力成本。奧爾特曼還介紹了ChatGPT會使用多少能量:平均大約使用0.34瓦時,大約是一個烤箱在一秒鐘多一點的時間內(nèi)使用的電量,或者是一個節(jié)能燈泡在幾分鐘內(nèi)使用的電量。此外,每次還使用了大約0.000085加侖的水,大約一茶匙的十五分之一。 奧爾特曼認為,技術(shù)進步的速度將繼續(xù)加快,會有一些非常困難的地方,例如整個階層的工作崗位會消失,但另一方面,世界將變得迅速富有,我們將能夠考慮以前從未有過的新政策和想法。 “我們正在沿著指數(shù)級技術(shù)進步的長弧線攀登,它總是向前看是垂直的,向后看是平坦的,但它是一條平滑的曲線。”奧爾特曼稱。 所以GPT-5什么時候出現(xiàn)?這也是評論區(qū)網(wǎng)友的呼聲。 前幾日,在墨西哥舉辦的 AI Summit 峰會上,兩名 OpenAI 公司代表透露,公司正在開發(fā)下一代基礎(chǔ)模型 GPT-5,性能將遠超 GPT-4 等現(xiàn)有模型。關(guān)于發(fā)布時間,OpenAI 初步定于今年夏天,7 月是目前的目標。然而,公司也表示計劃可能隨時調(diào)整。如果 GPT-5 未能達到內(nèi)部設(shè)定的性能目標,發(fā)布可能會延遲。 奧爾特曼此次在X上還提到,將花費更多時間在公開權(quán)重模型上,預計會在今年夏天晚些時候,而不是六月?!拔覀兊难芯繄F隊做了一些出乎意料且非常令人驚奇的事情,我們認為這非常值得等待,但需要更長的時間。”目前他沒有透露這到底是什么類型的模型。 |