OpenAI 發佈全新 o1 模型 數學與編程能力大躣進

openai

OpenAI 宣布推出新型人工智能模型 o1-preview,這是該公司計劃中「推理」模型系列的首款產品。o1 模型旨在回答更複雜的問題,且速度快於人類。同時發布的還有較小型、更經濟實惠的 o1-mini 版本。

oai o1 model picker

全新訓練方法提升準確度

o1 模型採用全新的訓練方法。OpenAI 研究主管 Jerry Tworek 表示,o1「使用了全新的優化演算法和特別為其量身打造的訓練數據集」。這種新方法使用強化學習技術,通過獎勵和懲罰來教導系統。

o1 模型還使用「思維鏈」來處理查詢,類似人類逐步解決問題的方式。Tworek 指出,這種新的訓練方法使模型更加準確,「幻覺」問題有所減少,但仍未完全解決。

o1 screenshot

卓越的數學與編程能力

OpenAI 首席研究官 Bob McGrew 表示,o1 模型在解決複雜問題方面表現出色,特別是在編碼(Coding)和數學領域。在國際數學奧林匹克競賽的資格考試中,o1 模型得分率達到 83%,遠高於 GPT-4o 的 13%。

在線上程式設計競賽 Codeforces 中,o1 模型的表現達到參與者的前 89%。OpenAI 聲稱,該模型的下一個更新版本在物理、化學和生物學等具挑戰性的基準任務中,將達到與博士生相似的水平。

screenshot 735

ChatGPT Plus 用戶已可使用

o1 模型目前僅向部分用戶開放。ChatGPT Plus 和 Team 用戶從今天起可以使用 o1-preview 和 o1-mini,而企業和教育用戶將於下週初獲得使用權限。OpenAI 計劃未來向所有 ChatGPT 免費用戶開放 o1-mini 的使用權限。

部份能力不及 GPT-4o

值得注意的是,o1 模型在某些領域的能力不及 GPT-4o,如事實性知識和網頁瀏覽等功能。然而,OpenAI 認為這代表了一種全新的能力類別,並將其命名為 o1 以表示「將計數器重置回 1」。

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookIG