OpenAI推出最新自然語言模型「o1」,也被認為是先前被傳聞出代號「Strawberry」的產品。
OpenAI強調,「o1」模型主要是能夠在做出反應之前花更多時間思考,它們可以透過複雜的任務進行推理,並解決比以前的科學、寫程式和數學模型更困難的問題。
「我們訓練這些模型在做出反應之前花更多的時間思考問題,就像人類一樣。而透過培訓,它們學會完善自己的思考過程、嘗試不同的策略,並意識到自己的錯誤,更從錯誤中進行修正,以增加解答的準確率。」該公司進一步指出。
在OpenAI的測試當中,「o1」模型在物理、化學、生物學、數學、寫程式等領域上的表現非常出色,像是在國際數學奧林匹克(IMO)資格考試中,GPT-4o只正確解決了13%的問題,但「o1」的正確率卻提升至83%。
與先前推出的GPT系列模型不同,「o1」本身不具備網頁瀏覽功能,也無法上傳文件和圖像,基本是都是透過模型訓練基礎來進行互動學習及成長,不過這對於複雜的推理任務來說是一個重大的進步,代表了人工智慧能力的新層次。
也因為如此,OpenAI將此模型的數字重設為1,並將該系列命名為OpenAI o1。
此外,在資訊安全方面,OpenAI提出一種新的安全培訓方法,利用它們的推理能力,使它們遵守安全準則,透過在上下文中推理安全規則來進行更有效的應用。
OpenAI解釋其衡量安全性的一種方法,就是測試模型在使用者試圖越獄時繼續遵循其安全規則的情況,而在OpenAI最難的越獄測試之一中,GPT-4o得分為22(評分範圍為0-100),而o1-preview模型得分為84。
(以上圖片取自OpenAI官網)