能夠如真人一般思考？OpenAI公布最新自然語言模型「o1」

OpenAI推出最新自然語言模型「o1」，也被認為是先前被傳聞出代號「Strawberry」的產品。

OpenAI強調，「o1」模型主要是能夠在做出反應之前花更多時間思考，它們可以透過複雜的任務進行推理，並解決比以前的科學、寫程式和數學模型更困難的問題。

「我們訓練這些模型在做出反應之前花更多的時間思考問題，就像人類一樣。而透過培訓，它們學會完善自己的思考過程、嘗試不同的策略，並意識到自己的錯誤，更從錯誤中進行修正，以增加解答的準確率。」該公司進一步指出。

在OpenAI的測試當中，「o1」模型在物理、化學、生物學、數學、寫程式等領域上的表現非常出色，像是在國際數學奧林匹克（IMO）資格考試中，GPT-4o只正確解決了13%的問題，但「o1」的正確率卻提升至83%。

與先前推出的GPT系列模型不同，「o1」本身不具備網頁瀏覽功能，也無法上傳文件和圖像，基本是都是透過模型訓練基礎來進行互動學習及成長，不過這對於複雜的推理任務來說是一個重大的進步，代表了人工智慧能力的新層次。

也因為如此，OpenAI將此模型的數字重設為1，並將該系列命名為OpenAI o1。

此外，在資訊安全方面，OpenAI提出一種新的安全培訓方法，利用它們的推理能力，使它們遵守安全準則，透過在上下文中推理安全規則來進行更有效的應用。

OpenAI解釋其衡量安全性的一種方法，就是測試模型在使用者試圖越獄時繼續遵循其安全規則的情況，而在OpenAI最難的越獄測試之一中，GPT-4o得分為22（評分範圍為0-100），而o1-preview模型得分為84。

（以上圖片取自OpenAI官網）