根據《 IT 之家》 11 月 15 日報導,微軟近日推出了名為「Everything of Thought」(XOT)的方法,靈感來自Google DeepMind 的 AlphaZero,利用緊湊的神經網絡,來增強 AI 模型推理能力。
微軟和喬治亞理工學院、華東師範大學合作開發了該算法,整合了強化學習(reinforcement learning)和蒙地卡羅樹搜尋(MCTS)能力,在複雜決策環境中,進一步提高解決問題的有效性。
據悉,微軟研究團隊表示 XOT 方法可以讓語言模型擴展到不熟悉的問題上,在 Game of 24、8-Puzzle 和 Pocket Cube 嚴苛測試中提升明顯。
結果表明,XOT 明顯優於其他方法,甚至解決了其他方法失敗的問題。但是,XOT 並沒有達到 100% 的可靠性。
本文為AI新智界授權刊登,原文標題為「微軟推出 XOT 方法,提升 AI 語言模型推理能力」