Google重磅推出Gemini 2.0 Flash Thinking模型
愛范兒 / 何渝婷編譯
2024-12-20 09:35

(取自Google臉書粉專)

今天凌晨,Google 重磅推出了 Gemini 2.0 Flash Thinking 模型。

新的 Thinking 模型支持多模態推理,使用類似 o1 模型的慢思維思考方式,可以深度可視化展示整個思維鏈過程,尤其是在執行數學、編程等複雜問題方面,能持續輸出全部推理過程,而不是直接給出答案。

據悉,在大模型排行榜 LMSYS 上,所有綜合類別指標中顯示,目前 Gemini 2.0 Flash Thinking 排名第一,包括數學、程式碼、指令跟隨、長 QA、創意寫作等等各方面。

目前在Google AI Studio 就可以免費使用 Gemini 2.0 Flash Thinking。

此外,近日據 TechCrunch 報導,Google 針對其大型語言模型 Gemini 回覆內容的外包審核流程進行了一項調整,引發了外界對其在敏感領域訊息準確性的擔憂。

此項調整要求外包人員審核流程不再像以往那樣,因自身專業知識不足而跳過某些特定的審核任務,這或將導致 Gemini 在醫療保健等高度專業性領域的資訊輸出出現偏差。

為改進 Gemini,Google 與其外包公司日立旗下的 GlobalLogic 合作,由後者雇用的約聘人員負責審核人工智慧生成的回覆,審核標準包括「真實性」等因素。

此前,如果審核員認為某個問題超出了自身專業領域,例如一個關於心臟病學的專業問題,而審核員本身並無相關科學背景,他們可以選擇「跳過」該回應,並避免審核該回應內容。

本文為愛范兒授權刊登,原文標題為「Google 版 o1 重磅推出