根據Google官方消息,宣布推出 Gemma Scope,這是一套幫助研究人員瞭解 Gemma 2內部工作原理的新工具。
Gemma Scope 集合了數百個免費開放的稀疏自動編碼器 (SAE),適用於 Gemma 2 9B 和 Gemma 2 2B,Google還對 Mishax 進行了開源,Mishax 是我們開發的一款工具,它支援 Gemma Scope 背後的大部分可解釋性工作。
Google希望Gemma Scope 的發布能促成更多雄心勃勃的可解釋性研究,進一步的研究有可能幫助該領域建立更強大的系統,開發更好的防護措施來防止模型幻覺,並防範來自自主人工智慧代理的風險,如欺騙或操縱。
本文為品玩授權刊登,原文標題為「Google DeepMind 發佈大模型可視化工具Gemma Scope」