Patronus推出檢測工具CopyrightCatcher ,可檢測AI模型中「版權內容」
品玩 / 何渝婷編譯
2024-03-11 15:00

專門開發大語言模型(LLM)評估工具的 Patronus AI 日前發表了一款名為「CopyrightCatcher」的 API,可用來檢測大語言模型的輸出結果中是否含有侵權內容,目前相關工具 DEMO 已經放出。

Patronus AI 表示,市面上常見的大語言模型的訓練數據中經常含有受到版權保護的內容,因此這些模型很容易輸出相應版權內容,從而為部署相關模型的企業帶來重大法律風險,因此他們推出了 CopyrightCatcher API,旨在解決相關侵權問題。

據介紹,為了檢查大語言模型輸出數據是否含有侵權內容,Patronus AI 研究人員從 Goodreads 書籍平台中抽取了一批受到版權保護的文字樣本對模型進行對抗性訓練,並基於這些書籍建立了 100 則暗示語段。

報告顯示,相關語段中有 50 則要求模型「生成書籍的第一段」,另外 50 則要求模型生成書籍中的文字片段,研究人員根據上述語段整理匯總而成 CopyrightCatcher API,號稱可用來檢測大語言模型如何「精確地從原始訓練數據複製內容」,同時還能評估模型輸出侵權內容的概率。

研究人員使用 OpenAI 的 GPT-4 、Mistral 的 Mixtral-8x7B-Instruct-v0.1、Anthropic 的 Claude-2.1,以及 Meta 的 Llama-2-70b-chat 進行測試,最終發現 GPT-4 最容易生成侵權內容,Claude-2.1 最難生成侵權內容:

GPT-4:44%

Mixtral-8x7B-Instruct-v0.1:22%

Llama-2-70b-chat:10%

Claude-2.1:8%

本文為品玩授權刊登,原文標題為「Patronus 推出檢測工具 CopyrightCatcher ,可檢測 AI 模型中「版權內容」