蘋果、NVIDIA等科技公司,被曝未經授權使用YouTube內容訓練 AI
愛范兒 / 何渝婷編譯
2024-07-17 09:45

(示意圖/取自pixabay)

《連線》雜誌報導,包括蘋果、NVIDIA、Anthropic、Salesforce 等科技公司被發現在未經許可的情況下,使用數千個 YouTube 影片來訓練他們的人工智慧模型。

報導披露了這些科技公司都在將各種 YouTube 影片的字幕整合入他們的訓練數據集之中,受影響的創作者包括MKBHD、MrBeast、Jacksepticeye,脫口秀演員Stephen Colbert、John Oliver和Jimmy Kimmel,麻省理工學院、可汗學院、哈佛大學等教育頻道,華爾街日報、NPR 等媒體。

據悉,一個叫 Eleuther AI 的非營利組織下載了這些內容的字幕文件,為他們發佈的「The Pile」大數據集的一部分,雖然他們的行為可能是為小型開發者和學者提供訓練資料,但這些數據集也被大公司們所利用。

值得一提的是,蘋果等公司並沒有自己下載扒取這些數據,而是由 Eleuther AI 完成的,所以技術上說,真正違反了 YouTube 條款的是 Eleuther AI。

本文為愛范兒授權刊登,原文標題為「蘋果、英偉達等科技公司被曝未經授權使用 YouTube 內容訓練 AI