Meta和Google用YT進行AI訓練引發爭議
編譯/夏洛特
隨著人們對人工智慧(AI)訓練資料越來越好奇,大家都對主要科技公司如何使用 YouTube 資料訓練其AI模型帶有疑問,而其中Meta 和Google更是都因其做法而受到審查。隨著AI技術的不斷進步,創新與尊重智慧財產權之間的平衡,已成為產業面臨的關鍵問題,YouTube 的條款就明確規定,上傳者保留對其內容的所有權,表明不允許未經授權使用,但授予 YouTube 在其服務中使用該內容的許可。
Meta AI 的訓練資料揭秘
比起Meta,Meta AI 聊天機器人似乎更願意分享它用來受訓的資料。Meta AI 透露,它接受了廣泛的資料集的訓練,包括數百萬個 YouTube 影片。該聊天機器人指出,Meta 使用名為「MSAE」(Meta Scraping and Extraction)的網路抓取機器人,從網路收集大量資料訓練AI。
更多新聞:AI資料中心電力需求大 天然氣和銅成關鍵
這項披露意義重大,因為這表明,Meta可能違反 YouTube 禁止外界使用機器人和抓取工具,並在未經許可下收集資料的服務條款,但值得注意的是,Meta 發言人並未否認這些說法,只是警告生成式AI系統可能會產生不準確的資訊。
發言人表示,「與業內其他公司一樣,我們使用網路爬蟲抓取資料,」並指出,Meta AI 是根據公開的線上數據和帶註解的數據進行訓練的,此外Meta AI也進一步澄清,其訓練資料包括 YouTube 轉錄內容和帶有字幕的各種第三方資料集,涵蓋數百萬個影片。
Google使用 YouTube 資料進行AI訓練
身為AI領域的主要參與者,Google也因其使用 YouTube 內容訓練AI模型(包括 Gemini 模型)而受到質疑,但YouTube 執行長 Neal Mohan 解決了這些擔憂,他表示,YouTube 內容被用於培訓AI,是根據該平台的服務條款或與內容創作者的具體合約進行的。
Mohan表示,YouTube 創作者簽訂了合約,允許他們的內容用於培訓AI,並解釋說,「許多創作者在我們平台上的內容,都有不同類型的許可合約,很多版權所有者也是如此,」因此建議任何培訓都遵守商定的條款,但目前尚不完全清楚 Google 是否及如何將普通 YouTube 影片用於訓練AI。
瀏覽 389 次