不忍了!紐時明文禁止內容被用來訓練AI模型

編譯/夏洛特

網路內容被用來訓練人工智慧(AI)模型的爭議越演越烈,《紐約時報》先發制人,禁止其內容被用於訓練AI模型。日前,《紐時》就更新其服務條款,禁止其內容,包括文本、照片、圖像、音頻/影片、外觀和感覺、後設資料或合集,被用於開發「任何軟體程式,包括但不限於訓練機器學習或AI系統」。

網路內容被用來訓練人工智慧(AI)模型的爭議越演越烈,《紐約時報》先發制人,禁止其內容被用於訓練AI模型。(圖/123RF)

據外媒報導,更新後的條款現在還規定,未經《紐時》的書面許可,不得使用在該出版物上使用網站爬蟲等自動化工具。《紐時》表示,拒絕遵守這些新限制可能會招致罰款或處罰。值得注意的是,儘管《紐時》在其政策中引入新規則,該出版物似乎並未對其 robots.txt 進行任何更改,robots.txt會通知搜尋引擎爬蟲哪些內容是不應被搜尋引擎的漫遊器取得的,而哪些是可以被取得的。

更多新聞:Google推AI新聞寫作工具!鎖定《紐約時報》《華爾街日報》

《紐時》此舉可能是對Google最近更新的隱私政策的回應。根據Google的新政策,其會從網路收集公共數據訓練其各種AI服務,如Bard或雲端AI。而許多其他AI服務的大型語言模型,如OpenAI 的ChatGPT,也都是在從網路上抓取的受版權保護或以其他方式保護的材料訓練的。

不過,即使《紐時》禁止其他公司使用自家內容,該出版商也在2023年 2 月份與Google簽署一項價值 1 億美元的協議,並允許這家搜尋引擎巨頭在未來三年內在其部分平台上展示《紐時》的內容。《紐時》稱,兩家公司將合作開發內容分配、訂閱、行銷、廣告和「實驗」工具,因此《紐約時報》服務條款的變化可能是針對 OpenAI 或微軟等其他公司。

報導還指出,《紐時》已退出試圖與科技公司就AI訓練數據進行聯合談判的媒體聯盟,這代表,《紐時》與一些公司達成的可能只會是「單獨」的個別協議。本月早些時候,包括美聯社和歐洲出版商委員會(European Publishers Council, EPC)在內的多家新聞機構共同簽署一封公開信,呼籲全球立法者制定法律,要求訓練數據集透明,並在使用數據進行訓練之前先取得所有人的同意。

參考資料:The Verge

※更多ChatGPT相關訊息,請參考【生成式AI創新學院】。

瀏覽 980 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button