不忍了！紐時明文禁止內容被用來訓練AI模型

2023-08-15

編譯／夏洛特

網路內容被用來訓練人工智慧（AI）模型的爭議越演越烈，《紐約時報》先發制人，禁止其內容被用於訓練AI模型。日前，《紐時》就更新其服務條款，禁止其內容，包括文本、照片、圖像、音頻／影片、外觀和感覺、後設資料或合集，被用於開發「任何軟體程式，包括但不限於訓練機器學習或AI系統」。

網路內容被用來訓練人工智慧（AI）模型的爭議越演越烈，《紐約時報》先發制人，禁止其內容被用於訓練AI模型。（圖／123RF）

據外媒報導，更新後的條款現在還規定，未經《紐時》的書面許可，不得使用在該出版物上使用網站爬蟲等自動化工具。《紐時》表示，拒絕遵守這些新限制可能會招致罰款或處罰。值得注意的是，儘管《紐時》在其政策中引入新規則，該出版物似乎並未對其 robots.txt 進行任何更改，robots.txt會通知搜尋引擎爬蟲哪些內容是不應被搜尋引擎的漫遊器取得的，而哪些是可以被取得的。

《紐時》此舉可能是對Google最近更新的隱私政策的回應。根據Google的新政策，其會從網路收集公共數據訓練其各種AI服務，如Bard或雲端AI。而許多其他AI服務的大型語言模型，如OpenAI 的ChatGPT，也都是在從網路上抓取的受版權保護或以其他方式保護的材料訓練的。

不過，即使《紐時》禁止其他公司使用自家內容，該出版商也在2023年 2 月份與Google簽署一項價值 1 億美元的協議，並允許這家搜尋引擎巨頭在未來三年內在其部分平台上展示《紐時》的內容。《紐時》稱，兩家公司將合作開發內容分配、訂閱、行銷、廣告和「實驗」工具，因此《紐約時報》服務條款的變化可能是針對 OpenAI 或微軟等其他公司。

報導還指出，《紐時》已退出試圖與科技公司就AI訓練數據進行聯合談判的媒體聯盟，這代表，《紐時》與一些公司達成的可能只會是「單獨」的個別協議。本月早些時候，包括美聯社和歐洲出版商委員會（European Publishers Council, EPC）在內的多家新聞機構共同簽署一封公開信，呼籲全球立法者制定法律，要求訓練數據集透明，並在使用數據進行訓練之前先取得所有人的同意。

參考資料：The Verge

※更多ChatGPT相關訊息，請參考【生成式AI創新學院】。

瀏覽 1,212 次

覺得不錯的話就分享出去吧！

標籤

2023-08-15

不忍了！紐時明文禁止內容被用來訓練AI模型

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

年輕世代「心困境」！職涯迷惘該怎麼辦 專業心理師給建議

立委提出《虛擬資產服務法》草案 盼KOL、RWA、穩定幣監管有新方向

想申請DEVCORE研發替代役？資深學長談競賽背景、研究成果重要性

研替辦公室諮詢輔導服務「2大對象」 4-6月梯次開放申請預約

黃仁勳一句話讓量子股重摔！微軟卻說快成功 量子電腦要等多久？

【整理包】臺灣學生遊戲團隊新勢力崛起 獨立遊戲殺出新藍海

發佈留言 取消回覆

年輕世代「心困境」！職涯迷惘該怎麼辦專業心理師給建議

立委提出《虛擬資產服務法》草案盼KOL、RWA、穩定幣監管有新方向

黃仁勳一句話讓量子股重摔！微軟卻說快成功量子電腦要等多久？

【整理包】臺灣學生遊戲團隊新勢力崛起獨立遊戲殺出新藍海

發佈留言取消回覆