AI模型又涉侵權!新研究發現AI疑似「抄襲」網路新聞

編譯/莊閔棻

在過去的一年裡,新聞出版商一直認為人工智慧(AI)聊天機器人是用受智慧財產權保護的文章支援該技術,而現在,出版商還發現,這些工具的開發人員正大量的使用新聞內容訓練機器人。日前,包括《紐約時報》在內的2,200 多家出版商的貿易組織美國新聞媒體聯盟(The News Media Alliance)發布研究報告表明,在訓練機器人的過程中,新聞內容的角色似乎比普通線上內容更吃重,聊天機器人甚至還會複製一些文章的部分內容作為回應。

出版商發現AI工具的開發人員,正大量的使用新聞內容訓練機器人。(圖/123RF)

AI機器人違反著作權法

據外媒報導,美國新聞媒體聯盟認為,該研究結果顯示AI公司正在違反著作權法。新聞媒體聯盟主席兼執行長Danielle Coffey表示:「這加劇了現有問題」。多年來,該聯盟一直主張,像Google這樣的科技公司沒有提供線上新聞機構合理補償。不過,基於許多模型尚未公開確認所使用的數據,因此不可能確切知道大型語言模型中到底輸入了哪些數據。

更多新聞:美國首個AI行政命令!拜登要求業界進行安全評估

AI模型大量使用新聞內容

在其分析中,新聞媒體聯盟則比較了據信用於訓練最著名的大型語言模型的公共資料集,發現精選資料集使用的新聞內容比通用資料集多 5 到 100 倍。Coffey表示,這些結果表明,建構AI模型的人們重視高品質的內容。該報告還發現模型會直接複製新聞文章中使用的語言的實例,Coffey說,這表示出版商內容的副本會被保留以供聊天機器人使用,而這也讓聊天機器人的產出隨後會與新聞文章競爭。

媒體界對AI的擔憂

為建立調查,新聞媒體聯盟已將該報告的調查結果,提交給美國智財局的AI和著作權法研究部門。Coffey補充說,新聞媒體聯盟正在積極探索其成員內容的許可,其中包括該國一些最大的新聞和雜誌出版商。此外,媒體高層都對AI提出了一些擔憂。除了文章被利用來訓練語言模型,一些高層還擔心,若是聊天機器人成為主要搜尋工具,新聞網站基於搜尋引擎的流量可能會減少。此外,許多媒體工作者也擔心他們可能會被AI取代。

參考資料:nytimes

瀏覽 600 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button