AI侵權之戰   研究人員:GPT-4版權侵害問題最嚴重

編譯/莊閔棻

隨著人工智慧(AI)侵權問題不斷升溫,由前 Meta 研究人員創立、專門從事大型語言模型評估和測試Patronus AI就指出,市面上著名的AI模型一直都在利用受版權保護的內容回應用戶查詢,其中GPT-4的使用情況最嚴重。

研究指出,市面上著名的AI模型一直都在利用受版權保護的內容回應用戶查詢,其中GPT-4的使用情況最嚴重。示意圖。圖/123RF

GPT-4高度使用受版權保護內容

據報導,Patronus AI調查了四種AI使用受版權保護的文字回應用戶查詢的頻率,包括 OpenAI 的 GPT-4、Anthropic 的 Claude 2、Meta 的 Llama 2 和 Mistral AI 的 Mixtral。在研究人員構建的提示中,GPT-4生成的44%都是受版權保護的內容。該研究涉及使用美國受版權保護的書籍來測試模型,研究人員制定了 100 種不同的提示,請求模型回答關於書中的特定段落,和完成某些書名的內容。

更多新聞:Claude 3是什麼? 深入解析Anthropic 的新AI模型

GPT-4、Claude 2

OpenAI 的 GPT-4 在侵犯版權內容上表現最差,當被要求完成某些書籍的文本時,GPT-4 有60%的情況下都會給出回應,甚至直接給出書籍的第一段完整內容。相較之下,Anthropic 的Claude 2則更謹慎,當被要求完成一本書的內文時,該模型僅有16%會使用受版權保護的內容做出回應,而當被要求寫出一本書的第一段時,Claude 2更是拒絕回應,稱自己只是一個AI助手,無法使用受版權保護的書籍。

Mixtral、Llama 2

Mistral 的 Mixtral 模型則是只有38%會完整給出一本書的第一段,但當被要求給出較多內容的文本時,只有6%會成功回應。另一方面,Meta 的 Llama 2 無論是在處理開頭段落還是更大範圍的文本時,都只有10%會產生具有版權的內容。

AI侵權問題升溫

Patronus AI 聯合創始人兼執行長 Anand Kannappan 對這些模型產生逐字版權內容的能力表示驚訝,並強調了這項研究結果的重要性。在這項研究發布之際,OpenAI 正在與包括《紐約時報》在內的出版商、作家和藝術家,就使用受版權保護的資料進行AI 訓練資料,展開一場更廣泛的鬥爭。

參考資料:CNBC

瀏覽 520 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button