創作變成訓練 AI 資料能提告?從紐約時報提告 OpenAI 看生成式內容對原創者的挑戰
記者/孫敬 Archer Sun
就在 OpenAI 開啟「2023 生成式 AI 元年」,帶動一眾科技巨頭如 Google、微軟相繼參與 AI 應用開發,期望 AI 能結合自己的服務創造更大的產業影響力。就在全球熱衷 AI 帶來的便利性時,近期 OpenAI 和微軟遭《紐約時報》指控在沒有經過授權的情況下,擅自使用《紐約時報》的內容來訓練 AI 模型。
生成式 AI 之所以強大,來自它背後龐大的資料庫訓練,那身在台灣的我們,如果我們的作品也在未被告知的情況下,被生成式 AI 業者拿去當作訓練的資料,能怎麼辦?
更多新聞:從OpenAI 事件到倡議監管 回顧2023 AI重大事件
OpenAI、微軟遭炎上!媒體、創作者內容被擅自拿來訓練 AI 模型
美國知名新聞業者《紐約時報》去年 12 月底公開表示,已對 OpenAI、微軟提告,因為這兩間科技公司在沒有付費、取得授權的情況下,大量使用《紐約時報》的報導內容訓練 AI。《紐約時報》對比了從 OpenAI 和自家媒體產出的內容,稱兩者有高度的重疊,認為此舉壓縮《紐約時報》的付費訂閱服務,而且生成式 AI 參照了《紐約時報》資料給出的建議還出現錯誤,影響了《紐約時報》品牌商譽。雖然沒有公開具體索賠金額,但《紐約時報》已向 OpenAI、微軟提出總計「數十億美元價值」的法定、實際認列損失,並要求刪除含《紐約時報》在內的 AI 機器模型資料。
OpenAI 發言人赫爾德(Lindsey Held)曾透過電子郵件回應《紐約時報》的控告,「我們尊重創作者和內容擁有者的權益,積極的與他們合作,以確保在人工智慧的新模式下獲得收益」「我們與《紐約時報》的對談正往著有建設性的方向前進,對於事件這樣的發展我們感到驚訝和失望」,微軟則沒有對《紐約時報》的發言做出回應。
早在去年 4 月《紐約時報》便開始跟 OpenAI 商討資源的交換方式,達成資料引用的合作,但最後並沒有達成協議,現今包含路透社、BBC、CNN 在內等媒體,已經設立了爬蟲防止 OpenAI 抓取網站的新聞內容。
資料被拿去訓練 AI 怎麼解?台灣資訊智慧財產權協會理事長陳家駿給出答案
創作者的內容和作品被當作訓練 AI 模型的資料,這究竟告不告的成?從這一兩年國外創作者向 OpenAI 跟微軟提告作品被拿來訓練 AI 案例,只能說有很高的機會「不會贏」。以美國著作權局(United States Copyright Office)對 AI 內容生成與再製的解釋為例,其認為在「創新性」基準上要有增加「新的東西」來改變原有的型態,且沒有改變原著作的用途,意思有點類似動畫、動漫圈常提到的「二創」概念。OpenAI 跟微軟面對生成式 AI 創作的作品,指出使用的是受版權保護的作品,來當作 AI 的資料是在「合理範圍」,也滿足了創新性的條件,因此認定引用內容或作品再製是符合使用原則。
那台灣法規對訓練生成式 AI 使用的資料規範,究竟態度為何?根據「經濟部智慧財產局」《智慧財產權月刊 298 期》作者;台灣資訊智慧財產權協會理事長陳家駿觀點,生成式 AI 工具服務商或使用者是否構成侵權的困難點,在於雙方都有參與到「AI 內容產製」的過程,服務商沒有主體上認知的侵權行為,僅能作間接侵權的角色。
使用者僅輸入指令生成創作,並非侵害重製或衍生著作構成要件的主體,很難在主觀上認定服務商、使用者之間,有意侵害原創作者的著作權,但畢竟雙方都有參與其中,服務商提供的服務有控制、引導使用者的能力,並在生成創作、作品中獲得實質的經濟收益,可能會構成智財法當中的「分工侵權」,不過最終是否成立侵權還有待法院進一步釐清。
瀏覽 611 次