訓練AI資料應免費嗎 OpenAI拋出世紀大難題
編譯/黃竣凱
人工智慧(AI)模型ChatGPT開發者OpenAI,近日在一份法律文件中聲稱,為了繼續訓練其AI模型,公司需要使用受版權保護的素材,OpenAI表示,若無法持續發布改良版本,其業務可能會陷入困境,根據這份提交給英國上議院通訊委員會的文件,OpenAI暗示說自己應被允許免費使用版權素材,否則其業務可能無法維持運作。
OpenAI的法律論點
據報導,OpenAI在文件中指出,僅依靠公有領域內容訓練AI模型是不可能的,因為現今幾乎所有人類表達形式都受到版權保護,包括部落格文章、照片、論壇貼文、程式碼片段及政府文件,文件中提到,「若將訓練數據限制在一世紀前的公有領域書籍和圖畫,或許能進行有趣的實驗,但無法提供滿足當今公民需求的AI系統。」
更多新聞:用AI證明AI創作 OpenAI請GPT-4o作證
到目前為止,OpenAI目前已面臨多起與未經授權使用版權素材有關的訴訟,OpenAI就因為使用外媒《紐約時報》內容進行訓練,被指控大規模侵犯版權,而美國作家協會(Authors Guild)也對OpenAI提起訴訟,認為該公司非法使用著名作家的作品來訓練其AI模型。
輿論反應與質疑
OpenAI的論點在公眾中引起了不少爭議,有評論認為,這就像毒品販子以自己無法承擔毒品成本為理由,要求獲得免費供應,在OpenAI的案例中,公司就主張因其無法負擔訓練AI所需的版權素材,應被免費提供素材進行訓練,但一些批評者認為,這種邏輯並不成立,因為若公司無法承擔訓練成本,或許應該改變其商業模式,甚至解散公司,而不是尋求特殊待遇。
AI訓練難題將持續
儘管科技產業似乎正逐漸遠離「快速行動,破壞規則」的文化,但OpenAI面臨的法律困境表明,許多科技巨頭依然在這種概念中掙扎,此外根據最新研究結果,網路上57%以上的內容可能已經是AI生成的,可能導致大型語言模型(LLM)陷入「自我循環」訓練的情況,使用先前AI生成的內容來進行自我訓練,並可能導致模型崩潰。
參考資料:tech.co
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
瀏覽 1,217 次