忽視YouTube規定   蘋果未經同意用其內容訓練 AI 模型

編譯/黃竣凱

根據發布的一份新報告,包括蘋果在內的多家科技巨頭,都在未經創作者同意的情況下,利用YouTube影片訓練人工智慧(AI)模型,他們使用第三方從超過17萬部影片中下載的字幕文件進行訓練,受影響的創作者還包括知名科技YouTuber Marquees Brownlee(MKBHD)、MrBeast、PewDiePie、Stephen Colbert、John Oliver和Jimmy Kimmel等。

包括蘋果在內的多家科技巨頭,都在未經創作者同意的情況下,利用YouTube影片訓練人工智慧(AI)模型。
包括蘋果在內的多家科技巨頭,都在未經創作者同意的情況下,利用YouTube影片訓練人工智慧(AI)模型。(圖/123RF)

忽視YouTube規定

據報導,全球一些最富有的AI公司,都使用了成千上萬的YouTube影片素材來訓練AI,無視了YouTube禁止未經許可擷取平台內容的規定。外媒《Proof News》的調查發現,這些字幕文件事實上是影片內容的逐字稿,來自48,000多個頻道的173,536部YouTube影片的字幕,被矽谷重量級企業使用,包括Anthropic、輝達、蘋果和Salesforce。

更多新聞:OpenAI 訓練新模型   GPT-5 可能的3大升級

「The Pile」數據集

據悉,這些下載是由非營利組織EleutherAI進行的,該組織幫助開發者訓練AI模型,雖然表明其目的是為了向小型開發者和學術界提供訓練素材,但該數據集也被包括蘋果在內的多家科技巨頭使用。這些數據集是EleutherAI發布的名為「The Pile」的一部分。「The Pile」的大部分數據集都是可訪問和公開的,任何在網路上擁有足夠空間和計算能力的人都可以使用,除了大型科技公司外,學術界和其他開發者也利用了這些數據集。

蘋果OpenELM模型

蘋果、輝達和Salesforce這些市值數千億到上兆美元的公司,在其研究論文和貼文中都描述了它們如何使用「The Pile」來訓練AI,文件還顯示,蘋果利用「The Pile」訓練了在四月發布的OpenELM模型,幾周後該公司就宣布將為iPhone和MacBook增加新的AI功能。

參考資料:9to5mac

瀏覽 244 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button