忽視YouTube規定 蘋果未經同意用其內容訓練 AI 模型
編譯/黃竣凱
根據發布的一份新報告,包括蘋果在內的多家科技巨頭,都在未經創作者同意的情況下,利用YouTube影片訓練人工智慧(AI)模型,他們使用第三方從超過17萬部影片中下載的字幕文件進行訓練,受影響的創作者還包括知名科技YouTuber Marquees Brownlee(MKBHD)、MrBeast、PewDiePie、Stephen Colbert、John Oliver和Jimmy Kimmel等。
忽視YouTube規定
據報導,全球一些最富有的AI公司,都使用了成千上萬的YouTube影片素材來訓練AI,無視了YouTube禁止未經許可擷取平台內容的規定。外媒《Proof News》的調查發現,這些字幕文件事實上是影片內容的逐字稿,來自48,000多個頻道的173,536部YouTube影片的字幕,被矽谷重量級企業使用,包括Anthropic、輝達、蘋果和Salesforce。
更多新聞:OpenAI 訓練新模型 GPT-5 可能的3大升級
「The Pile」數據集
據悉,這些下載是由非營利組織EleutherAI進行的,該組織幫助開發者訓練AI模型,雖然表明其目的是為了向小型開發者和學術界提供訓練素材,但該數據集也被包括蘋果在內的多家科技巨頭使用。這些數據集是EleutherAI發布的名為「The Pile」的一部分。「The Pile」的大部分數據集都是可訪問和公開的,任何在網路上擁有足夠空間和計算能力的人都可以使用,除了大型科技公司外,學術界和其他開發者也利用了這些數據集。
蘋果OpenELM模型
蘋果、輝達和Salesforce這些市值數千億到上兆美元的公司,在其研究論文和貼文中都描述了它們如何使用「The Pile」來訓練AI,文件還顯示,蘋果利用「The Pile」訓練了在四月發布的OpenELM模型,幾周後該公司就宣布將為iPhone和MacBook增加新的AI功能。
參考資料:9to5mac
瀏覽 243 次