YouTube成AI訓練的百寶箱|漫談【主筆室】
科技島主筆/蔡哲明
人工智慧公司OpenAI以聊天機器人ChatGPT橫空出世,躍升AI領域的科技大廠,去年發布功能更強大的GPT-4,快速進步靠的正是YouTube影片,《紐約時報》報導指出,OpenAI利用AI版權法的灰色空間,轉錄了超過百萬小時的YouTube影片,訓練其先進大型語言模型GPT-4。
OpenAI利用YouTube的影片內容來訓練AI模型,儘管此舉可能違反服務條款,目前業者急需以大規模內容培養AI之際,加上不願購買大量數位資料的專業資訊,恐讓YouTube上非專業的錯誤知識以訛傳訛。
更多新聞:手機鍛鍊意志能抵擋分心?|漫談【主筆室】
OpenAI 發言人赫爾德(Lindsay Held)表示OpenAI 是為每個模型開發策劃獨特資料,宣稱訓練內容來自不同來源,當中包括公開資料以及合作夥伴的非公開資料,同時也會考慮自家產生的合成資料,並未正面回應是否運用 YouTube 影片投入 GPT-4 訓練。
YouTube 目前是網路上最大且最豐富的文字、圖像、音訊平台,面臨AI技術日新月異,各類企業對於訓練數據需求迫切,對於推動AI模型的相關進程又至為關鍵,也讓YouTube自然成為科技公司的頭號目標。
大廠為了在AI競賽搶得先機援引YouTube作為訓練卻忽略了訊息品質,一般使用者可拍攝影片上傳平台,除非明顯違反使用條款,否則不會限定發布門檻,一旦涉及專業性的知識技術,資訊內容可說參差不齊,用作AI訓練恐將誤人子弟。
YouTube真的是訓練先進大型語言模型GPT-4的百寶箱嗎? 影音平台上的錯誤知識比比皆是,難道科技大廠還要飲鴆止渴,自甘作為YouTube AI平台,最終淪為無關資訊正確與否,只求市場消費的秘聞型媒體。
瀏覽 2,052 次