連鎖效應!亞馬遜、彭博效仿紐時封鎖OpenAI 的GPTBot

編譯/莊閔棻

包括亞馬遜和《紐約時報》等在內的數十家大公司都開始禁止 OpenAI 用來在網路上抓取數據的GPTBot。專門檢查內容是否由人工智慧(AI)生成或抄襲的Originality.ai公司就發現,在過去兩週內,在100 個最受歡迎的網站中,就有超過 15% 決定封鎖 GPTBot。

包括亞馬遜和《紐約時報》等在內的數十家大公司都開始禁止 OpenAI 用來在網路上抓取數據的GPTBot。(圖/123RF)

亞馬遜、彭博社、CNN都加入

據外媒報導, GPTBot 於 14 天前才剛推出,阻止該機器人網站的比例就一直在逐步增加。全球前 1000 個網站中,已經有 70 個封鎖GPTBot,包括亞馬遜(amazon.com)、《紐約時報》(nytimes.com)、CNN(cnn.com)、Wiki How(wikihow.com)、美國圖片庫、圖片素材、圖片音樂和編輯工具供應商Shutterstock(shutterstock.com )、《彭博社》(Bloomberg.com)和線上問答網站Quora(quora.com)等。

更多新聞:《紐時》封鎖OpenAI網路爬蟲 AI巨頭計畫受挫

利用robots.txt來禁止

這些網站阻止 GPTBot 的方法相對簡單粗暴,只是將GPTBot 添加到其robots.txt的禁止列表中。創建於 20 世紀 90 年代的Robots.txt 旨在用來阻止網路爬蟲,如 Google 或 Bing 的搜尋爬蟲從網站提取數據和資訊。 OpenAI 在公開GPTBot時就表示,它將遵守 robots.txt,並不會抓取被禁止的網站。

OpenAI非法抓取資料引眾怒

從技術上講,網路上的大部分內容,包括文本和圖像都受到版權保護。而像 GPTBot 這樣的爬蟲不需要要求許可或付費就可以獲得這些數據和資訊。因此,目前唯一阻止它們方法就是透過 robots.txt。為訓練GPT-3.5 和 GPT-4 等語言模型,OpenAI 透過網路資料抓取機器人,從網路收集第三方數據訓練 GPT 模型。但問題是,OpenAI 使用的不只有免費、無版權的內容,其中還包括受版權保護的內容,這讓版權所有者感到憤怒。

紐時開出第一槍

隨著 ChatGPT 等工具在科技領域的迅猛發展,人們對版權和訓練AI資料來源的意識越來越強。早在8月初,《紐約時報》就先發制人,更新其服務條款,禁止其內容,包括文本、照片、圖像、音頻/影片、外觀和感覺、後設資料或合集,被用於開發「任何軟體程式,包括但不限於訓練機器學習或AI系統」。並在其 robots.txt 上封鎖GPTBot。

其他封鎖GPTBot的網站

目前已知封鎖GPTBot的網站包括:amazon.com、quora.com、nytimes.com、shutterstock.com、wikihow.com、cnn.com、foursquare.com、healthline.com、scribd.com、businessinsider.com、reuters.com、medicalnewstoday.com、amazon.co.uk、insider.com、yourdictionary.com、slideshare.net、amazon.de、bloomberg.com、amazon.in、studocu.com、ikea.comuol.com.br、amazon.fr、geeksforgeeks.org、pcmag.com、theverge.com、nextdoor.com、amazon.ca、amazon.co.jp、airbnb.com、vulture.com、polygon.com、prnewswire.com、mashable.com、nymag.com、detik.com、theatlantic.com、trulia.com、amazon.es、eater.com、picclick.com、bustle.com、etymonline.com、teacherspayteachers.com、archiveofourown.org、vox.com、kumparan.com、theathletic.com、amazon.it、alltrails.com、thrillist.com、amazon.com.br、usmagazine.com、pikiran-rakyat.com、city-data.com、hellomagazine.com、stern.de、chicagotribune.com、spanishdict.com、lonelyplanet.com、inverse.com、actu.fr、fool.com、coursera.org、france24.com、myfitnesspal.com、dotesports.com、theglobeandmail.com、axios.com。

參考資料:Insider

※更多ChatGPT相關訊息,請參考【生成式AI創新學院】。

瀏覽 2,287 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button