人工智慧檢測器 難判文本真偽令人失望
編譯/莊閔棻
隨著 「聊天機器人大戰 」在矽谷的興起,專門用於生成類似人類文本的人工智慧工具不斷湧現,而分辨內容是由人工智慧還是人類所寫的工具也相繼出現,但就在測試後,一些人就發現其中沒有一個是萬無一失的辦法,所有這些方法都很容易就能被破解,一點都不可靠。
以下是《Tech Xplore》對各種檢測方法和可能引發的問題做的一些討論:
- OpenAI的檢測器
ChatGPT的創造者OpenAI 在今年1月下旬推出了一個用於辨別人工智慧編寫的文本的檢測器。《Tech Xplore》表示,他們頂多給這個辨別器打C- 分。 OpenAI自己也承認,它只可以準確識別26%的人工智慧生成文本,而在9%的情況下還會錯誤的將人類所也的內容標記為是人工智慧生成的,參考價值並不高。
- GPTZero
一名普林斯頓大學的學生Edward Tian也在1月份時發布了人工智慧內容辨別器GPTZero的第一個版本。這個應用程式根據兩個因素來識別內容作者身份:困惑度和突發性。困惑度衡量一個文本有多複雜,而突發性則比較了句子之間的變化。這兩個因素的值越低,文本就越有可能是由人工智慧創作的。
《Tech Xplore》表示,像Tian這樣的工具是有巨大前景的,但它們並不完美,而且也容易被躲過。例如,最近就有一個YouTube影片教人們如何讓ChatGPT產生具有高困惑度和突發性的內容。
- 騙過檢測器
誤導人工智慧檢測器非常簡單,幾乎都只要用同義詞替換幾個單字就行了。而為此,提供轉述人工智慧生成的文本的工具也已經充斥網路。也就是說,只要稍微將用字修改一下,就可以很容易的躲過這些檢測器的偵查。
- 浮水印
最新的一個建議是在人工智慧寫的文本中加入一個 「浮水印」,人類讀者看不到,但軟體可以檢測到。
自然語言模型是在一個個單詞的基礎上工作的,其根據統計學上的概率來選擇要生成的詞。然而,它們並不總是選擇一起出現的概率最高的詞。相反,它們是從可能出現的單詞列表中隨機選擇一個的,而這也是為什麼當用戶使用相同的提示時,也可以得到不同的輸出。
照目前來說,所謂的浮水印就是將某些人類可能會用的詞從人工智慧系統中禁止掉,並讓它們只能用其他的詞,但如此一來,人工智慧生成的文本詞彙量就將受到限制,也就失去了質量,而每個文本生成器也可能會有不同的浮水印系統,因此此技術還有待討論。而同時,只要把被禁止的詞加入內容中,也就可以很簡單的躲過檢測。
- 人工智慧檢測器競賽
不只文本生成器一直在推陳出新,AI生成的文本檢測器也將變得越來越複雜。反抄襲服務TurnItIn最近就宣布說他們即將推出一個人工智慧寫作檢測器,其準確率高達97%。
OpenAI就曾承認說,大概永遠不可能使人工智慧文本檢測器變得完美,總會有新的方法來誤導它們。然而,隨著文本生成器變得更加複雜,這些問題可能只會更加嚴重,因此要如何解決,可能是一個迫在眉睫的問題。
參考資料:techxplore
瀏覽 1,250 次