獲選測試GPT-4 冰島人工智慧新創公司:令人震驚
編譯/莊閔棻
現在,只有少數幸運兒有機會使用OpenAI的最新大型語言模型(LLM)GPT-4。而其中之一是冰島的人工智慧新創公司Miðeind ehf,它是僅有的六個被選中進行GPT-4測試的公司之一。
Miðeind團隊向新創新聞網站《Sifted》介紹了他們對GPT-4的一些見解,關於其如何比前一代更進步,以及人工智慧在語言上得到的進展。
- 令人震驚
一直以來,「可解釋性 」都是作為是開發生成式人工智慧的人一直在努力解決的一大挑戰。因為LLM的運作方式代表了,輸出是在一個「黑盒子」中生成的,也就是說,即使是建造GPT-4的人也不知道它是如何以這樣的方式回答問題的,而這將很難讓這些模型顯示其工作原理。
Ragnarsson說,當涉及到更普遍的推理時,他能看到GPT-3.5的巨大改進,「最令人震驚的是,你可以要求它做一些事情,並要求其解釋為什麼為什麼會給你這個結果。」他說:「GPT-3.5可以做到這一點,但GPT-4更好,解釋更合理、更周全。」
- 高階思維
Ragnarsson對GPT-4的另一個特點印象深刻,那就是它能夠產生比該模型的前代更具洞察力的反應。他舉例說,當他輸入了一段他認為「相當中性」的文字,關於一個客戶向客戶服務部詢問的事情,而GPT-4卻告訴他這段文字是「略微積極的」。
他表示,當他要求GPT-4進行解釋時,他感到很驚訝。GPT-4說:「雖然文本本身是中性的,但這個人正在考慮做的行動會改善他們的生活,所以總體而言,這篇文本是略微積極的。」他認為這表明了,GPT-4已經學會了超越文本的「表面意義」。
Miðeind的首席營運長Linda Heimisdottir說:「看到一個這樣的模型能做研究人員多年來一直在研究的事情,而且它沒有經過專門的訓練,這基本上是令人震驚的。」
- 語言進展
Miðeind團隊的任務是,透過向模型輸入冰島強化學習數據,並看其是否能提高GPT-4的外語性能。Miðeind機器學習團隊成員Pétur Orri Ragnarsson說,比起 GPT-3.5,GPT-4的結果有一定的改進,但當涉及到用冰島語工作時,該模型仍不完美。他說:「它生成的冰島語文本往往是可以理解的,它很好,但仍有一些語法錯誤。」
作為GPT-4如何在語言上取得進展一個例子,其在冰島語複合詞使用上令人震驚。Heimisdottir說,當她讓GPT-4告訴講一個關於貓的故事時,它產生了一個帶有 「kattafræðilega」的冰島語文本。
作為一個模型發明的複合詞,「Kattafræðilega」第一部分是「貓」;而第二部分「fræðilega」則是「理論上」的意思。她解釋說:「該模型將這隻貓描述「kattafræðilega duglegur」。Duglegur是一個普通的冰島詞,表示「勤奮或努力工作的」。也就是說,模型想表達的是,這隻貓在其作為一隻貓的工作上特別勤奮。換句話說,它擅長做所有跟貓有關的活動,並擅長「做一隻貓」。
Miðeind認為,要使LLM在較少使用的語言中取得真正的高性能,這些模型將需要在其初始訓練中包括良好的多語言數據集。像這樣的研究,對於確保下一代人工智慧不會只集中於英語世界來說非常重要。
參考資料:sifted
瀏覽 1,595 次