PaLM 2技術進步 Google翻譯新增支援110種語言
記者/竹二
許多人常因為出國旅遊或是工作需要而使用Google翻譯,現在Google翻譯所支援的語言達到243種了。近日Google翻譯宣布,利用PaLM 2大型語言模型,讓翻譯服務支援的語言數量翻倍增加,新增110種新語言,包含香港所使用的粵語、巴基斯坦最常用的Punjabi,以及已失去最後一位母語人士的Manx等。
Google翻譯新增110種語言
據了解,這一次Google所支援的110種新語言代表全球超過6.14億使用者,約占全球人口的8%,有些是使用人數超過1億的主要語言,但大多數是土著的小社群在使用,也有少數幾乎沒有母語人士,整體而言,約有四分之一的新語言來自非洲。
在這110種新語言當中,粵語長期以來一直是Google翻譯最需要的語言之一,只不過因為粵語在寫作上經常跟普通話重疊,因此很難找到資料並訓練模型。至於Manx則是英國曼島(Isle of Man)的傳統語言,是凱爾特(Celtic)語族的語言,最後一位母語者已經在1974年去世,現在只有數千人在使用Manx。
PaLM 2技術進步可學習更多語言
另一個有趣的語言則是NKo,是屬於西非曼丁(Manding)語系的一種標準化形式,它將所有方言統一為一種通用語言,還擁有一個專門替它開發資源與技術的活躍社群,而NKo的字母則是在1949年才發明。
根據Google官方說明,在增添翻譯服務的新語言的時候,考慮了各種變種與拼法,因為不同的地區及方言都有不同的拼寫標準,加上有很多語言缺乏標準形式,所以很難出現所謂的正確變種,因此優先考慮每種語言最常用的變種,並利用PaLM 2模型來學習相近的各種語言。技術進步加上與專業語言學家及母語人士的合作,未來的Google翻譯可望支援更多的語言變體及拼法慣例。
瀏覽 985 次