Google全面改善Gboard差分隱私技術 採用聯合學習方式
記者/竹二
使用Google行動虛擬鍵盤應用程式Gboard的人有福了!Google近日宣布,所有下一個單字預測(Next Word Prediction,NWP)的神經網路語言模型,在Gboard全面採用聯合學習和差分隱私技術,提供差分隱私保證,保護用戶打字預測模型隱私。
Gboard語言模型全面聯合學習
Google從2017年以來,開始研究以聯合學習私密訓練Gboard語言模型,並在2022年正式應用差分隱私,聯合學習允許行動裝置在不共用資料下協作訓練模型。目前已經有超過30多個Gboard裝置上語言模型,在超過7種語言和15個以上的國家中推出,且具有差分隱私保證。根據Google的說法,這是目前已知最大的用戶等級差分隱私部署,針對直接使用用戶資料訓練的模型提供差分隱私保證。
更多新聞:大型語言模型輸出無法零錯誤 Google提出新訓練方式
聯合學習只會聚合有助於特定模型改進的更新,最小化資料使用量,且Google所採用安全聚合的加密方法,可以進一步保證聯合學習只能存取臨時更新的聚合結果,確保只有合併後的更新資訊會被用於改進模型,不會使用任意個別用戶的資料。
Gboard打字預測具有差分隱私
其實Gboard中所有打字預測模型都具有差分隱私保證,這代表著在使用用戶打字資料改善預測準確度的同時,也可以確保個人資料的匿名和安全,在聯合學習中,Gooogle透過使用多語言資料集預訓練模型,在公共資料集中進行實驗模擬,找出一個最佳的雜訊比,讓模型能夠有效運作卻又不會洩漏個人資料。
Google對於聯合學習與差分隱私的研究,證實了透過客戶端的參與度和系統演算法設計來實作差分隱私是可行的方式,當規模龐大且匯集大量裝置的貢獻時,隱私和效果都可達到較高的水準。目前Google正在研究機器學習相關的所有隱私方法,並擴展差分隱私技術,同時也增加系統的可稽核性和可驗證性。
瀏覽 421 次