新越獄攻擊　LLM聊天機器人產生威脅

2023-07-20

編譯／Cynthia

近年來，大型語言模型（large language model，LLM）技術在自然語言處理領域取得驚人的進展，聊天機器人如ChatGPT、Bing Chat和 Bard等已成為我們日常中的助手之一。這些機器人不僅為我們帶來便利，同時也讓我們面臨了新的挑戰—越獄攻擊。

越獄攻擊是指利用許多複雜的提示操作LLM聊天機器人，使其逃避安全檢查，進而自由生成違反政策的回應和惡意內容，例如讓聊天機器人扮為某一種人格，來惡意誘導模型產生不道德等負面的話語，甚至誘發用戶洩漏個人資訊。所以這對於商用LLM聊天機器人服務而言，可能產生嚴重的安全風險和信任問題。

為了深入了解這些越獄機制，南洋理工大學（Nanyang Technological University）、新南威爾斯大學（University of New South Wales）、華中科技大學（Huazhong University of Science and Technology）和維吉尼亞理工大學（Virginia Tech）的網路安全專家展開了一項實用研究。這項研究主要對現狀商用LLM聊天機器人服務的越獄對策公開披露。經過詳盡的實驗和測試，研究發現OpenAI的聊天機器人在面對現有越獄提示攻擊時顯得較為脆弱，而Bard和Bing Chat則展現出更強的抵抗力，故這項發現引起人們對於商用LLM聊天機器人安全性的關注。

為了強化LLM的越獄防禦，研究人員提出一系列建議。首先，他們建議增加道德和政策措施，以確保LLM聊天機器人在生成內容時遵守合適的行為準則。其次，他們主張改進審核系統，提高對內容的監控，及時檢測並阻止可能的越獄行為。另外，將情境分析納入防禦策略也被認為是有效的手段，使聊天機器人能夠更好地理解用戶意圖並避免回應不恰當的內容。最後，研究人員建議實施自動化壓力測試，以驗證LLM聊天機器人的安全性和穩定性。

這項研究顯示商用LLM聊天機器人服務面臨的越獄攻擊挑戰，並顯示OpenAI聊天機器人相對脆弱的安全性，並突顯了強化越獄防禦的重要性，加強道德和政策措施、改進審核系統、引入情境分析以及實施自動化壓力測試等防禦措施將有助於確保LLM機器人的安全性和可信度。這項研究將為LLM技術的進一步發展和越獄攻擊的防範提供重要參考，讓我們能夠更安全地享受智慧機器人帶來的便利。

資料來源：Cyber Security News

瀏覽 711 次

覺得不錯的話就分享出去吧！

標籤

2023-07-20

新越獄攻擊　LLM聊天機器人產生威脅

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

研替辦公室諮詢輔導服務「2大對象」 4-6月梯次開放申請預約

黃仁勳一句話讓量子股重摔！微軟卻說快成功 量子電腦要等多久？

【整理包】臺灣學生遊戲團隊新勢力崛起 獨立遊戲殺出新藍海

小心「冒牌貨症狀群」上身！解構焦慮「五大招」重拾自信與平衡

繼吉卜力後！ChatGPT再推「Monday」語音功能 超厭世女聲很有感

川普擬課25%關稅 蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

發佈留言 取消回覆

黃仁勳一句話讓量子股重摔！微軟卻說快成功量子電腦要等多久？

【整理包】臺灣學生遊戲團隊新勢力崛起獨立遊戲殺出新藍海

繼吉卜力後！ChatGPT再推「Monday」語音功能超厭世女聲很有感

川普擬課25%關稅蘇姿丰直言：不只衝擊AMD 全球PC手機都會變貴

發佈留言取消回覆