新越獄攻擊　LLM聊天機器人產生威脅

2023-07-20

編譯／Cynthia

近年來，大型語言模型（large language model，LLM）技術在自然語言處理領域取得驚人的進展，聊天機器人如ChatGPT、Bing Chat和 Bard等已成為我們日常中的助手之一。這些機器人不僅為我們帶來便利，同時也讓我們面臨了新的挑戰—越獄攻擊。

越獄攻擊是指利用許多複雜的提示操作LLM聊天機器人，使其逃避安全檢查，進而自由生成違反政策的回應和惡意內容，例如讓聊天機器人扮為某一種人格，來惡意誘導模型產生不道德等負面的話語，甚至誘發用戶洩漏個人資訊。所以這對於商用LLM聊天機器人服務而言，可能產生嚴重的安全風險和信任問題。

為了深入了解這些越獄機制，南洋理工大學（Nanyang Technological University）、新南威爾斯大學（University of New South Wales）、華中科技大學（Huazhong University of Science and Technology）和維吉尼亞理工大學（Virginia Tech）的網路安全專家展開了一項實用研究。這項研究主要對現狀商用LLM聊天機器人服務的越獄對策公開披露。經過詳盡的實驗和測試，研究發現OpenAI的聊天機器人在面對現有越獄提示攻擊時顯得較為脆弱，而Bard和Bing Chat則展現出更強的抵抗力，故這項發現引起人們對於商用LLM聊天機器人安全性的關注。

為了強化LLM的越獄防禦，研究人員提出一系列建議。首先，他們建議增加道德和政策措施，以確保LLM聊天機器人在生成內容時遵守合適的行為準則。其次，他們主張改進審核系統，提高對內容的監控，及時檢測並阻止可能的越獄行為。另外，將情境分析納入防禦策略也被認為是有效的手段，使聊天機器人能夠更好地理解用戶意圖並避免回應不恰當的內容。最後，研究人員建議實施自動化壓力測試，以驗證LLM聊天機器人的安全性和穩定性。

這項研究顯示商用LLM聊天機器人服務面臨的越獄攻擊挑戰，並顯示OpenAI聊天機器人相對脆弱的安全性，並突顯了強化越獄防禦的重要性，加強道德和政策措施、改進審核系統、引入情境分析以及實施自動化壓力測試等防禦措施將有助於確保LLM機器人的安全性和可信度。這項研究將為LLM技術的進一步發展和越獄攻擊的防範提供重要參考，讓我們能夠更安全地享受智慧機器人帶來的便利。

資料來源：Cyber Security News

瀏覽 714 次

覺得不錯的話就分享出去吧！

標籤

2023-07-20

新越獄攻擊　LLM聊天機器人產生威脅

推薦工作

發佈留言取消回覆

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

TXOne資安報告點出OT資安產業現況！台積電、ASML做了哪些努力？

因應美國對等關稅 總統賴清德證實：臺灣在首批談判名單內

企業如何因應對等關稅？邱達生：建議企業先觀望做盤點存貨

美關稅鬆綁不代表無事！葛如鈞：企業應重審體質、市場多元布局

桃竹苗大矽谷迎關稅戰！4縣市首長：強化合作關係、機動調整計畫

資料不上雲也能用最強 AI！Google Gemini搭配NVIDIA Blackwell 正式支援在地部署

發佈留言 取消回覆

因應美國對等關稅總統賴清德證實：臺灣在首批談判名單內

發佈留言取消回覆