數位新挑戰 機器學習有助因應釣魚攻擊
編譯/Cynthia
隨著數位時代發展,網路釣魚攻擊已成為一大嚴重問題,這些攻擊針對數百萬用戶,試圖竊取敏感資訊。傳統的釣魚檢測方法,像是黑名單和啟發式偵測,在即時防護上顯示出限制性效果,特別是對抗零日攻擊更是難上加難。這些攻擊不斷演變,傳統的防禦措施難以跟上步伐,迫使研究人員積極探索新的解決方案。
機器學習助釣魚檢測技術進步
為了應對釣魚攻擊問題,研究人員開發一款結合機器學習的瀏覽器擴充功能,能夠即時辨識和分類釣魚網址。研究進行全面的文獻回顧,評估現有的釣魚檢測技術及其限制,接著團隊使用Python開發機器學習模型,並將其整合到以JavaScript、HTML和CSS構建的瀏覽器擴充功能中。這項創新解決方案結合先進技術,顯示機器學習在提升網路安全方面的巨大潛力。
數據集訓練與算法測試
為了確保模型準確性,研究團隊使用來自PhishTank和Kaggle的公共數據集進行訓練。這些數據集包含大量釣魚和正常網址,幫助模型學習並區分它們之間的差異。團隊測試多種機器學習算法,如支援向量機(Support Vector Machine,SVM)、貝氏分類(Naive Bayes)、決策樹(Decision Tree)、極限梯度提升(eXtreme Gradient Boosting,XGBoost)、K-近鄰演算法(K-nearest neighbors,KNN)。最後隨機森林算法(Random Forests)在所有測試中表現突出,成為性能最佳的選擇。
隨機森林算法表現出色
隨機森林算法顯示高性能表現,包括模型正確預測的準確率為98.32%、評估模型預測為釣魚網站且確實如此的精確率達98.62%、衡量模型對實際為釣魚網站的檢測能力為97.86%、用於綜合評估模型的整體性能(F1-score)達98.24%,顯示隨機森林演算法在即時檢測釣魚攻擊方面具有高度的準確性和可靠性。為進一步評估其零日檢測能力,研究團隊進行為期15天的測試,每天從PhishTank獲取15個新網址(URL)。測試結果顯示,模型達到99.11%的總體準確率,成功檢測到一些避過Google安全瀏覽的釣魚網址。
機器學習強化網路安全
這項研究的發現突顯機器學習在增強網路安全方面的潛力,不僅能即時檢測釣魚網站,瀏覽器擴充功能還包含一個報告系統,讓用戶可以標記可疑網站,這有助於持續更新數據集,以應對新的釣魚趨勢和手法。
優化與內建於瀏覽器的目標
研究團隊建議採用動態更新數據集和整合高階演算法及特徵工程,以提升模型的準確性和適應性。動態更新確保模型能即時應對新型釣魚攻擊,而先進技術則讓模型更精確地區分釣魚和正常網址,最終目標是將這項解決方案內建於瀏覽器,為用戶提供無縫的保護體驗,無需額外安裝套件或軟體,同時增強用戶的隱私和數據安全。
資料來源:CybersecurityNews
瀏覽 206 次