一種應用于機器學習的惡意網(wǎng)頁特征提取方法
所屬分類:技術論文
上傳者:aetmagazine
文檔大?。?span>768 K
標簽: 機器學習 惡意網(wǎng)頁檢測 哈希壓縮
所需積分:0分積分不夠怎么辦?
文檔介紹:基于機器學習的惡意網(wǎng)頁檢測技術進行研究。目前流行的“特征碼”“白名單”等方式,僅能夠檢測已知的惡意網(wǎng)頁;機器學習方法,能夠檢測出未知的惡意網(wǎng)頁,但在處理網(wǎng)頁特征時要面臨數(shù)據(jù)量大、復雜和繁瑣的問題。提出一種哈希壓縮的方法,用于處理網(wǎng)頁的特征數(shù)據(jù)。該方法在保證檢測模型的漏報率和誤報率下可實現(xiàn)將150萬的特征映射在2萬的特征空間內(nèi),對提取出的特征數(shù)據(jù)運用K折交叉驗證法訓練多個傳統(tǒng)機器學習模型和集成學習模型。并通過評估模型的檢測效果,篩選出表現(xiàn)最好的分類檢測模型。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。