《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 基于字節序列頻域采樣的惡意軟件分類
基于字節序列頻域采樣的惡意軟件分類
網絡安全與數據治理
蔣永康,孫遜,楊玉龍
貴州航天計量測試技術研究所
摘要: 近年來,利用機器學習直接從文件字節序列中提取特征并進行惡意軟件分類的方法受到了廣泛關注。但惡意軟件字節序列較長,直接輸入模型進行訓練,時間和空間開銷巨大,難以適用大數據場景下的海量文件樣本。針對該問題,提出基于字節序列頻域采樣的惡意軟件分類方法,通過離散傅里葉變換設計頻域采樣策略保留字節序列中的主要低頻成分,合成新的短信號,實現訓練效率的提高。公開數據集上的實驗結果表明,與最先進的基于原始字節序列的惡意軟件分類方法相比,所提出的方法與其分類效果相當,且將模型的訓練時間和GPU顯存占用分別降低了90%和50%以上。
中圖分類號:TP393.08文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.01.003引用格式:蔣永康,孫遜,楊玉龍. 基于字節序列頻域采樣的惡意軟件分類[J].網絡安全與數據治理,2025,44(1):15-20.
Frequency domain sampling of byte sequences for malware classification
Jiang Yongkang,Sun Xun,Yang YuLong
Institute of Guizhou Aerospace Measuring and Testing Technology
Abstract: Recently, methods of using machine learning to directly extract features from byte sequences and classify malware have received widespread attention. However, byte sequences of malware are long, directly inputting them into models for training will involve large time and space overheads, making it difficult to adapt to massive samples in big data scenarios. To address this problem, this paper proposes a malware classification method based on frequency domain sampling of byte sequences. A frequency domain sampling strategy is designed through discrete Fourier transform to retain main low-frequency components in byte sequence, synthesize new short signals, and achieve the purpose of improving training efficiency. Experimental results show that compared with the state-of-the-art malware classification method based on raw byte sequences, the proposed method has comparable accuracy and can reduce the model training time and GPU memory usage by more than 90% and 50% respectively.
Key words : malware classification; byte sequences; frequency domain sampling; machine learning

引言

惡意軟件分類致力于研究如何識別惡意軟件以及區分不同的惡意軟件家族,作為網絡安全研究領域中的一個重要分支,對于理解和防御不同類型的惡意軟件以及溯源網絡攻擊具有重要意義。惡意軟件分類方法大致可以分為:基于靜態特征[1]和動態特征[2]的傳統方法,以及引入機器學習[3]的新式方法。基于靜態特征的方法[4-6]依賴于復雜的特征工程,難以應對惡意軟件的快速演化;基于動態特征的方法[7-9]涉及耗時的行為特征監控[10],難以規模擴展。近年來,利用機器學習直接從文件字節序列中提取特征并進行惡意軟件分類的方法受到了廣泛關注[11-12]。該方法的框架如圖1所示,其研究核心是設計一個分類模型,將輸入樣本x的字節序列映射到一個范圍為[0,1]的概率分布c=[c0,c1,…,cM]上,其中∑cm=1。測試時,計算類別m=argmax(c),m=0表示良性軟件,m≥1表示相應的惡意軟件家族。如果M=1,分類模型實現面向良性軟件與惡意軟件的二分類;如果M≥2,則分類模型實現面向惡意軟件家族的多分類,此時良性軟件被看作一類特殊的家族。

03.1.png

圖1基于字節序列分析的惡意軟件分類框架

通過機器學習模型自動地從序列中提取和編碼特征的技術路線能更好地適應當今惡意軟件的動態變化,也能更好地實現各類型和跨平臺的惡意軟件分類。然而,當面對大數據場景下的海量文件樣本時,該路線面臨因惡意軟件的字節序列較長,直接輸入模型進行訓練,導致時間和空間開銷巨大的挑戰。從形式上看,字節序列分類任務類似于時間序列分類任務,借鑒其研究成果已被證明極具挑戰[12]。惡意軟件通常包含數十萬到數百萬長度的字節序列,以100萬長度的字節序列為例,其相當于T=1 000 000步長的時間序列,而已知的最長時間序列分類任務步長≤16 000[13],這限制了現有時間序列分類模型的直接應用。目前為止,能處理這種極端長度字節序列分類任務的實現是MalConv[11],其通過簡潔的模型設計,可以處理T=2 000 000步長的字節序列。遺憾的是,MalConv的訓練開銷極大,例如在Ember[14]數據集60萬樣本上訓練該模型,128 GB顯存的DGX1需要消耗一個月的時間。盡管MalConv2[12]通過優化池化降低了訓練的顯存開銷,但訓練的時間開銷依然很大。本文針對上述如何提高字節序列分類模型的訓練效率展開研究。通過引入離散傅里葉變換[15]分析文件字節序列的頻率分量發現,字節序列中的能量主要集中在低頻部分。本文通過截取低頻分量來縮短輸入字節序列的長度,進而提出基于字節序列頻域采樣的惡意軟件分類方法。核心的設計思路為:設計頻域采樣策略,保留字節序列中的主要低頻分量,合成新的短信號,從而實現訓練效率的提高。Windows和Android公開惡意軟件數據集上的實驗結果表明,與最先進的基于原始字節序列的MalConv2[12]相比,本文提出的方法與其分類效果相當,且將模型的訓練時間和GPU顯存占用分別降低了90%和50%以上。綜上,本文的主要貢獻如下:(1)提出了一種基于字節序列頻域采樣的惡意軟件分類方法,通過設計頻域采樣策略,減小輸入字節序列的長度,實現模型訓練效率的提高。(2)在公開數據集上進行了驗證,結果表明,提出的惡意軟件分類方法與最先進的基于原始字節序列的方法分類效果相當,且能將模型的訓練時間和GPU顯存占用大幅降低。(3)分析了字節序列頻域采樣策略中采樣長度的影響,并對未來的研究方向進行了討論。


本文詳細內容請下載:

http://m.jysgc.com/resource/share/2000006296


作者信息:

蔣永康,孫遜,楊玉龍

(貴州航天計量測試技術研究所,貴州貴陽550009)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
最新日韩精品| 亚洲制服少妇| 国产精品久久久一区麻豆最新章节| 久久深夜福利| 欧美一区亚洲二区| 亚洲性感激情| 亚洲小少妇裸体bbw| 亚洲四色影视在线观看| 99精品欧美一区| 亚洲精品视频免费| 亚洲精品国产精品国自产观看| 久久精品水蜜桃av综合天堂| 性色av香蕉一区二区| 亚洲综合国产精品| 午夜精品国产精品大乳美女| 亚洲自拍偷拍福利| 亚洲一区免费观看| 亚洲中午字幕| 欧美亚洲免费电影| 午夜精品福利在线| 欧美在线二区| 亚洲承认在线| 亚洲人人精品| 99热这里只有成人精品国产| 99精品免费视频| 日韩午夜免费视频| 一区二区三区四区五区视频| 亚洲深夜福利在线| 午夜精品电影| 久久精品一区二区| 美女主播一区| 欧美日韩精品一二三区| 欧美视频在线观看 亚洲欧| 国产精品黄色| 国产日韩成人精品| 影音先锋久久久| 91久久精品一区二区别| 9久re热视频在线精品| 亚洲一区二区在| 欧美在线影院| 亚洲精品视频免费观看| 亚洲婷婷综合色高清在线| 亚洲欧美一区二区三区在线| 久久精品国产亚洲5555| 免费看的黄色欧美网站| 欧美精选午夜久久久乱码6080| 欧美午夜不卡视频| 国产日韩精品一区二区| 在线观看国产欧美| 一区二区久久久久| 欧美一区91| 亚洲九九九在线观看| 午夜亚洲福利在线老司机| 久久噜噜亚洲综合| 欧美久久影院| 国产日韩欧美电影在线观看| 在线欧美三区| 亚洲淫性视频| 亚洲美女毛片| 久久爱www| 欧美人妖在线观看| 国产日韩在线一区二区三区| 亚洲激情视频在线观看| 亚洲综合不卡| 日韩视频免费| 久久成人av少妇免费| 欧美激情一区二区三区蜜桃视频| 国产精品午夜在线| 91久久精品美女| 午夜精品一区二区三区电影天堂| 亚洲精品国久久99热| 欧美一级二级三级蜜桃| 欧美国产高清| 国产一区二区高清| 妖精成人www高清在线观看| 久久精品免费观看| 亚洲砖区区免费| 欧美jizz19性欧美| 国产日韩一区二区三区在线| 日韩午夜在线电影| 亚洲欧洲一级| 久久精品国产99| 欧美三级在线视频| 亚洲国产网站| 久久国产免费| 欧美一区二区三区久久精品茉莉花| 欧美精品免费看| 激情六月综合| 亚洲欧美国产高清| 一区二区日韩欧美| 欧美成人69av| 海角社区69精品视频| 亚洲免费在线播放| 亚洲一区二区三区久久| 欧美精品亚洲一区二区在线播放| 激情国产一区| 香蕉国产精品偷在线观看不卡| 亚洲尤物视频在线| 欧美日韩午夜在线视频| 亚洲国产高清一区二区三区| 欧美一区三区三区高中清蜜桃 | 亚洲欧美日韩综合一区| 欧美人妖在线观看| 亚洲国产影院| 91久久香蕉国产日韩欧美9色| 久久九九免费视频| 国产午夜久久| 欧美一乱一性一交一视频| 午夜精品久久久久久久| 国产精品国产自产拍高清av王其| 99精品久久免费看蜜臀剧情介绍| 99精品99久久久久久宅男| 欧美18av| 亚洲黄网站黄| 日韩亚洲欧美成人一区| 女女同性女同一区二区三区91| 黄色成人av| 久久av二区| 久久综合色一综合色88| 有码中文亚洲精品| 亚洲国产视频直播| 麻豆精品传媒视频| 亚洲国产毛片完整版| aaa亚洲精品一二三区| 亚洲激情偷拍| 免费看成人av| 亚洲激精日韩激精欧美精品| 亚洲精品日韩激情在线电影 | 国产精品丝袜久久久久久app| 亚洲天堂av综合网| 亚洲欧美影音先锋| 国产精品专区第二| 欧美一区二区在线播放| 久久久免费精品| 尤物九九久久国产精品的特点 | 欧美电影免费网站| 99精品福利视频| 亚洲自拍高清| 国产亚洲电影| 亚洲国产一区在线观看| 欧美大胆成人| 一本色道久久加勒比88综合| 亚洲欧美视频在线观看视频| 国产区二精品视| 亚洲二区三区四区| 欧美经典一区二区三区| 亚洲视频精品在线| 久久国产加勒比精品无码| 激情久久综艺| 在线视频欧美日韩精品| 国产精品视频网| 亚洲国产精品成人综合| 欧美日本精品在线| 亚洲男人的天堂在线| 久久久综合网| 亚洲精品永久免费| 欧美一区二区三区免费在线看 | 亚洲精品免费一二三区| 欧美日韩综合不卡| 欧美一区二区精品| 欧美国产精品劲爆| 亚洲午夜精品一区二区| 久久看片网站| 99这里只有久久精品视频| 欧美在线视频一区二区三区| 精品不卡一区| 亚洲在线成人| 黑人极品videos精品欧美裸| 夜夜爽99久久国产综合精品女不卡| 国产精品久久久免费| 亚洲国产成人精品久久久国产成人一区| 欧美精品导航| 欧美一区二区高清| 欧美精品免费看| 欧美一区二视频| 欧美日韩一区二区三| 欧美专区日韩专区| 欧美日韩免费看| 亚洲高清电影| 国产精品毛片a∨一区二区三区|国| 久久精品视频免费| 国产精品久久久久久久电影| 亚洲韩国青草视频| 国产精品一区一区| 一区二区三区久久精品| 国内精品久久久久影院优| 亚洲视频高清| 玉米视频成人免费看| 午夜亚洲视频| 亚洲精品综合| 久久午夜视频| 亚洲亚洲精品在线观看| 欧美激情久久久久| 欧美一区二区私人影院日本| 欧美午夜精品久久久久免费视 | 欧美一区影院| 国产精品久线观看视频| 日韩亚洲视频| 激情欧美一区二区三区在线观看| 亚洲已满18点击进入久久|