中文引用格式: 馬琰,蘇馬婧,姚旺君,等. 基于聚類的HTTP/HTTPS協議資產發現[J]. 電子技術應用,2025,51(11):98-106.
英文引用格式: Ma Yan,Su Majing,Yao Wangjun,et al. HTTP/HTTPS protocol asset discovery based on clustering[J]. Application of Electronic Technique,2025,51(11):98-106.
引言
在數字化轉型的推動下,網絡資產的種類和數量呈指數級增長,網絡安全面臨日益復雜的挑戰。網絡資產不僅包括傳統的網絡設備(如網絡攝像頭、防火墻),還擴展至各種內容管理系統和網絡服務。當前,網絡資產識別主要依賴基于靜態指紋規則匹配的方法,這種方法雖然在已知類型資產的識別中表現良好,但其局限性同樣明顯:首先,指紋規則構建和維護依賴于專家經驗和大量人力資源投入;其次,基于靜態指紋庫的方法在面對新型設備時響應速度緩慢,導致對未知類型資產的識別率顯著降低。這些缺陷限制了當前基于指紋規則匹配的資產識別技術的有效性和適應性。
為解決上述問題,本文創新性地提出了一種針對HTTP/HTTPS協議網絡資產的發現方法,通過自動化規則生成器對主動探測所采集到的HTTP/HTTPS協議數據進行指紋規則生成和數據過濾,配合無監督聚類方法實現對網絡資產數據按共同特征進行劃分,以實現協議的自動發現,此方法可以發現未知資產,提高標注效率。本文提出的自動化規則生成器基于層次化分組策略,逐步對數據集進行細化,提煉具有高區分度的特征字段并構建可以進行粗分類的指紋規則,以過濾掉無共性資產特征的數據。針對HTTP/HTTPS響應頭部字段的多樣性,本文對大規模探測結果數據集進行了統計分析并結合專家經驗,篩選出了21個響應頭部字段用于生成自動化過濾規則,設計了自動化規則生成器;在此基礎上,對經預過濾后的數據,設計了面向HTTP/HTTPS響應體信息的多特征融合資產聚類算法,該算法采用Word2Vec[1]進行特征編碼,將處理后的數據轉化為特征向量,結合特征融合技術與DBSCAN[2]聚類技術,在多維特征空間中進行高效聚類以實現對潛在資產的發現。最后,本文通過實驗驗證了所提方法的有效性。此方法不僅提高了HTTP/HTTPS協議資產發現的效率,還能夠有效發現未知資產,進而提高指紋標注和規則提取的效率。
本文詳細內容請下載:
http://m.jysgc.com/resource/share/2000006847
作者信息:
馬琰1,2,蘇馬婧1,2,姚旺君1,2,權曉文3,劉紅1,2
(1.中國信息安全研究院有限公司,北京 102200;
2.華北計算機系統工程研究所,北京 100083;
3.遠江盛邦(北京)網絡安全科技股份有限公司,北京 100084)

