《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于Boosting集成學(xué)習(xí)的風(fēng)險(xiǎn)URL檢測研究
基于Boosting集成學(xué)習(xí)的風(fēng)險(xiǎn)URL檢測研究
網(wǎng)絡(luò)安全與數(shù)據(jù)治理
馮美琪1,2,李赟1,2,蔣冰1,2,王立松1,2,劉春波3,陳偉1,2
1.中國民航信息網(wǎng)絡(luò)股份有限公司運(yùn)行中心; 2.中國民航信息網(wǎng)絡(luò)股份有限公司IT基礎(chǔ)設(shè)施國產(chǎn)化適配工程技術(shù)研究中心; 3.中國民航大學(xué)信息安全測評中心
摘要: 隨著互聯(lián)網(wǎng)的不斷發(fā)展,網(wǎng)站數(shù)量不斷增長,URL作為訪問網(wǎng)站的唯一入口,成為Web攻擊的重點(diǎn)對象。傳統(tǒng)的URL檢測方式主要是針對惡意URL,主要方法是基于特征值和黑白名單,容易產(chǎn)生漏報(bào),且對于復(fù)雜URL的檢測能力不足。為解決上述問題,基于集成學(xué)習(xí)中的Boosting思想,提出一種針對業(yè)務(wù)訪問的風(fēng)險(xiǎn)URL檢測的混合模型。該模型前期將URL作為字符串,使用自然語言處理技術(shù)對其進(jìn)行分詞及向量化,然后采用分步建模法的思想,首先利用GBDT算法構(gòu)建二分類模型,判斷URL是否存在風(fēng)險(xiǎn),接著將風(fēng)險(xiǎn)URL原始字符串輸入到多分類模型中,利用XGBoost算法對其進(jìn)行多分類判定,明確風(fēng)險(xiǎn)URL的具體風(fēng)險(xiǎn)類型,為安全分析人員提供參考。在模型構(gòu)建過程中不斷進(jìn)行參數(shù)調(diào)優(yōu),并采用AUC值和F1值分別對二分類模型和多分類模型進(jìn)行評估,評估結(jié)果顯示二分類模型的AUC值為98.91%,多分類模型的F1值為0.993,效果較好。將其應(yīng)用到實(shí)際環(huán)境中,與現(xiàn)有檢測手段進(jìn)行對比,發(fā)現(xiàn)模型的檢出率高于現(xiàn)有WAF和APT安全設(shè)備,其檢測結(jié)果彌補(bǔ)了現(xiàn)有檢測手段的漏報(bào)。
中圖分類號:TP393文獻(xiàn)標(biāo)識碼:ADOI:10.19358/j.issn.2097-1788.2024.07.006
引用格式:馮美琪,李赟,蔣冰,等.基于Boosting集成學(xué)習(xí)的風(fēng)險(xiǎn)URL檢測研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2024,43(7):32-40.
Research on risk URL detection based on Boosting ensemble learning
Li Yun 1,2,Jiang Bing 1,2,Wang Lisong 1,2,Liu Chunbo3,Chen Wei1,2
1. Operation Center,TravelSky Technology Limited; 2. IT Infrastructure Localization Adaptation Engineering Technology Research Center,TravelSky Technology Limited 3. Information Security Evaluation Center, Civil Aviation University of China
Abstract: With the continuous development of the Internet and the growing number of websites, URL, as the only access to websites, has become the focus of web attacks. The traditional URL detection method mainly targets malicious URLs, based on feature values and black-and-white lists, but it is prone to false positives and lacks detection capability for complex URLs. To resolve the appeal issue, a hybrid model for risk URL detection in business access is proposed based on the Boosting concept in ensemble learning. In the early stage of this model, the URL is treated as a string, and natural language processing techniques are used to segment and vectorize it. Then, a two-step approach is adopted. Firstly, the GBDT algorithm is used to construct a binary classification model to determine whether the URL is at risk. Then, the original string of the risk URL is input into a multi classification model, and the XGBoost algorithm is used to perform multi classification judgment on it, clarifying the specific risk types of the risk URL and providing reference for security analysts. During the model construction process, parameter optimization was continuously carried out, and the AUC value and F1 value were used to evaluate the binary classification model and the multi classification model, respectively. The evaluation results showed that the AUC value of the binary classification model was 98.91%, and the F1 value of the multi classification model was 0.993, indicating good performance. Applying it to practical environments and comparing it with existing detection methods, it was found that the detection rate of the model is higher than that of existing WAF and APT detection devices, and its detection results make up for the missed reports of existing detection methods.
Key words : web attacks; ensemble learning; regularization; stepwise modeling method

引言

隨著互聯(lián)網(wǎng)的快速發(fā)展,在線購物、出行服務(wù)、系統(tǒng)工具和生活服務(wù)等都為人們帶來了極大的便利。根據(jù)CNNIC數(shù)據(jù),截至2023年12月,中國網(wǎng)民數(shù)達(dá)10.92億,互聯(lián)網(wǎng)滲透率達(dá)77.5%。同時(shí),Log4j等重大漏洞的出現(xiàn)也印證了Web應(yīng)用程序所帶來的嚴(yán)重危害。而URL作為訪問網(wǎng)站的唯一入口,其也成為了Web攻擊的重點(diǎn)對象,如何從海量業(yè)務(wù)訪問中檢測出風(fēng)險(xiǎn)URL也成為了重點(diǎn)研究方向。針對URL的檢測,目前的研究方向主要集中在惡意URL,是指通過作為釣魚網(wǎng)頁的載體、XSS攻擊等多種方式竊取用戶的隱私和財(cái)產(chǎn),造成嚴(yán)重的網(wǎng)絡(luò)安全威脅的URL[1],檢測方法主要包括特征值檢測、黑白名單過濾等,其不足之處在于,當(dāng)特征值或URL不在預(yù)設(shè)的名單中,則會產(chǎn)生漏報(bào),同時(shí)此類方法無法實(shí)時(shí)對新的URL進(jìn)行檢測。啟發(fā)式技術(shù)的提出解決了對新的URL檢測的不足,但此類方法僅能用于有效數(shù)量的常見威脅[1]。然而,隨著URL攻擊的復(fù)雜度以及攻擊能力的不斷增強(qiáng),傳統(tǒng)的檢測方法已無法滿足防護(hù)需求,且其覆蓋范圍較窄,無法識別海量業(yè)務(wù)訪問中存在風(fēng)險(xiǎn)的URL,需要探索新的應(yīng)用場景和檢測方法。在20世紀(jì)80年代,隨著人工神經(jīng)網(wǎng)絡(luò)的成功,機(jī)器學(xué)習(xí)越來越受到重視,由于其使計(jì)算機(jī)能夠?qū)W習(xí)、適應(yīng)、推測模式,在沒有明確編程指令的情況下相互通信[2]的特點(diǎn),逐漸應(yīng)用到網(wǎng)絡(luò)安全領(lǐng)域。相較于傳統(tǒng)的檢測方法,機(jī)器學(xué)習(xí)模型具有更高的檢測效率和更強(qiáng)的泛化能力。目前對于URL的研究主要集中在惡意URL,而非業(yè)務(wù)相關(guān)的風(fēng)險(xiǎn)URL的檢測。惡意URL的相關(guān)研究主要可以分為三類:第一類是單一的機(jī)器學(xué)習(xí)算法,如BP神經(jīng)網(wǎng)絡(luò)[3]、卷積神經(jīng)網(wǎng)絡(luò)[4]、關(guān)聯(lián)規(guī)則[5]等。第二類是集成多種機(jī)器學(xué)習(xí)算法,如雙向長短期記憶網(wǎng)絡(luò)[6]和膠囊網(wǎng)絡(luò)結(jié)合、雙向長短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)結(jié)合[7-9]等,同時(shí)引入注意力機(jī)制來增加關(guān)鍵特征的權(quán)重。此類研究中還有一種是集成學(xué)習(xí)[1],一種方法是主要利用嶺分類、支持向量機(jī)、樸素貝葉斯作為初級學(xué)習(xí)器,采用邏輯回歸作為次級學(xué)習(xí)器,通過初級學(xué)習(xí)器和次級學(xué)習(xí)器相結(jié)合的雙層結(jié)構(gòu)對URL進(jìn)行檢測[10];另一種方法采用CNN與XGBoost相結(jié)合的檢測模型,利用CNN實(shí)現(xiàn)自動提取特征,通過XGBoost進(jìn)行分類[11]。最后一類研究是機(jī)器學(xué)習(xí)與其他手段聯(lián)合進(jìn)行檢測,如威脅情報(bào)[12]、專家知識[13]、字符嵌入編碼[14]等。本文對業(yè)務(wù)從互聯(lián)網(wǎng)接收到的風(fēng)險(xiǎn)URL請求開展檢測研究,采用分步建模法和集成學(xué)習(xí)的思想,將風(fēng)險(xiǎn)URL檢測模型分為兩個(gè)子模型:風(fēng)險(xiǎn)URL檢測以及風(fēng)險(xiǎn)URL類型分類。首先采用GBDT算法確定業(yè)務(wù)訪問的URL是否存在風(fēng)險(xiǎn),針對風(fēng)險(xiǎn)URL,采用XGBoost算法確定具體的風(fēng)險(xiǎn)類型。同時(shí)產(chǎn)生告警供安全運(yùn)營人員確認(rèn)并處置,在一定程度上彌補(bǔ)現(xiàn)有特征值檢測方法的漏報(bào)。


本文詳細(xì)內(nèi)容請下載:

http://m.jysgc.com/resource/share/2000006089


作者信息:

馮美琪1,2,李赟1,2,蔣冰1,2,王立松1,2,劉春波3,陳偉1,2

(1.中國民航信息網(wǎng)絡(luò)股份有限公司運(yùn)行中心,北京101318;

2.中國民航信息網(wǎng)絡(luò)股份有限公司IT基礎(chǔ)設(shè)施國產(chǎn)化適配工程技術(shù)研究中心,北京101318;

3.中國民航大學(xué)信息安全測評中心,天津300300)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久免费视频在线| 国产精品男人爽免费视频1| 亚洲视频在线观看三级| 亚洲人成人一区二区三区| 久久精品亚洲| 久久成人精品无人区| 久久国产精品亚洲77777| 午夜免费在线观看精品视频| 亚洲一区国产精品| 亚洲欧美国产va在线影院| 亚洲一区在线免费| 亚洲综合另类| 香蕉国产精品偷在线观看不卡| 午夜精品久久| 欧美一区二区三区免费看| 欧美一区免费视频| 亚洲福利国产精品| 亚洲欧洲一区| 99国内精品久久久久久久软件| 99在线精品视频| 亚洲一区二区在线看| 亚洲欧美在线免费| 欧美专区在线播放| 久久亚洲午夜电影| 欧美成人国产| 欧美日韩免费一区二区三区视频| 国产精品igao视频网网址不卡日韩| 欧美午夜剧场| 国产日韩欧美在线视频观看| 国户精品久久久久久久久久久不卡| 国外视频精品毛片| 在线播放豆国产99亚洲| 亚洲人成网站777色婷婷| 一区二区冒白浆视频| 亚洲欧美在线磁力| 久久精品一区二区国产| 亚洲伦理久久| 亚洲综合国产| 久久久精品tv| 欧美成人自拍| 国产精品videosex极品| 国产视频一区免费看| 亚洲国产美女| 亚洲午夜av在线| 久久国产精品第一页| 亚洲理论在线观看| 亚洲女人天堂成人av在线| 久久高清免费观看| 欧美国产日韩精品免费观看| 国产精品xxxav免费视频| 国产一区二区无遮挡| 亚洲欧洲精品天堂一级| 亚洲一区二区在线| 亚洲黄色免费| 亚洲欧美另类国产| 毛片基地黄久久久久久天堂| 欧美日韩亚洲一区二区| 国产亚洲精品高潮| 亚洲精品一区二区三区av| 亚洲欧美国产77777| 亚洲精品久久久久久久久久久| 亚洲在线黄色| 免费人成精品欧美精品| 国产精品美女一区二区在线观看| 黄色欧美成人| 亚洲丝袜av一区| 最新日韩在线| 欧美制服丝袜| 欧美日韩人人澡狠狠躁视频| 狠狠色狠狠色综合人人| 制服丝袜激情欧洲亚洲| 亚洲国产欧美国产综合一区| 午夜影院日韩| 欧美激情精品久久久久| 国产一区二区三区在线观看免费 | 亚洲欧洲视频在线| 香蕉成人久久| 亚洲制服av| 欧美韩日一区二区三区| 国产香蕉97碰碰久久人人| 日韩亚洲在线| 亚洲精品日韩在线| 久久免费高清视频| 国产欧美 在线欧美| 一区二区三区四区五区精品视频 | 一本久久青青| 久久免费黄色| 国产麻豆日韩欧美久久| 艳妇臀荡乳欲伦亚洲一区| 亚洲国产精品福利| 久久精品在线| 国产精品色一区二区三区| 99精品久久久| 亚洲免费成人av| 久久中文字幕一区二区三区| 国产精品揄拍一区二区| 一本色道久久综合一区| 99视频日韩| 欧美成人69av| 精品1区2区| 亚洲承认在线| 久久久在线视频| 国产在线观看一区| 亚洲欧美国产高清va在线播| 亚洲一区二区在线看| 欧美日韩午夜精品| 亚洲伦伦在线| 一区二区黄色| 欧美日韩国产精品成人| 亚洲人在线视频| 99国产精品久久| 欧美劲爆第一页| 亚洲国产欧美一区二区三区同亚洲| 久久精品盗摄| 久久综合九色九九| 精品av久久久久电影| 久久精品一二三| 免费91麻豆精品国产自产在线观看| 国内精品99| 久久精品国产精品亚洲综合 | 美乳少妇欧美精品| 亚洲春色另类小说| 亚洲精品一二区| 欧美激情亚洲一区| 亚洲毛片av| 亚洲一区二区三区欧美| 国产精品爱啪在线线免费观看| 亚洲色图综合久久| 亚洲欧美日韩一区在线| 国产日韩精品一区观看 | 久久综合伊人77777麻豆| 在线观看中文字幕不卡| 亚洲日本在线观看| 欧美日韩成人在线观看| 在线亚洲精品福利网址导航| 午夜久久福利| 国产在线播精品第三| 亚洲激情另类| 欧美日韩免费网站| 亚洲专区在线| 久久亚洲春色中文字幕久久久| 尤物精品在线| av成人老司机| 国产精品一区二区你懂得 | 久久精品动漫| 欧美激情视频一区二区三区不卡| 99视频一区二区| 欧美一进一出视频| 国内精品亚洲| 99伊人成综合| 国产毛片久久| 亚洲欧洲综合| 国产精品hd| 久久成人综合视频| 欧美电影在线| 亚洲一区免费观看| 麻豆av一区二区三区| 亚洲精品欧美日韩专区| 亚洲欧洲99久久| 伊人激情综合| 亚洲影院色在线观看免费| 国产一区二区三区在线观看网站| 亚洲精选中文字幕| 国产精品自在在线| 亚洲日本视频| 国产毛片一区| 99国产精品视频免费观看| 国产精品伊人日日| 亚洲人体大胆视频| 国产精品手机视频| 亚洲人成在线观看| 国产精品一区视频| 日韩午夜激情电影| 国产午夜精品在线观看| 9国产精品视频| 韩日在线一区| 亚洲摸下面视频| 亚洲电影在线| 欧美在线观看一区二区三区| 亚洲日本理论电影| 久久激情视频| 99视频一区| 欧美成黄导航| 午夜欧美精品| 欧美日本一区二区高清播放视频| 香蕉久久国产| 欧美视频导航| 亚洲国产视频直播| 国产欧美在线看| 亚洲网站在线观看| 亚洲国产欧美日韩| 久久久久久久久岛国免费| 一区二区三区视频在线| 欧美大片在线观看一区| 久久av在线看| 国产精品自拍三区| 亚洲一区二区在线免费观看视频| 亚洲国产精品久久精品怡红院| 欧美在线播放视频| 一区二区日韩精品|