《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 設(shè)計(jì)應(yīng)用 > 安全類文章的多文本分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
安全類文章的多文本分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
《信息技術(shù)與網(wǎng)絡(luò)安全》2020年第7期
吳習(xí)沫,朱廣宇,張 雷
華北計(jì)算機(jī)系統(tǒng)工程研究所,北京100083
摘要: 目前安全類網(wǎng)站信息的分類標(biāo)簽各不相同,沒有統(tǒng)一分類標(biāo)準(zhǔn),使安全類網(wǎng)站無法準(zhǔn)確地向用戶展示特定類別的安全信息。面對大量的安全類網(wǎng)站的技術(shù)類文章信息,用戶需要花費(fèi)大量的時(shí)間來識別文本類別。因此,設(shè)計(jì)一個(gè)多文本分類系統(tǒng)對于提高安全類網(wǎng)站的用戶體驗(yàn)和使用效率具有重要意義。開發(fā)了一套基于CNN和LSTM混合模型的安全類文章多文本分類系統(tǒng),本系統(tǒng)采用基于Scrapy框架的網(wǎng)絡(luò)爬蟲,該網(wǎng)絡(luò)爬蟲支持定制化配置提取不同布局的頁面數(shù)據(jù),支持?jǐn)?shù)據(jù)持久化存儲。并在 CNN和 LSTM混合模型基礎(chǔ)上設(shè)計(jì)實(shí)現(xiàn)了多文本自動標(biāo)注模塊,實(shí)現(xiàn)了網(wǎng)站安全類信息的自動分類,相對傳統(tǒng)的CNN和LSTM模型分類準(zhǔn)確率分別提升1.79%和1.54%,F(xiàn)1值分別提升1.02%和0.32%。
中圖分類號: TP391.1
文獻(xiàn)標(biāo)識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.07.009
引用格式: 吳習(xí)沫,朱廣宇,張雷. 安全類文章的多文本分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,
39(7):52-56,60.
Design and implementation of multi-text classification system for security articles
Wu Ximo,Zhu Guangyu,Zhang Lei
North China Institute of Computer Systems Engineering,Beijing 100083,China
Abstract: At present, the classification labels of security website information are different, and there is no unified classification standard, so that security websites cannot accurately display specific types of security information to users. Faced with a large number of technical article information of security websites, users need to spend a lot of time to identify text categories. So, it′s significant to design a multi-text classification system to advance the user experience and make use of security websites′ efficiency. This paper develops a security text multi-text classification system based on a hybrid model of CNN and LSTM. Based on the Scrapy framework, a web crawler, which supports both customized configuration to extract page data in different layouts and data persistence storage, is used in this system. Based on the mixed model of CNN and LSTM, a multi-text automatic labeling module is designed and implemented to realize the automatic classification of website security information. The rate of classification accuracy has increased by 1.79% and 1.54% in comparison with the traditional CNN and LSTM models respectively. Meanwhile,the F1 value has increased by 1.02% and 0.32%.
Key words : in-depth learning;text categorization;crawler;system

互聯(lián)網(wǎng)已成為信息傳播的普遍途徑,然而,由于互聯(lián)網(wǎng)中的冗余信息過多,各網(wǎng)站提供的標(biāo)簽沒有統(tǒng)一的分類標(biāo)準(zhǔn),使得整合某一特定類的文章信息所消耗的時(shí)間成本和人力成本增加。但目前為止,針對網(wǎng)絡(luò)安全類網(wǎng)站的技術(shù)類文章,還沒有一套系統(tǒng)能夠很好地解決上述對應(yīng)問題。

為迅速掌握最新的網(wǎng)絡(luò)安全信息,本文設(shè)計(jì)并實(shí)現(xiàn)了基于CNN和LSTM混合模型的安全類文章多文本分類系統(tǒng),該系統(tǒng)從多種來源收集安全類技術(shù)文本,并將它們以特定格式匯總,自動標(biāo)記匯總后的文章內(nèi)容。就信息收集而言,系統(tǒng)主要采集近一年的安全類技術(shù)文本,收集的目標(biāo)內(nèi)容主要包括文章內(nèi)容和網(wǎng)頁自帶的標(biāo)簽,對于各網(wǎng)站自定義的文章標(biāo)簽,可作為多標(biāo)簽的一部分,供用戶參考。安全類文本與普通文本對比需要由多個(gè)標(biāo)簽對其進(jìn)行標(biāo)記分類處理。因此安全類文本的分類要難于普通文本分類處理。

面向網(wǎng)絡(luò)安全數(shù)據(jù)高并發(fā)的安全類網(wǎng)站,本文設(shè)計(jì)和實(shí)現(xiàn)了信息采集模塊,該模塊主要實(shí)現(xiàn)了基于Scrapy框架的分布式爬蟲程序設(shè)計(jì),完成了多個(gè)安全類網(wǎng)站技術(shù)類文章的文本信息數(shù)據(jù)采集。

本文設(shè)計(jì)并實(shí)現(xiàn)了信息分類模塊,它負(fù)責(zé)對所獲得的數(shù)據(jù)進(jìn)行預(yù)處理、文本表示以及文本分類,其中文本分類模塊具體提出了一種基于CNN和LSTM的混合分類模型,它綜合了CNN與LSTM的優(yōu)點(diǎn),提高了模型的特征提取能力。實(shí)驗(yàn)結(jié)果表明,基于CNN和LSTM的混合分類模型達(dá)到了比較高的準(zhǔn)確率,CNN和LSTM的混合模型的準(zhǔn)確率為91.99%。CNN-LSTM與CNN、LSTM相比分類準(zhǔn)確率提高了1.79%和1.54%。



本文詳細(xì)內(nèi)容請下載:http://m.jysgc.com/resource/share/2000003231

作者信息:

       吳習(xí)沫,朱廣宇,張  雷

       (華北計(jì)算機(jī)系統(tǒng)工程研究所,北京100083)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久久噜噜噜久久狠狠50岁| 欧美午夜精品久久久久久人妖 | 久久乐国产精品| 午夜精品av| 亚洲免费网址| 亚洲欧美电影院| 亚洲综合日韩| 午夜视频在线观看一区二区三区| 亚洲一卡久久| 亚洲视频导航| 亚洲一区二区三区精品视频| 亚洲视频电影在线| 亚洲一区黄色| 欧美一区二区三区在线| 欧美一区二区大片| 久久久精彩视频| 久久手机免费观看| 免费观看成人| 欧美精品一二三| 欧美日韩精品在线| 国产精品福利网| 国产女主播一区二区三区| 国产视频久久久久| 国外成人在线| 亚洲国产精品va在看黑人| 最新国产成人av网站网址麻豆| 亚洲欧洲日韩女同| 日韩视频在线观看国产| 一区二区三区四区五区在线| 亚洲一区二区影院| 欧美一区二区视频在线观看2020 | 亚洲影视综合| 欧美一区二区日韩| 久久婷婷国产综合精品青草| 麻豆av福利av久久av| 欧美成在线视频| 欧美日韩精品不卡| 国产精品视频网| 狠狠色丁香久久婷婷综合丁香| 尤物网精品视频| 亚洲免费播放| 午夜伦欧美伦电影理论片| 亚洲高清一区二| 日韩一区二区久久| 亚洲欧美另类久久久精品2019| 欧美中文在线观看国产| 麻豆精品视频在线观看视频| 欧美伦理a级免费电影| 国产精品久久久久久久久| 国产一二三精品| 亚洲激情另类| 亚洲欧美日产图| 亚洲精品视频一区| 亚洲欧美日韩一区在线| 久久亚洲精品一区二区| 欧美日韩精选| 国产一区二区在线观看免费| 亚洲欧洲另类| 亚洲综合色在线| 亚洲欧洲精品一区二区精品久久久| 一区二区三区四区五区精品| 久久国产日韩| 欧美三级视频在线| 韩国三级电影久久久久久| 日韩午夜视频在线观看| 欧美一区二区三区啪啪| 99国内精品久久久久久久软件| 欧美怡红院视频一区二区三区| 欧美+亚洲+精品+三区| 国产精品久久久久aaaa樱花| 在线精品视频一区二区三四| 亚洲一区二区在线免费观看视频| 亚洲国内自拍| 欧美与欧洲交xxxx免费观看| 欧美极品aⅴ影院| 国产原创一区二区| 亚洲午夜久久久久久久久电影院| 91久久久久久久久| 久久国产黑丝| 欧美性事免费在线观看| 亚洲国产高清视频| 欧美一级视频免费在线观看| 亚洲一区二区三区四区五区黄| 蜜臀a∨国产成人精品| 国产日韩欧美黄色| 一区二区精品国产| 亚洲精品国产精品乱码不99 | 国产日韩精品视频一区| 亚洲精品国产精品国自产在线| 欧美一区二区在线免费观看| 亚洲一区二区在线免费观看视频| 你懂的网址国产 欧美| 国产一区二区激情| 亚洲欧美久久久| 亚洲一区二区欧美日韩| 欧美剧在线观看| 亚洲国产老妈| 亚洲国产精品va在看黑人| 久久精品夜色噜噜亚洲a∨| 欧美性感一类影片在线播放| 亚洲人成亚洲人成在线观看| 亚洲欧洲精品一区二区精品久久久| 欧美综合国产| 国产欧美欧美| 亚洲在线中文字幕| 新67194成人永久网站| 国产精品福利在线| 99精品99| 亚洲无线视频| 欧美日韩一区二区三区免费看| 亚洲国产清纯| 亚洲区欧美区| 欧美va亚洲va日韩∨a综合色| 红桃视频国产精品| 久久国产99| 久久久精品午夜少妇| 国产亚洲一级| 久久精品99久久香蕉国产色戒| 久久精品一区蜜桃臀影院 | 亚洲精选大片| 这里是久久伊人| 欧美日韩在线另类| 在线视频免费在线观看一区二区| 一区二区三区欧美在线| 欧美日韩你懂的| 夜夜嗨一区二区三区| 在线视频精品一| 国产精品v欧美精品∨日韩| 洋洋av久久久久久久一区| 亚洲午夜在线观看| 国产精品日韩欧美一区二区三区| 亚洲性感美女99在线| 亚洲欧美一区二区原创| 国产欧美精品一区| 久久精品国产清高在天天线| 老司机一区二区| 91久久精品国产91久久性色| 在线亚洲免费| 国产精品伦一区| 亚洲欧美视频在线观看视频| 久久久久久穴| 亚洲国产精品一区二区尤物区| 一区二区免费在线观看| 国产精品久久久久毛片软件 | 午夜精品一区二区在线观看 | 亚洲视频日本| 国产欧美高清| 亚洲国产天堂久久综合网| 欧美大片免费观看| 亚洲最新视频在线| 久久成人精品电影| 亚洲电影第三页| 亚洲一区二区在线免费观看视频| 国产乱码精品一区二区三| 久久xxxx| 欧美日韩久久精品| 性欧美1819性猛交| 欧美电影免费观看| 亚洲一区二区三区涩| 久久久水蜜桃av免费网站| 亚洲激情二区| 亚洲欧美一区二区精品久久久| 国产字幕视频一区二区| 日韩一本二本av| 国产精品亚洲成人| 亚洲激情影视| 国产精品普通话对白| 亚洲国产老妈| 国产精品美女久久久免费| 亚洲二区精品| 欧美色中文字幕| 久久精品女人| 欧美香蕉视频| 91久久精品美女高潮| 国产精品嫩草影院一区二区| 久久精品国产欧美激情 | 国产精品每日更新在线播放网址| 久久精品成人一区二区三区蜜臀| 欧美精品久久久久久久| 西西人体一区二区| 欧美日韩成人在线视频| 久久成人免费电影| 欧美三级精品| 亚洲黑丝一区二区| 国产精品综合网站| 一本久道综合久久精品| 黑人巨大精品欧美一区二区| 亚洲一区视频| 亚洲激情亚洲| 久久一区欧美| 亚洲专区一区二区三区| 欧美精品一区二| 亚洲高清视频在线观看| 国产精品有限公司| 一本久道综合久久精品| 黑人中文字幕一区二区三区| 亚洲嫩草精品久久| 亚洲人在线视频| 久热精品在线| 性色av一区二区三区|