《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 涉及隱私侵占類APP識別與分類方法研究
涉及隱私侵占類APP識別與分類方法研究
信息技術與網絡安全 12期
易 黎1,邱秀連1,馬 芳1,彭艷兵1,程 光2
(1.南京烽火星空通信發展有限公司,江蘇 南京210019;2.東南大學 網絡空間安全學院,江蘇 南京211189)
摘要: 隨著信息基礎建設的發展和移動應用的普及,用戶個人信息在使用過程中被應用開發者大量收集,出現了對個人信息的非法泄露和使用問題,嚴重威脅到了個人信息安全。為了更加高效準確地識別是否存在侵占隱私行為及對應APP類別,提出了一種基于多模態特征的多策略組合的識別算法。首先,該算法采用Word2vec的方法來完成APP相關文本的詞匯層面的特征向量表示,隨后有針對性地將獲得的特征向量輸入CNN網絡進行分類,接著根據文本分類的結果和多種行為特征集合生成應用程序特征向量,最后結合多種不同的基分類器,采用硬投票的方式預測侵占隱私行為。實驗結果表明,經過訓練的模型在驗證集上的分類結果F1值最高可達91%,該方法可以有效地對侵占隱私類APP進行識別及分類,有助于在大數據時代,保障個人信息安全建設。
中圖分類號: TP391.4
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.12.002
引用格式: 易黎,邱秀連,馬芳,等. 涉及隱私侵占類APP識別與分類方法研究[J].信息技術與網絡安全,2021,40(12):8-14.
Research on identification and classification methods of APP involving privacy infringement
Yi Li1,Qiu Xiulian1,Ma Fang1,Peng Yanbing1,Cheng Guang2
(1.Nanjing FiberHome Software Technology Co.,Ltd.,Nanjing 210019,China; 2.School of Cyber Science and Engineering,Southeast University,Nanjing 211189,China)
Abstract: With the development of information infrastructure and the popularization of mobile applications, a large number of users′ personal information is collected by application developers in the process of use, and there are problems with the illegal collecting and using of personal information, which seriously threatens the security of personal information. In order to more effectively identify the type of APP and whether it has violated privacy, a recognition algorithm based on multi-modal features and multi-strategy combination is proposed. Firstly, the algorithm uses the Word2vec method to extract feature formation vectors related to APP text, and then the obtained feature vector is input into the CNN network for classification. Based on the result of the text classification and a variety of behavior feature sets, it generates application feature vectors, and finally combines a variety of different base classifiers and uses hard voting to predict the applications′ invade-privacy categories. The experimental result shows that the F1 value of the trained model on the validation set can be as high as 91%. This method can effectively identify and classify privacy-invading apps, which is helpful to ensure the security of personal information in the era of big data.
Key words : multi-label text classification;feature extraction;behavioral features;model construction;machine learning

0 引言

中國互聯網絡信息中心(CNNIC)發布的第48次《中國互聯網絡發展狀況統計報告》表明,截至2021年6月,中國手機網民的數量已高達10.07億,如此巨大的用戶量具有不可估量的商業價值,而其背后如此巨大的用戶個人信息在當前信息時代環境下更是蘊含著巨大價值[1]。但在實踐中,如此眾多的用戶使用量其問題也接踵而至,最明顯的是關于用戶個人信息泄漏事件層出不窮,對用戶個人信息的侵害可謂無孔不入,智能手機APP為用戶帶來便利的同時,也成為個人信息泄漏的根本原因之一。

依據敏感程度和安全性不同,用戶個人信息內容分為用戶核心隱私信息、用戶的重要隱私信息與用戶的普通隱私信息三個類別[2]。其中關于通訊錄聯系人、手機賬號、賬戶密碼、聊天記錄以及定位用戶當前所在地點等內容被劃分為核心隱私信息;關于手機發送接收短信信息、撥通電話、調用手機自帶的攝像頭權限等內容信息歸屬于重要隱私信息一類;最后用戶的Wi-Fi連接無線網絡、藍牙連接無線設備、手機數據網絡流量使用等信息屬于普通隱私信息。





本文詳細內容請下載:http://m.jysgc.com/resource/share/2000003889







作者信息:

易  黎1,邱秀連1,馬  芳1,彭艷兵1,程  光2

(1.南京烽火星空通信發展有限公司,江蘇 南京210019;2.東南大學 網絡空間安全學院,江蘇 南京211189)


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 国产v片免费播放| 国产香蕉一本大道| 久久久久久国产精品免费免费男同| 欧美成人一区二区三区在线视频 | 国产农村乱子伦精品视频| 男人资源在线观看| 国产麻豆天美果冻无码视频| www羞羞动漫网在线观看| 成年女人毛片免费播放视频m| 久久婷婷成人综合色| 樱桃视频直播在线观看免费| 亚洲日韩第一页| 激情国产白嫩美女在线观看| 全黄h全肉远古| 美女被免费网站视频九色| 国产丝袜无码一区二区三区视频| 黄色网址免费大全| 国产真实乱对白精彩久久| 2021国产成人精品国产| 在线看亚洲十八禁网站| chinese帅哥18kt| 嫩草影院免费观看| 一级呦女专区毛片| 成人av免费电影| 中文字幕aⅴ在线视频| 放荡的闷骚娇妻h交换3p| 久久久久亚洲精品无码蜜桃| 日韩一中文字幕| 久久精品午夜一区二区福利| 欧洲乱码伦视频免费| 亚洲va无码va在线va天堂| 欧美怡红院免费的全部视频| 亚洲日韩区在线电影| 永久不封国产毛片AV网煮站| 亚洲综合无码一区二区| 狠狠精品干练久久久无码中文字幕| 免费无码又爽又黄又刺激网站| 精品国产免费观看一区| 加勒比色综合久久久久久久久| 精品香蕉伊思人在线观看| 双乳奶水被老汉吸呻吟视频|