《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于人工神經網絡的多維離群點檢測算法
基于人工神經網絡的多維離群點檢測算法
來源:微型機與應用2014年第5期
梁 兵,盧建軍,衛 晨
(西安郵電大學 通信與信息工程學院,陜西 西安 710121)
摘要: 為了更加智能地檢測離群點,克服傳統離群點檢測算法的機械性,提升多維數據集合離群點挖掘效率,在傳統的離群數據挖掘算法的基礎上,提出了一種基于人工神經網絡的多維離群點檢測算法。仿真實驗結果表明,該算法具有對用戶依賴性小、檢測精度高的優點,為檢測離群點提供了一種新的路徑。
Abstract:
Key words :

摘  要: 為了更加智能地檢測離群點,克服傳統離群點檢測算法的機械性,提升多維數據集合離群點挖掘效率,在傳統的離群數據挖掘算法的基礎上,提出了一種基于人工神經網絡的多維離群點檢測算法。仿真實驗結果表明,該算法具有對用戶依賴性小、檢測精度高的優點,為檢測離群點提供了一種新的路徑。
關鍵詞: 人工神經網絡;多維數據;智能化;熵權

 離群點(Outlier)就是明顯偏離其他數據、不滿足數據的一般模式或行為、與存在的其他數據不一致的數據[1]。離群點檢測的目的在于從海量數據中找出具有明顯異常行為的數據。離群點的檢測應用于多個行業,如通信盜用、網絡病毒檢測、疾病診斷等方面。目前有一些高效的離群點檢測挖掘算法,比如基于統計的、 距離的、深度的、密度的方法,參考文獻[2]-[6]中較為詳細地介紹了這些方法和各自的局限性。
這些傳統方法雖然有時針對各自的檢測對象具有良好性能,但是前提是必須對數據集有很深入的了解,比如用基于統計的方法,需要預先知道數據集屬于什么分布。這些傳統方法沒有智能挑選的能力,不會從復雜數據集中找出潛藏的規則。如有一組數據A=[1 2 4 8 15 32],如果按照基于距離的離群點檢測方法檢測,最有異常行為的數據是32,但是如果經過訓練與預測,可發現15這個點在這里才具有最異常的行為。因此,找出數據集中潛在的規則是很有現實意義的。人工神經網絡使得解決這一問題變成了一種可能。
 高維空間點的數據特性決定了其檢測與低維數據集有很大的區別。首先,與低維空間不同的是高維空間中的數據分布比較稀疏,造成高維空間中數據之間的距離尺度及區域密度不再具有直觀的意義[7]。從一個數據點來看,其他點到它的距離落在一個范圍很小的區間內,很難給出一個合適的近似度閾值來確定哪些點與它相似,哪些點不是。另外,對高維數據的估計需要的樣本個數與維數構成指數增加的關系,這在機器學習中稱作著名的維數災難(Curse of Dimensionality)。大量的數據分析問題本質上是非線性的,甚至是高度非線性,對此不能利用已有的快速成熟的線性模型進行研究[8]。
 因此引入熵權的概念,通過它能知道每個屬性對于離群點的貢獻程度,較好地解決了非線性問題,而且分開對于每個屬性值進行預測,然后做一個統計求和,對于位于維數災難有了較好的解決。
1 相關工作
1.1 人工神經網絡

 人工神經網絡(ANN)是一種應用類似于大腦神經突觸連接的結構進行信息處理的數學模型[9]。ANN是一個由大量簡單的處理單元組成的高度復雜的大規模非線性自適應系統[10]。它是對巨量信息并行處理和大規模平行計算的基礎,既是高度非線性的動力學系統,又是自適應組織系統,可用來描述認知、決策及控制的智能行為。對于處理大量原始數據而不能用規則或公式描述的問題,ANN則表現出極大的靈活性和自適應性。
1.2 BP神經網絡的基本結構以及工作范式
 BP網絡是誤差反向傳播神經網絡的簡稱,由輸入層、隱含層、輸出層組成。每一層由一個或多個神經元組成。隱含層可以包括BP網絡的結構,如圖1所示。

 BP神經網絡的輸入層接收輸入樣本信息,隱含層對輸入信息進行處理,輸出層負責處理后的結果。如果輸出層結果與預測值有誤差或者誤差大于給定閘值,則網絡將誤差反向通過輸出層傳遞給隱含層,經過隱含層處理后,傳遞給輸入層,期間相鄰網絡層之間的連接權值經過多次的權值修正。由此通過多次傳輸與反向傳輸,相鄰層之間的連接權值通過不斷修正,從而將誤差控制到給定閘值范圍之內,至此,學習結束。權值不斷調整的過程就是網絡學習的過程。BP神經網絡最直接的優點就是與大腦認知具有一定的相似性,如容錯性、學習能力、非線性等。
1.3 相關定義與公式
 定義1 rji稱為第j個對象在i個屬性上的值,且rji∈[0,1],則在n個對象d維屬性中,第i維屬性的熵定義為:


2 算法描述及偽代碼
 本文算法(BAOA)將所選數據分為訓練數據和檢測數據(預測數據)。算法將訓練數據當做全部非離群點進行訓練而找出隱藏規則,然后將這規則應用于檢測數據的預測。所選訓練數據通常占全部數據比率為8.5~11.5%左右(此時數據量也比較大),這樣既可以保證訓練的有效性(找出隱藏規則),同時又能保證丟失掉的訓練數據中的離群點(如果存在)對于全部離群點來說影響又不大。該算法除在訓練點數據個數的選取上較為新穎且有實際意義外,而且中間加入判定有無預測值的算法,對于沒有預測值的數據點賦予一個經驗值,這樣更能維持數據監測的穩定性。
 該算法首先對原始數據集中每一個屬性對應的值進行極差變換,然后計算每一個屬性的熵權,而后對數據集中的訓練數據的每一個非空間屬性按照順序排列后經過所選人工神經網絡模型進行訓練,然后對于剩下的所有數據(檢測數據)的每一個屬性按照順序排序后經過所選神經網絡模型進行預測,然后經過算法的判斷函數,將沒有預測值的屬性值人工賦予一個預測值(在經驗波動范圍內),保證每個待檢測的數據點都有預測值。而后將預測值作為標準值,通過計算每一個屬性值自身的的偏差,再結合每一個屬性熵權對它進行處理,得出每一個數據點的離群程度大小,最后按照離群程度從大到小的順序進行排序。
3 仿真
 仿真操作系統和軟件:win7-32、Matlab
 仿真對象:葡萄酒識別數據
 所選數據描述:所選數據來源于由C.Blake于1998年9月21日更新的數據集,它分為低中高三種,個數分別為63,1319,27。有12屬性,分別為:酒精、蘋果酸、灰、鎂、總酚類、黃酮、Nonflavanoid酚類、原花色素、顏色強度、色相、0D280/0D315稀釋葡萄酒、脯氨酸。
 所選ANN網絡:BP網絡
 輸入個數J:4
 輸出個數K:1
 隱含層個數Y:6
 處理說明:在訓練和預測時,每次都是對屬性值排序后進行訓練和預測,這樣更容易找出隱藏規則,計算效率更高,預測效果更好。后s+1到n個數據點每個屬性預測時,前J個作為輸入值時,它沒有對應的預測值。對此進行的處理是此時賦予它一個合適的值(波動大小在經驗范圍內),此次仿真過程中是賦予一個和原始值一樣的值作為預測值。雖然后s+1到n個數據點每個對象按照每個屬性每次排序后對應的前J個值id不一樣,但是因為數據海量,且維數較多,這樣處理后對于離群點的預測并無大的影響。圖2為后800個葡萄酒樣本中脯氨酸的屬性值的真實值和預測值。

 

 

  本文針對高維空間中數據的特點,提出了一種智能找出隱藏規則并且自動檢測離群點的算法。對于多維復雜且對離群點特征沒有明顯約束的數據集,ANN表現出了它的優越性。仿真結果表明, 通過ANN建立的多維離群點檢測,具有傳統方法無可比擬的智能性,而且檢測精度較高。為各位離群點檢測相關專業人員和業務愛好者提供了一種思路。

參考文獻
[1] HAWKINS D M. Identification of outliers[M]. London: Chapman and Hall, 1980.
[2] HAN J, KAMBER M, PEI J. Data mining: concepts and techniques[M]. Morgan kaufmann, 2006.
[3] WANG L, ZOU L. Research on algorithms for mining distance based outliers[J]. Chinese Journal of Electronics, 2005, 14(3) :384-387.
[4] SHEKHAR S, LU C T, ZHANG P. A unified approach to detecting spatial outliers[J]. GeoInformatica, 2003, 7(2): 139-166.
[5] AGGARWAL C C, YU P S. Finding generalized projected clusters in high dimensional spaces[M]. ACM, 2000.
[6] 魏藜,宮學慶,錢衛寧,等.高維空間中的離群點發現[J].軟件學報,2002,13(2):280-290.
[7] SHEKHAR S, LU C T, ZHANG P. A unified approach to detecting spatial outliers[J]. GeoInformatica, 2003, 7(2): 139-166.
[8] 傅薈璇,趙紅.MATLAB神經網絡應用設計[M].北京:機械工業出版社,2010.
[9] 鐘義信.知識理論與神經網絡[M].北京:清華大學出版社,2009.
[10] 閔劍.人工神經網絡在石化項目績效評價中的應用研究[D].北京:清華大學,2009.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
午夜视频久久久| 亚洲一区日本| 亚洲视频免费看| 亚洲国产精品热久久| 国产在线高清精品| 国产日韩精品一区二区三区在线 | 亚洲性夜色噜噜噜7777| 日韩香蕉视频| 99精品视频网| 亚洲美女黄网| 99精品国产一区二区青青牛奶 | 西瓜成人精品人成网站| 亚洲免费在线看| 亚洲欧美日韩精品综合在线观看| 亚洲一区免费观看| 亚洲欧美自拍偷拍| 校园春色国产精品| 欧美在线视频二区| 久久国产精品久久精品国产 | 欧美日韩在线观看一区二区三区 | 黄色国产精品| 在线观看视频一区| 亚洲人成毛片在线播放| 亚洲国产免费看| 亚洲三级免费电影| 一本不卡影院| 亚洲中无吗在线| 欧美在线播放| 亚洲国产精品成人| 日韩视频中文字幕| 亚洲视频1区| 午夜精品视频在线观看一区二区| 午夜精品久久久久久久| 久久成人人人人精品欧| 久久久久久久一区| 欧美福利网址| 欧美三级在线| 国产一区二区三区成人欧美日韩在线观看| 国内精品99| 亚洲精品久久久久久一区二区| 亚洲日本中文字幕区| 亚洲图片欧洲图片日韩av| 午夜精品久久久久久久99热浪潮| 久久精品一区二区三区四区| 亚洲精品在线免费| 亚洲欧美999| 久久婷婷影院| 欧美日韩国产一级| 国产欧美日本在线| 亚洲国产欧美一区二区三区久久| 99国产精品99久久久久久粉嫩| 亚洲欧美三级在线| 亚洲精品亚洲人成人网| 亚洲综合色网站| 久热精品视频在线观看一区| 欧美日韩岛国| 国产综合av| aa级大片欧美| 亚洲国产美国国产综合一区二区| 亚洲视频狠狠| 久久一综合视频| 国产精品播放| 亚洲高清视频在线观看| 亚洲一级黄色av| 亚洲欧洲一区二区三区| 午夜日韩视频| 欧美高清视频一区二区三区在线观看| 国产精品久久久久久久免费软件| 黄页网站一区| 亚洲性视频网站| 亚洲六月丁香色婷婷综合久久| 欧美一区二区在线免费播放| 欧美激情91| 国产在线播放一区二区三区| 一区二区三区不卡视频在线观看 | 亚洲一区二区三区四区视频| 亚洲国产精品视频一区| 亚洲综合不卡| 欧美福利电影网| 国产一区二区三区直播精品电影| 99pao成人国产永久免费视频| 亚洲大片免费看| 欧美在线观看网址综合| 欧美日本不卡视频| 激情av一区二区| 亚洲欧美在线视频观看| 国产精品99久久久久久白浆小说| 老司机午夜精品视频在线观看| 国产精品视频一区二区高潮| 91久久久久久久久| 亚洲国产另类久久精品| 久久精品亚洲热| 国产伦精品一区二区三区视频孕妇 | 亚洲国产精品久久久久秋霞蜜臀| 午夜日韩在线观看| 亚洲一区欧美激情| 欧美日韩播放| 亚洲大胆人体视频| 久久成人精品无人区| 久久成人免费电影| 国产精品丝袜白浆摸在线| 日韩亚洲欧美综合| 9l视频自拍蝌蚪9l视频成人| 免费观看成人www动漫视频| 国产一区二区无遮挡| 亚洲综合色自拍一区| 亚洲男女自偷自拍| 国产精品videossex久久发布| 亚洲乱码一区二区| 一本大道久久精品懂色aⅴ| 欧美v亚洲v综合ⅴ国产v| 伊人久久综合97精品| 久久精品动漫| 老司机精品福利视频| 精品成人国产| 久久国产精品一区二区三区四区| 久久gogo国模裸体人体| 国产欧美在线视频| 午夜伦欧美伦电影理论片| 欧美一区二区三区喷汁尤物| 国产精品一区二区男女羞羞无遮挡 | 日韩亚洲一区在线播放| 欧美高清在线| 亚洲精品女av网站| 亚洲午夜未删减在线观看| 欧美日韩在线观看一区二区| 日韩视频在线观看| 亚洲一区美女视频在线观看免费| 国产精品v欧美精品∨日韩| 国产精品99久久不卡二区| 亚洲欧美日韩在线| 国产欧美 在线欧美| 性久久久久久久久久久久| 久久精品国产精品亚洲精品| 国产欧美在线播放| 亚洲电影天堂av| 欧美黄色视屏| 99热免费精品在线观看| 午夜精品久久久久久久男人的天堂 | 99国产精品久久久久久久成人热| 在线亚洲观看| 国产精品美女| 欧美中文字幕在线播放| 美女图片一区二区| 亚洲精品一区二区三区四区高清| 亚洲制服av| 国产区亚洲区欧美区| 久久精品国产一区二区三区免费看| 美乳少妇欧美精品| 亚洲人成网在线播放| 亚洲五月六月| 国产亚洲欧美在线| 亚洲精品网站在线播放gif| 欧美日韩在线视频一区二区| 亚洲欧美第一页| 嫩模写真一区二区三区三州| 最新国产乱人伦偷精品免费网站| 亚洲一级电影| 国内揄拍国内精品少妇国语| 日韩视频一区二区三区在线播放免费观看 | 依依成人综合视频| 一区二区三区精密机械公司| 国产精品乱码一区二三区小蝌蚪| 欧美在线高清| 欧美日韩亚洲免费| 欧美一区二区成人6969| 嫩草伊人久久精品少妇av杨幂| 夜久久久久久| 久久人人爽爽爽人久久久| 亚洲人屁股眼子交8| 欧美亚洲一区二区在线| 伊人久久亚洲热| 亚洲一区国产精品| 在线精品福利| 香蕉久久夜色精品| 在线成人激情视频| 亚洲欧美综合网| 亚洲成人在线视频网站| 亚洲欧美日韩精品久久奇米色影视| 好看的亚洲午夜视频在线| 一区二区三区四区五区在线| 国产午夜精品一区理论片飘花| 亚洲日本成人女熟在线观看| 国产精品乱码一区二区三区| 亚洲国产小视频在线观看| 国产精品蜜臀在线观看| 亚洲精品乱码| 国外成人在线视频网站| 亚洲在线观看免费| 在线观看一区视频| 久久9热精品视频| 一本色道久久88综合亚洲精品ⅰ | 91久久精品国产91性色tv| 欧美亚洲三级| 亚洲精品视频一区| 久久综合久久美利坚合众国| 亚洲一区二区三区四区五区黄| 欧美1区2区| 性欧美大战久久久久久久久| 欧美日韩天堂|