《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 穩(wěn)定的特征選擇研究
穩(wěn)定的特征選擇研究
來源:微型機與應用2012年第15期
李 云
(南京郵電大學 計算機學院,江蘇 南京 210003)
摘要: 特征選擇是機器學習和數(shù)據(jù)挖掘領域的關鍵問題之一,而特征選擇的穩(wěn)定性也是目前的一個研究熱點。主要對特征選擇的穩(wěn)定性因素和穩(wěn)定性度量進行分析,并詳細介紹了目前比較經(jīng)典的兩種提高特征選擇穩(wěn)定性的方法。
Abstract:
Key words :

摘  要: 特征選擇是機器學習和數(shù)據(jù)挖掘領域的關鍵問題之一,而特征選擇的穩(wěn)定性也是目前的一個研究熱點。主要對特征選擇的穩(wěn)定性因素和穩(wěn)定性度量進行分析,并詳細介紹了目前比較經(jīng)典的兩種提高特征選擇穩(wěn)定性的方法。
關鍵詞: 特征選擇;穩(wěn)定性;集成;樣本加權

    隨著信息技術和生物技術的快速發(fā)展,在現(xiàn)實生活及科學研究中產(chǎn)生大量的高維海量數(shù)據(jù)。為了從大規(guī)模數(shù)據(jù)中挖掘出有用的知識,特征選擇已成為高維數(shù)據(jù)分類或者回歸中的關鍵問題[1],目前已被廣泛應用于文本分類、圖像檢索、基因分析和入侵檢測等。所謂特征選擇就是從一組特征中挑選出一些最有效的特征以達到降低特征空間維數(shù)或者發(fā)現(xiàn)自然模型真實變量的過程,其通常包括兩個關鍵問題:搜索策略和評價準則。參考文獻[2-4]對已有特征選擇方法以及特征選擇統(tǒng)一框架進行了全面的綜述。特征選擇算法根據(jù)訓練的數(shù)據(jù)集中樣本有無標記通常分為監(jiān)督、非監(jiān)督和半監(jiān)督特征選擇算法。在評價過程中,監(jiān)督的特征選擇方法通常通過評價特征與類別之間的關聯(lián)性或者特征的分類性能來獲取特征的相關性。非監(jiān)督的特征選擇方法通常通過探究未標記數(shù)據(jù)分布特性來獲取特征的相關性。半監(jiān)督特征選擇方法則同時利用標記的和未標記的樣本。此外,根據(jù)評價準則,特征選擇又可以分為過濾器、封裝器以及嵌入式三類基本模型[2]。過濾器模型是將特征選擇作為一個預處理過程,利用數(shù)據(jù)的內(nèi)在特性對選取的特征子集進行評價,獨立于學習算法。封裝器模型則將后續(xù)學習算法的結果作為特征子集評價準則的一部分。嵌入式模型則試圖利用前兩種模型的優(yōu)點,在不同的搜索階段利用不同的評價準則。一般而言,過濾器的時間復雜度比封裝器低,且結構相對簡單,因此廣泛用于對高維數(shù)據(jù)的處理。如果根據(jù)輸出結果來區(qū)分,特征選擇又可以分為兩種[3]:一種是輸出所有特征權重,并對其進行排序,如Lmba[5]、SQP-FW[6]等;另一種是輸出選擇的特征子集,如SVM-RFE[7]等。
1 穩(wěn)定性分析
    特征選擇的一個重要特性是發(fā)現(xiàn)自然模型的真實變量,在很多應用場景下,特征選擇所選取的特征或者變量應該是具有可解釋性的。如在文本分類中,本研究利用一些先驗知識很容易檢查所選擇的單詞對分類是否有意義。此外在基因數(shù)據(jù)處理中,所選擇的基因也可以解釋。但是,如果當收集的某種病例樣本發(fā)生變化時,特征選擇算法獲取的基因子集或者排序結果差別較大,那么專家就會對基因選擇結果產(chǎn)生疑慮,而且也給結果的驗證帶來不便,從而難以確切獲得解釋該疾病的相關基因組。因此在某些領域,特征選擇的穩(wěn)定性也是至關重要的。特征選擇的穩(wěn)定性是對所選擇的特征子集相似性度量。它主要研究當樣本或者算法自身的參數(shù)有變化時,特征選擇算法的魯棒性。也就是說,對于高維數(shù)據(jù)的分類或者回歸,其主要任務有兩個:一個是設計盡可能好的算法,以獲取對未知樣本較高的預測能力;另一個是除了進一步提高算法的性能,還要能深入理解特征與樣本輸出之間的關系[1]。對于這第二個任務來說,除了要提高特征選擇的分類性能外,還需要關注其穩(wěn)定性,否則第二個任務將難以完成。不穩(wěn)定的特征選擇結果將帶來很多歧義,難以獲取可以理解的真實特征(變量)。
1.1 穩(wěn)定性因素
    產(chǎn)生不穩(wěn)定特征選擇結果的主要因素有:
    (1)數(shù)據(jù)擾動。數(shù)據(jù)擾動包括兩個方面:①數(shù)據(jù)本身變化,包括數(shù)量變化和訓練樣本分布的不同;②添加噪聲特征。
    (2)算法本身沒有穩(wěn)定機制。已有的算法在設計特征選擇評價準則時,只是考慮了分類性能或者聚類性能,而沒有關注算法的穩(wěn)定性。
    (3)當特征集里含有大量的冗余特征時,由于冗余特征之間的關聯(lián)性較強,具有相似的(分類)性能,也會產(chǎn)生多個具有近似性能的特征子集,從而影響算法的穩(wěn)定性。
    (4)高維小樣本。由于這類數(shù)據(jù)的訓練樣本較少,而特征維數(shù)非常高,如基因數(shù)據(jù)等,雖然訓練樣本只有細微的變化,而特征選擇的結果將發(fā)生很大變化。
為了有效提高特征選擇算法的穩(wěn)定性,目前主要有基于經(jīng)典特征選擇算法的集成特征選擇[8]、基于樣本加權的算法[9]和特征組群的方法[10]。
1.2 穩(wěn)定性度量
    特征選擇的穩(wěn)定性是對所選擇的特征子集相似性度量。它主要研究當樣本或者算法自身的參數(shù)有變化時,特征選擇算法的魯棒性。所有特征選擇結果的相似性越大,則認為特征選擇的穩(wěn)定性越高。而整體的穩(wěn)定性就是所有特征選擇結果的相似之和的平均值:

 



參考文獻
[1] FAN J Q, LV J C. A selective overview of variable selection in high dimensional feature space[J]. Statistical Sinica, 2010(10):101-148.
[2] LIU H, YU L. Toward integrating feature selection algorithms for classification and clustering[J]. IEEE Transaction on Knowledge and Data Engineering, 2005, 17(3):1-12.
[3] ZHAO Z. Spectral feature selection for mining ultrahigh dimensional data[M]. Arizona State University PhD Dissertation, 2010.
[4] GUYON I, ELISSEEFF A. An introduction to variable and feature selection[J]. Journal of Machine Learning Research, 2003,3(3):1157-1182.
[5] LI Y, LU B L. Feature selection based on loss margin of nearest neighbor classification[J]. Pattern Recognition, 2009,42:1914-1921.
[6] TAKEUCHI I, SUGIYAMA M. Target neighbor consistent feature weighting for nearest neighbor classification[C]. Conference on Advances in Neural Information Processing Systems(NIPS), 2011:1-9.
[7] GUYON I, WESTON J, BARNHILT S, et al. Gene selection for cancer classification using support vector machines[J]. Machine Learning, 2002,46:389-422.
[8] SAEYS Y, ABEL T, PEER Y V. Robust feature selection using ensemble feature selection techniques[C]. Proceeding of the European Conference. on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML-PKDD), Lecture Notes on Artificial Intelligence, 2008,5212:313-325.
[9] YU L, HAN Y, BERENS M E. Stable gene selection from microarray data via sample weighting[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2012,9(1):262-272.
[10] LOSCALZO S, YU L, DING C. Consensus group stable feature selection[C]. Proceeding ACM SIGKDD Conference. on Knowledge Discovery and Data Mining(KDD), Paris France, June 28-July 1. 2009:567-575.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美日韩国产在线播放| 狠狠色伊人亚洲综合成人 | 亚洲精品中文字幕在线| 欧美一区二区三区在线| 亚洲男人天堂2024| 亚洲在线观看| 亚洲伊人一本大道中文字幕| 中日韩美女免费视频网址在线观看| 亚洲精品一区二区三区蜜桃久| 亚洲第一在线| 在线观看视频一区二区| 一区二区三区在线观看国产| 国产一区日韩一区| 国产自产高清不卡| 韩国欧美一区| 亚洲国产精品v| 亚洲黄色成人| 亚洲毛片网站| 一区二区三区欧美成人| 亚洲一二三四久久| 午夜精品国产更新| 欧美一区二区三区四区夜夜大片| 欧美在线亚洲综合一区| 久久精品国产亚洲一区二区三区| 亚洲高清资源综合久久精品| 亚洲日本理论电影| 日韩特黄影片| 亚洲一区二区三区在线看| 亚洲欧美一区二区三区久久| 欧美在线视频观看| 久久蜜桃精品| 欧美承认网站| 欧美视频中文一区二区三区在线观看 | 国模大胆一区二区三区| 一色屋精品亚洲香蕉网站| 亚洲第一二三四五区| 亚洲精品视频在线播放| 一区二区三区视频在线观看| 亚洲欧美日韩精品久久亚洲区 | 新67194成人永久网站| 欧美一区二区三区免费在线看 | 欧美成人免费全部观看天天性色| 欧美久久久久久久久| 国产精品v亚洲精品v日韩精品| 国产毛片精品视频| 亚洲福利在线看| 99在线热播精品免费| 亚洲欧美日产图| 亚洲丁香婷深爱综合| 日韩一区二区精品视频| 午夜精品久久久久久久99热浪潮| 久久精品国产久精国产爱| 欧美暴力喷水在线| 国产精品久久国产精麻豆99网站| 国内久久精品| av成人动漫| 欧美在线免费观看亚洲| 亚洲美女啪啪| 欧美在线观看网址综合| 欧美成人精品在线| 国产精品热久久久久夜色精品三区| 国产午夜亚洲精品羞羞网站 | 一区二区三区日韩精品| 欧美在线观看视频一区二区三区 | 亚洲欧美激情视频在线观看一区二区三区| 欧美一区二区三区在| 日韩午夜中文字幕| 欧美一区二区三区在线免费观看| 美女被久久久| 国产精品男gay被猛男狂揉视频| 国产综合视频| 一区二区欧美视频| 久久精品国产免费看久久精品| 中文精品视频一区二区在线观看| 久久国产精品久久国产精品| 欧美精品一区二区高清在线观看| 国产欧美亚洲视频| 9久re热视频在线精品| 久久精品视频播放| 午夜精品区一区二区三| 欧美激情精品久久久久久久变态| 国产欧美日韩一区| 日韩香蕉视频| 亚洲精品日韩一| 久久理论片午夜琪琪电影网| 国产精品视频导航| 99re6热只有精品免费观看| 亚洲国产成人久久综合一区| 欧美一级片久久久久久久| 欧美日韩一区二区三区高清| 伊甸园精品99久久久久久| 亚洲在线观看视频| 在线中文字幕不卡| 欧美刺激午夜性久久久久久久| 国产有码一区二区| 亚洲摸下面视频| 午夜精品久久久久久99热| 欧美日韩一区在线观看| 亚洲二区在线| 久久精品国产在热久久 | 久久经典综合| 久久爱另类一区二区小说| 国产精品v日韩精品v欧美精品网站| 亚洲高清不卡在线| 亚洲国产激情| 久久免费视频一区| 国产一区二区三区不卡在线观看 | 欧美 日韩 国产精品免费观看| 国产午夜久久| 欧美一区二区三区视频在线| 欧美一区二区三区日韩视频| 国产精品免费看| 亚洲五月六月| 午夜伦理片一区| 国产精品欧美久久| 亚洲在线1234| 欧美在线观看视频一区二区| 国产欧美日韩在线播放| 亚洲女爱视频在线| 亚洲激情一区二区| 国模套图日韩精品一区二区| 亚洲中字在线| 欧美一级网站| 国产视频一区三区| 销魂美女一区二区三区视频在线| 欧美一区二区免费观在线| 国产精品腿扒开做爽爽爽挤奶网站| 国产伦精品一区二区三区免费迷| 99精品欧美一区| 99这里只有久久精品视频| 欧美精品成人| 91久久国产自产拍夜夜嗨| 亚洲精品一区二区在线| 欧美了一区在线观看| 亚洲免费激情| 午夜精品一区二区三区在线视| 国产精品久久久一本精品| 亚洲欧美另类在线| 久久久999成人| 在线观看日产精品| 亚洲毛片在线看| 欧美性猛片xxxx免费看久爱| 亚洲影视在线播放| 久久精品国产久精国产思思| 狠狠久久亚洲欧美专区| 亚洲人体1000| 欧美日韩亚洲综合在线| 亚洲一区免费观看| 久久精品亚洲一区二区| 亚洲第一网站| 亚洲一区二区在线看| 国产亚洲一区二区三区| 亚洲国产另类久久精品| 欧美日韩国产精品专区| 亚洲嫩草精品久久| 牛牛精品成人免费视频| 亚洲精品日韩欧美| 欧美亚洲一区二区在线| 欲色影视综合吧| 中文av字幕一区| 国产乱码精品一区二区三区av| 亚洲第一天堂无码专区| 欧美日韩国产综合新一区| 亚洲一区二区三| 久久久久久久综合狠狠综合| 91久久国产精品91久久性色| 亚洲女ⅴideoshd黑人| 激情综合中文娱乐网| 亚洲最新色图| 国内成+人亚洲| 99re66热这里只有精品4| 国产精品久久一区主播| 亚洲国产欧美不卡在线观看| 欧美揉bbbbb揉bbbbb| 久久成人这里只有精品| 欧美日韩色综合| 篠田优中文在线播放第一区| 欧美交受高潮1| 亚洲欧美日韩国产综合精品二区| 欧美成人免费在线观看| 亚洲免费一在线| 欧美精品七区| 欧美亚洲一级| 欧美三级精品| 亚洲国产精品传媒在线观看| 欧美亚洲成人精品| 亚洲激情网站免费观看| 国产九区一区在线| 一本色道久久综合亚洲精品婷婷| 国产一区二区三区在线观看免费| 中文精品99久久国产香蕉| 国内精品久久久久久| 亚洲一区二区三区精品在线| 亚洲电影免费在线| 欧美中文字幕久久| 在线综合亚洲欧美在线视频| 免费亚洲视频| 亚欧成人在线| 国产精品二区三区四区| 亚洲另类在线一区|