《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 測試測量 > 設(shè)計(jì)應(yīng)用 > 樣本不平衡的睡眠數(shù)據(jù)分期研究
樣本不平衡的睡眠數(shù)據(jù)分期研究
2016年微型機(jī)與應(yīng)用第18期
李玉平, 夏斌
上海海事大學(xué) 信息工程學(xué)院,上海 201306
摘要: 睡眠數(shù)據(jù)中各個(gè)階段的樣本數(shù)差異較大,睡眠數(shù)據(jù)的自動(dòng)分期是一個(gè)典型的樣本不平衡的機(jī)器學(xué)習(xí)問題。均衡樣本方法通過抽樣的手段來平衡樣本,是解決樣本不平衡問題的主要方法。采用均衡樣本方法來平衡睡眠數(shù)據(jù)的不同階段的樣本,并且結(jié)合多域特征(時(shí)域、頻域、時(shí)頻域以及非線性)和隨機(jī)森林分類算法進(jìn)行分類預(yù)測。比較分析了樣本均衡處理和非均衡處理的分類結(jié)果,發(fā)現(xiàn)均衡處理后的數(shù)據(jù)取得了更好的分類效果。
Abstract:
Key words :

  李玉平, 夏斌

  (上海海事大學(xué) 信息工程學(xué)院,上海 201306)

       摘要:睡眠數(shù)據(jù)中各個(gè)階段的樣本數(shù)差異較大,睡眠數(shù)據(jù)的自動(dòng)分期是一個(gè)典型的樣本不平衡的機(jī)器學(xué)習(xí)問題。均衡樣本方法通過抽樣的手段來平衡樣本,是解決樣本不平衡問題的主要方法。采用均衡樣本方法來平衡睡眠數(shù)據(jù)的不同階段的樣本,并且結(jié)合多域特征(時(shí)域、頻域、時(shí)頻域以及非線性)和隨機(jī)森林分類算法進(jìn)行分類預(yù)測。比較分析了樣本均衡處理和非均衡處理的分類結(jié)果,發(fā)現(xiàn)均衡處理后的數(shù)據(jù)取得了更好的分類效果。

  關(guān)鍵詞:睡眠分期數(shù)據(jù)不平衡;隨機(jī)森林

0引言

  睡眠是生命過程中必不可少且十分重要的生理現(xiàn)象。依據(jù)國際R&K標(biāo)準(zhǔn)[1],睡眠期可分為快速眼動(dòng)期、非快速眼動(dòng)期(S1,S2,S3,S4)以及清醒期,區(qū)別分期主要以眼球是否進(jìn)行了陣發(fā)性快速運(yùn)動(dòng)為標(biāo)準(zhǔn)。根據(jù)上述睡眠分期標(biāo)準(zhǔn),睡眠數(shù)據(jù)可分為6類,且不同類別的數(shù)據(jù)量之間具有較大的差異性,即睡眠數(shù)據(jù)分期存在樣本不平衡的問題。在應(yīng)用機(jī)器學(xué)習(xí)研究睡眠分期過程中,樣本不平衡會(huì)導(dǎo)致睡眠分期結(jié)果不準(zhǔn)確,睡眠分期的可信度降低。在以前的睡眠分期研究中,研究的主要是睡眠數(shù)據(jù)特征的提取以及分類算法的選取[24],并沒有研究睡眠分期樣本不平衡問題。本文采用EEG、EOG、EMG 3種信號5個(gè)通道的睡眠數(shù)據(jù),研究中發(fā)現(xiàn),EOG信號會(huì)出現(xiàn)在EEG信號的一些睡眠分期(如清醒狀態(tài)和快速眼動(dòng)狀態(tài))中,這種數(shù)據(jù)會(huì)對睡眠分期產(chǎn)生不好的影響[5]。本文通過對睡眠分期樣本不平衡的研究以及信號混雜的處理,進(jìn)一步提高睡眠分期的準(zhǔn)確度,同時(shí)對相關(guān)睡眠疾病的診斷和治療提供重要的參考意義。

  基于以上睡眠數(shù)據(jù)分期的討論,本文采用均衡采樣的方法解決睡眠分期樣本不平衡問題,同時(shí)研究睡眠數(shù)據(jù)的特征提取以減少信號混雜對睡眠分期的影響。

1方法

  1.1特征提取

  睡眠數(shù)據(jù)的特征主要?jiǎng)澐譃闀r(shí)域特征、頻域特征、時(shí)頻域特征以及非線性特征。本文中,提取EEG、EOG和EMG每種信號各38種特征。

  特征參數(shù)如下:第1~6種是6個(gè)時(shí)域特征[68]:均值(Mean)、方差(Variance)、峰度(Kurtosis)、偏度(Skewness)、過零率(Number of zero crossing,NZC)、最大值(MaxV);第7~19種是頻域特征[810]:對4個(gè)子節(jié)律波分別提取各自范圍的功率譜能量(SP_),計(jì)算0.01~30 Hz頻帶的總功率譜能量(SP_D),以及總功率譜能量的規(guī)范化能量比(NSP_),即theta/beta、beta/alpha、(theta+alpha)/beta, (theta+alpha)/(beta+alpha);第20~35種是時(shí)頻域特征[810]:4個(gè)子節(jié)律波在當(dāng)前頻帶范圍上小波系數(shù)的均值、能量、標(biāo)準(zhǔn)差以及相對于總頻帶范圍的絕對平均值;第36~38種特征分別是Petrosian分形指數(shù)、Hurst指數(shù)、排列熵[1112]。

  1.2均衡采樣

  睡眠數(shù)據(jù)存在樣本不平衡的問題,在6類的數(shù)據(jù)中,最多一類的數(shù)據(jù)集與最少的一類數(shù)據(jù)集的比例達(dá)到10倍以上,存在嚴(yán)重不平衡現(xiàn)象。本文應(yīng)用均衡采樣的方法處理樣本失衡的問題[13]:(1)分別計(jì)算6類睡眠分期數(shù)據(jù)的個(gè)數(shù)n1、n2、n3、n4、n5、n6;(2)去掉個(gè)數(shù)最少和個(gè)數(shù)最多的個(gè)數(shù)值,剩余為n1、n2、n3、n4,計(jì)算這4類個(gè)數(shù)的平均值n;(3)對6類數(shù)據(jù)按個(gè)數(shù)平均值n采樣,不足平均個(gè)數(shù)的類別重復(fù)采樣,超過平均個(gè)數(shù)的類別欠采樣;(4)整合6類數(shù)據(jù)采樣得到的新數(shù)據(jù)集即為均衡處理后的數(shù)據(jù)[4,14]。

  1.3隨機(jī)森林分類器

  隨機(jī)森林模型是決策樹集成的算法,并且由一隨機(jī)向量決定決策樹的構(gòu)造。通過訓(xùn)練集得到隨機(jī)森林模型后,當(dāng)有一個(gè)新的輸入樣本進(jìn)入時(shí),就讓隨機(jī)森林的每一棵決策樹分別進(jìn)行判斷,判斷樣本所屬類別,然后計(jì)算哪一個(gè)類別被選擇最多,就預(yù)測該樣本所屬的類別。隨機(jī)森林算法特征參數(shù)較多,測試結(jié)果不會(huì)出現(xiàn)過擬合的情形;能夠處理高維度特征的睡眠數(shù)據(jù),不用做特征選擇,對數(shù)據(jù)集的適應(yīng)能力強(qiáng);訓(xùn)練速度快,能夠檢測不同特征之間的影響[13,15]。

  隨機(jī)森林實(shí)現(xiàn)過程為:(1)原始訓(xùn)練集為N,采用集成算法有放回地隨機(jī)選取k個(gè)樣本集構(gòu)建k棵分類樹,每次沒有被抽到的樣本組成k個(gè)袋外數(shù)據(jù);(2)設(shè)定mall變量,在每棵樹的每個(gè)節(jié)點(diǎn)處隨機(jī)抽取mtry個(gè)變量(mtry,n,mall),然后在mtry中選擇一個(gè)最佳的分類變量,變量分類的閾值通過檢查每一個(gè)分類點(diǎn)確定;(3)每一棵樹最大限度地生長,不做任何修剪;(4)將構(gòu)造的多棵分類樹組成隨機(jī)森林,用隨機(jī)森林分類器對新的數(shù)據(jù)進(jìn)行判別與分類,分類的結(jié)果按樹分類器投票數(shù)確定。

2實(shí)驗(yàn)與結(jié)果

  2.1數(shù)據(jù)

  本文采用9名受試者的睡眠數(shù)據(jù)來驗(yàn)證分類方法和數(shù)據(jù)不平衡處理的可行性。數(shù)據(jù)集記錄了這9名志愿者一晚上的睡眠數(shù)據(jù),以1~9命名這些數(shù)據(jù)集。數(shù)據(jù)包含15個(gè)通道的睡眠時(shí)的信號數(shù)據(jù)以及呼吸頻率和身體溫度。對應(yīng)的EEG、EOG、EMG信號按100 Hz進(jìn)行采樣。數(shù)據(jù)集處理部分,分別進(jìn)行了7/3分和留一方法,采用這兩種方法驗(yàn)證睡眠分期樣本不平衡的處理效果。

  2.2數(shù)據(jù)預(yù)處理

  首先采用巴特沃夫?yàn)V波器提取原始睡眠數(shù)據(jù)中0.01~35 Hz的數(shù)據(jù),并應(yīng)用高斯歸一化方法對數(shù)據(jù)進(jìn)行歸一化處理。由于采樣的睡眠數(shù)據(jù)可能存在標(biāo)簽不正確的問題,因此會(huì)剔除不正確的標(biāo)簽數(shù)據(jù)。具體方法是,首先找出空標(biāo)簽或標(biāo)簽異常(不在已有類別中的標(biāo)簽),根據(jù)標(biāo)簽對應(yīng)的位置,剔除這些標(biāo)簽對應(yīng)的數(shù)據(jù)集,最后更新數(shù)據(jù)集。采用以上方法進(jìn)行數(shù)據(jù)預(yù)處理之后,得到7 461條數(shù)據(jù)。

  2.3均衡采樣數(shù)據(jù)

  經(jīng)預(yù)處理和特征提取之后,對9個(gè)受試者的數(shù)據(jù)進(jìn)行整合,數(shù)據(jù)總量為59 680。采用7/3分?jǐn)?shù)據(jù)集,即70%數(shù)據(jù)做訓(xùn)練集,30%數(shù)據(jù)做測試集,訓(xùn)練集數(shù)據(jù)量為41 773,測試集數(shù)據(jù)量為17 907。為了驗(yàn)證均衡采樣的可行性,對訓(xùn)練集做均衡處理,得到22 465條新的訓(xùn)練集。

  2.4結(jié)果

  本文第一種驗(yàn)證方法是7/3數(shù)據(jù)集,結(jié)果如下:表1是所有數(shù)據(jù)集7/3分,對訓(xùn)練集進(jìn)行均衡處理的分類結(jié)果準(zhǔn)確率;表2是均衡采樣數(shù)據(jù)集和普通數(shù)據(jù)集分類結(jié)果對比;表3是不同信號組合,均衡采樣分類結(jié)果對比。

圖像 002.png

圖像 003.png

圖像 004.png

圖像 001.png

第二種驗(yàn)證方法是對9個(gè)受試者的數(shù)據(jù)集進(jìn)行留一驗(yàn)證。分別提取其中8個(gè)受試者的數(shù)據(jù)集作為訓(xùn)練集做均衡處理,剩下1個(gè)受試者的數(shù)據(jù)集作為測試集。分類結(jié)果如圖1所示。

  由表1得知,同時(shí)考慮EEG、EOG、EMG 3種信號5個(gè)通道的數(shù)據(jù)集,得到的分類準(zhǔn)確率達(dá)到84.33%,wake類別的分類準(zhǔn)確率最高,模型對wake類別的泛化能力最好,而S1類別數(shù)據(jù)量最少,同時(shí)分類效果也最差。由表2得知:均衡處理之后,wake、S1、S3、rem這4類睡眠分期結(jié)果得到了提升,S4基本一致,S2的結(jié)果降低了。由表3知:提取一種信號EEG時(shí),睡眠分期準(zhǔn)確率比同時(shí)提取多種信號時(shí)的準(zhǔn)確率低。由圖1留一驗(yàn)證知,2、5、9號受試者睡眠分期的結(jié)果達(dá)到了80%以上,分類效果較好;3、6號受試者睡眠分期準(zhǔn)確率較低。

3結(jié)論

  本研究采用了EEG、EOG、EMG 3種信號5個(gè)通道數(shù)據(jù)集,并且應(yīng)用均衡采樣的方法處理訓(xùn)練集數(shù)據(jù)不平衡問題,睡眠分期結(jié)果較好,平均分類準(zhǔn)確率得到了提升,并且有4個(gè)睡眠分期的分類結(jié)果都得到了提升。在今后對睡眠分期樣本不平衡的研究中,可以采用加權(quán)隨機(jī)森林或其他的方法處理睡眠數(shù)據(jù)集不平衡的問題。

  參考文獻(xiàn)

  [1] RECHTSCHAFFEN A Q, KALES A A. A manual of standardized terminology, techniques, and scoring system for sleep stages of human subjects[J]. Psychiatry & Clinical Neurosciences, 1968,55.

  [2] 李谷,范影樂,龐全.基于排列組合熵的腦電信號睡眠分期研究[J].生物醫(yī)學(xué)工程學(xué)志,2009,26(4):869-872.

  [3] Liu Derong,Pang Zhongyu,LLOYD S R.A neural network method for detection of obstructive sleep apnea and narcolepsy based on pupil size and EEG[J].IEEE Transactions on Neural Networks,2008,19(2):308-318.

  [4] ANAND A, PUGALENTHI G, FOGEL G B, et al. An approach for classification of highly imbalanced data using weighting and undersampling[J]. Amino Acids, 2010,39(5):1385-1391.

  [5] BREIMAN L, FRIEDMAN J, OLSHEN R, et al. Classification and regression trees[M]. New York: Chapman & Hall,1984.

  [6] SMITH J R. Automated EEG analysis with microcomputers[J]. Medical Instrumentation, 1980,14(6):319-321.

  [7] VURAL C, YILDIZ M. Determination of sleep stage separation ability of features extracted from EEG signals using principal component analysis[J]. Journal of Medical Systems,2010,34(1):83-89.

  [8] QQ圖片20161023220227.pngA comparative study on classification of sleep stage based on EEG signals using feature selection and classification algorithms[J]. Journal of Medical Systems,2014,38(3):1-21.

  [9] HAMIDA T B, AHMED B. Computer based sleep staging: challenges for the future[C]. 2013 IEEE GCC Conference and Exhibition, 2013:280-285.

  [10] AKIN M. Comparison of wavelet transform and FFT methods in the analysis of EEG signals[J]. Journal of Medical Systems,2002,26(3):241-247.

  [11] FELL J, RSCHKE J, MANN K, et al. Discrimination of sleep stages: a comparison between spectral and nonlinear EEG measures[J]. Electroencephalography and Clinical Neurophysiology, 1996,98(5):401-410.

  [12] PEREDA E, GAMUNDI A, RIAL R, et al. Nonlinear behavioor of human EEG: fractal exponent versus correlation dimension in awake and sleep stages[J]. Neuroscience Letters, 1998,250(2):91-94.

  [13] 毛文濤,王金婉,等.面向貫序不均衡數(shù)據(jù)的混合采樣極限學(xué)習(xí)機(jī)[J].計(jì)算機(jī)應(yīng)用,2015, 35(8):2221-2226.

  [14] He Haibo,GARCIA E A. Learning from imbalanced data[J],IEEE Transactions on Knowledge and Data Engineering,2009,21(9):1263-1284.

  [15] BREIMAN L. Random forests[J]. Machine Learning,2001, 45(1):5=32.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久手机免费观看| 欧美福利视频在线| 亚洲国产精品va在线看黑人动漫 | 亚洲激情专区| 一区二区三区在线观看国产| 国产午夜精品一区理论片飘花 | 亚洲综合导航| 亚洲一区美女视频在线观看免费| 日韩午夜av在线| 亚洲美女性视频| 亚洲精品乱码久久久久久蜜桃麻豆| 久久精品一本| 亚洲黄色影片| 日韩一区二区精品视频| 亚洲精品影视| 亚洲国产日韩精品| 亚洲级视频在线观看免费1级| 亚洲国产精品久久久久婷婷884 | 亚洲无亚洲人成网站77777| 一区二区久久久久| 99成人精品| 亚洲色无码播放| 亚洲综合视频网| 香蕉久久精品日日躁夜夜躁| 欧美一级大片在线观看| 久久精品五月| 亚洲欧洲精品一区二区三区| 日韩一区二区精品在线观看| 亚洲视频在线一区| 亚洲欧美日韩专区| 久久国产精品网站| 麻豆九一精品爱看视频在线观看免费| 免费亚洲视频| 欧美日韩精品欧美日韩精品 | 久久久久久久性| 久久人体大胆视频| 欧美电影免费观看高清| 欧美日韩国产探花| 国产精品mv在线观看| 国产精品系列在线播放| 国产一区二区三区在线观看精品 | 亚洲精品久久久一区二区三区| 亚洲免费大片| 亚洲免费视频一区二区| 久久精品国产精品亚洲| 免费亚洲电影在线观看| 欧美午夜精品理论片a级按摩| 国产精品一区在线观看你懂的| 国产日韩欧美一区| 一区免费观看| 99在线精品免费视频九九视| 伊甸园精品99久久久久久| 亚洲人成网站在线播| 亚洲一区亚洲| 亚洲日韩欧美视频一区| 午夜精品福利视频| 免费永久网站黄欧美| 国产精品v片在线观看不卡 | 日韩一区二区精品| 欧美一区二区视频在线| 99国产精品国产精品久久| 欧美在线你懂的| 欧美精品成人91久久久久久久| 国产精品网站一区| 91久久久久久国产精品| 欧美亚洲一级片| 一区二区三区四区国产精品| 久久精品一区蜜桃臀影院| 欧美国产亚洲精品久久久8v| 国产精品伊人日日| 亚洲激情成人在线| 午夜久久久久久久久久一区二区| 最新成人av在线| 香蕉久久一区二区不卡无毒影院 | 久久久久久久激情视频| 欧美日韩成人综合| 好看不卡的中文字幕| 一个人看的www久久| 亚洲国产中文字幕在线观看| 亚洲女同同性videoxma| 欧美精品97| 国产综合婷婷| 亚洲天堂av图片| 亚洲精品午夜精品| 久久久精品欧美丰满| 欧美午夜精品久久久久久浪潮| 在线电影国产精品| 午夜在线播放视频欧美| 一区二区三区黄色| 免费国产一区二区| 国产亚洲一级高清| 一区二区免费看| 亚洲精品免费一二三区| 久久乐国产精品| 国产精品午夜春色av| 亚洲精选一区二区| 亚洲国产欧美一区二区三区久久 | 国产精品一级在线| 99在线|亚洲一区二区| 亚洲精品久久久久久下一站| 久久久999精品| 国产精品久久久久一区二区三区共| 亚洲国产一区二区三区在线播| 欧美一级网站| 午夜宅男久久久| 欧美日韩中文字幕精品| 亚洲激情在线观看| 亚洲国内精品| 在线视频你懂得一区二区三区| 欧美va亚洲va国产综合| 国内自拍一区| 久久riav二区三区| 久久国产精品毛片| 国产欧美日韩亚洲精品| 亚洲私人影吧| 亚洲综合国产精品| 欧美体内谢she精2性欧美| 亚洲国产精品久久久久秋霞不卡| 久久精品成人一区二区三区| 久久精品欧美日韩| 国产婷婷97碰碰久久人人蜜臀| 亚洲综合好骚| 欧美一区观看| 国产亚洲二区| 欧美影院午夜播放| 久久久五月天| 一区二区三区在线看| 久久成人资源| 快she精品国产999| 黄页网站一区| 亚洲国产欧美日韩另类综合| 免费视频最近日韩| 亚洲电影视频在线| 亚洲精品在线观| 欧美日产国产成人免费图片| 亚洲免费精品| 亚洲男人的天堂在线aⅴ视频| 国产精品久久久久三级| 亚洲欧美激情一区二区| 性欧美办公室18xxxxhd| 国产精品人人做人人爽人人添| 亚洲视频中文| 欧美一区91| 狠狠爱综合网| 91久久精品美女高潮| 欧美激情在线有限公司| 亚洲开发第一视频在线播放| 亚洲一区二区三区在线| 国产精品永久免费在线| 久久aⅴ国产欧美74aaa| 女生裸体视频一区二区三区| 亚洲精品一区二区三区av| 亚洲一区日本| 国产色爱av资源综合区| 亚洲国产成人av好男人在线观看| 欧美黄色精品| 亚洲香蕉在线观看| 久久九九免费视频| 激情文学一区| 99视频超级精品| 国产精品麻豆va在线播放| 性感少妇一区| 理论片一区二区在线| 亚洲精品在线三区| 欧美一区永久视频免费观看| 伊人久久综合97精品| 一区二区免费在线播放| 国产情侣久久| 亚洲巨乳在线| 国产农村妇女毛片精品久久麻豆 | 亚洲精品影院| 久久高清免费观看| 在线观看视频免费一区二区三区| 一本大道久久精品懂色aⅴ| 国产精品综合av一区二区国产馆| 亚洲国产精品电影| 国产精品国产三级国产专区53| 欧美一区二区高清| 欧美日韩视频专区在线播放| 亚洲欧美激情诱惑| 欧美激情视频网站| 亚洲欧美视频| 欧美精品一区二区精品网| 性伦欧美刺激片在线观看| 欧美激情综合五月色丁香小说| 亚洲免费综合| 欧美黄在线观看| 欧美一区二区三区在线| 欧美日韩在线大尺度| 亚洲第一视频| 国产精品乱码妇女bbbb| 亚洲日本一区二区三区| 国产精品一区二区三区四区| 99国产精品99久久久久久| 狠狠色狠狠色综合日日tαg| 亚洲亚洲精品在线观看| 尤物在线观看一区| 欧美在线999| 夜夜嗨av色一区二区不卡| 久久综合九色九九|