《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于蟻群算法改進One-Class SVM的電力離群用戶檢測算法研究
基于蟻群算法改進One-Class SVM的電力離群用戶檢測算法研究
2018智能電網增刊
張 薇1,呂 磊2,朱 敏2
國網冀北電力有限公司經濟技術研究院,北京 100038
摘要: 用電采集負荷數據反映了用戶的用電特性及用電習慣,通過用電負荷數據分析識別用電離群用戶。根據高維用電負荷數據的特點,提出了一種基于改進One-Class SVM算法的電力離群用戶檢測,同時采用蟻群算法對支持向量機的訓練參數進行優化,可以在樣本分布不均勻、樣本分布未知的環境下有效識別電力離群用戶。通過對某市紡織業用戶的數據進行實踐證明,改進的算法能夠有效提高收斂速度,并能有效地識別出離群的用電用戶。
中圖分類號: TM76
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.068
Abstract:
Key words :

0  引言

    近年來,隨著用電信息采集系統的推廣,部分地區的用電數據采集成功率達到99%以上,大工業用戶的96點負荷數據反映了用戶的用電特征和用電習慣。在同一個行業里,往往存在幾種相同的、相似的用電特性,而一小部分與其他企業用電習慣不同的用戶,稱之為離群點,離群用戶往往意味著用電異常、疑似竊電等情況,因此對于電力離群用戶的識別具有重要的業務意義。針對無序數據的離群點檢測方法通常包括基于統計的方法、基于距離的方法、基于密度的方法和基于偏離的方法。針對時間序列間的離群點檢測方法,近年來的主要研究包括:文獻[2]提出了一種基于小波密度估計的數據流離群點檢測;文獻[3]提出了一種基于粗糙集理論的序列離群點檢測方法,利用粗糙集理論中的知識熵和屬性重要性等概念來構建3種類型的序列,并通過分析序列中元素的變化情況來檢測離群點。在電力領域的離群點檢測研究中,文獻[4]提出了一種基于集合論估計的電網狀態辨識的離群點識別方法,它基于相容性的角度對離群點的性質進行分析,提出不相容離群點和相容離群點的概念,并基于狀態估計和集合論估計理論分別識別兩類離群點。在使用數據挖掘的技術方案中,文獻[1]中NAGI J等人使用GA-SVM (Genetic Support Vector Machines)檢測用電異常情況和竊電行為,GA-SVM使用C類SVM進行分類,能夠取得較高的準確率,但是存在學習時間過長、需要事先對大量樣本進行分類的問題。文獻[5]中提出了一種基于高斯核函數改進的電力用戶用電數據離群點檢測方法。首先通過模糊聚類的方法將用戶分類;然后提取每一類用戶的用電行為特征量,采用主成分分析法對特征集進行降維;最后利用高斯核函數改進局部離群因子算法,提出高斯核密度局部離群因子。文獻文獻[6]提出了一種基于SVM的AMI環境下用電異常檢測研究方法,使用One-Class SVM無監督機器學習架構對電力用戶負荷異常進行檢測,但因為未對參數進行優化,同樣存在學習時間過長、容易陷入局部最優化的問題。

    本文提出了一種基于蟻群算法優化參數的One-Class SVM分類算法進行用電特征離群用戶識別研究,并通過實踐分析證明,該算法能夠有效識別某個行業中的用電特征離群用戶。

1  算法介紹

1.1  SVM簡介

    支持向量機(Support Vector Machine,SVM)是VAPNIK V和CORTES C等人于20世紀90年代提出的一種分類算法,它是基于結構風險最小化原則,利用有限樣本訓練獲取具有較高泛化能力的決策函數。根據樣本集的特征,支持向量機可分為線性支持向量機和非線性支持向量機。一般情況下,實際問題中的樣本是符合高斯分布的非線性樣本集。本文專注于對非線性支持向量機的研究。

    設樣本集為(xi,yi),i=1,2,…,n,其中n代表樣本個數,xi∈Rm是樣本的特征向量,yi∈{+1,-1}為樣本類別。存在非線性映射x→Φ(x),可以將樣本特征向量映射到另一個高維特征空間,并構造最優分類超平面:

zw-gs1-3.gif

其中C為懲罰參數,控制錯分樣本的懲罰程度。

    引入核函數K(xi,xj)=Φ(xi)·Φ(xj),再用拉格朗日乘子法,將上述最優化問題轉化為對偶形式:

zw-gs4-5.gif

1.2  One-Class SVM算法介紹

    One-Class問題指的是在分類問題中由于異常樣本較難獲取而只關注正常樣本,可以用One-Class SVM來解決,本文研究的電力離群用戶檢測即可以用此方法。在One-Class SVM算法中常用的核函數有線性核函數、多項式核函數、高斯徑向基(RBF)核函數以及Sigmoid核函數等,本文采用高斯徑向基核函數zw-1.2-x1.gif

    One-Class SVM的參數決定了該算法的學習能力和推廣能力,對于RBF核函數的One-Class SVM來說,其參數包含懲罰參數C和核參數σ。懲罰參數C是在結構化風險和樣本誤差之間的折中,其值越大則允許的誤差越小;核參數σ與學習樣本的輸入空間范圍和寬度有關,樣本輸入空間越大,σ取值越大。

2  改進蟻群算法優化One-Class SVM參數

    One-Class SVM算法通常存在參數難以確定的問題,本文采用改進的蟻群算法對參數進行調優。蟻群算法是1992年意大利學者DORIGO M首先提出的一種源于螞蟻覓食行為的智能仿生蟻群優化算法,該算法具有智能搜索、正反饋、全局優化、魯棒性強等優點,本文采用蟻群算法優化One-Class SVM參數。

2.1 初始化參數

    首先初始化蟻群算法的迭代次數M、蟻群數量N、全局搜索步長lam和信息素揮發系數等參數Rho。再隨機生成每只螞蟻的初始化位置(C,σ),然后對訓練集通過SVM學習得到相應的正確率模型:

     zw-gs6-7.gif

其中precission(i)代表第i只螞蟻進行SVM訓練的準確率。當準確率越大時信息素越大。

2.2  局部和全局搜索

    首先找到信息素最大的螞蟻并保存信息素信息為T0(bestindex),根據螞蟻的信息素大小確定每只螞蟻的下一步轉移概率:

zw-gs8.gif

    如果螞蟻i的轉移概率p(i)≥p0,則進行全局搜索。當進行局部搜索時,對螞蟻的位置進行迭代更新,使用如下規則:記(Coldold)為迭代前的螞蟻位置,(Cnewnew)為迭代后的螞蟻位置,(Cbestbest)為迭代前信息素最大的螞蟻所在的位置,則當Cold<Cbest時,Cnew=Cold+lam;否則,Cnew=Cold-lam。同理,當σoldbest時,σnewold+lam;否則,σnewold-lam。

2.3  更新信息素

    若所有的螞蟻都完成了一次局部或全局搜索的迭代,根據蟻群算法的規則,需要對每個螞蟻位置上的信息素進行更新,將信息素揮發因子定義為:

zw-gs9-10.gif

    利用更新后的信息素重復2.2的步驟,直至迭代次數達到設定的最大迭代次數,參數優化完成。找到信息素最大的螞蟻,并記錄下其位置(C,σ),即為One-Class SVM的最優化參數。

    本文的改進蟻群算法優化One-Class SVM的過程如圖1所示。

zw-t1.gif

3  實證驗證

    本文以某地市電力公司的紡織業用戶的用電負荷數據為樣本,通過數據選取、數據預處理,利用上述基于蟻群算法優化的改進One-Class SVM算法進行離群用戶識別建模,最終通過模型輸出電力離群用戶。

3.1  數據選取及預處理

    本文選取某地市電力采集系統的紡織業所有用戶(共計6 046個)的96點負荷數據,時間跨度為2018年2月1日至5月31日,共3個月,共計54萬余條樣本數據,94個維度,如表1所示。

zw-b1.gif

3.2  數據預處理

    在做大數據分析時,獲取到的原始數據通常不能立即使用,需要進行相應的去重、填補缺失值、歸一化處理等數據規范化操作才能使數據正常可用,本文的數據預處理包括缺失值處理、歸一化處理和數據降維。

    (1)缺失值處理

    由于數據采集系統在采集的過程中可能存在斷電或者其他采集異常等行為,會導致用戶96點負荷數據存在缺失值,如若不處理將會對分析結果造成影響。常用的處理缺失值的方法有刪除法、均值插補法、多重插補法等,本文采取的方式是均值插補法,即對每一個指標中存在的缺失值用該指標的非缺失樣本均值填充。

    (2)歸一化處理

    本文的目的是尋找用電曲線特征離群的用戶,因此在處理數據時,需要通過歸一化消除不同樣本之間負荷數據的大小問題,本文按照每個樣本對數據進行歸一化。處理函數如下:

    zw-gs11.gif

其中x是某一樣本,i是代表該樣本對應的第x個變量,min(x)表示該用戶這一天的最小負荷,max(x)表示該用戶這一天的最大負荷。

    (3)數據降維

    本文數據采集的是96點負荷數據,維度太高對輸入模型的干擾較大,因此本文將數據處理為24小時的負荷數據。

3.3  蟻群算法獲取最優One-Class SVM參數

    在蟻群算法中,設置初始化參數:迭代次數M=50,蟻群數量N=20,信息素揮發系數Rho=0.1,步長lam=0.03,螞蟻的初始化位置(C,σ)為隨機生成的范圍均為(0,1)。期間進行One-Class SVM訓練的樣本為6 046個用戶的用電負荷數據。最終得到最優的(C,σ)為(0.057,0.378)。

3.4  One-Class SVM異常點檢測

    本文選用的核函數為高斯徑向基函數,懲罰系數和核函數分別取蟻群算法訓練得到的最優參數的One-Class SVM模型對樣本數據集進行異常點檢測,在6 046個樣本中共檢測出異常點344個,正常點5 702個。對所有樣本數據采用主成分分析(PCA)降至三維后,進行可視化,可得所有異常負荷點和正常負荷點的分布圖,如圖2所示。

zw-t2.gif

    在電量負荷曲線的表現上,離群用戶與正常用戶的差異很大,如圖3所示。正常用戶的負荷用電高峰出現在上午9點至下午17點范圍內,而離群用戶的負荷高峰出現在下午18點至凌晨2點這個范圍內,特征差異明顯,通過對識別出來的離群用戶進行調研,這部分用戶屬于多用電量較大且對電費敏感,在晚上進行生產的用戶。

zw-t3.gif

4  結論

    本文通過基于蟻群算法改進One-Class SVM模型對電力離群用戶進行識別,實踐證明,該改進的算法具有收斂速度快、運行效果好、能較快得到全局最優解等特點,具有良好的實踐效果,能有效識別出用電特征離群的用戶。

參考文獻

[1] NAGI J, YAP K S, TIONG S K, et al. Detection of abnormalities and electricity theft using genetic support vector Machines[C].TENCON 2008-2008 IEEE Region 10 Conference.IEEE,2008:1-6.

[2] 劉耀宗,張宏,孟錦,等.基于小波密度估計的數據流離群點檢測[J].計算機工程,2013,39(2):178-181.

[3] 江峰,杜軍威,葛艷,等.基于粗糙集理論的序列離群點檢測[J].電子學報,2011(2):345-350.

[4] 周寧慧,王彬,王治華,等.基于集合論估計的電網狀態辨識 (四)離群點識別[J].電力系統自動化,2016,40(8):22-28,50.

[5] 孫毅,李世豪,崔燦,等.基于高斯核函數改進的電力用戶用電數據離群點檢測方法[J].電網技術,2018,42(5):1595-1606.

[6] 簡富俊,曹敏,王磊,等.基于SVM的AMI環境下用電異常檢測研[J]. 電測與儀表,2014(6):64-69.

[7] 張玲,劉波.基于殘差統計的時間序列加性離群點檢測算法研究[J].電子技術應用,2015,41(9):85-87,91.

[8] 孫毅,李世豪,崔燦,等.基于高斯核函數改進的電力用戶用電數據離群點檢測方法[J].電網技術,2018,42(5):1595-1606.

[9] 李權,周興社.一種新的多變量時間序列數據異常檢測方法[J].時間頻率學報,2011,34(2):154-158.

[10] 周勇.時間序列時序關聯規則挖掘研究[D].成都:西南財經大學,2008. 

[11] 蘇衛星,朱云龍,胡琨元,等.基于模型的過程工業時間序列異常值檢測方法[J].儀器儀表學報,2012(9):2080-2087.

[12] 皇甫堪,陳建文,樓生強.現代數字信號處理[M].北京:電子工業出版社,2003.

[13] 薛安榮,鞠時光,何偉華,等.局部離群點挖掘算法研究[J]. 計算機學報,2007(8):1455-1463.



作者信息:

張  薇1,呂  磊2,朱  敏2

(1.中國電力科學研究院有限公司,北京 100192;2.國網四川省電力公司眉山供電公司,四川 眉山 620020)

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲国产日韩在线| aⅴ色国产欧美| 亚洲精品免费网站| 黄色成人在线| 国产午夜精品视频| 国产精品嫩草99av在线| 欧美视频在线观看免费| 欧美日韩国产色视频| 欧美—级在线免费片| 美女精品一区| 美日韩丰满少妇在线观看| 久久亚洲精品网站| 久久久久久黄| 久久久国产一区二区三区| 久久狠狠亚洲综合| 久久高清国产| 久久久精品国产一区二区三区| 欧美一区二区三区免费观看视频 | 欧美日韩激情小视频| 欧美激情麻豆| 欧美日韩免费一区| 欧美特黄视频| 国产精品白丝av嫩草影院| 欧美午夜精品久久久久久浪潮| 欧美日韩一区在线| 国产精品裸体一区二区三区| 国产精品美女一区二区在线观看| 国产精品久久波多野结衣| 国产精品久久久久久久久免费桃花 | 亚洲伊人久久综合| 亚洲欧美日韩成人| 欧美一区二区三区免费视频| 欧美在线播放视频| 亚洲国产欧美一区二区三区同亚洲| 亚洲国产欧美一区二区三区同亚洲 | 亚洲综合999| 欧美一区二区| 亚洲国产精品123| 日韩午夜免费| 亚洲永久精品国产| 欧美在线日韩精品| 老司机精品福利视频| 欧美韩日精品| 久久亚洲一区二区| 欧美精品久久久久久久久老牛影院| 欧美日韩精品在线观看| 国产精品人人做人人爽人人添| 国产日韩在线不卡| 亚洲丰满在线| 一区二区三区精品视频| 亚洲女人天堂av| 亚洲国产精品t66y| 亚洲图片激情小说| 久久久久综合一区二区三区| 欧美成人亚洲成人日韩成人| 欧美日韩另类字幕中文| 国产精品免费一区豆花| 韩国福利一区| 亚洲精品视频啊美女在线直播| 亚洲午夜免费视频| 亚洲第一页中文字幕| 一本一道久久综合狠狠老精东影业| 亚洲女人天堂成人av在线| 久久久精品国产免大香伊| 欧美乱妇高清无乱码| 国产欧美在线视频| 亚洲韩日在线| 亚洲欧美美女| 99精品国产福利在线观看免费| 欧美一区二区播放| 欧美国产日韩视频| 国产欧美日韩另类一区| 亚洲激情女人| 亚洲欧美日韩另类| 日韩一级欧洲| 久久久久久久国产| 欧美午夜视频| 亚洲电影免费观看高清完整版在线 | 亚洲一区在线播放| 亚洲日韩欧美一区二区在线| 香蕉免费一区二区三区在线观看| 牛牛国产精品| 国产区日韩欧美| 亚洲精品资源美女情侣酒店| 欧美一区免费视频| 中文久久乱码一区二区| 久久嫩草精品久久久精品一| 国产精品www.| 亚洲人体影院| 欧美在线视频免费播放| 亚洲一区久久久| 欧美激情亚洲国产| 精品不卡在线| 午夜精品久久久久久久99黑人| 一本色道久久88亚洲综合88| 久久国产福利国产秒拍| 欧美性大战久久久久久久| 亚洲国产高清aⅴ视频| 欧美亚洲网站| 香港久久久电影| 欧美色视频日本高清在线观看| 亚洲高清不卡在线| 久久精品一区二区三区不卡牛牛| 翔田千里一区二区| 国产精品成人观看视频免费| 亚洲日本成人网| 亚洲片区在线| 久久综合中文字幕| 国产专区一区| 欧美一区91| 久久精品综合| 国产视频久久网| 亚洲欧美春色| 午夜视频在线观看一区二区| 欧美视频一区二区三区…| 亚洲人成绝费网站色www| 亚洲专区免费| 午夜精品一区二区三区在线| 国产精品va在线播放| 一区二区三区日韩精品视频| 一区二区三区视频免费在线观看| 欧美高清在线视频观看不卡| 永久免费毛片在线播放不卡| 亚洲动漫精品| 美女啪啪无遮挡免费久久网站| 黄色成人在线网站| 亚洲第一精品久久忘忧草社区| 久久久久久9999| 激情丁香综合| 亚洲国产另类久久精品| 美女日韩欧美| 最新中文字幕亚洲| 99riav久久精品riav| 欧美精品日韩精品| 亚洲美女视频在线观看| 国产精品99久久久久久久久久久久 | 日韩一本二本av| 亚洲午夜精品久久| 国产精品亚洲成人| 午夜免费电影一区在线观看| 欧美在线综合视频| 韩国女主播一区二区三区| 久久精品一二三| 欧美激情无毛| 99re66热这里只有精品4| 亚洲综合第一| 国产一区二区三区免费不卡| 亚洲国产一区二区a毛片| 欧美另类69精品久久久久9999| 一区二区三区免费网站| 久久激情视频免费观看| 在线激情影院一区| 日韩性生活视频| 国产精品久久久久久久久免费桃花 | 看片网站欧美日韩| 亚洲精品极品| 亚欧成人在线| 在线观看日产精品| 在线亚洲美日韩| 国产午夜精品在线| 亚洲精品视频免费在线观看| 欧美日韩综合在线| 欧美一区高清| 欧美日韩免费在线观看| 欧美在线播放一区| 欧美精品日韩三级| 亚洲男女自偷自拍| 你懂的视频欧美| 亚洲图片你懂的| 久久婷婷久久一区二区三区| 欧美日韩国产不卡在线看| 亚洲欧美日韩天堂| 久久久久久伊人| 99亚洲一区二区| 欧美在线free| 亚洲第一中文字幕在线观看| 亚洲欧美国产制服动漫| 国产性色一区二区| 亚洲欧洲一区二区三区久久| 欧美日韩免费观看一区二区三区 | 亚洲欧美国产高清va在线播| 国产午夜精品麻豆| 亚洲激情欧美| 国产精品一区亚洲| 亚洲国产一区二区视频| 欧美日韩激情网| 午夜欧美视频| 欧美视频福利| 久久激情视频| 欧美午夜精品久久久久久浪潮| 久久国内精品视频| 欧美日韩另类在线| 久久av二区| 欧美成人激情视频免费观看| 午夜激情综合网| 欧美黄色日本| 亚洲欧美成人一区二区在线电影| 欧美日韩国产欧| 欧美一级在线视频| 欧美日韩一区成人|