《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于垂直分布方法的關聯規則算法及改進
基于垂直分布方法的關聯規則算法及改進
來源:微型機與應用2011年第8期
楊振華
(西安文理學院 計算機科學系, 陜西 西安710065)
摘要: 數據挖掘中的關聯規則挖掘近些年一直是人們研究的熱點。但是關聯規則挖掘的經典算法Apriori存在著挖掘效率低、系統開銷大等問題。AprioriTid、DIC等算法,也僅從某一方面進行了改進。針對上述問題,提出了一種新的改進算法,新算法從三大方面對原有的算法進行了改進,以此提高算法的效率,降低系統的開銷。
Abstract:
Key words :

摘  要: 數據挖掘中的關聯規則挖掘近些年一直是人們研究的熱點。但是關聯規則挖掘的經典算法Apriori存在著挖掘效率低、系統開銷大等問題。AprioriTidDIC等算法,也僅從某一方面進行了改進。針對上述問題,提出了一種新的改進算法,新算法從三大方面對原有的算法進行了改進,以此提高算法的效率,降低系統的開銷。
關鍵詞: 數據挖掘;關聯規則; Apriori; AprioriTid; DIC

    數據庫中大量的數據與數據之間存在著某種聯系,這種數據之間的聯系就屬于一種重要的知識,也是進行數據挖掘的對象,即關聯規則挖掘[1]。在眾多的關聯規則挖掘算法中最著名的是Apriori算法[2]。它的基本思想是使用一種逐層搜索的迭代算法。但是Apriori算法也有明顯的缺點:每次都會產生大量的候選頻繁項集,而且候選頻繁項集呈指數級增長。每產生一個頻繁項目集就需要掃描一次完整的數據庫。這些都需要耗費巨大的系統資源而且算法的執行速度、效率也比較低。因此人們提出了許多改進的Apriori算法,本文吸取前人的經驗提出了一種新的改進Apriori算法,稱為Apriori-Evo算法。
1 Apriori算法分析
     Apriori算法的基本步驟是:首先掃描事務數據庫D中的事務,統計各個項目出現的次數來產生頻繁項目集L1,然后由L1×L1進行連接運算生成候選2-項集C2,掃描數據庫統計各個候選2-項集出現的次數,確定其中的頻繁2-項集L2。再由L2×L2進行連接運算產生候選3-項集C3,一直反復進行這個過程生成頻繁k-項集Lk,直到無法再生成頻繁項目集為止。

 



     代碼中apriori_gen( )函數[3]主要完成兩個動作:連接和剪枝運算。Lk-1與Lk-1進行連接生成候選頻繁項集。然后剪枝部分利用Apriori的性質刪除掉包含非頻繁子集的候選。
     Apriori算法的主要缺點是會產生大量的候選項集,如果頻繁1-項集有10 000個,則候選2-項集的個數將超過10 000 000個,算法實現時,大量的候選2-項集都被存放在哈希樹中,對它們的統計和測試所需要的開銷會很大;每產生一個頻繁項目集就需要將整個事務數據庫掃描一遍,大大降低了系統I/O效率。
2 對Apriori算法的改進
 關聯規則具有如下性質:
 (1)對于項目集X和它的任意子集Y,如果X是頻繁的,則它的子集Y一定也是頻繁的。
   (2)對于項目集X和它的任意子集Y,如果Y是非頻繁項目集,則X也一定不是頻繁項目集。
   (3)X是k維項目集,如果頻繁項目集Lk-1中包含的X的子集個數小于k,則X不可能是頻繁項目集。
   利用它的性質對Apriori算法從以下三方面進行了改進。
   (1)在剪枝階段減少掃描Lk-1的次數
   進行剪枝的工作原理是:根據關聯規則的性質,Ck中的一個項集如果是頻繁項集,那么它一定有K個k-1項頻繁子集,且這K個k-1項頻繁子集一定都在Lk-1當中。因此以往的對Ck的剪枝過程都是先取出一個候選k項集,然后產生它的K個k-1項子集,再掃描一次Lk-1查看這K個k-1項子集是否都在Lk-1中,如果不是則剪掉這個候選k項集,如此循環。如果產生m條候選k項集,就需掃描Lk-1項集m次。然而頻繁項集具有性質3[4]。所以不需要掃描Lk-1次。首先進行Lk-1×Lk-1的連接運算生成所有的候選項集Ck,然后取出Lk-1中的第一個頻繁k-1項集,查看該k-1項集是Ck中哪些k項集的子集,如果是子集,則對相應的k項集進行計數。然后再從Lk-1中取出第二個頻繁k-1項集,再到Ck中去查看它是哪些k項集的子集,直到Lk-1中的各個項集都比對完成。最后,查看Ck中的每個k項集,如果它的計數小于k,則它不可能是頻繁k項集,需要刪除。因為頻繁k項集一定有k個k-1項子集存放在Lk-1中。這樣整個剪枝步驟只需要掃描Lk-1一次,提高了剪枝步驟的效率和開銷。

    (3)對用于連接的頻繁項目集進行精簡,減少無用候選的產生。
    對于產生的頻繁項目集Lk-1,Apriori算法直接用它連接產生候選頻繁項目集Ck。但實際上Lk-1中的有些項目集已經對產生Lk不起作用了,包含這些項目集的候選k-項集一定不是頻繁的,因此可以對頻繁項目集Lk-1進行精簡。
    根據頻繁項集的性質[7],當要用Lk-1連接產生Ck時,首先統計Lk-1中各個項目出現的次數,如果該項目出現的次數小于k-1,則該項目所在的項目集不用來鏈接生成Ck[8]。

   
    實驗結果表明,改進的Apriori-Evo算法確實在關聯規則數據挖掘的速度和效率方面有很大的提高,而且隨著事務數據的增多,提升效果更加明顯。
    新的算法從三個方面對原有的算法進行了改進,減少了產生的候選頻繁項集Ck中項集的數據,也減少了剪枝過程中的運算次數,在統計支持度階段減少了需要掃描的數據庫中的事務數。而且計算機進行向量運算和位運算速度更快,程序也會更容易實現。實驗證明,新算法在系統的開銷和時間效率上都有很大的提高。
參考文獻
[1] HAN J,KAMBER M.數據挖掘:概念與技術[M]. 范明,孟小峰,譯.北京:機械工業出版社,2001.
[2] AGRAWAL R, IMIEL NSKI T , SWAM I A. Mining association rules between sets of items in large database[A]. In Proc. of the ACM SIGMOD Intl Conf. on Management of Data[C]. Washington D. C. , 1993:207-216.
[3] AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules[C].Morgan Kaufmann, San Francisco, CA: Proceedings of the 24th International Conference on Very  Large Databases,1998:478-499.
[4] 李緒成,王保保. 挖掘關聯規則中Apriori 算法的一種改進[J]. 計算機工程,2002,7(28):104-105.
[5] 羅芳,李志亮.一種基于壓縮矩陣的Apriori改進算法[J]. 科技資訊,2010(4):19.
[6] 劉以安,羊斌.關聯規則挖掘中對Apriori算法的一種改進研究[J].計算機應用,2007,27(2):418-420.
[7] 盛立,劉希玉,高明.挖掘關聯規則中AprioriTid算法的改進[J].山東師范大學學報(自然科學版),2005,20(4): 20-22.
[8] 葉福蘭,施忠興.Apriori算法的改進及應用[J].現代計算機,2009(9):95-126.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美成人首页| 国内揄拍国内精品少妇国语| 欧美一级黄色录像| 亚洲一区二区av电影| 亚洲精品一区中文| 亚洲区一区二区三区| 亚洲国产精品日韩| 久久精品国产99国产精品澳门| 午夜日本精品| 新67194成人永久网站| 午夜精品久久久久久| 午夜视频一区在线观看| 亚洲欧美激情诱惑| 亚洲欧美不卡| 午夜精品福利在线| 欧美中日韩免费视频| 久久久久国产精品www| 欧美香蕉大胸在线视频观看| 欧美激情小视频| 欧美精品综合| 欧美老女人xx| 欧美精品自拍偷拍动漫精品| 欧美日韩国产精品一区二区亚洲| 欧美精品一区二区蜜臀亚洲| 欧美日韩成人在线视频| 欧美午夜剧场| 国产精品一区二区三区久久久| 国产免费亚洲高清| 国产在线高清精品| 亚洲电影成人| 日韩视频在线永久播放| 中文欧美字幕免费| 午夜在线一区| 亚洲第一黄色| 日韩视频精品在线| 亚洲视频一区在线观看| 亚洲欧美综合| 久久影院午夜片一区| 欧美国产日韩一区二区| 欧美色偷偷大香| 国产欧美日韩不卡免费| 黄色影院成人| 亚洲激情成人网| 亚洲色诱最新| 欧美综合国产精品久久丁香| 亚洲欧洲日韩女同| 亚洲一区综合| 久久夜色精品国产噜噜av| 欧美激情一区二区三区在线视频观看| 欧美性猛交99久久久久99按摩| 国产丝袜一区二区| 91久久久久久| 亚洲一级免费视频| 久久精品麻豆| 在线亚洲欧美| 久久精品视频在线看| 欧美精品偷拍| 国产欧美日韩综合| 91久久午夜| 午夜精彩视频在线观看不卡 | 亚洲精品国产无天堂网2021| 亚洲无线视频| 亚洲欧洲一级| 欧美亚洲视频一区二区| 欧美韩日一区二区| 国产精品专区h在线观看| 亚洲国产精品久久久久婷婷884| 中国av一区| 亚洲黄色免费| 久久超碰97人人做人人爱| 欧美女激情福利| 好看的日韩视频| 国产精品99久久久久久久久| 亚洲国产精品99久久久久久久久| 亚洲午夜伦理| 免费成人小视频| 国产精品一区在线观看你懂的| 亚洲国产精品一区二区www| 亚洲欧美欧美一区二区三区| 亚洲精品社区| 久久久.com| 国产精品久久久久久久久久久久久 | 亚洲国产精品一区二区第一页 | 日韩手机在线导航| 亚洲成人在线视频网站| 亚洲欧美视频一区| 欧美日韩日日夜夜| 在线观看欧美精品| 欧美在线亚洲一区| 99一区二区| 欧美丰满少妇xxxbbb| 国产视频观看一区| 亚洲少妇自拍| 一区二区三区国产| 欧美成人在线网站| 韩国女主播一区二区三区| 亚洲欧美日韩国产另类专区| 亚洲视频一区在线观看| 欧美激情亚洲| 亚洲激情在线激情| 亚洲激情在线观看视频免费| 久久久久久久成人| 国产亚洲女人久久久久毛片| 亚洲午夜一区二区三区| 一本色道久久88综合日韩精品| 欧美成人小视频| 在线观看日产精品| 亚洲成在人线av| 久久网站热最新地址| 国语自产精品视频在线看8查询8| 亚洲欧美综合国产精品一区| 亚洲欧美日韩精品久久久| 欧美视频一二三区| 99热免费精品| 亚洲图片在线| 国产精品yjizz| 一区二区三区精密机械公司| 亚洲午夜激情网页| 国产精品成人观看视频免费 | 亚洲视屏一区| 亚洲永久字幕| 国产精品乱人伦一区二区| 国产精品99久久久久久宅男| 亚洲综合视频网| 国产精品人人爽人人做我的可爱| 一区二区精品在线| 亚洲欧美国产一区二区三区| 国产精品男女猛烈高潮激情 | 欧美区在线播放| 亚洲精品视频啊美女在线直播| 99re8这里有精品热视频免费| 欧美日韩国产在线播放| 99精品99久久久久久宅男| 在线视频欧美日韩精品| 欧美香蕉视频| 亚洲欧美一区二区激情| 久久精品视频免费观看| 国内精品伊人久久久久av影院 | 亚洲日本理论电影| 欧美日韩国产在线| 亚洲天堂成人| 久久精品中文字幕免费mv| 韩国精品久久久999| 亚洲人成网站777色婷婷| 欧美日韩色综合| 亚洲一二三区视频在线观看| 久久狠狠久久综合桃花| 亚洲成人自拍视频| 亚洲视频香蕉人妖| 国产色综合久久| 亚洲日本精品国产第一区| 欧美日韩在线视频一区| 亚洲欧美中文日韩v在线观看| 久久综合亚州| 亚洲乱码国产乱码精品精可以看| 亚洲欧美日本日韩| 精久久久久久久久久久| 99re在线精品| 国产伦精品一区二区三区免费 | 欧美激情一区二区三区| 中文国产成人精品久久一| 久久久av网站| 亚洲精品社区| 一区二区日韩伦理片| 久久国产夜色精品鲁鲁99| 亚洲国内在线| 欧美一区二区网站| 亚洲国产中文字幕在线观看| 午夜精品区一区二区三| 在线精品在线| 亚洲欧美视频在线| 亚洲承认在线| 亚洲欧美日韩精品久久亚洲区 | 亚洲一区二区成人在线观看| 久久综合亚洲社区| 亚洲视频在线视频| 免费久久99精品国产自| 亚洲图片自拍偷拍| 欧美a级片网站| 校园激情久久| 国产精品www994| 亚洲精品免费一区二区三区| 国产精品亚洲综合| 亚洲九九精品| 国产专区精品视频| 亚洲一区在线视频| 91久久精品一区二区三区| 久久精品人人做人人爽| 宅男噜噜噜66国产日韩在线观看| 麻豆精品网站| 亚欧成人精品| 欧美午夜a级限制福利片| 亚洲欧洲精品一区二区三区不卡 | 欧美午夜不卡在线观看免费| 亚洲成人资源网| 国产欧美精品日韩| 亚洲午夜激情网站| 亚洲欧洲精品成人久久奇米网 | 最新日韩在线视频| 久久综合图片|