《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 基于決策樹的數據挖掘算法應用研究

基于決策樹的數據挖掘算法應用研究

2009-08-04
作者:常秉琨,李 莉

??? 摘 要:決策樹數據挖掘分類算法在金融客戶關系管理(CRM)中的應用為例,進行了數據挖掘的嘗試,從中發現企業產品的銷售規律和客戶群特征,從而提高CRM對市場活動和銷售活動的分析能力,得到了與實際經驗相符的結果和相應的“規則”,驗證了其可行性和可供決策支持的現實意義。
??? 關鍵詞:算法;數據挖掘;決策樹;客戶關系管理

?

??? 決策樹技術是一種對海量數據集進行分類的非常有效方法,通過決策樹的構造模型,從海量信息中挖掘有效的數據,提取有價值的分類規則,從而獲得有用的知識,為決策者提供支持,幫助決策者準確地預測[1]。本文研究了基于決策樹的數據挖掘的相關理論發展及實際應用,尤其是在商業中的應用,研究了決策樹算法在數據挖掘中應用,給出了在金融客戶關系管理中的具體算例。
1 決策樹的分類挖掘技術
1.1 決策樹的分類挖掘算法

??? 分類是數據挖掘中應用最多的任務,要為每個類別做出準確的描述或建立分析模型或挖掘出分類規則,然后用這個分類規則對其他數據庫中的記錄進行分類[2]。在具體分類中,總是希望進行較少的屬性測試,較快地給實例分類,因此在構建決策樹時,樹的高度越小越好。對于N個樣本,它們分成屬于類別Ci( i = 1 ,2 , …, C)的樣本集合,類別Ci中的樣本個
??? 數為Ni,每個樣本有K個屬性,每個屬性有JK個值。決策樹的構造過程如下:
??? (1)計算初始熵(熵用字符S表示):

???

??? (2)選擇一個屬性作為決策樹的根節點:
??? ①對每個屬性Ak( k = 1 ,2 , …,K ) 按照屬性Ak的J個Akj值,把原始樣本分成第1級樣本集。雖然Akj的分支含有nkj個樣本,但它們不一定屬于單一的類別;
??? ②對于每個分支的nkj個樣本,屬于類別Ci的樣本數目是nkj(i),用下式可以求出該分支的熵:

???

??? ③計算由測試屬性引起的熵降低,即
??? ④選擇產生最大熵降低的屬性AK0,即AK0滿足:
???
??? ⑤屬性AK0便是決策樹的根。
??? (3)由屬性將產生JK0個葉節點,并將樣本集分成JK0個子集,對每個葉節點上的樣本子集依次利用上面的方法選擇一個屬性Ay作為決策樹的下一級,使在該葉節點能得到最大的熵降低。
??? (4)按照步驟(3)不斷構造決策樹的下一級直至所有的樣本子集只有一個類別,這時表明系統的熵為零,決策樹構造過程完畢。
1. 2 決策樹分類挖掘系統的建立
??? 在對金融客戶進行分類分析的過程中,決策樹分類數據挖掘系統建立和應用的一個典型過程是:(1)根據客戶分類的標準,執行客戶分類算法,并將運行結果存儲于數據倉庫中,這樣,每個現有的客戶都具有一個確定的客戶類別;(2)根據歷史數據,主要是客戶的背景數據和客戶的分類數據,執行決策樹生成算法,針對每一種客戶類別,生成一棵決策樹,以一定的形式存放于數據倉庫中;(3)在以上過程執行完畢后,當一個新的客戶來辦理業務時,客戶經理可以首先在系統中調用決策樹展示模塊,系統將整個決策樹展示出來,然后系統根據客戶的具體背景情況預測客戶所屬的客戶類別,以及屬于該客戶類別的概率,并將這些情況展現給客戶經理,客戶經理根據這些情況,對該客戶采取相應的營銷策略,從而達到較好的效果。
2 基于決策樹的數據挖掘的案例分析
2.1 公司客戶關系數據庫

??? 利用決策樹實現客戶細分,主要是在基于客戶價值的客戶細分方法之上進行的,目的是通過了解客戶的特征性指標和行為性指標與客戶所在客戶類別的關系,可以了解同一價值客戶的差異性,有針對性地對不同客戶制定相應的銷售策略[3]。下面以河南省某金融企業的客戶關系管理(CRM)為例,該公司CRM數據如表1所示,說明基于決策樹的客戶分類數據挖掘技術在金融企業客戶關系管理中的應用,來具體闡述如何運用改進ID3算法進行數據挖掘。由于是以分析客戶的特征性指標為例的,所以從中選取了代表特征性的3個屬性:客戶年齡段、學歷以及職業。

?


2.2基于ID3的細分步驟
??? 對于N個樣本,它們分成屬于類別Ci( i = 1 ,2 , …, C )的樣本集合,類別Ci中的樣本個數為Ni,每個樣本有K個屬性,每個屬性有JK個值。類別是客戶類別,分為Ⅰ類客戶、Ⅱ類客戶、Ⅲ類客戶和Ⅳ類客戶4類。將具體的客戶年齡概化為≤25 、25~50 和≥50 3個年齡段,按學歷分為初等學歷、中等學歷和高等學歷3類。按職業分為商業人員、企業人員和其他人員3類。分別如表2、表3、表4所示。
???

?????
??? 決策樹的構造過程如下:
??? (1)計算初始熵(熵用字符S表示) :
????
??? (2) 選擇一個屬性作為決策樹的根節點:
??? ①對每個屬性Ak( k = 1 ,2 , …, K ) 按照屬性Ak的J個Akj值,把原始樣本分成第1級樣本集。雖然Akj的分支含有nkj個樣本,但它們不一定屬于單一的類別。
??? ②對于每個分支的nkj個樣本,屬于類別Ci的樣本數目是nkj(i),用下式可以求出該分支的熵:
???

??? ③計算由測試屬性引起的熵降低,即

???
??? 根據以上計算結果,得出最大熵降低的屬性是K3,即職業。
??? ⑤屬性職業便是決策樹的根。
??? (3) 由屬性將產生JK0個葉節點,并將樣本集分成個子集,對每個葉節點上的樣本子集依次利用上面的方法選擇一個屬性Ay作為決策樹的下一級,使在該葉節點能得到最大的熵降低。
??? (4) 按照步驟(3)不斷構造決策樹的下一級直至所有的樣本子集只有一個類別,這時表明系統的熵為零,決策樹構造過程完畢。然后根據上述的決策樹構造過程,得到圖1所示的決策樹。

?


2.3具體應用分析
??? 決策樹算法中屬性的取值,進一步細分所依據的是特征性指標和行為性指標,然后可以分別得出各種特征性指標和行為性指標與4類客戶之間的樹狀分類結構。下面以分析特征性指標為例,來說明決策樹的構建。
??? 決策樹構建之前,必須要找出決策樹的主屬性。決策樹主屬性的確定主要是根據具體的情況而定。所以客戶細分的主屬性應該是“客戶類別”,就是基于客戶價值的客戶細分得出的客戶類別。
??? 對于數據的選取,并不是所有的數據都符合要求,決策樹建立所要求的數據應是沒有噪音數據和缺失數據,這就需要對數據進行匯總處理。匯總處理一方面是將企業不同部門和不同分銷機構的數據進行集成;另一方面是將數據進行概化處理,即將低層次的原始數據替換為高層次的概念,以便于進行數據挖掘。
??? 分析圖1,從中可以明確4類客戶的特征屬性的大致排布情況,根據所了解的情況,能夠很方便地從客戶的這些特征中大概了解其在4 類客戶中所處的位置。用IF - THEN 的格式來表示樹狀圖的信息(以第Ⅲ類客戶為例),例如:
??? IF 職業=“商業員工”AND 年齡> 25 AND 年齡
??? < 50 AND 學歷=“初等教育”THEN 屬于Ⅲ類客戶
??? IF 職業=“企業員工”AND 年齡> 25 AND 年齡
??? < 50 AND學歷=“初等教育”OR 學歷=“中等教育”THEN 屬于Ⅲ類客戶
??? IF 職業=“其他員工”AND 年齡> 25 AND 學歷
??? ≠“高等教育”THEN 屬于Ⅲ類客戶???????????????????
??? 這些式子說明:對于“商業員工”的客戶來說,如果年齡在25~50 歲之間,學歷為“初等教育”,屬于Ⅲ類客戶;對于“企業員工”的客戶來說,如果年齡在25~50 歲之間,學歷為“中等教育”或者“高等教育”,屬于Ⅲ類客戶;對于“其他員工”的客戶來說,如果年齡大于25 歲,只要學歷不是“高等教育”,就屬于Ⅲ類客戶。
??? 根據上面分析第Ⅲ類客戶的結果,可以得出:不論客戶職業是什么,只要年齡在25~50 歲之間,學歷為“初等教育”的客戶,都屬于Ⅲ類客戶。由于Ⅲ類客戶是企業目前利潤的重要來源,所以企業就要吸引和保持住與Ⅲ類客戶之間的客戶關系,需要把營銷策略更傾向于年齡在25~50歲之間的客戶,而對于在該區間之外的客戶,需要有選擇性地開展促銷方式,例如對其他職業的客戶,就要考慮大于50歲的情況。由于Ⅰ類客戶對企業的貢獻很小,分析的必要性不大,所以重點是對Ⅱ、Ⅲ和Ⅳ類客戶的分析。通過這種分析方式,逐步把通過ID3得出的樹狀結構的所有分支都進行分析,可以了解企業的同一價值客戶在特征屬性上的差異性。同理再對客戶的行為性指標進行分析,可以得出同一價值客戶在行為屬性上的差異性。結合這兩方面,就能夠在了解客戶價值類別的基礎上,有針對性地對不同客戶制定相應的銷售策略,減少企業不必要的開銷,實現對客戶價值細分后的進一步細分。
??? 如何高效地整合和分析企業各部門和各級分銷機構內的銷售和客戶信息,使企業能夠從全局的角度了解和認識市場是CRM的重要任務之一,而基于決策樹的數據挖掘算法對于企業來說剛好可以實現這個任務。通過基于決策樹的客戶分類數據挖掘技術,可以了解客戶的特征性指標和行為性指標與客戶所在客戶類別的關系[4],使企業能夠在了解何種資源組合可以使得自己獲得高利潤的同時,有針對性地根據客戶的差異化和多變性需求制定相應的銷售策略,使得企業制定的營銷策略更加符合市場的需求,保持在市場中的競爭地位。
參考文獻
[1]? 張世海,劉曉燕,涂慶,等.基于決策樹的高層結構智能選型知識發現[J] .哈爾濱工業大學學報, 2005,37(4):451-454.
[2]?崔立新,苑森森,趙春喜.約束性相聯規則發現方法及算法[J].計算機學報,2000,22(2):216-220.
[3]?李緒成,王保保.挖掘關聯規則中Apriori算法的一種改進[J].計算機工程與應用,2002,28(7):104-105.
[4]?魏定國,彭宏.基于知識網絡的數據挖掘[J].計算機科學,2006,33(6):210-213.

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲欧美在线播放| 欧美精品一二三| 亚洲精选视频免费看| 久久精品成人欧美大片古装| 亚洲综合三区| 亚洲一级网站| 在线综合亚洲欧美在线视频| 99ri日韩精品视频| 亚洲免费av电影| 亚洲人在线视频| 亚洲青涩在线| 亚洲日本免费| 亚洲美女中文字幕| 一区二区不卡在线视频 午夜欧美不卡在 | 国产欧美一区二区三区国产幕精品 | 亚洲美女毛片| 亚洲免费观看高清在线观看| 亚洲免费大片| 亚洲视频在线观看三级| 亚洲一区二区免费在线| 在线亚洲一区二区| 亚洲男同1069视频| 久久爱www.| 久久琪琪电影院| 欧美激情精品久久久久久变态| 欧美精品18| 国产精品国产三级国产aⅴ无密码| 国产精品久久国产精麻豆99网站| 国产精品免费看久久久香蕉| 国产麻豆综合| 一区免费观看| 亚洲精品1区2区| 一区二区精品国产| 性做久久久久久久久| 亚洲观看高清完整版在线观看| 亚洲精品国产欧美| 中文在线不卡视频| 久久爱91午夜羞羞| 蜜臀av性久久久久蜜臀aⅴ四虎| 欧美理论在线播放| 国产精品稀缺呦系列在线| 国内精品视频在线播放| 亚洲国产精品视频| 中文在线资源观看网站视频免费不卡| 午夜亚洲性色福利视频| 亚洲激情在线播放| 亚洲尤物在线视频观看| 久久米奇亚洲| 欧美日本一区二区三区| 国产欧美日韩综合一区在线观看 | 一本一本久久a久久精品综合麻豆| 亚洲一区在线播放| 最新国产成人在线观看| 亚洲一区二区三区在线看| 久久久久久免费| 欧美日本高清| 国产香蕉97碰碰久久人人| 亚洲国产视频a| 午夜国产精品影院在线观看| 最新精品在线| 午夜亚洲伦理| 欧美精品国产精品日韩精品| 国产欧美日韩视频一区二区三区| 亚洲激情在线观看| 午夜精品区一区二区三| 亚洲美女中文字幕| 久久精品亚洲热| 欧美视频日韩视频在线观看| 很黄很黄激情成人| 一本色道久久综合亚洲精品高清| 久久高清免费观看| 亚洲欧美精品在线观看| 欧美风情在线观看| 国产一区二区日韩精品欧美精品| 一本久久综合亚洲鲁鲁| 亚洲欧洲精品一区二区三区 | 国内精品视频久久| 亚洲午夜激情网页| 亚洲毛片在线观看| 久久深夜福利免费观看| 国产精品乱码人人做人人爱| 亚洲激情综合| 久久精品72免费观看| 亚洲欧美日韩一区在线| 欧美精品免费在线| 在线免费不卡视频| 欧美中文字幕精品| 欧美亚洲一区| 欧美香蕉视频| 亚洲精品一区在线观看香蕉| 亚洲国产精品一区二区第一页| 性欧美暴力猛交69hd| 欧美无乱码久久久免费午夜一区| 在线视频观看日韩| 久久国产精品久久国产精品| 欧美伊人精品成人久久综合97| 欧美日韩国产探花| 亚洲国产欧美一区| 亚洲国产mv| 久久午夜av| 狠狠v欧美v日韩v亚洲ⅴ| 小嫩嫩精品导航| 午夜精品电影| 国产精品久久久久免费a∨大胸 | 亚洲天天影视| 亚洲少妇在线| 欧美日韩午夜在线视频| 亚洲三级影院| 99精品99| 欧美日韩国产一区精品一区 | 性欧美videos另类喷潮| 午夜在线观看免费一区| 国产精品扒开腿爽爽爽视频| 夜夜爽www精品| 亚洲无毛电影| 欧美视频日韩视频| 99亚洲视频| 亚洲视频在线视频| 欧美视频一区在线| 一区二区三区视频免费在线观看 | 国产精品青草久久| 亚洲系列中文字幕| 欧美一级大片在线免费观看| 国产精品午夜春色av| 亚洲男人的天堂在线| 欧美在线|欧美| 国产午夜精品一区二区三区视频| 欧美一区二区高清| 久久久精品一区二区三区| 国模一区二区三区| 亚洲国产黄色| 欧美精品久久一区| 一二三区精品| 午夜伦理片一区| 国产小视频国产精品| 欧美一区二区视频观看视频| 久久久久久一区二区三区| 韩国福利一区| 亚洲人成小说网站色在线| 欧美成人一区二区三区片免费| 91久久精品国产91久久性色tv| 99av国产精品欲麻豆| 欧美午夜激情在线| 亚洲男同1069视频| 久久视频一区| 亚洲精品黄色| 午夜视黄欧洲亚洲| 狠久久av成人天堂| 亚洲美女精品久久| 国产精品毛片a∨一区二区三区|国| 亚洲欧美日本伦理| 蜜臀久久久99精品久久久久久| 亚洲欧洲日韩在线| 亚洲伊人网站| 好看的亚洲午夜视频在线| 亚洲狼人综合| 国产精品久久7| 久久se精品一区二区| 欧美韩国日本综合| 中文在线一区| 久久另类ts人妖一区二区| 亚洲激情小视频| 欧美一区二区| 在线 亚洲欧美在线综合一区| 中文av字幕一区| 国模精品一区二区三区| 99精品国产高清一区二区| 国产精品美女久久久久久2018| 欧美在线免费播放| 欧美日本韩国在线| 欧美一区久久| 欧美精品免费播放| 午夜亚洲性色视频| 欧美日本免费一区二区三区| 午夜精品久久久99热福利| 欧美成人午夜| 亚洲欧美日韩一区| 欧美激情中文不卡| 销魂美女一区二区三区视频在线| 欧美韩日一区二区三区| 亚洲永久免费av| 欧美精品三级日韩久久| 欧美一区二区免费| 欧美日韩在线精品| 亚洲国产视频直播| 国产精品视频免费在线观看| 亚洲精品国产无天堂网2021| 国产精品三级视频| 亚洲美女尤物影院| 国产农村妇女毛片精品久久莱园子| 最新高清无码专区| 国产精品伊人日日| 这里只有视频精品| 在线看欧美日韩| 欧美一区二视频| 亚洲最新在线| 欧美大片免费观看在线观看网站推荐 | 欧美亚洲自偷自偷| 欧美午夜精品久久久久久久 | 久久一区二区三区四区五区|