《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 業(yè)界動(dòng)態(tài) > 利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)開發(fā)文化稽查統(tǒng)計(jì)分析系統(tǒng)

利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)開發(fā)文化稽查統(tǒng)計(jì)分析系統(tǒng)

2009-06-03
作者:李 山

??? 摘 要:提出統(tǒng)計(jì)分析系統(tǒng)不應(yīng)該歸入普通管理信息系統(tǒng),而應(yīng)該根據(jù)用戶具體需求,充分分析其本質(zhì),利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)進(jìn)行開發(fā)和實(shí)現(xiàn),并闡述了如何利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)從需求分析到最終表現(xiàn)的開發(fā)全過(guò)程。
??? 關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù);統(tǒng)計(jì)分析;需求分析;工作流

?

??? 統(tǒng)計(jì)分析系統(tǒng)(Statistic Analysis System)不是歸入到普通管理信息系統(tǒng)MIS中的模塊或插件,而是建立在MIS基礎(chǔ)之上,具有一定輔助決策能力的獨(dú)立系統(tǒng)。往往在傳統(tǒng)MIS中嵌入統(tǒng)計(jì)分析系統(tǒng),會(huì)造成MIS運(yùn)行的數(shù)據(jù)吞吐瓶頸,給客戶帶來(lái)MIS運(yùn)行緩慢的錯(cuò)覺(jué)。尤其是當(dāng)業(yè)務(wù)數(shù)據(jù)量很大的時(shí)候,這種情況會(huì)突顯出來(lái)。為此,使用有效的技術(shù)手段構(gòu)造獨(dú)立的統(tǒng)計(jì)分析系統(tǒng)是很有必要的。在開發(fā)“文化稽查統(tǒng)計(jì)分析系統(tǒng)”項(xiàng)目的時(shí)候,采用了數(shù)據(jù)倉(cāng)庫(kù)技術(shù),構(gòu)建起運(yùn)行在“文化稽查管理信息系統(tǒng)”之上的統(tǒng)計(jì)分析系統(tǒng)。本文介紹了相關(guān)的構(gòu)建過(guò)程和關(guān)鍵技術(shù)的實(shí)施。
1 需求分析
1.1 需求特點(diǎn)

??? 建立統(tǒng)計(jì)分析系統(tǒng)依然要經(jīng)過(guò)嚴(yán)格的需求分析階段,只有在明確的需求指導(dǎo)下,才能開發(fā)出滿足客戶真正需要的系統(tǒng)。MIS系統(tǒng)是建立在非信息化的原始手工平臺(tái)上的全新系統(tǒng),而該系統(tǒng)則是在原有的MIS系統(tǒng)開放平臺(tái)上構(gòu)造上層系統(tǒng),因此具兩大特點(diǎn):(1)業(yè)務(wù)過(guò)程信息化。在需求分析階段不需要重新分析整個(gè)業(yè)務(wù)過(guò)程,因?yàn)檫@些復(fù)雜的業(yè)務(wù)流程已經(jīng)整理并實(shí)現(xiàn)在良構(gòu)的MIS中,需關(guān)注的應(yīng)該是對(duì)于領(lǐng)導(dǎo)決策層關(guān)心的業(yè)務(wù)數(shù)據(jù)及其表現(xiàn)形式上。(2)無(wú)需采集數(shù)據(jù)。由于數(shù)據(jù)的采集過(guò)程已經(jīng)由MIS完成,因此,只需要去分析現(xiàn)有的數(shù)據(jù)集即可。
1.2 關(guān)鍵業(yè)務(wù)需求
??? 正因?yàn)樯鲜鲂枨筇攸c(diǎn),可以將工作重心從整理業(yè)務(wù)流程上轉(zhuǎn)移到數(shù)據(jù)分析上。通過(guò)與客戶的交流,建立起共性需求。對(duì)于任何統(tǒng)計(jì)分析系統(tǒng),都有對(duì)數(shù)據(jù)進(jìn)行歸并和分類的過(guò)程,并且提供給決策層的數(shù)據(jù)往往是在某個(gè)層面上的匯總結(jié)果。因此,將“文化稽查統(tǒng)計(jì)分析系統(tǒng)”的需求歸納成:(1)建立分項(xiàng)統(tǒng)計(jì)功能。即對(duì)決策層面臨的“舉報(bào)”、“稽查”、“立案”、“處罰”等業(yè)務(wù)主題建立各自獨(dú)立的統(tǒng)計(jì)模塊。(2)確立統(tǒng)計(jì)方式為:匯總與分類,同時(shí)要多維度表現(xiàn)。即可以在任何統(tǒng)計(jì)分項(xiàng)上,考核各統(tǒng)計(jì)指標(biāo),建立起按照時(shí)間、地點(diǎn)、任務(wù)劃分的統(tǒng)計(jì)過(guò)程。(3)同時(shí)要采用靈活的表現(xiàn)方式。即可以以表格和圖形的方式展現(xiàn)給最終用戶。
??? 對(duì)整個(gè)統(tǒng)計(jì)過(guò)程簡(jiǎn)單建模如圖1所示。這在需求上就確立了該系統(tǒng)的特點(diǎn)符合構(gòu)造數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn),即面向主題,用于決策支持,與時(shí)間刻度相關(guān)的系統(tǒng)。

?

?

2 數(shù)據(jù)預(yù)處理
??? 采用基于工作流(Workflow)方式的數(shù)據(jù)預(yù)處理過(guò)程。在原有的MIS系統(tǒng)上很容易總結(jié)工作流。例如在該系統(tǒng)中,從原有的MIS中截獲的基本過(guò)程是:舉報(bào)、稽查、立案和處罰,但是這些只是基本工作過(guò)程,在它們之間還有一定的關(guān)聯(lián)關(guān)系,這就要通過(guò)對(duì)業(yè)務(wù)過(guò)程進(jìn)行分析( Business Process Analysis),以便更好地建立數(shù)據(jù)集。
2.1 工作流分析
??? 對(duì)于整個(gè)文化稽查業(yè)務(wù)基本上劃分出上述的5個(gè)過(guò)程(Process),在各過(guò)程之間是判斷與選擇的關(guān)聯(lián)關(guān)系。基本工作流程描述如圖2所示。

?

?

??? 對(duì)于一般的系統(tǒng),可以從定義過(guò)程開始進(jìn)行分析。
??? 定義 1:
???
??? P是定義在業(yè)務(wù)過(guò)程上的集合;R是定義在P上的關(guān)系對(duì)與條件判斷C的有序?qū)稀Mㄟ^(guò)給定這樣兩組集合,可以在確立主題統(tǒng)計(jì)指標(biāo)之間關(guān)系的時(shí)候進(jìn)行直接關(guān)聯(lián)。
??? 這樣上述過(guò)程可以更加精確的描述:
??? P={p1: 舉報(bào), p2: 稽查, p3: 立案, p4: 處罰, p5: 終結(jié) }
??? R={ (1, p2>, c1), (2, p3>, c2), (2, p4>, c3), (2, p5>, c4), (3, p4>, c5), (4, p5>, c6) }
??? C = {c1: 接受, c2: 待處理, c3: 現(xiàn)場(chǎng)裁決, c4: 正常, c5: 裁決, c6: 結(jié)案}
2.2 數(shù)據(jù)準(zhǔn)備
??? 基于上述定義的工作流過(guò)程,可以確定需要數(shù)據(jù)的范疇,并且建立指標(biāo)集。在數(shù)據(jù)預(yù)處理階段,將原有業(yè)務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)按照上述過(guò)程進(jìn)行了劃分,確立了分別反映前4個(gè)過(guò)程的4個(gè)關(guān)鍵數(shù)據(jù)表,并且在它們之間建立了以集合C為條件的關(guān)聯(lián)關(guān)系。
??? JuBao(ID#, …)
??? JiCha(ID#, JuBaoID, LiAnID…)
??? ChuFa(ID#, JiChaID, …)
??? JieAn(ID#, ChuFaID, JiChaID)
??? 按照這4個(gè)表中的主外鍵確立過(guò)程關(guān)系,同時(shí)根據(jù)具體情況去除一些異常數(shù)據(jù),如圖3所示。

?

?

3 數(shù)據(jù)倉(cāng)庫(kù)建模
3.1 確立主題

??? 依照工作流總結(jié)的4個(gè)基本過(guò)程,可以定義出4個(gè)主題,如圖4所示,按照它們?cè)谛枨箅A段確定的內(nèi)容,劃分?jǐn)?shù)據(jù)間的粒度大小。

?

?

??? 在粒度劃分上要遵循客戶實(shí)用性原則,即依照客戶需求將各維度(Dimension)劃分成不同的類別,以便于用戶識(shí)別。例如:時(shí)間維度,可以劃分成按年、季度、月份、周和日期的不同粒度。地區(qū)維度,可以劃分為市、區(qū)(縣)、街道等。
3.2 建立信息包
??? 確立主題之后,在主題的作用域內(nèi)確立維度、事實(shí)(Facts),并建立起信息包(Information Package)。
??? 例如:對(duì)于“稽查”主題,在用戶看來(lái)需要了解的信息包括,稽查單位數(shù)、處罰數(shù)量、代立案數(shù)量等一些業(yè)務(wù)指標(biāo),而這些正好構(gòu)成了我們要求解的事實(shí)。同時(shí)關(guān)心在不同時(shí)間片斷,不同地區(qū),以及考量各業(yè)務(wù)部門之間的這些指標(biāo)的變化情況,這樣就構(gòu)成了統(tǒng)計(jì)時(shí)需要的維度。依次,建立如圖5所示的信息包。

?

?

3.3 建立星型模型
??? 信息包的確立是建立數(shù)據(jù)集合的基礎(chǔ),但是需要將這種二維表現(xiàn)模型轉(zhuǎn)換成具有多維度表現(xiàn)的星型模型,如圖6所示。

?

?

4 實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)并開發(fā)系統(tǒng)
4.1 基本過(guò)程

??? 星型模型指導(dǎo)我們?nèi)グl(fā)現(xiàn)和抽取維度信息、事實(shí)數(shù)據(jù),最終建立數(shù)據(jù)倉(cāng)庫(kù),為統(tǒng)計(jì)分析系統(tǒng)的開發(fā)奠定基礎(chǔ)。由模型到物理實(shí)現(xiàn)需要經(jīng)歷如圖7所示的基本過(guò)程。

?

?

??? 建立數(shù)據(jù)倉(cāng)庫(kù)前期需要對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行凈化,消除異常數(shù)據(jù),提煉符合要求的基礎(chǔ)數(shù)據(jù)集,并在此之上依照星型模型構(gòu)建各個(gè)主題的數(shù)據(jù)立方(Data Cube),最后將數(shù)據(jù)立方登臺(tái)到物理數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)統(tǒng)計(jì)分析的進(jìn)一步處理。
??? 例如對(duì)于“稽查”主題,我們首先尋找和構(gòu)建維度表。 一般地,可以將維度表描述為:D = {di | i ∈N∧di ∈ R}。同時(shí)發(fā)現(xiàn)事實(shí)數(shù)據(jù)提取的業(yè)務(wù)表。在這里的事實(shí)業(yè)務(wù)表為上述4個(gè)基本表中的JiCha。在清理完上述事實(shí)表和構(gòu)建好維度表之后,需要利用這些表格建立數(shù)據(jù)立方,計(jì)算出各項(xiàng)指標(biāo)值。
??? 續(xù)上過(guò)程,一般在構(gòu)建數(shù)據(jù)立方過(guò)程,可以采用標(biāo)準(zhǔn)SQL完成。一般可以描述為:
??? di×dj(0< i,j ≤ Count(維度表) ∧i≠j) 即各維度的笛卡爾積。或:
??? SELECT COUNT(*), Date, District, …
??? FROM JICHA
??? GROUP BY Date, District, …
??? 最后將此結(jié)果集記錄在專門用于統(tǒng)計(jì)分析使用的物理數(shù)據(jù)庫(kù)中。
4.2 構(gòu)建前端統(tǒng)計(jì)分析系統(tǒng)
??? 在完成數(shù)據(jù)倉(cāng)庫(kù)的物理實(shí)現(xiàn)后,可以在此基礎(chǔ)上開發(fā)相應(yīng)的統(tǒng)計(jì)分析系統(tǒng),并且需要利用到很多表現(xiàn)豐富的前端處理技術(shù)。在此系統(tǒng)中,基本采用以下過(guò)程來(lái)建造這個(gè)前端,如圖8所示。

?

?

??? 在對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行展現(xiàn)的時(shí)候往往需要滿足客戶適時(shí)調(diào)整展現(xiàn)結(jié)果的需要,這就需要采用數(shù)據(jù)鉆取(Data Drill)技術(shù),而這個(gè)技術(shù)在很多商業(yè)化的開發(fā)工具中都作為包的形勢(shì)提供給開發(fā)人員,因此,開發(fā)過(guò)程會(huì)相對(duì)方便和快捷。
??? 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)自提出到現(xiàn)在,具體在工程界的應(yīng)用并不是十分到位,其中一個(gè)重要的原因在于客戶與開發(fā)組織在實(shí)現(xiàn)與之相關(guān)的項(xiàng)目時(shí),往往不區(qū)分傳統(tǒng)業(yè)務(wù)系統(tǒng)和數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),這樣就會(huì)在概念和技術(shù)實(shí)現(xiàn)上受到阻礙,從而不能滿足最終用戶的需要。本文從建立統(tǒng)計(jì)分析系統(tǒng)在需求上的本質(zhì)特征,提出兩者分離并形成層次關(guān)系,利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù),從而很好地解決了上述不足。但是在實(shí)現(xiàn)過(guò)程中發(fā)現(xiàn),對(duì)于實(shí)現(xiàn)這種統(tǒng)計(jì)分析系統(tǒng),并非只限于采用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的直接結(jié)果,項(xiàng)目的實(shí)施還要受到開發(fā)成本、用戶概念接受程度、現(xiàn)有MIS的完備程度等諸多因素影響,因此在實(shí)際開發(fā)過(guò)程中要權(quán)衡考慮。
參考文獻(xiàn)
[1]? KANTARDZI M. Data mining Concepts, Model, Methods and Algorithms[M]. Tsinghua University Publisher, 2003.
[2]? HAMMERGREN T. Data Warehouse Technology[M].Ventana Communications Group, Inc., 1997.

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
激情欧美日韩| 国产在线一区二区三区四区| 亚洲亚洲精品在线观看| 久久国产精品毛片| 亚洲一区二区三区四区五区黄| 尤物精品国产第一福利三区| 国产老肥熟一区二区三区| 欧美激情一区二区三级高清视频| 一区二区三区免费观看| 久久精品人人做人人综合| 亚洲一区二区三区在线观看视频 | 国产亚洲精品自拍| 国产精品久久久久久久久免费桃花 | 激情综合中文娱乐网| 国产精品久久久久秋霞鲁丝 | 国产一级久久| 欧美日韩久久| 亚洲国产欧美日韩精品| 欧美一级视频| 亚洲欧美综合v| 亚洲影视综合| 国产精品99久久久久久白浆小说| 亚洲人成在线播放| 精品88久久久久88久久久| 国产欧美日韩在线视频| 国产精品高清在线| 欧美精品色网| 欧美电影在线免费观看网站 | 亚洲一区二区毛片| 亚洲一区二区三区四区在线观看| 日韩一级在线| 91久久久亚洲精品| 亚洲日本视频| 亚洲伦理在线| 一区二区日韩欧美| 亚洲视屏在线播放| 亚洲影视九九影院在线观看| 在线一区二区三区四区五区| 在线视频免费在线观看一区二区| 一本综合久久| 亚洲天堂av在线免费观看| 日韩一二三在线视频播| 一区二区欧美在线观看| 中国成人黄色视屏| 99国产精品99久久久久久| 日韩亚洲欧美成人| 亚洲一区二区精品在线观看| 亚洲综合视频网| 亚洲视频在线播放| 午夜亚洲福利| 久久久久久伊人| 麻豆成人在线| 欧美精品在线一区二区三区| 欧美视频一区在线观看| 国产精品无码专区在线观看| 国产精品区一区二区三| 国产欧美日本一区二区三区| 国产日韩在线一区| 国产欧美精品一区aⅴ影院| 国产偷国产偷精品高清尤物| 黑人极品videos精品欧美裸| 伊人久久亚洲美女图片| 亚洲人成啪啪网站| 中文亚洲欧美| 亚欧成人在线| 亚洲欧洲一区二区三区在线观看| 99re国产精品| 午夜亚洲福利在线老司机| 久久久免费精品视频| 免费成人高清视频| 欧美日韩久久久久久| 国产精品热久久久久夜色精品三区| 国产亚洲精品久久久| 在线播放不卡| 91久久亚洲| 亚洲欧美国产高清| 亚洲国产一成人久久精品| 99热这里只有精品8| 性欧美精品高清| 美女尤物久久精品| 欧美日韩在线一区| 国产亚洲欧美一区二区| 91久久精品www人人做人人爽| 中文日韩在线| 亚洲国产高清一区| 亚洲一区二区三| 久久综合一区| 欧美视频一区二区三区在线观看 | 亚洲永久免费视频| 亚洲黄色成人网| 午夜精品999| 欧美1区2区视频| 国产九色精品成人porny| 在线精品视频在线观看高清| 国产精品99久久久久久久久| 亚洲午夜av在线| 亚洲国产裸拍裸体视频在线观看乱了| 一区二区国产日产| 久久久精品国产免大香伊| 欧美精品一区二区三区蜜臀| 国产精品视频观看| 亚洲精品网址在线观看| 久久激情视频久久| 亚洲一区二区三| 欧美成年视频| 国产一区二区三区在线观看网站 | 国产农村妇女毛片精品久久麻豆| 亚洲高清视频一区| 亚洲欧美视频在线观看视频| 99pao成人国产永久免费视频| 久久九九精品99国产精品| 亚洲欧美激情四射在线日| 亚洲一二三区在线观看| 一本久久a久久免费精品不卡| 美女免费视频一区| 国产在线拍偷自揄拍精品| 欧美一级淫片播放口| 欧美在线免费视屏| 国产精品网站在线观看| 亚洲综合色激情五月| 亚洲一区二区三区中文字幕在线| 欧美日韩国产bt| 亚洲免费激情| 亚洲一区二区三区成人在线视频精品 | 国产最新精品精品你懂的| 亚洲成人资源网| 欧美11—12娇小xxxx| 亚洲电影免费观看高清完整版| 亚洲国产一二三| 欧美激情一区二区三区| 亚洲日本国产| 亚洲小说春色综合另类电影| 欧美视频中文字幕在线| 中文日韩电影网站| 先锋资源久久| 国产日产精品一区二区三区四区的观看方式 | 国产精品福利久久久| 亚洲综合成人婷婷小说| 久久精品国产精品| 在线成人av网站| 99精品国产一区二区青青牛奶| 欧美日本精品在线| aa级大片欧美三级| 午夜免费在线观看精品视频| 国产精品一区二区三区四区| 久久成人免费视频| 欧美高清影院| 亚洲天堂激情| 久久久综合网站| 亚洲欧洲在线一区| 亚洲欧美在线一区二区| 国产一区二区按摩在线观看| 亚洲国产精品精华液网站| 欧美—级高清免费播放| 亚洲图片欧美一区| 久久精品亚洲| 亚洲激情校园春色| 午夜影视日本亚洲欧洲精品| 韩国v欧美v日本v亚洲v| 日韩一区二区免费看| 国产精品视频观看| 亚洲黄色有码视频| 欧美午夜寂寞影院| 欧美中文字幕在线| 欧美精品一区二区在线观看 | 99精品免费| 国产欧美一区二区视频| 亚洲精品视频免费观看| 国产精品免费网站在线观看| 亚洲国产日本| 国产精品豆花视频| 亚洲欧洲在线播放| 国产精品福利网站| 亚洲国产精品久久人人爱蜜臀 | 亚洲美女中文字幕| 国产精品综合| 亚洲伦理精品| 国产欧美综合在线| 一区二区久久| 精品成人一区| 亚洲欧美日韩精品久久久久| 伊人蜜桃色噜噜激情综合| 亚洲欧美一区二区精品久久久| 伊甸园精品99久久久久久| 亚洲欧美另类在线| 最新亚洲一区| 久久久久久久高潮| 国产精品99久久99久久久二8 | 亚洲网站视频| 欧美精品色一区二区三区| 午夜在线视频观看日韩17c| 欧美激情久久久久久| 欧美中文字幕不卡| 国产精品免费一区豆花| 亚洲狼人综合| 黄网站色欧美视频| 香蕉尹人综合在线观看| 99在线热播精品免费99热| 免费亚洲视频| 久久精品日产第一区二区|