《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 一種改進的本體相似度計算方法
一種改進的本體相似度計算方法
來源:微型機與應用2011年第1期
朱珍元,鄭 誠
(安徽大學 計算智能與信號處理教育部重點實驗室,安徽 合肥 230039)
摘要: 本體映射的關鍵技術是本體相似度計算。本文基于已有的V-Doc(虛擬文檔)技術提出一種新的NV-Doc本體相似度計算方法,其中不僅用到了本體中實體自身以及其第一層相鄰節點的信息,而且還充分利用了第二層相鄰節點的信息。
Abstract:
Key words :

摘  要: 本體映射的關鍵技術是本體相似度計算。本文基于已有的V-Doc(虛擬文檔)技術提出一種新的NV-Doc本體相似度計算方法,其中不僅用到了本體中實體自身以及其第一層相鄰節點的信息,而且還充分利用了第二層相鄰節點的信息。
關鍵詞: 語義網;本體映射;虛擬文檔;本體相似度

 本體是共享概念化的明確具體規范,隨著語義網的發展,本體的應用越來越多。用RDF[1]或OWL[2]書寫的Web本體在語義網的出現和應用方面起到了很大作用,本體的數量也與日俱增。
Web的分布式特點使得大量的本體由不同組織開發,并且在很大程度上覆蓋相同或者相交的領域,因此Web本體之間存在一定的相似性,但相關領域的不同本體之間也存在很大的異構性。
解決本體異構問題的最好方法是本體映射。本體映射的目的是架起異構本體之間的橋梁,在使用不同本體的Web應用之間建立互操作,從而實現語義網環境下數據的集成與管理。而本體映射的關鍵技術是本體的相似度計算,即計算兩個不同本體中實體之間的相似度,當相似度值大于某個給定的閾值時,可以認為這兩個實體之間存在著一定的語義關系。
 目前,關于本體相似度計算方法的自動化程度不高,而且不能充分利用本體的各種描述信息。已有的V-Doc技術能夠較好地解決這兩方面的問題,但也存在一些不足。
基于虛擬文檔的本體相似度計算方法V-Doc[3]將本體看成一個有向圖,圖中的每個節點對應本體中的一個實體,為每個實體自動建立虛擬文檔,充分利用了節點自身和鄰接節點的描述信息。但該方法也存在不足:節點的特征不僅與鄰接節點有關,而且還與鄰接節點的鄰接節點信息有關,即實體的描述信息還應該考慮節點的第二層鄰接節點的信息。針對其不足,本文提出一種新的基于虛擬文檔的本體相似度計算方法NV-Doc。
1 V-Doc簡介
1.1 虛擬文檔的構建

 虛擬文檔是為了描述概念特點而建立起來的文檔,為每一個節點構建虛擬文檔,充分利用節點自身和鄰接節點的描述信息。
定義1 (URIrefs描述):假設e是一個URIref,對e的描述通過與其有關的名字、標簽、注釋和其他自然語言描述信息組成,其定義[3]為:

1.2 相似度計算
 本體中每一個實體(節點)的描述信息(語言學特征)通過該節點的虛擬文檔表示。因此,兩個本體中實體的相似度可通過計算與之對應的兩虛擬文檔之間的相似度而得到,即虛擬文檔之間的相似度就是實體之間的相似度。虛擬文檔之間的相似度通過在信息檢索領域應用廣泛的向量空間模型VSM(Vector Space Model)[4]方法計算。將兩個待匹配的虛擬文檔用向量空間中的一個向量表示,當然在相似度計算之前還要對文檔進行預處理,如分詞、去除停用詞、提取詞干等。向量空間模型中,關鍵詞的權重使用TF/IDF技術[5]表示。由此可以得到一個N×W的矩陣X,其中N是虛擬文檔的個數,W表示所有虛擬文檔中token的總數。可以通過矩陣與其倒置矩陣的積得到虛擬文檔之間的相似矩陣,最后規范化相似矩陣,使相似度值在[0,1]區間內。規范化后所得矩陣即為虛擬文檔之間的相似度矩陣,每個值也代表了兩個虛擬文檔之間的相似度,從而得到與之對應的兩實體之間的相似度。
2 NV-Doc
2.1 改進的虛擬文檔

 為RDF圖中每一個節點構建虛擬文檔,不僅用到節點自身以及相鄰第一層的鄰居節點信息,還用到節點第二層的鄰接節點信息。
 定義3 (改進的虛擬文檔):假設e是一個URIref,e的虛擬文檔NVD(e)的表示方程為:

2.2 簡單示例
 假設一個簡單的本體片段模型如圖1所示。

 按照式(3)得到節點A的虛擬文檔為:

3 實驗結果及分析
3.1 實驗數據

 實驗數據選用基于KAON2的開源資源Framework for Ontology Alignment and Mapping中所提供的Test Ontologies and Alignments。從中選用本體規模較小的russia1.owl和russia2.owl作為數據源,其中russia1中共有49個節點,russia2中共有51個節點。進一步的實驗選用數據集OAEI 2005 benchmark tests中的五組規模稍大的本體作為數據源。 本文兩次實驗中各參數的取值不變:α1、α2、α3、α4的值分別為1.0、0.5、0.25、0.25,參數γ1、γ2、γ3、γ4的值分別取0.1、0.1、0.05、0.05。各參數的取值借鑒Falcon-OA[6]系統在程序中所給的參數值。對于實體的描述,第一層鄰接節點一般比第二層鄰接節點更有影響力,所以γ3、γ4分別取0.05、0.05,比γ1、γ2的值0.1、0.1都小是有道理的。
 本文采用查準率和查全率的綜合評估函數以及運行時間作為評價標準對實驗結果進行評估。

3.2 實驗結果及分析
 本文主要的改進之處是提出新的算法來構建本體中實體的虛擬文檔,虛擬文檔間的相似度計算也是通過描述的方法實現,初步實驗結果如表1所示。

    初步實驗結果:表明改進的算法雖然在運行時間上有所延長,但查準率和查全率都有所提高,而且這種時間消耗不是很大。
 其次,為了再一次驗證NV-Doc較V-Doc的可行性,對數據集OAEI 2005 benchmark tests中的五組本體進行實驗,最后得到的實驗結果如圖2、圖3所示。

 再次實驗結果表明,NV-Doc能夠取得比V-Doc更好的查全率和查準率,雖然在效率方面不及V-Doc,但從整體上來看,效率上的部分損失換來更好的查準率和查全率也是值得的。
 本文針對計算本體中實體相似度存在的問題提出改進方法,充分利用實體自身和實體的第一層及第二層鄰接節點的描述信息(即實體的語言學上的特征)。實驗結果分析表明,改進后的算法在查準率和查全率方面優于原先的算法。下一步的研究工作是:一方面將此方法和其他計算本體相似度的方法有效結合,從而更有效地實現本體映射;另一方面是減少運行時間,提高效率。最后還要充分利用本體其他的描述信息,如本體的屬性、關系、實例等。
參考文獻
[1] KLYNE G, CARROLL J J. Resource description framework (RDF): concepts and abstract syntax.//W3C Recommendation 10 February 2004. Latest version is available at http://www.w3. org/TR/rdf-concepts/.
[2] Patel-Schneider P F, HAYES P, HORROCKS I. OWL web ontology language semantics and abstract syntax. W3C Recommendation 10 February 2004. Latest version is available at http: //www. w3. org/ TR/owl-semantics/.
[3] QU Yuzhong, HU Wei, CHENG Gong. Constructing virtual documents for ontology matching[C]//Proceedings of the 15th International Conference on W orld W ide W eb.Edinburgh,Scotland: [S.n.],2006.
[4] VIJAY V, RAGHAVAN S K, WONG M. A critical analysis of vector space model for information retrieval. JASIS, 1986: 37(5), 279-287.
[5] SALTON G, MCGILL M. Introduction to modern information retrieval[M]. McGraw-Hill Book Company,1984.
[6] Hu Wei, Qu Yuzhong. Falcon-AO: a practical ontology matching system[C]. Web Semantics: Science, Services and Agents on theWorldWideWeb, 2008: 237-239.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
一二三四社区欧美黄| 久久噜噜噜精品国产亚洲综合| 校园激情久久| 日韩午夜在线观看视频| 亚洲韩国青草视频| 亚洲国产高清高潮精品美女| 激情综合久久| 黄色成人av在线| 国产在线欧美| 国产在线观看一区| 狠狠干综合网| 1769国产精品| 在线看日韩欧美| 亚洲电影专区| 亚洲精品日韩激情在线电影| 亚洲日本成人| 日韩一区二区精品| 一区二区三区免费在线观看| 夜夜爽av福利精品导航| 一本大道久久a久久精二百| 亚洲精选大片| 一区二区三区久久网| 夜夜爽夜夜爽精品视频| 在线亚洲国产精品网站| 亚洲图片在区色| 性一交一乱一区二区洋洋av| 午夜一区不卡| 久久大逼视频| 亚洲激情另类| 99国产精品久久| 亚洲午夜久久久| 午夜精品福利在线观看| 久久av一区二区| 久久综合亚州| 欧美成人午夜77777| 欧美激情一区在线观看| 欧美四级剧情无删版影片| 国产精品美腿一区在线看| 亚洲欧美日韩在线不卡| 亚洲午夜精品福利| 欧美一区二区成人6969| 亚洲国产精品美女| av成人国产| 欧美一区二区福利在线| 久久视频在线视频| 欧美女激情福利| 国产精品嫩草影院av蜜臀| 国产一区二区在线观看免费| 亚洲福利视频三区| 亚洲网站在线观看| 亚洲国产激情| 宅男精品导航| 久久精品国产69国产精品亚洲| 美女黄色成人网| 欧美日韩卡一卡二| 国产色综合天天综合网| 亚洲国产精品高清久久久| 亚洲最新在线| 亚洲国产精品福利| 亚洲视频一二三| 久久久久久久一区| 欧美日韩免费观看一区二区三区| 国产精品日韩精品欧美在线| 在线不卡亚洲| 亚洲一区二区三区精品动漫| 亚洲国产另类 国产精品国产免费| 中文欧美在线视频| 久久一二三四| 国产精品免费区二区三区观看| 黄色成人在线网址| 在线亚洲免费视频| 91久久久亚洲精品| 亚洲欧美成人一区二区三区| 久久天天躁狠狠躁夜夜av| 欧美日韩在线不卡一区| 激情欧美日韩| 亚洲综合欧美日韩| 日韩一级在线| 久久综合九色综合久99| 国产精品久久久亚洲一区 | 欧美激情欧美激情在线五月| 国产精品每日更新| 亚洲精品乱码久久久久久黑人 | 亚洲欧洲一区二区天堂久久| 亚洲欧美综合另类中字| 欧美激情第五页| 国产一区二区三区奇米久涩| 99re6热只有精品免费观看| 亚洲国产日韩一区| 久久成人精品一区二区三区| 欧美精品久久99| 极品尤物一区二区三区| 亚洲欧美日产图| 中文成人激情娱乐网| 欧美aⅴ99久久黑人专区| 国产综合久久久久久| 亚洲免费影视| 亚洲伊人伊色伊影伊综合网 | 国产精品素人视频| 91久久精品国产91性色| 久久精品国产一区二区三区| 亚洲午夜视频在线| 日韩视频在线播放| 奶水喷射视频一区| 好男人免费精品视频| 性久久久久久久久久久久| 亚洲欧美一级二级三级| 欧美视频在线观看一区| 最新中文字幕一区二区三区| 亚洲国产精品电影| 久久夜色精品国产噜噜av| 国产亚洲成av人在线观看导航 | 亚洲国产天堂久久国产91| 久久er精品视频| 久久精品国产99国产精品| 国产精品免费观看在线| 在线亚洲激情| 亚洲欧美日产图| 国产精品日韩精品欧美精品| 中文一区二区| 亚洲免费一级电影| 国产精品麻豆欧美日韩ww| 中文欧美日韩| 小辣椒精品导航| 国产精品尤物| 欧美一级播放| 久久久999| 在线观看日韩av电影| 亚洲激情午夜| 欧美α欧美αv大片| 亚洲激情视频| 中文一区在线| 国产精品第一页第二页第三页| 在线视频免费在线观看一区二区| 亚洲淫片在线视频| 国产欧美欧洲在线观看| 欧美一区二区三区免费大片| 久久精品视频99| 精品不卡在线| 日韩香蕉视频| 欧美午夜激情在线| 亚洲婷婷综合久久一本伊一区| 亚洲欧美一区二区原创| 国产伦精品一区二区| 欧美一区二区三区免费大片| 麻豆成人91精品二区三区| 亚洲激情在线视频| 亚洲一区二区伦理| 国产精品尤物| 亚洲激情在线观看视频免费| 欧美激情一区二区三区全黄 | 99视频一区二区三区| 午夜精品亚洲一区二区三区嫩草| 国产精品欧美日韩久久| 久久福利一区| 欧美精品少妇一区二区三区| 亚洲午夜久久久久久久久电影院| 久久国产精品久久精品国产| 韩国在线一区| 在线亚洲免费视频| 国产午夜精品一区二区三区视频| 亚洲国内在线| 欧美系列电影免费观看| 欧美一二区视频| 欧美女激情福利| 午夜视频一区二区| 欧美国产第二页| 亚洲专区欧美专区| 免费成年人欧美视频| 一区二区欧美激情| 久久深夜福利| 亚洲视频在线观看网站| 久久不射中文字幕| 亚洲精品国精品久久99热| 欧美中文字幕久久| 亚洲黄色av| 欧美制服丝袜第一页| 亚洲人成亚洲人成在线观看图片 | 国产日产精品一区二区三区四区的观看方式 | 欧美一区二区免费| 91久久亚洲| 久久精品色图| 亚洲少妇最新在线视频| 欧美~级网站不卡| 午夜欧美精品久久久久久久| 欧美大尺度在线观看| 午夜精品福利视频| 欧美日韩日日骚| 亚洲福利久久| 国产精品你懂的在线| 日韩一区二区免费高清| 国产一区二区欧美| 亚洲女女女同性video| 一区一区视频| 欧美中文字幕不卡| 亚洲视频欧洲视频| 欧美激情中文字幕一区二区| 欧美专区在线观看| 国产精品手机在线| 亚洲午夜高清视频|