《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于用戶相似度遷移的協同過濾推薦算法
基于用戶相似度遷移的協同過濾推薦算法
2014年微型機與應用第14期
柯良文,王 靖
華僑大學 計算機科學與技術學院,福建 廈門
摘要: 數據稀疏性問題是傳統的協同過濾算法主要的瓶頸之一。遷移學習利用輔助領域的用戶評分信息,有效地緩解了目標領域的稀疏性問題。現有的遷移學習推薦算法中,普遍存在領域間的用戶需要一致、模型平衡參數較多等限制。針對這些局限性,提出了一種用戶相似度遷移的模型,利用輔助領域的用戶相似度幫助目標領域用戶相似度的學習。此外,通過一種用戶特征子空間的距離來度量模型的平衡參數,使模型更加具有智能性。實驗結果表明,該模型與其他協同過濾算法相比較能夠更有效地緩解數據稀疏性問題
Abstract:
Key words :

  摘  要數據稀疏性問題是傳統的協同過濾算法主要的瓶頸之一。遷移學習利用輔助領域的用戶評分信息,有效地緩解了目標領域的稀疏性問題。現有的遷移學習推薦算法中,普遍存在領域間的用戶需要一致、模型平衡參數較多等限制。針對這些局限性,提出了一種用戶相似度遷移的模型,利用輔助領域的用戶相似度幫助目標領域用戶相似度的學習。此外,通過一種用戶特征子空間的距離來度量模型的平衡參數,使模型更加具有智能性。實驗結果表明,該模型與其他協同過濾算法相比較能夠更有效地緩解數據稀疏性問題。

  關鍵詞: 數據稀疏性;協同過濾;遷移學習;用戶相似度;特征子空間

  協同過濾技術是推薦系統中應用最為廣泛和成功的推薦技術之一[1],其基本思想是:利用整個用戶集對項目集的歷史評分數據來預測目標用戶對其未評分的項目集的偏好程度,從而選擇若干個預測后偏好程度最高的項目作為推薦結果[2]。

  傳統的協同過濾算法最為關鍵的步驟是度量用戶之間或項目之間的相似度。隨著系統規模的不斷擴大,用戶對項目評分數據極端稀疏時,利用傳統的方法難以準確地度量相似性,導致了推薦系統的推薦質量降低。為了緩解稀疏性的問題,多領域數據的遷移學習已受到了學者們的高度關注。目前,研究者已提出了多種基于遷移學習的推薦算法,如SINGH等人提出了一種聯合矩陣分解模型CMF(Collective Matrix Factorization)[3],Li Bin等人提出了一種評分矩陣生成模型RMGM(Rating Matrix Generative Model)[4], Pan Weike等人則提出了一種坐標系統遷移模型CST(Coordinate System Transfer)[5]。這些算法均通過對輔助領域的知識進行遷移來幫助提高目標領域的推薦精度。

  然而,在現有的遷移學習推薦算法中,如CMF模型和CST模型,需要輔助領域與目標領域的用戶空間一致,并且模型中需要控制較多的參數,受到了一定的限制。針對這些局限,本文提出一種用戶相似度遷移的協同過濾模型UST(User Similarity Transfer),對輔助領域和目標領域共同用戶的相似度進行遷移。為了能夠充分利用輔助領域的用戶評分信息,本文的模型在輔助領域里采用先填充后計算用戶相似度的策略。另一方面,通過一種用戶特征子空間的距離來度量模型中的平衡參數,一定程度上消除了人為調控的局限性。

  1 相關定義

  首先給出本文中所使用的符號及含義。在輔助領域里,定義一個p×q的矩陣RA來表示p個用戶對q個項目的評分;在目標領域里,定義一個m×n的評分矩陣RT來表示m個用戶對n個項目的評分。評分矩陣的項ri,j表示用戶ui對項目vj的偏好程度,分值越大表示用戶對項目的偏好程度越高。為了方便描述評分矩陣的項是否被評分,在輔助領域和目標領域里分別定義一個只有0和1值的標記矩陣WA和WT,其中0表示該項未被評分,1表示該項已被評分。

  2 基于用戶的協同過濾算法

  基于用戶的協同過濾算法根據其他用戶的觀點產生目標用戶的推薦列表。首先利用已有的評分數據計算目標用戶與其他用戶的相似度,其次通過目標用戶的最近鄰居對某個項目的評分來預測目標用戶對該項目的評分[6]。

  2.1 相似度的計算方法

  相似度的計算是基于用戶的協同過濾算法中最為關鍵的一步。傳統的相似度度量方法有余弦相似度、修正的余弦相似度和pearson相關系數[2],本文采用實踐中實現效果較好的pearson相關系數來度量[7]。設I是ui和uj共同評分的項目集合,則ui和uj的pearson相似度計算方法如下:

  {BRB91AULFQ1BQ5G5E2%X0I.png

  其中,ri、rj分別表示ui、uj對它們共同評分項目的平均評分。

  2.2 產生推薦結果

  根據目標用戶ui的最近鄰居集合C對項目的評分信息預測ui對未評分項目的評分,選擇預測評分最高的若干個項目作為推薦結果反饋給目標用戶。目標用戶ui對未評分項目vk的預測評分,可以根據ui的最近鄰居集合C對vk評分的平均加權得到[8],計算方法如下:

  2.png

  其中,ri、rj分別表示用戶ui、uj對其已知評分項目的平均評分。

  3 基于用戶相似度遷移的推薦模型

  3.1 UST模型介紹

  現實世界中,輔助領域和目標領域往往只有部分共同的用戶或項目,導致大部分現有的遷移學習算法在實際應用中具有一定的局限性。為了能夠提高傳統協同過濾算法用戶相似度計算的準確性,本文從相似度遷移的角度出發,建立用戶相似度遷移模型,以更好地利用輔助領域的評分信息幫助目標領域用戶相似度的學習。

  定義Asim為輔助領域計算得到的用戶相似度矩陣,Tsim為目標領域計算得到的用戶相似度矩陣,通過加權的方法建立如下UST模型:

  Usim=?琢Tsim+(1-?琢)Asim,0<?琢≤1(3)

  其中,?琢為平衡參數,用來控制輔助領域的用戶相似度對目標領域用戶相似度學習的遷移程度。

  在UST模型中,首先利用輔助領域用戶評分數據計算用戶之間的相似度,然后通過式(3)計算目標領域的用戶相似度矩陣,最后對目標領域未評分的項目進行預測。

  3.2 輔助領域用戶相似度的學習

  為了利用輔助領域的評分數據來計算用戶相似度矩陣,UST模型首先通過一種填充的方法對輔助領域的缺失評分矩陣進行填充,然后對填充后的矩陣計算用戶間的相似度。這樣做的好處是能夠更有效地利用輔助領域已知評分的信息來計算用戶的相似性度。

  矩陣分解MF(Matrix Factorization)技術是一種有效的填充方式,它希望通過找到一個低秩的矩陣來逼近RA[9]。記填充后的低秩矩陣為ZA,則通過矩陣分解的方法可以將ZA近似分解成如下形式:

  45678.jpg

  進一步地,將輔助領域填充后的矩陣ZA通過式(1)計算出輔助領域的用戶相似度矩陣Asim。

  3.3 目標領域用戶相似度的學習

  在UST模型中,α的大小受到目標領域和輔助領域相關性的影響。為了度量α的值,采用一種目標領域和輔助領域的用戶特征子空間距離來估計。設正交矩陣UT和UA分別是目標領域和輔助領域的用戶特征矩陣,則UT和UA的子空間距離可由下式計算:

  9.png

  其中,?滓 min(Z)表示Z的最小奇異值。為了獲得輔助領域和目標領域的用戶特征子空間UT和UA,可以通過矩陣的QR分解將U分解成一個列正交的矩陣Q和上三角矩陣T[11]:

  U=Q×T(10)

  確定了平衡參數α,根據模型式(3)計算出目標領域最終的用戶相似度矩陣,最后通過式(2)為目標用戶產生推薦結果。

  4 實驗結果和分析

  為了驗證UST-CF算法的有效性,選取了以下幾種經典的非遷移學習協同過濾算法和遷移學習的協同過濾算法做比較:基于pearson相關相似性的協同過濾算法(PCC)[6];基于傳統矩陣分解的單個目標領域協同過濾算法(RMF)[10],即本文式(6)的模型;聯合矩陣分解的協同過濾算法(CMF)。為了驗證輔助領域評分矩陣填充后是否有利于提高目標領域用戶相似度計算的準確性,本文還對輔助領域未填充的UST-unImpute算法進行比較。

  4.1 實驗數據集

  采用MovieLens(http://www. gouplens.org/node/73)站點的電影評分數據集來對比各種算法的效果。MovieLens數據集包括71 567個用戶對10 681個電影項目的約107條評分數據,其評分形式為{0.5,1.0,1.5,…,5.0}。為了度量整個數據集的稀疏性,引入數據稀疏度的概念,定義為用戶已評分數據占整個數據集的比例,可以得到該數據集的稀疏度為107/(71 567×10 681)≈1.31%。

  4.2 評價標準

  推薦系統的質量由預測結果的精度決定。實驗中,采用兩種廣泛的評價方法:均方根誤差RMSE(Root Mean Square Error)和平均絕對誤差MAE(Mean Absolute Error),具體計算方式如下:

  1112.png

  其中,pi,j、ri,j分別表示預測評分值和實際評分值,TE表示訓練集的下標集合。

  4.3 參數設定

  對幾種比較算法的參數做如下設定:對于基于最近鄰的協同過濾算法(如PCC、UST-unImpute、UST-CF),選擇的最近鄰居數為{5~300};對于RMF模型和CMF模型,選擇的特征維度為{4,5,…,10},正則項參數為{0.1,1,

  5,10},平衡參數為{0.1,0.5,0.9}。

  4.4 實驗方案和結果分析

  根據目標和輔助領域的用戶集相同且評分形式一致、用戶集相同但評分形式不一致、用戶集不相同但評分形式一致這三種情形設計3個實驗方案,每種方案的輔助領域的稀疏度均固定為5%。

  方案1 用戶集相同且評分形式一致

  從數據集中隨機選取1 000個用戶對2 000個電影的評分數據,將其中1 000部電影作為輔助領域的項目,剩余的1 000部電影作為目標領域的項目。目標領域內每個用戶至少評價過25部以上的電影。進一步地劃分目標領域的訓練集和測試集,其中訓練集按照不同的數據稀疏度劃分為5組,每一組的稀疏度依次為1.0%、1.5%、2.0%、2.5%和3.0%,而每組剩余的評分數據作為測試集。

  方案2 用戶集相同但評分形式不一致

  從數據集中隨機選取1 000個用戶對1 500個電影的評分數據,將其中1 000部電影作為輔助領域的項目,剩余的500部電影作為目標領域的項目。在輔助領域里人為地對用戶評分數據進行如下轉化:對評分≧4的項用1來代替,評分<4的項用0來代替。目標領域里每個用戶至少評價過20部以上的電影,訓練集和測試集的劃分同方案1。

  方案3 用戶集不同但評分形式一致

  從數據集中隨機選取2 000部電影,其中1 000部作為輔助領域的項目,剩下的1 000部作為目標領域的項目。輔助領域和目標領域的用戶數均固定為1 500個,并且按照兩個領域的共同用戶數劃分5組實驗。每組實驗的共同用戶數分別為300、600、900、1 200、1 500。目標領域里每個用戶至少評價25部以上電影,并且訓練集的稀疏度為1%。

001.jpg


002.jpg

003.jpg

  三個實驗方案的結果分別如表1~表3所示。從實驗結果可以看出,與其他協同過濾算法相比較,本文提出的UST-CF算法均能取得最好的推薦效果。從表1和表2可以看出,目標領域的稀疏度越低,UST-CF算法取得的優勢越明顯,這說明對評分數據極其稀疏的情形,UST-CF算法體現了更好的適應性,能有效緩解數據稀疏的問題。從表3可以看出,即使只有部分的共同用戶,UST-CF算法也能有效利用這部分共同用戶的評分數據,改進目標領域測試集的推薦精度。

  本文提出了一種用戶相似度遷移的協同過濾推薦算法,有效地緩解了目標領域數據稀疏性的問題。此外,算法采用一種用戶特征子空間的距離來度量UST模型中的平衡參數,大大提高了模型的智能性。本文算法只考慮了對輔助領域的用戶相似度進行遷移,因此如何改進模型,使模型能夠對輔助領域的其他知識進行遷移(如用戶的評價特征、項目的屬性等),進一步提高目標領域的推薦精度,是一個有意義的研究方向。

  參考文獻

  [1] SU X,KHOSHGOFTAAR T M.A survey of collaborative filtering techniques[J].Advances in Artificial Intelligence,2009(4):1-19.

  [2] 馬宏偉,張光衛,李鵬.協同過濾推薦算法綜述[J].小型微型計算機系統,2009,30(7):1282-1288.

  [3] SINGH A P,GORDON G J.Relational learning via collectivematrix factorization[C].Proceeding of the 14th ACM SIGKDDInternational Conference on Knowledge Discovery and Data Mining,ACM,2008:650-658.

  [4] Li Bin,Yang Qiang,Xue Xiangyang.Transfer learning for collaborative filtering via a rating-matrix generative model[C].Proceeding of the 26th Annual Internatioal Conference on Machine Learning,ACM,2009:617-624.

  [5] Pan Weike,XIANG E W,LIU N N,et al.Transfer Learningin Collaborative Filtering for Sparsity Reduction[C].AAAI,2010(10):230-235.

  [6] BREESE J S,HECKERMAN D,KADIE C.Empirical analysisof predictive algorithms for collaborative filtering[C].Proceed-ing of the 14th Conference on Uncertainty in ArtificialIntelligence,Morgan Kaufmann Publishers Inc.,1998:43-52.

  [7] MCLAUGHLIN M R,HERLOCKER J L.A collaborative fil-tering algorithm and evaluation metric that accurately modelthe user experience[C].Proceeding of the 27th Annual In-ternational ACM SIGIR Conference on Research and devel-opment in Information Retrieval,ACM,2004:329-336.

  [8] SARWAR B,KARYPIS G,KONSTAN J,et al.Item-based collaborative filtering recommendation algorithms[C].Proceed-ing of the 10th International Conference on World Wide Web,ACM,2001:285-295.

  [9] BUCHANAN A M,FITZGIBBON A W.Damped newton algorithms for matrix factorization with missing data[C].IEEE Computer Society Conference on Computer Vision and Pat-tern Recognition,CVPR 2005,2005(2):316-322.

  [10] 李改,李磊.基于矩陣分解的協同過濾算法[J].計算機工程與應用,2011,47(30):4-7.


此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲欧洲综合| 久久国产精品99久久久久久老狼| 国产女优一区| 欧美日韩免费在线视频| 欧美成人午夜剧场免费观看| 久久久久久日产精品| 欧美专区第一页| 午夜激情亚洲| 亚洲欧美激情诱惑| 亚洲宅男天堂在线观看无病毒| 正在播放欧美视频| 一区二区三区欧美| 一本一道久久综合狠狠老精东影业| 日韩视频免费| 9久re热视频在线精品| 夜夜嗨av一区二区三区网站四季av| 亚洲精品色图| 日韩亚洲欧美精品| 日韩亚洲欧美高清| 国产精品99久久99久久久二8| 一区二区欧美激情| 亚洲午夜电影网| 亚洲一区二区三区免费在线观看| 在线中文字幕一区| 亚洲一区二区免费在线| 中国成人黄色视屏| 亚洲永久字幕| 性欧美暴力猛交另类hd| 欧美在线视频一区二区| 久久精品国产久精国产思思| 久久久久免费| 免费亚洲视频| 欧美日韩国产美| 欧美午夜欧美| 国产精品亚洲综合久久| 国产香蕉97碰碰久久人人| 国产一区二区中文字幕免费看| 国内揄拍国内精品少妇国语| 亚洲高清在线观看| 亚洲精品久久久久久久久久久久久 | 久久久在线视频| 欧美成年人在线观看| 欧美激情亚洲综合一区| 欧美视频免费| 国产日韩欧美另类| 亚洲国产aⅴ天堂久久| 亚洲最新在线视频| 午夜精品影院| 亚洲黄页一区| 亚洲一区二区在线看| 久久av一区二区| 欧美高清不卡| 国产精品女人网站| 伊人成人在线视频| 一本久久a久久免费精品不卡| 午夜视频精品| 日韩亚洲视频| 久久精品视频免费播放| 欧美护士18xxxxhd| 国产精品一区二区久久精品 | 精品动漫3d一区二区三区免费| 亚洲日本电影| 欧美亚洲系列| 日韩午夜激情| 久久精品二区三区| 欧美久久久久免费| 国产一区二区三区黄| 亚洲精品中文字| 亚洲欧美制服另类日韩| 亚洲伦理在线| 久久久91精品国产一区二区三区| 欧美精品在线观看一区二区| 国产欧美1区2区3区| 亚洲区国产区| 欧美一区91| 亚洲视频在线一区| 久久这里有精品视频| 国产精品久久二区二区| 尤妮丝一区二区裸体视频| 亚洲午夜视频在线| 欧美日韩国产在线| 欧美精品尤物在线| 欧美成人一品| 欧美精品一区二区精品网| 亚洲精品久久视频| 性欧美xxxx视频在线观看| 欧美国产日韩一区二区三区| 中文国产一区| 亚洲女人天堂av| 亚洲最新视频在线| 久久综合九色99| 国产精品丝袜91| 99国产精品99久久久久久| 亚洲国产一区在线| 久久免费一区| 国产欧美短视频| 亚洲视频axxx| 一区二区三区四区蜜桃| 欧美大片在线看免费观看| 国产一区二区电影在线观看 | 亚洲精品国产欧美| 亚洲国产精品福利| 久久精品国产久精国产一老狼 | 亚洲综合首页| 欧美日韩一区二区三区在线| 91久久精品国产91久久| 亚洲国产精品嫩草影院| 久久久www免费人成黑人精品| 国产精品视频成人| 亚洲最新色图| 亚洲午夜免费福利视频| 欧美另类综合| 亚洲人成网站影音先锋播放| 亚洲欧洲日韩女同| 美女黄网久久| 国内精品视频久久| 欧美一区永久视频免费观看| 久久av一区| 国产亚洲欧美另类一区二区三区| 亚洲一区二区三区影院| 亚洲欧美一区二区在线观看| 欧美日韩在线视频一区| 亚洲美女淫视频| 一本久道久久综合狠狠爱| 欧美精品亚洲二区| 亚洲精品一二区| 一区二区三区 在线观看视| 欧美日韩123| 日韩亚洲综合在线| 亚洲影院在线| 国产农村妇女毛片精品久久莱园子| 亚洲在线不卡| 久久九九精品99国产精品| 国产在线国偷精品产拍免费yy| 欧美一区二区三区播放老司机| 久久成人免费日本黄色| 国产综合色产在线精品| 亚洲国产精品黑人久久久| 美女日韩在线中文字幕| 亚洲日本中文字幕免费在线不卡| 亚洲精品在线免费观看视频| 欧美久久成人| 亚洲天堂偷拍| 久久精品视频导航| 亚洲国产精品999| 亚洲视频欧洲视频| 国产精品欧美日韩一区二区| 欧美一区二区三区在线观看视频 | 欧美~级网站不卡| 亚洲精品视频在线看| 亚洲视频每日更新| 国产精品一香蕉国产线看观看 | 国一区二区在线观看| 91久久国产综合久久| 欧美日本在线视频| 亚洲欧美日韩国产精品| 久久综合国产精品| 亚洲肉体裸体xxxx137| 亚洲一区免费网站| 国产一区二区中文字幕免费看| 亚洲欧洲一区二区三区久久| 欧美日韩日韩| 午夜激情一区| 欧美激情久久久久久| 亚洲一区二区三区四区五区午夜| 久久免费的精品国产v∧| 91久久国产精品91久久性色| 亚洲欧美激情一区二区| 红桃视频国产一区| 亚洲视频在线观看三级| 国产一区二区三区四区hd| 99在线精品观看| 国产亚洲精品久久飘花| 亚洲乱码精品一二三四区日韩在线| 国产精品久久久久久亚洲调教 | 午夜久久久久久久久久一区二区| 美女主播一区| 在线视频免费在线观看一区二区| 欧美日韩综合| 久久av在线| 亚洲国产一成人久久精品| 亚洲网站啪啪| 国产一区二区三区精品欧美日韩一区二区三区| 午夜精品久久一牛影视| 亚洲男女毛片无遮挡| 老司机成人网| 一二三区精品| 久久综合九色99| 亚洲一级在线观看| 欧美好骚综合网| 亚洲精品人人| 午夜精品福利在线| 国内偷自视频区视频综合| 中文av一区特黄| 狠狠入ady亚洲精品经典电影| 亚洲新中文字幕| 1769国产精品| 欧美一区二区三区在线| 亚洲美女尤物影院| 六十路精品视频|