《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于網絡論壇文本挖掘的筆記本電腦滿意度研究
基于網絡論壇文本挖掘的筆記本電腦滿意度研究
2014年微型機與應用第18期
李艷紅,程 翔
上海財經大學 信息管理與工程學院,上海 200433
摘要: 不同于以往的滿意度模型中頭腦風暴和問卷調研等手段建立指標體系的思路,以大量掩埋和分布在各個網絡平臺中的評論信息為基礎,通過文本挖掘手段分析消費者對筆記本電腦重點關注的角度和內容,確立評價指標體系;基于Formell模型,使用多元回歸方法,建立了筆記本電腦滿意度模型。該研究過程基于消費者的真實感受,提煉出了消費者對筆記本電腦最為關注的優勢屬性和缺陷屬性,幫助產品制造商全面、準確地了解消費者的需求和心理期望。同時,滿意度模型有助于消費者和制造商對筆記本電腦的滿意度進行綜合測算、比較和選擇。
Abstract:
Key words :

  摘  要: 不同于以往的滿意度模型中頭腦風暴和問卷調研等手段建立指標體系的思路,以大量掩埋和分布在各個網絡平臺中的評論信息為基礎,通過文本挖掘手段分析消費者對筆記本電腦重點關注的角度和內容,確立評價指標體系;基于Formell模型,使用多元回歸方法,建立了筆記本電腦滿意度模型。該研究過程基于消費者的真實感受,提煉出了消費者對筆記本電腦最為關注的優勢屬性和缺陷屬性,幫助產品制造商全面、準確地了解消費者的需求和心理期望。同時,滿意度模型有助于消費者和制造商對筆記本電腦的滿意度進行綜合測算、比較和選擇。

  關鍵詞網絡論壇;文本挖掘;筆記本電腦;滿意度

0 引言

  當前,互聯網網站為數眾多的產品評論以及打分為消費者相互交流提供了平臺。這些評價內容豐富,包含以往消費者對該產品的情感傾向,它們的存在將影響潛在買家所做出的購買決策。

  在不受以往頭腦風暴和傳統調查問卷結構限制的環境下,從自身出發的論壇消費者評價有更強的主動性和真實性,能夠全面深入地反映消費者的真實感受。但數量眾多的評論與潛在消費者有限的時間、精力存在矛盾,容易出現一葉障目的問題。這些信息運用文本挖掘技術進行處理和量化之后能夠更清晰地反映出消費者對某產品的滿意程度和感情傾向。

  本文以筆記本電腦為對象,嘗試基于網絡論壇文本挖掘的滿意度模型建立思路。

1 相關理論和研究

  1.1 產品評論挖掘

  產品評論挖掘通過對結果進行分析,用文本挖掘的方法將整理出的結果呈現給用戶和商家。短短幾年間,無論是在英文還是在中文領域,產品評論挖掘技術都取得了很大的進步。通過用戶隨意發表一段產品評論來表達對產品使用之后的看法,商家和購買者都可以輕易地從這些評論中獲取各自所需要的信息。

  通常情況下,對產品評論挖掘的目的主要有兩點:一是面向該產品的潛在購買者,使他們能夠快速、準確、全面、及時地了解已經購買該產品的消費者的真實體驗感受,減少產品信息搜索成本;二是面向產品的制造商,幫助其能夠全面、準確地了解消費者的需求和心理期望,使他們能夠有針對性地改進產品并且設計新產品。

  1.2 Fomell模型

  1989年,美國密歇根大學質量研究中心的Fomell教授總結了理論研究的成果,提出了把顧客期望、購買過程中各種屬性影響等多方面因素組成了一個計量經濟學邏輯模型,即Fomell邏輯模型。該模型是迄今為止最成熟和運用最廣泛的顧客滿意度指數理論。

  1.3 相關研究現狀

  在國外,2002年是評論挖掘開始興起的一年,TURNEY P[1]首先提出將語義傾向性應用在非監督的評論分類上,并設計了一個簡單的算法,即將評論分為推薦和不推薦兩類;2003年學者DAVE K、LAWRENCE S、PENNOCK D對觀點抽取和語義分類進行了系統研究[2];ABRAHAMS A S等人和樊衛國教授合作在2012年利用評論挖掘進行汽車產品缺陷的發現,并建立相應的決策支持系統[3],在實踐中取得較好效果。

  由于中文和英文的差異,中文領域的評論挖掘剛剛起步。2007年,評論挖掘以及句子的語義傾向性判別己經成為很多學者的研究熱點;2011年,郗亞輝、張明等學者[4]將產品評論挖掘劃分為4個子任務,介紹了國內外學者對每個子任務的研究成果,并給出了該領域進一步的研究方向;2012年,出現了一些產品評論挖掘的研究成果,如參考文獻[5]、[6]等;2013年,結合微博的社會性特點構建的微博產品評論挖掘模型[7]出現。

2 領域特征詞匯提取

  2.1 筆記本電腦領域文本選取

  讀取來自于互聯網的約200篇筆記本領域相關文本,大致為筆記本廣告和筆記本新聞,這兩類文本多為筆記本電腦公司官方或者分銷商為介紹其產品而對其進行的描述,因此這類文章中有大量屬性詞匯以及描述性詞匯;再者這類文本的長度一般比較長,適合統計詞頻,獲取筆記本電腦領域特有屬性詞匯,所以從以上文本中事先做出重點特征詞匯的抽取是后面研究的基礎。

  2.2 筆記本電腦領域重點特征詞匯提取

  領域內的特殊屬性詞匯在評論中出現的頻率較高,表達的意思也比較重要,具體詞匯獲取辦法和步驟是:(1)把從互聯網上獲取的文本轉換整理為文本格式;(2)對每一個文本利用軟件ROST Content Mining進行分詞處理以及詞頻統計;(3)設置一個閾值,將符合條件的詞匯提取出來。

  經過提取,共有86個高頻詞匯進入筆記本領域產品屬性詞匯表,根據字母排序如表1所示。

001.jpg

3 筆記本電腦評論挖掘過程

  3.1 挖掘對象選取

  在進行筆記本電腦評論挖掘之前,首先要明確大部分評論的構成要素以及所要挖掘的重點要素,這些要素直接決定了應該關注評論中的哪些內容。評論內容的存在形式決定著最后進行數據分析時所采用的數學模型和方法。

  在實際的評論挖掘工作中,默認一條完整的產品評論需要包含6個要素:誰、評論時間、在哪里評論、所針對的產品、具體針對哪個屬性和評分。所以筆記本電腦產品評論的抽取對象包含:(1)意見表達者(人或組織);(2)意見表達時間(包括評論的原始發表時間和評論的更新時間);(3)意見表達空間(諸如網絡論壇、討論組、專業評論網站等);(4)產品名稱(品牌、型號);(5)產品屬性;(6)評分。

  3.2 筆記本電腦評論的網頁抓取

  3.2.1 評論抓取方式和范圍

  大量可用的評論意見零散地分布在各個網頁中,因此利用爬蟲程序識別評論信息并抓取評論網頁。由于筆記本電腦有較快的更新速度,不能對所有頁面都進行抓取,因此人為設定抓取時間為2012年8月至2013年3月,抓取空間為點評狂、太平洋電腦評價網站和中關村筆記本論壇,抓取品牌為Sony和ThinkPad。

  3.2.2 數據庫設計

  為抓取信息存儲,設計原始網頁數據庫和抽取信息數據庫。其中,原始網頁數據庫是網頁原封不動的信息存儲,而抽取信息數據庫則是用來存儲抽取之后的重要信息。抓取步驟如下:

 ?。?)設計原始網頁數據庫,包括URL、評論者、評論時間、機型、優點、缺點、評分、價格。

  (2)在原始網頁數據庫基礎上對重點名詞和形容詞進行抽取后,存儲于抽取信息數據庫,包括了URL、評論者、評論時間、機型、優點屬性、缺點屬性、其他、評分、價格。

  (3)根據以上兩步數據庫中存儲的信息以及筆記本電腦領域特殊詞匯,通過數據庫的查找篩選功能統計出各個詞頻。

  3.3 評論挖掘結果分析

  將筆記本電腦屬性作為此次評論挖掘的重要研究對象之一,在整個研究中有重要作用。通常從商家角度概括筆記本電腦性能特點及優勢,但從消費者的個人傾向出發來看待該筆記本電腦的屬性能反映廣大消費者對該筆記本電腦的心理期望才是本文研究的重點。

  為了方便研究,將筆記本電腦屬性分為內在屬性、外在屬性和抽象屬性三類。內在屬性包括筆記本電腦樣式、大小、重量以及硬件等性質;外在屬性包括包裝、價格、相關服務等;抽象屬性是通過使用之后由于不同消費者的不同感受而引起的,即所謂的情感傾向。

  抽取的評論詞根據英文字母排序,存在大量不同的詞語表達著相同意思的情況,例如“價錢、價格、費用”和“電池、電源”。因此,將所有屬性按內在屬性、外在屬性和抽象屬性進行重新分類,并且將內在屬性繼續分為筆記本電腦硬件類屬性和外觀類屬性,如表2所示。

002.jpg

  根據表2所示的筆記本電腦屬性分類進行詞頻抽取,具體原則是:對某個產品出現了哪些特征屬性,是褒還是貶,出現頻次分別為多少;在匯總的屬性當中,消費者更關心哪些屬性;對于同一條評論,消費者更關心哪些屬性,消費者關注的屬性之間是否有聯系?;谝陨蠋c考慮,將86個高頻詞匯再次概括為45個具體屬性,并對出現頻次進行了合并統計,統計結果將在之后的頻數分析中進行詳細說明。

  詞頻權值法是根據詞在文檔中出現的頻率來確定其重要程度的一種加權方法,即wk=fk,其中fk為特征項出現的詞頻。wk的計算公式如式(1)所示,其中,nt表示屬性在所有的評論中出現的次數。

  1.png

  將嚴格分類后的45個屬性進行詞頻測試,每一種屬性的具體權重如表3所示。

003.jpg

  從表3可以看出,消費者在市面購買筆記本電腦和使用過程中,對于顯示屏和鍵盤此類屬性的關注度遠遠超過了市面上銷售人員在介紹筆記本時所用的處理器、網卡、內存等屬性。對于普通消費者來說,顯示屏分辨率大小、鍵盤舒適程度以及電池的續航能力等帶有直觀感受的筆記本電腦屬性更容易影響消費者的購買傾向。與臺式機相比,筆記本電腦最大的特點就是便于攜帶,所以筆記本電腦的重量在外觀類屬性中遠遠高于設計風格。對于外在屬性來說,用途屬性主要是以商務、辦公、游戲等形容詞為基礎進行統計,而服務質量包括了在購買時的服務態度、售后服務是否到位等。從表3可以看出,筆記本電腦的用途、價格屬性遠遠高于其他屬性,可以反映出人們在購買筆記本電腦的過程中性價比始終是一個至關重要的影響因素。

  消費者對性能方面和硬件方面的屬性關注度普遍高于一些外在屬性,說明大部分顧客還是更看重筆記本電腦的內在品質。在硬件屬性和外觀屬性中,前5項所占比例雖有不同,但差距并不大。相比之下,對于外在屬性,消費者似乎對于價格和用途的關注遠遠高于其他外在屬性,同時對一些直觀方面的屬性(例如電池持續能力、散熱能力以及顯示屏分辨率能力等)關注度遠遠超過一些常規屬性。畢竟對于廣大非專業消費者來說,其并不了解筆記本電腦的相關硬件知識,而市面上通常的宣傳資料以及經銷商在為顧客講解時卻時常側重于其硬件配置等方面。通過以上頻數分析,建議銷售人員在介紹其新產品時關注的方向可以側重于消費者能夠直觀感受到的一些功能屬性。

4 筆記本電腦滿意度模型建立

  評論中包含的屬性數量和屬性特征自然是該筆記本電腦是否符合消費者心理的一個重要因素,評價屬性數量尤其是優勢屬性數越多,表明該產品的滿意度越高。再者,通過消費者對于不同屬性的關注度的區別,不同屬性對于影響筆記本電腦滿意度的權重也勢必不同。

  Formell模型主要是通過顧客對質量、價值的感知,顧客忠誠,顧客抱怨進行多元回歸分析。而根據實際研究情況,本文選擇了直接將所有感受即所收集的評價分為優點和缺點,利用優缺點出現的次數和相應評分的回歸模型與第一部分中相關屬性在整個評價中所占權重建立筆記本電腦滿意度模型。

004.jpg

  首先進行優勢屬性回歸。如表4所示,首先提取出根據權值模型計算出的整個評價中權值最大的10個屬性;然后根據所抽取的評價信息,如果該評價中出現了首行所示的屬性,則記為1,否則為0;之后在最后一列中提取出該評價的評論者在網上或論壇上所給出的評分。在做滿意度評價時,統一把評分設定成以10為標準。根據以上規則整理好評價,進行評分以及各屬性的回歸分析,如表5所示。

005.jpg

  筆記本電腦優點滿意度回歸=4.28+1.46×重量+1.00×外觀+0.88×散熱+0.58×鍵盤+0.89×屏幕+1.04×顏色+2.28×開機+1.29×價格+1.37×電池+1.70×系統。

  根據之前的分析得出,每一種筆記本電腦優勢屬性的權重有著很大的差別,從而在進行優點回歸之后乘以相應的屬性權值即為優點回歸模型,記為:

  2.png

  同理,用相同的方法可以得到筆記本電腦缺陷模型。首先根據權重評價模型中對出現的筆記本電腦缺點的統計,抽取出12個出現頻數較高的屬性并做出布爾統計矩陣,結果如表6所示。

006.jpg

  之后利用評分以及屬性進行回歸分析得出回歸分析系數,結果如表7所示。

007.jpg

  從而得出消費者對于筆記本電腦缺陷的抱怨程度模型= -(8.13+0.58×電池+1.61×開機+0.32×散熱+1.35×系統+0.80×屏幕+0.65×硬盤+0.41×價格+0.39×鍵盤+1.62×接口+1.21×速度+1.29×聲音+0.89×自帶軟件)

  345.jpg

  從標準回歸方程可以看出,影響筆記本電腦顧客滿意度的因素即為筆記本電腦的重點屬性,包括由筆記本硬件屬性、內在外在屬性以及它們每種屬性在之前詞頻模型中所占的權重。

5 結論

  本文基于產品評論挖掘理論、Fomell模型,使用文本挖掘、多元回歸、數據庫等方法和技術,完成了筆記本電腦領域特征詞匯的提取、產品評論的挖掘、滿意度評價模型的建立三項工作。本文研究思路不同于以往的頭腦風暴、問卷調研、AHP等建立評價指標體系的思路,充分利用了網絡論壇上豐富的消費者評論信息,提取和挖掘消費者最真實的產品使用體驗來建立指標體系和滿意度模型,研究成果對消費者和產品制造商有參考借鑒意義。

  參考文獻

  [1] TURNEY P. Thumbs up or thumbs down semantic orientation applied to unsupervised classification of reviews[J]. Proceedings of the Association of Computational Linguistics(ACL02), Philadelphia, 2002: 417-424.

  [2] DAVE K, LAWRENCE S, PENNOCK D M. Mining the peanut gallery: opinion extraction and semantic classification of product reviews[C]. Proceedings of the 12th International Conference on World Wide Web, New York, 2003:519-528.

  [3] ABRAHAMS A S, Jiao Jian, WANG G A, et al. Vehicle defect discovery from social media[J]. Decision Support Systems, 2012(54): 87-97.

  [4] 郗亞輝,張明,袁方,等.產品評論挖掘研究綜述[J].山東大學學報(理學版),2011,46(5):16-23,38.

  [5] 易力,王麗亞.基于觀點挖掘的產品可用性建模與評價[J].計算機工程,2012,38(16):270-274.

  [6] 李芳,何婷婷,宋樂,等.評價主題挖掘及其傾向性識別[J].計算機科學,2012,39(6):159-162.

  [7] 唐曉波,王洪艷.微博產品評論挖掘模型研究[J].情報雜志,2013,32(2):107-111,127.


此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美不卡视频| 国产欧美日韩免费| 欧美制服丝袜| 亚洲在线一区二区| 一区二区三区国产在线| 亚洲欧洲美洲综合色网| 久久狠狠婷婷| 亚洲二区在线| 91久久中文字幕| 91久久中文| 亚洲精选在线观看| 日韩视频在线免费| 亚洲美女视频网| 日韩一区二区精品葵司在线| 日韩视频不卡| 一区二区日韩精品| 亚洲少妇自拍| 亚洲免费影院| 欧美在线国产精品| 欧美在线二区| 久久九九精品99国产精品| 久久精品中文字幕一区| 久久亚洲欧洲| 欧美成人午夜激情视频| 欧美激情国产精品| 欧美日韩国产一区二区三区| 欧美日韩一区视频| 国产精品成人在线观看| 国产精品视频免费| 国产自产v一区二区三区c| 在线精品观看| 亚洲日本视频| 中文在线资源观看网站视频免费不卡 | 99re国产精品| 亚洲一区二区三区四区五区黄| 亚洲欧美影音先锋| 久久久精品国产一区二区三区| 久久午夜羞羞影院免费观看| 欧美成人国产| 国产精品成人一区二区三区吃奶 | 欧美久久久久久| 欧美三级电影一区| 国产精品日韩欧美大师| 国产亚洲精品成人av久久ww| 黄色精品在线看| 日韩亚洲欧美一区| 欧美夜福利tv在线| 亚洲人成77777在线观看网| 一区二区三区av| 欧美专区中文字幕| 欧美激情性爽国产精品17p| 欧美午夜一区二区| 韩国av一区| 一区二区不卡在线视频 午夜欧美不卡在| 亚洲一区二区高清| 亚洲国产精品综合| 亚洲综合国产| 久久亚洲精选| 欧美午夜电影一区| 亚洲国产精品黑人久久久| 久久手机免费观看| 欧美日韩高清不卡| 国产精品资源在线观看| 亚洲二区视频在线| 亚洲一区精品视频| 91久久国产精品91久久性色| 亚洲欧美国产制服动漫| 蜜臀av性久久久久蜜臀aⅴ四虎| 欧美视频中文一区二区三区在线观看 | 亚洲综合成人在线| 亚洲精品中文字幕女同| 午夜老司机精品| 欧美成人免费播放| 国产欧美日韩精品在线| 亚洲欧洲日产国码二区| 欧美在线视频一区| 亚洲免费影视| 欧美久久一区| 极品裸体白嫩激情啪啪国产精品| 一区二区三区免费观看| 亚洲激情第一页| 久久精品国产99| 欧美视频在线视频| 亚洲激情中文1区| 欧美在线二区| 亚洲欧美网站| 欧美日韩亚洲综合在线| 在线精品亚洲一区二区| 欧美一级久久| 香蕉免费一区二区三区在线观看 | 国产精品v欧美精品∨日韩| 亚洲福利精品| 久久精品91久久久久久再现| 亚洲欧美日韩在线观看a三区 | 欧美一区二区在线免费观看| 亚洲一区二区毛片| 欧美韩日一区| 国产一区二区三区四区五区美女 | 亚洲欧美资源在线| 欧美日韩精品在线视频| 亚洲欧洲精品一区二区三区波多野1战4| 久久av在线| 久久精品91久久久久久再现| 国产精品户外野外| 99精品国产一区二区青青牛奶| 亚洲美女精品一区| 欧美成人伊人久久综合网| 极品日韩久久| 欧美一区二区三区四区高清| 亚洲欧美日韩精品久久亚洲区| 欧美日韩综合一区| 亚洲美女色禁图| 一个人看的www久久| 欧美另类高清视频在线| 亚洲激情欧美| 日韩视频免费在线| 欧美激情一区二区三区高清视频| 亚洲国产精品欧美一二99| 91久久国产综合久久| 欧美成人免费在线| 亚洲丰满少妇videoshd| 亚洲欧洲日本在线| 欧美成人在线网站| 亚洲国产91精品在线观看| 亚洲黄色大片| 欧美激情导航| 日韩亚洲欧美成人一区| 亚洲图片欧美午夜| 欧美午夜a级限制福利片| 亚洲天堂av在线免费观看| 亚洲免费一级电影| 国产精品亚洲激情| 欧美一级欧美一级在线播放| 久久久久久久网站| 亚洲电影免费| 中国女人久久久| 国产精品国产亚洲精品看不卡15| 亚洲一区二区三区成人在线视频精品| 香蕉久久精品日日躁夜夜躁| 国产亚洲一区二区三区| 久久精品人人做人人爽| 欧美福利电影在线观看| 亚洲人成在线影院| 亚洲一区三区在线观看| 国产精品一区二区久久| 欧美一区二区三区的| 欧美69视频| 一本一本a久久| 欧美在线日韩在线| 伊甸园精品99久久久久久| 99亚洲伊人久久精品影院红桃| 欧美午夜www高清视频| 香蕉视频成人在线观看| 蘑菇福利视频一区播放| 亚洲麻豆视频| 久久成人在线| 91久久精品美女| 午夜欧美大片免费观看| 狠狠久久亚洲欧美专区| 一本久久综合亚洲鲁鲁| 国产精品一区二区在线观看网站 | 中国亚洲黄色| 久久久久9999亚洲精品| 最新国产成人在线观看| 亚洲欧美久久久| 尹人成人综合网| 亚洲一区二区三区成人在线视频精品| 国产欧美91| 亚洲精品乱码久久久久久| 国产精品videosex极品| 久久激情视频久久| 欧美日韩性视频在线| 午夜精品婷婷| 欧美精品不卡| 欧美在线播放高清精品| 欧美日韩少妇| 久久精品青青大伊人av| 欧美午夜精品久久久久久久| 亚洲电影视频在线| 国产精品久久久久久五月尺| 亚洲国产美国国产综合一区二区| 欧美午夜欧美| 亚洲日本电影| 国产日产精品一区二区三区四区的观看方式 | 亚洲国产欧美国产综合一区 | 国产精品永久免费观看| 亚洲免费观看| 国产一区二区三区久久悠悠色av| 在线中文字幕一区| 一区二区三区在线视频播放| 亚洲欧美中文在线视频| 亚洲国产一区二区三区a毛片 | 欧美成人免费视频| 欧美在线播放高清精品| 国产精品国产三级国产普通话蜜臀 | 欧美成人免费在线观看| 午夜免费日韩视频| 欧美色道久久88综合亚洲精品| 亚洲国产精品专区久久| 国产三级欧美三级|