《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 針對(duì)在線(xiàn)教育情感分析的數(shù)據(jù)擴(kuò)充研究
針對(duì)在線(xiàn)教育情感分析的數(shù)據(jù)擴(kuò)充研究
網(wǎng)絡(luò)安全與數(shù)據(jù)治理 2022年 第1期
黃偉強(qiáng)1,劉 海2,梁韜文2,楊海華2
(1.華南師范大學(xué) 網(wǎng)絡(luò)中心,廣東 廣州510631;2.華南師范大學(xué) 計(jì)算機(jī)學(xué)院,廣東 廣州510631)
摘要: 在互聯(lián)網(wǎng)上大量主觀性的評(píng)論具有豐富的研究?jī)r(jià)值,可以通過(guò)對(duì)評(píng)論的分析獲取評(píng)論的情感極性。在對(duì)大量評(píng)論進(jìn)行情感分析時(shí),存在時(shí)間和人力消耗過(guò)多等問(wèn)題,針對(duì)該問(wèn)題,提出了基于聚類(lèi)分析的文本數(shù)據(jù)擴(kuò)充方法:在對(duì)少量關(guān)鍵數(shù)據(jù)進(jìn)行標(biāo)注的基礎(chǔ)上,通過(guò)聚類(lèi)分析標(biāo)注大量數(shù)據(jù),以減少情感分析在實(shí)際應(yīng)用中的成本。以在線(xiàn)教育平臺(tái)的評(píng)論為例,對(duì)目前多個(gè)主流在線(xiàn)教育平臺(tái)上爬取的共569 970條中文評(píng)論數(shù)據(jù)進(jìn)行少量標(biāo)注,然后使用該方法進(jìn)行數(shù)據(jù)擴(kuò)充,最后基于目前多個(gè)主流機(jī)器學(xué)習(xí)模型和卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行情感分析訓(xùn)練。研究結(jié)果表明,數(shù)據(jù)處理經(jīng)過(guò)聚類(lèi)后取得較好的數(shù)據(jù)擴(kuò)充效果,其中采用卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行的情感分析,準(zhǔn)確度可以達(dá)到96.5%。
中圖分類(lèi)號(hào): TP391
文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.20044/j.csdg.2097-1788.2022.01.015
引用格式: 黃偉強(qiáng),劉海,梁韜文,等. 針對(duì)在線(xiàn)教育情感分析的數(shù)據(jù)擴(kuò)充研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2022,41(1):93-100.
A data augmentation method for online education sentiment analysis
Huang Weiqiang1,Liu Hai2,Liang Taowen2,Yang Haihua2
(1.Network Center,South China Normal University,Guangzhou 510631,China; 2.School of Computer Science,South China Normal University,Guangzhou 510631,China)
Abstract: A large number of subjective comments have rich research value on the Internet. The sentiment polarity of the comments can be obtained through the sentiment analysis of the text. However, there are many problems such as excessive time and human resource consumption in sentiment analysis of massive text comments. In response to the above problems, a method of augmenting data based on cluster analysis is proposed to reduce the cost of sentiment analysis in practical applications. The method can label a large amount of data based on a small amount of key data. Taking reviews on online education platforms as an example, in this paper, a small number of data are labelled on a total of 569 970 Chinese comments crawled on many mainstream online education platforms and then augmented using the method mentioned in this paper,four popular machine learning models and the CNN(Convolutional Neural Network) model are used in the sentiment analysis. The experimental results show that the data processing achieves better data expansion effect after clustering,and the Chinese sentiment analysis model based on the convolutional neural network has an accuracy of 96.5%.
Key words : text data augmentation;sentiment analysis;natural language processing;cluster analysis

0 引言

隨著信息技術(shù)的飛速發(fā)展,在線(xiàn)教育逐漸興起,越來(lái)越多的人在在線(xiàn)教育課程中留下了有價(jià)值的評(píng)論,通過(guò)對(duì)這些評(píng)論進(jìn)行情感分析可以達(dá)到多方面的目的,如分析學(xué)生對(duì)課程的滿(mǎn)意度、調(diào)查老師授課水平、挖掘課程質(zhì)量等。 

情感分析(Sentiment Analysis),又稱(chēng)為情感傾向性分析[1],目的是找出文本中情感的正負(fù)性,如正面或負(fù)面、積極或消極,并且把這種正負(fù)性數(shù)值化,以百分比或者正負(fù)值的方式表現(xiàn)出來(lái)。情感分析的研究方法大致可以分為兩種:一是基于情感詞典的情感分析[2],主要通過(guò)建立情感詞典或領(lǐng)域詞典及通過(guò)文本中帶有極性的情感詞進(jìn)行計(jì)算來(lái)獲取文本的極性,由于依賴(lài)于情感詞典,存在覆蓋率不足等缺點(diǎn);二是基于機(jī)器學(xué)習(xí)的情感分析,包括監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)三種方法,其中與監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)相比,半監(jiān)督學(xué)習(xí)通過(guò)少量標(biāo)注數(shù)據(jù)和大量無(wú)標(biāo)注數(shù)據(jù)進(jìn)行識(shí)別,既不用對(duì)所有的數(shù)據(jù)進(jìn)行標(biāo)注,也不依賴(lài)先驗(yàn)經(jīng)驗(yàn),有較好的實(shí)用性,從而被許多學(xué)者應(yīng)用在情感分析問(wèn)題上,如陳珂等[3]利用基于分類(lèi)器集成的self-training方法進(jìn)行情感分析研究,使用少量標(biāo)注樣本和大量未標(biāo)注樣本來(lái)進(jìn)行情感分析訓(xùn)練,準(zhǔn)確率達(dá)86%。

數(shù)據(jù)擴(kuò)充[4]是一種結(jié)合機(jī)器學(xué)習(xí)使用的方法,在訓(xùn)練樣本不足的情況下,可使模型訓(xùn)練更好地?cái)M合,通過(guò)與半監(jiān)督的方法相結(jié)合,可達(dá)到標(biāo)注少量數(shù)據(jù)以擴(kuò)充至大量訓(xùn)練數(shù)據(jù)的效果。數(shù)據(jù)擴(kuò)充方法目前已被用于圖像、交通、醫(yī)療等領(lǐng)域[5-7],目前主流的數(shù)據(jù)擴(kuò)充方法有圖像翻轉(zhuǎn)、隨機(jī)噪聲、標(biāo)簽傳播等[8]。

情感分析目前已被應(yīng)用于如電影評(píng)論、書(shū)籍評(píng)論、微博短評(píng)等多個(gè)領(lǐng)域,但在在線(xiàn)教育課程評(píng)論領(lǐng)域的應(yīng)用還較缺乏,把情感分析應(yīng)用在在線(xiàn)教育課程評(píng)論上存在著各種挑戰(zhàn),如評(píng)論數(shù)據(jù)的獲取、評(píng)論數(shù)據(jù)的標(biāo)注等。為了解決以上問(wèn)題,本文借鑒半監(jiān)督學(xué)習(xí)的方法,提出基于聚類(lèi)分析的文本數(shù)據(jù)擴(kuò)充方法:對(duì)少量關(guān)鍵數(shù)據(jù)進(jìn)行標(biāo)注,并通過(guò)聚類(lèi)分析獲得大量已標(biāo)注數(shù)據(jù)。在目前主流在線(xiàn)教育平臺(tái)爬取的569 970條課程評(píng)論中選取1 000條關(guān)鍵數(shù)據(jù)進(jìn)行標(biāo)注并使用本文數(shù)據(jù)擴(kuò)充方法擴(kuò)充至10萬(wàn)條標(biāo)注數(shù)據(jù),分別利用SVM[9]、RandomForest[10]、AdaBoost[11]、GradientBoost[12]和CNN模型對(duì)標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,實(shí)驗(yàn)表明,與目前主流的LabelSpreading算法相比,本文的數(shù)據(jù)擴(kuò)充方法均有準(zhǔn)確率上的優(yōu)勢(shì)。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://m.jysgc.com/resource/share/2000004618




作者信息:

黃偉強(qiáng)1,劉  海2,梁韜文2,楊海華2

(1.華南師范大學(xué) 網(wǎng)絡(luò)中心,廣東 廣州510631;2.華南師范大學(xué) 計(jì)算機(jī)學(xué)院,廣東 廣州510631)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美成人精品福利| 国产精品久久77777| 亚洲午夜精品福利| 99国内精品| 亚洲美女在线国产| 91久久精品久久国产性色也91| 欧美一区二区视频在线观看| 午夜精彩视频在线观看不卡| 亚洲欧美在线高清| 亚洲欧美另类在线观看| 亚洲性夜色噜噜噜7777| 亚洲午夜在线观看视频在线| 亚洲最新合集| 在线亚洲免费| 亚洲自拍啪啪| 欧美伊久线香蕉线新在线| 性欧美长视频| 久久精品二区| 亚洲国产日韩欧美综合久久| 91久久精品日日躁夜夜躁国产| 亚洲国产小视频在线观看| 最新亚洲激情| 一区二区三区日韩精品视频| 中文在线资源观看网站视频免费不卡 | 久久九九全国免费精品观看| 久久久91精品国产一区二区精品| 久久久蜜桃精品| 欧美成人自拍视频| 欧美日韩精品在线| 国产精品欧美一区二区三区奶水 | 国产日韩欧美二区| 狠狠色伊人亚洲综合成人| 亚洲第一福利在线观看| 亚洲一区二区成人在线观看| 亚洲一区二区精品在线| 亚洲午夜视频在线| 午夜久久电影网| 欧美在线日韩精品| 另类天堂av| 欧美日韩xxxxx| 国产精品久久久久av| 国产九色精品成人porny| 国产精品亚洲片夜色在线| 亚洲欧美久久久| 亚洲国产欧美一区| 亚洲午夜女主播在线直播| 亚洲午夜精品久久久久久app| 国产精一区二区三区| 亚洲精品久久久久久一区二区 | 国产精品麻豆欧美日韩ww | 日韩视频在线一区二区三区| 久久夜色精品国产欧美乱| 欧美一区二区视频在线观看2020| 久久亚洲色图| 欧美日本国产在线| 国产九九精品视频| 亚洲大片在线| 亚洲视频一二三| 亚洲电影专区| 亚洲尤物视频网| 久久综合九色综合久99| 欧美视频在线观看免费网址| 国产一区二区三区免费不卡| 亚洲青涩在线| 欧美在线视屏| 亚洲专区一二三| 免费日韩一区二区| 国产精品国色综合久久| 1769国内精品视频在线播放| 亚洲欧美精品伊人久久| 亚洲精选在线观看| 久久久噜噜噜久久人人看| 欧美色播在线播放| 亚洲第一精品影视| 亚洲免费网址| 一个色综合av| 蜜桃久久av一区| 国产欧美一区二区在线观看| 亚洲黄色在线观看| 欧美在线看片a免费观看| 亚洲一卡二卡三卡四卡五卡| 免费高清在线视频一区·| 国产欧美一区二区精品性| 亚洲美女中出| 亚洲精选视频免费看| 久久久久国产精品麻豆ai换脸| 欧美无砖砖区免费| 亚洲国产一区二区视频| 欧美一区二区精美| 午夜欧美视频| 欧美日韩精品一区二区| 影视先锋久久| 欧美在线free| 欧美在线视频免费观看| 国产精品第十页| 日韩一二三在线视频播| 日韩视频精品在线| 麻豆freexxxx性91精品| 国产午夜精品美女毛片视频| 亚洲一区二区三区视频播放| 在线视频欧美日韩| 欧美黄免费看| 亚洲国产精品黑人久久久| 亚洲福利视频专区| 久久深夜福利免费观看| 国产区在线观看成人精品| 在线视频中文亚洲| 亚洲一区在线看| 欧美日韩中文精品| 亚洲伦理在线| 一区二区三区高清在线观看| 欧美精品一区二区三区高清aⅴ| 影音先锋久久久| 亚洲国产美国国产综合一区二区| 久久青草久久| 尤物精品在线| 亚洲国产一区二区a毛片| 久久综合九色综合欧美就去吻| 狠狠色综合色综合网络| 久久高清福利视频| 久久综合九色| 136国产福利精品导航| 最新国产拍偷乱拍精品 | 国产精品国产福利国产秒拍| 亚洲无线观看| 欧美一区二区视频免费观看| 国产欧美不卡| 欧美在线免费视频| 老牛影视一区二区三区| 亚洲成人资源| 一区二区欧美国产| 国产精品国产三级国产普通话蜜臀 | 亚洲精品欧美极品| 欧美激情一区三区| 亚洲精品影视| 亚洲伊人久久综合| 国产精品一区视频网站| 欧美制服丝袜第一页| 美玉足脚交一区二区三区图片| 亚洲精品123区| 亚洲在线成人精品| 国产手机视频一区二区| 亚洲福利av| 欧美日韩不卡| 一区二区动漫| 久久se精品一区二区| 在线免费观看视频一区| 一区二区三区国产盗摄| 国产精品入口| 亚洲激情视频网站| 欧美三级黄美女| 欧美一级午夜免费电影| 男人天堂欧美日韩| 国产精品99久久不卡二区| 欧美中文字幕第一页| 亚洲电影免费| 亚洲一区二区三区在线观看视频| 国产视频亚洲精品| 亚洲精品国产精品国产自| 国产精品v欧美精品v日本精品动漫| 性做久久久久久久免费看| 欧美黄色视屏| 亚洲影院色在线观看免费| 久久资源av| 中日韩美女免费视频网址在线观看 | 亚洲一级电影| 久久一区国产| 日韩一区二区免费高清| 久久精品国产亚洲精品| 亚洲精品国久久99热| 久久都是精品| 亚洲精品一区在线观看香蕉| 久久国产精品99精品国产| 亚洲人成小说网站色在线| 午夜亚洲福利| 最新国产成人在线观看| 欧美一区中文字幕| 亚洲精品三级| 久久精品国产一区二区电影| 亚洲看片网站| 久久中文字幕一区| 亚洲与欧洲av电影| 欧美国产日韩精品免费观看| 午夜精品在线观看| 在线视频欧美一区| 日韩视频中文| 久久久精品国产免费观看同学| 亚洲精品视频一区| 久久久久久国产精品一区| 99国产精品视频免费观看| 久久久亚洲国产美女国产盗摄| 夜夜爽99久久国产综合精品女不卡 | 国产精品久久久久影院亚瑟| 亚洲三级免费| 国内伊人久久久久久网站视频| 亚洲一区二区视频在线| 亚洲国产精品黑人久久久| 久久久免费精品视频| 亚洲免费在线电影| 欧美亚洲不卡|