《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 針對在線教育情感分析的數據擴充研究
針對在線教育情感分析的數據擴充研究
網絡安全與數據治理 2022年 第1期
黃偉強1,劉 海2,梁韜文2,楊海華2
(1.華南師范大學 網絡中心,廣東 廣州510631;2.華南師范大學 計算機學院,廣東 廣州510631)
摘要: 在互聯網上大量主觀性的評論具有豐富的研究價值,可以通過對評論的分析獲取評論的情感極性。在對大量評論進行情感分析時,存在時間和人力消耗過多等問題,針對該問題,提出了基于聚類分析的文本數據擴充方法:在對少量關鍵數據進行標注的基礎上,通過聚類分析標注大量數據,以減少情感分析在實際應用中的成本。以在線教育平臺的評論為例,對目前多個主流在線教育平臺上爬取的共569 970條中文評論數據進行少量標注,然后使用該方法進行數據擴充,最后基于目前多個主流機器學習模型和卷積神經網絡模型進行情感分析訓練。研究結果表明,數據處理經過聚類后取得較好的數據擴充效果,其中采用卷積神經網絡模型進行的情感分析,準確度可以達到96.5%。
中圖分類號: TP391
文獻標識碼: A
DOI: 10.20044/j.csdg.2097-1788.2022.01.015
引用格式: 黃偉強,劉海,梁韜文,等. 針對在線教育情感分析的數據擴充研究[J].網絡安全與數據治理,2022,41(1):93-100.
A data augmentation method for online education sentiment analysis
Huang Weiqiang1,Liu Hai2,Liang Taowen2,Yang Haihua2
(1.Network Center,South China Normal University,Guangzhou 510631,China; 2.School of Computer Science,South China Normal University,Guangzhou 510631,China)
Abstract: A large number of subjective comments have rich research value on the Internet. The sentiment polarity of the comments can be obtained through the sentiment analysis of the text. However, there are many problems such as excessive time and human resource consumption in sentiment analysis of massive text comments. In response to the above problems, a method of augmenting data based on cluster analysis is proposed to reduce the cost of sentiment analysis in practical applications. The method can label a large amount of data based on a small amount of key data. Taking reviews on online education platforms as an example, in this paper, a small number of data are labelled on a total of 569 970 Chinese comments crawled on many mainstream online education platforms and then augmented using the method mentioned in this paper,four popular machine learning models and the CNN(Convolutional Neural Network) model are used in the sentiment analysis. The experimental results show that the data processing achieves better data expansion effect after clustering,and the Chinese sentiment analysis model based on the convolutional neural network has an accuracy of 96.5%.
Key words : text data augmentation;sentiment analysis;natural language processing;cluster analysis

0 引言

隨著信息技術的飛速發展,在線教育逐漸興起,越來越多的人在在線教育課程中留下了有價值的評論,通過對這些評論進行情感分析可以達到多方面的目的,如分析學生對課程的滿意度、調查老師授課水平、挖掘課程質量等。 

情感分析(Sentiment Analysis),又稱為情感傾向性分析[1],目的是找出文本中情感的正負性,如正面或負面、積極或消極,并且把這種正負性數值化,以百分比或者正負值的方式表現出來。情感分析的研究方法大致可以分為兩種:一是基于情感詞典的情感分析[2],主要通過建立情感詞典或領域詞典及通過文本中帶有極性的情感詞進行計算來獲取文本的極性,由于依賴于情感詞典,存在覆蓋率不足等缺點;二是基于機器學習的情感分析,包括監督學習、無監督學習和半監督學習三種方法,其中與監督學習和無監督學習相比,半監督學習通過少量標注數據和大量無標注數據進行識別,既不用對所有的數據進行標注,也不依賴先驗經驗,有較好的實用性,從而被許多學者應用在情感分析問題上,如陳珂等[3]利用基于分類器集成的self-training方法進行情感分析研究,使用少量標注樣本和大量未標注樣本來進行情感分析訓練,準確率達86%。

數據擴充[4]是一種結合機器學習使用的方法,在訓練樣本不足的情況下,可使模型訓練更好地擬合,通過與半監督的方法相結合,可達到標注少量數據以擴充至大量訓練數據的效果。數據擴充方法目前已被用于圖像、交通、醫療等領域[5-7],目前主流的數據擴充方法有圖像翻轉、隨機噪聲、標簽傳播等[8]。

情感分析目前已被應用于如電影評論、書籍評論、微博短評等多個領域,但在在線教育課程評論領域的應用還較缺乏,把情感分析應用在在線教育課程評論上存在著各種挑戰,如評論數據的獲取、評論數據的標注等。為了解決以上問題,本文借鑒半監督學習的方法,提出基于聚類分析的文本數據擴充方法:對少量關鍵數據進行標注,并通過聚類分析獲得大量已標注數據。在目前主流在線教育平臺爬取的569 970條課程評論中選取1 000條關鍵數據進行標注并使用本文數據擴充方法擴充至10萬條標注數據,分別利用SVM[9]、RandomForest[10]、AdaBoost[11]、GradientBoost[12]和CNN模型對標注數據進行訓練,實驗表明,與目前主流的LabelSpreading算法相比,本文的數據擴充方法均有準確率上的優勢。




本文詳細內容請下載:http://m.jysgc.com/resource/share/2000004618




作者信息:

黃偉強1,劉  海2,梁韜文2,楊海華2

(1.華南師范大學 網絡中心,廣東 廣州510631;2.華南師范大學 計算機學院,廣東 廣州510631)


此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲欧美一区二区视频| 欧美日韩免费网站| 伊人婷婷欧美激情| 亚洲一区二区高清视频| 国产亚洲欧洲一区高清在线观看| 国产精品久久福利| 亚洲片在线资源| 国产麻豆午夜三级精品| 亚洲免费观看在线观看| 国产区二精品视| 制服丝袜激情欧洲亚洲| 影音欧美亚洲| 久久久久久网址| 亚洲一区在线直播| 欧美大片18| 欧美一区二区三区免费观看视频| 欧美乱在线观看| 欧美综合国产| 国产日韩1区| 亚洲伊人一本大道中文字幕| 国产精品亚洲а∨天堂免在线| 欧美专区日韩专区| 国产精品午夜视频| 亚洲影院色无极综合| 一本色道久久综合亚洲精品按摩| 蜜桃视频一区| 欧美影院午夜播放| 国产一区二区三区久久 | 久久婷婷成人综合色| 性欧美18~19sex高清播放| 国产精品久久久久一区二区三区共 | 麻豆久久婷婷| 久久国产福利| 国产揄拍国内精品对白| 久久av一区二区三区漫画| 国产欧美日韩亚洲精品| 久久se精品一区精品二区| 亚洲欧美精品| 国内精品久久久久久影视8 | 欧美午夜影院| 性欧美精品高清| 欧美自拍偷拍午夜视频| 亚洲国产中文字幕在线观看| 欧美激情一区二区在线| 亚洲一区久久| 欧美永久精品| 亚洲三级视频| 国产欧美激情| 蜜臀99久久精品久久久久久软件 | 日韩视频中文字幕| 亚洲视频中文| 久久青草福利网站| 亚洲一区在线观看视频| 欧美系列一区| 久久人体大胆视频| 亚洲午夜电影网| 亚洲高清不卡一区| 夜夜嗨一区二区| 精品盗摄一区二区三区| 欧美色网在线| 欧美成人资源网| 久久国产精品一区二区三区| 亚洲精品日产精品乱码不卡| 亚洲欧美久久久| 夜夜爽av福利精品导航| 一区二区三区无毛| 国产精品一卡二| 欧美日韩国产色综合一二三四| 久久久久久久综合| 亚洲欧美日韩精品一区二区| 亚洲卡通欧美制服中文| 欧美在线www| 亚洲免费中文| 亚洲视频在线视频| 洋洋av久久久久久久一区| 欧美视频在线观看免费网址| 午夜精品剧场| 亚洲一区二区三区乱码aⅴ蜜桃女| 亚洲第一黄色| 久久精品国产99国产精品| 午夜国产精品视频免费体验区| 一区二区三区四区国产| 亚洲精品视频免费在线观看| 亚洲国产天堂网精品网站| 国产日产亚洲精品| 香蕉免费一区二区三区在线观看| 亚洲免费av网站| 一本色道久久88综合日韩精品| 亚洲激情影院| 欧美女人交a| 一区二区日韩欧美| 亚洲一区欧美激情| 午夜久久久久久| 久久精品国产久精国产一老狼| 香蕉久久精品日日躁夜夜躁| 欧美影院午夜播放| 久久天天躁夜夜躁狠狠躁2022| 久久在精品线影院精品国产| 欧美成人首页| 欧美午夜精品理论片a级大开眼界| 久久久欧美一区二区| 欧美大片第1页| 国产精品国产馆在线真实露脸| 国产精品高潮呻吟久久| 国产一区二区三区av电影| 亚洲国产精品久久久久婷婷884| 亚洲人成在线播放网站岛国| 亚洲一区二区三区四区五区黄| 久久国产福利| 亚洲中字在线| 欧美凹凸一区二区三区视频| 欧美日韩久久不卡| 国产亚洲欧美另类中文| 91久久在线播放| 亚洲欧美综合网| 99精品国产一区二区青青牛奶| 欧美一区二区三区久久精品| 亚洲高清久久网| 亚洲午夜一区二区| 女仆av观看一区| 国产视频一区三区| 在线视频一区二区| 国产视频精品va久久久久久| 精品96久久久久久中文字幕无| 亚洲精品免费观看| 亚洲一区影院| 国产老女人精品毛片久久| 欧美激情91| 国产精品露脸自拍| 日韩视频一区二区三区| 亚洲国产午夜| 老色鬼久久亚洲一区二区| 国产精品久久久久久久久久久久久| 亚洲成人资源网| 亚洲高清不卡一区| 久久―日本道色综合久久| 国产精品久久精品日日| 亚洲国产精品一区制服丝袜| 欧美一区二区三区四区在线观看地址| 亚洲一区二区三区午夜| 欧美精品在线观看一区二区| 怡红院av一区二区三区| 亚洲电影免费| 毛片一区二区| 亚洲国产精品成人一区二区| 欧美在线看片| 久久久久久久久一区二区| 国产字幕视频一区二区| 亚洲小视频在线观看| 亚洲欧美综合精品久久成人| 国产精品magnet| 亚洲欧美日韩国产一区二区三区| 亚洲国产婷婷香蕉久久久久久99| 久久网站热最新地址| 在线成人av| 亚洲天堂av在线免费| 亚洲欧洲一区二区三区| 亚洲日本va在线观看| 亚洲一区免费| 国产在线精品成人一区二区三区| 亚洲欧美日韩天堂| 久久久久久亚洲精品杨幂换脸| 在线播放日韩欧美| 亚洲深夜福利| 国产一区二区三区视频在线观看| 亚洲国产精选| 欧美黄色片免费观看| 一区二区三区欧美在线观看| 亚洲在线成人| 你懂的国产精品永久在线| 一本久久综合亚洲鲁鲁五月天| 欧美一区二区在线免费播放| **网站欧美大片在线观看| 亚洲免费视频中文字幕| 国内久久婷婷综合| 国产精品99一区二区| 亚洲欧美久久久| 欧美日韩国产va另类| 久久精品国产欧美激情| 欧美日韩精品在线视频| 亚洲国产日韩精品| 欧美一区二区视频免费观看 | 日韩小视频在线观看| 久久人91精品久久久久久不卡| 亚洲少妇最新在线视频| 欧美777四色影视在线| 午夜精品视频| 国产精品夜夜夜一区二区三区尤| 一二三区精品福利视频| 亚洲国产精品成人久久综合一区 | 午夜激情久久久| 国产精品―色哟哟| 亚洲自拍都市欧美小说| 亚洲最新在线视频| 欧美偷拍一区二区| 亚洲一品av免费观看| 亚洲第一视频| 欧美激情一区二区三区| 亚洲精品女人| 亚洲精品一区二区三区四区高清|