《電子技術應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 設計應用 > 基于爬蟲和TFIDF-NB算法的微博情感分析
基于爬蟲和TFIDF-NB算法的微博情感分析
2021年電子技術應用第4期
楊 戈1,2,楊麓濤1
1.北京師范大學珠海分校 智能多媒體技術重點實驗室,廣東 珠海519087; 2.北京大學深圳研究生院 深圳物聯(lián)網(wǎng)智能感知技術工程實驗室,廣東 深圳518055
摘要: 針對微博網(wǎng)絡輿情信息量大、無規(guī)則、隨機變化的特點,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,設計與實現(xiàn)了一個基于Scrapy框架的微博評論爬蟲,將某熱點事件的若干條微博評論進行爬取并存進數(shù)據(jù)庫,然后進行文本分割、LDA(Latent Dirichlet Allocation)主題聚類,最后使用TFIDF-NB算法進行情感分類。實驗結果表明,TFIDF-NB算法平均準確率高于線性支持向量機算法和K近鄰算法,在精確率和召回率方面高于K近鄰算法,具有較好的情感分類效果。
中圖分類號: TN011;TP391.41
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200748
中文引用格式: 楊戈,楊麓濤. 基于爬蟲和TFIDF-NB算法的微博情感分析[J].電子技術應用,2021,47(4):59-62,66.
英文引用格式: Yang Ge,Yang Lutao. Sentiment analysis of Weibo based on TFIDF-NB algorithm[J]. Application of Electronic Technique,2021,47(4):59-62,66.
Sentiment analysis of Weibo based on TFIDF-NB algorithm
Yang Ge1,2,Yang Lutao1
1.Key Laboratory of Intelligent Multimedia Technology,Beijing Normal University(Zhuhai Campus),Zhuhai 519087,China; 2.Engineering Lab on Intelligent Perception for Internet of Things(ELIP),Shenzhen Graduate School,Peking University, Shenzhen 518055,China
Abstract: In view of the large amount of public opinion information on Weibo, irregular and random changes, this paper proposes a Weibo sentiment analysis method based on TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes) algorithm. By coding a Weibo comment crawler based on the Scrapy framework, several Weibo comments on a hot event are crawled and stored in the database. Then text segmentation and LDA(Latent Dirichlet Allocation) topic clustering are performed. And finally the TFIDF-NB algorithm is used for sentiment classification. Experimental results show that the accuracy of the algorithm is higher than that of the standard linear Support Vector Machine algorithm and the K-Nearest Neighbor algorithm, and it is higher than the K-Nearest Neighbor algorithm in terms of accuracy and recall, and it has a better effect on sentiment classification.
Key words : Weibo public opinion;web crawler;sentiment classification

0 引言

    網(wǎng)絡輿情是指網(wǎng)絡用戶對社會各方面熱點問題所發(fā)表的見解和建議的輿論,是社會輿情的一種體現(xiàn),是公眾對社會中各種熱點事件和問題所表達的態(tài)度、想法、情緒等的集合。互聯(lián)網(wǎng)的快速發(fā)展使得網(wǎng)絡輿情的形成和傳播速度不斷提升,對社會的影響巨大。

    文獻[1]證明了網(wǎng)絡輿情的發(fā)展具有混沌的特性,即表現(xiàn)為亂序、無規(guī)則、隨機變化。在網(wǎng)絡輿情傳播的過程中,微博給網(wǎng)絡輿情的形成、發(fā)酵和傳播提供了一個強大的互聯(lián)網(wǎng)平臺,給其用戶提供了一個向全世界分享信息、發(fā)表評論和表達訴求的平臺,這些輿論內容在短時間內會大規(guī)模地擴散,甚至會影響事件的走向。

    本文首先實現(xiàn)一個基于Scrapy框架的微博評論爬蟲,將某熱點事件的若干條微博評論進行爬取并存進數(shù)據(jù)庫,然后進行文本分割和LDA(Latent Dirichlet Allocation)主題聚類,最后采用TFIDF-NB(Term Frequency Inverse Document Frequency-Navie Bayes)算法進行文本情感分類

    (1)爬蟲

    爬蟲全稱為網(wǎng)絡爬蟲,是一種可以對互聯(lián)網(wǎng)上的信息進行自動化瀏覽的網(wǎng)絡腳本或程序,可實現(xiàn)對海量互聯(lián)網(wǎng)信息進行瀏覽、爬取等操作,并將抓取到的信息存儲于本地中。

    網(wǎng)絡爬蟲可以分為4種[2]:通用網(wǎng)絡爬蟲[3]、主題網(wǎng)絡爬蟲[4]、增量式網(wǎng)絡爬蟲[5]、深層網(wǎng)絡爬蟲[6-7]

    (2)情感分類

    情感分析是指識別文本中潛在的想法、情感和態(tài)度的方法[8]。情感分類是情感分析的核心內容,情感分類的作用是識別文本數(shù)據(jù)中的觀點,對情感的積極或消極情緒進行分類[9]

    目前情感分類主要有兩種方法,一種是基于詞典的方法[10-13],另一種是基于機器學習的方法[14-16]




本文詳細內容請下載:http://m.jysgc.com/resource/share/2000003464




作者信息:

楊  戈1,2,楊麓濤1

(1.北京師范大學珠海分校 智能多媒體技術重點實驗室,廣東 珠海519087;

2.北京大學深圳研究生院 深圳物聯(lián)網(wǎng)智能感知技術工程實驗室,廣東 深圳518055)

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
精品999久久久| 西瓜成人精品人成网站| 国产精品亚洲一区| 欧美日韩国产va另类| 欧美精品aa| 欧美激情精品久久久久久大尺度 | 亚洲欧美日韩精品久久| 亚洲人屁股眼子交8| 亚洲成色777777在线观看影院| 国产视频在线观看一区二区三区| 欧美一区二区三区视频免费播放 | 美女精品国产| 久久精品亚洲精品国产欧美kt∨| 亚洲三级视频| 亚洲电影免费观看高清完整版在线观看| 亚洲福利在线看| 国产综合色精品一区二区三区| 欧美日韩精品| 欧美日韩国产在线播放网站| 欧美激情综合亚洲一二区| 欧美α欧美αv大片| 欧美成人一区在线| 欧美精品在线免费| 欧美日韩国产综合视频在线| 欧美日韩精品免费在线观看视频| 久久爱www| 久久久精品久久久久| 久久资源在线| 欧美成人中文字幕| 欧美日韩三级电影在线| 欧美色网在线| 国产欧美一区二区在线观看| 国产午夜精品全部视频播放| 国内精品免费午夜毛片| 在线观看三级视频欧美| 亚洲人成啪啪网站| 亚洲视频一区二区| 亚欧成人精品| 亚洲肉体裸体xxxx137| 亚洲婷婷在线| 久久狠狠婷婷| 欧美—级高清免费播放| 国产精品视频福利| 永久免费精品影视网站| 日韩一区二区高清| 欧美伊人久久久久久久久影院| 亚洲视频观看| 午夜日韩av| 日韩一区二区精品葵司在线| 亚洲欧美日韩精品综合在线观看| 亚洲精品一区二区三区av| 夜夜嗨av一区二区三区四季av| 欧美在线黄色| 亚洲欧洲精品一区二区三区不卡 | 在线观看日韩国产| 日韩亚洲欧美在线观看| 欧美一级免费视频| 亚洲精品乱码久久久久久蜜桃91| 久久精品国产综合精品| 亚洲欧洲日本一区二区三区| 亚洲在线视频一区| 六月婷婷一区| 国产精品久久久久久久久借妻 | 亚洲免费视频一区二区| 久久精品亚洲热| 亚洲无线一线二线三线区别av| 亚洲啪啪91| 亚洲综合大片69999| 蜜桃视频一区| 国产精品久久久久秋霞鲁丝| 禁断一区二区三区在线| 一区二区三区视频观看| 最新日韩在线| 久久精品国产999大香线蕉| 欧美精品日韩www.p站| 国产在线不卡精品| 亚洲伊人伊色伊影伊综合网| 亚洲国产成人精品久久久国产成人一区| 午夜欧美大片免费观看| 亚洲精品久久久久久一区二区| 亚洲日本在线视频观看| 亚洲欧美日韩一区二区三区在线| 亚洲男人天堂2024| 麻豆精品国产91久久久久久| 国产精品久久久久久一区二区三区| 国产精品www994| 亚洲第一精品夜夜躁人人爽| 性欧美暴力猛交另类hd| 亚洲一级二级| 欧美激情小视频| 国产在线视频不卡二| 日韩小视频在线观看| 亚洲精品一区二区三区在线观看| 日韩午夜电影在线观看| 欧美有码在线观看视频| 欧美午夜精品久久久久久浪潮 | 国产精品久久97| 亚洲激情在线播放| 亚洲国产高清一区| 欧美影片第一页| 欧美午夜在线视频| 亚洲精品国产欧美| 91久久综合亚洲鲁鲁五月天| 久久精品日韩| 国产啪精品视频| 亚洲私拍自拍| 亚洲一区二区三区在线看| 欧美日本一道本| 亚洲国产日韩欧美| 91久久精品美女高潮| 久久久亚洲国产美女国产盗摄| 免费试看一区| 在线成人亚洲| 久久精品91久久久久久再现| 欧美一区二区三区免费视频| 国产精品国产三级国产专区53 | 欧美一区二区免费视频| 欧美系列电影免费观看| 亚洲毛片一区| 一区二区三区四区蜜桃| 麻豆精品一区二区综合av| 精品成人乱色一区二区| 亚洲福利视频三区| 老巨人导航500精品| 好吊成人免视频| 亚洲国产导航| 欧美jjzz| 亚洲精品国产精品国产自| 亚洲毛片视频| 欧美日韩午夜在线| 一本色道久久加勒比精品| 亚洲视频香蕉人妖| 欧美性事免费在线观看| 亚洲网站在线播放| 午夜一区二区三区不卡视频| 国产麻豆日韩| 亚洲电影天堂av| 欧美jizzhd精品欧美巨大免费| 国产精品区一区| 亚洲欧美区自拍先锋| 欧美一区2区视频在线观看| 国产一区91精品张津瑜| 亚洲丰满少妇videoshd| 欧美精品久久一区二区| 一区二区三区产品免费精品久久75| 亚洲国产色一区| 欧美xart系列高清| 一区二区欧美在线| 欧美一级视频一区二区| 国产一区二区激情| 亚洲人成在线观看一区二区| 欧美日韩国产一中文字不卡| 一本一本久久a久久精品综合麻豆| 亚洲黄一区二区三区| 欧美黑人多人双交| 一区二区三区av| 久久精品中文字幕免费mv| 亚洲丁香婷深爱综合| 一区二区三区高清不卡| 国产精品一区免费在线观看| 亚洲高清在线观看一区| 欧美日韩亚洲天堂| 香蕉乱码成人久久天堂爱免费 | 国产日韩欧美一区| 久久精品欧美| 欧美日韩美女在线| 性欧美18~19sex高清播放| 欧美激情视频在线免费观看 欧美视频免费一| 国内成+人亚洲| 亚洲国产精品欧美一二99| 欧美日韩一区二区三区| 欧美亚洲免费高清在线观看| 欧美激情一区在线| 性感少妇一区| 欧美人在线观看| 亚洲欧美日韩精品久久久| 欧美成人一二三| 亚洲欧美中日韩| 欧美激情国产日韩精品一区18| 在线国产亚洲欧美| 午夜精品国产| 亚洲人体影院| 久久久久久久久岛国免费| 日韩一级二级三级| 开心色5月久久精品| 亚洲小说春色综合另类电影| 老司机一区二区| 亚洲一区二区四区| 欧美日韩成人免费| 久久精品国产77777蜜臀| 欧美色区777第一页| 亚洲欧洲精品一区二区| 国产视频在线观看一区二区三区| 欧美在线播放一区二区| 欧美日韩一区二区在线播放| 欧美一区二区三区视频免费| 欧美午夜不卡在线观看免费| 亚洲激情在线观看视频免费| 国产欧美二区| 亚洲欧美不卡|