《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 設(shè)計應(yīng)用 > 基于RoBERTa和多層次特征的中文事件抽取方法
基于RoBERTa和多層次特征的中文事件抽取方法
電子技術(shù)應(yīng)用 11期
樂楊,胡軍國,李耀
(浙江農(nóng)林大學(xué) 數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院,浙江 杭州 311300)
摘要: 針對中文事件抽取中語義表征不充分、特征提取不全面等問題,提出一種基于RoBERTa和多層次特征的中文事件抽取方法。通過RoBERTa預(yù)訓(xùn)練模型構(gòu)建字向量,并基于詞性標(biāo)注和觸發(fā)詞語義信息融入進(jìn)行字向量擴(kuò)展;其次使用雙向長短時記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)抽取全局特征和局部特征,并通過自注意力機(jī)制捕捉不同特征之間的關(guān)聯(lián),加強(qiáng)對重要特征的利用;最后通過條件隨機(jī)場實現(xiàn)BIO序列標(biāo)注,完成事件抽取。在DuEE1.0數(shù)據(jù)集上,觸發(fā)詞抽取和事件論元抽取的F1值達(dá)到86.9%和68.0%,優(yōu)于現(xiàn)有常用事件抽取模型,驗證了該方法的有效性。
中圖分類號:TP391
文獻(xiàn)標(biāo)志碼:A
DOI: 10.16157/j.issn.0258-7998.234136
引用格式: 樂楊,胡軍國,李耀. 基于RoBERTa和多層次特征的中文事件抽取方法[J]. 電子技術(shù)應(yīng)用,2023,49(11):49-54.
Chinese event extraction method based on RoBERTa and multi-level feature
Le Yang,Hu Junguo,Li Yao
(College of Mathematics and Computer Science, Zhejiang Agriculture &Forestry University, Hangzhou 311300, China)
Abstract: To address the issues of insufficient semantic representation and incomplete feature extraction in Chinese event extraction, a method based on RoBERTa and multi-level features is proposed. Firstly, by using the pre-trained RoBERTa model, word embeddings are constructed and extended based on syntactic and semantic information of trigger words. Specifically, part-of-speech tags and trigger word embeddings are integrated into the word embeddings. Secondly, global and local features are extracted using a bi-directional long short-term memory network and convolutional neural network, respectively. The self-attention mechanism is employed to capture the relationships among different features, emphasizing the utilization of important features. Finally, a conditional random field is used to achieve BIO sequence labeling, completing the event extraction process. On the DuEE1.0 dataset, the F1 scores of trigger word extraction and event argument extraction reach 86.9% and 68.0%, respectively, which are superior to existing common event extraction models, validating the effectiveness of this method.
Key words : event extraction;RoBERTa pretrained model;multi-level feature;self-attention mechanism;sequence labeling

【引言】

事件抽取作為一種信息抽取技術(shù),旨在從文本中識別和提取出事件的關(guān)鍵要素[1],以自動化處理大規(guī)模的非結(jié)構(gòu)化文本數(shù)據(jù),在知識圖譜[2]、信息檢索[3]、自動問答[4]、情報收集[5]等領(lǐng)域均有著廣泛的應(yīng)用。

近年來,隨著深度學(xué)習(xí)的發(fā)展,深度學(xué)習(xí)在事件抽取任務(wù)中取得了廣泛的應(yīng)用且取得了優(yōu)異的效果。基于深度學(xué)習(xí)的事件抽取方法,先將文本中的詞轉(zhuǎn)換成向量,再將向量作為模型的輸入進(jìn)行特征抽取和分類。目前使用最廣泛的詞向量工具是Word2Vec,但通過Word2Vec得到的詞向量是靜態(tài)的,只針對單獨(dú)的詞,無法解決中文詞語在不同環(huán)境下?lián)碛胁煌Z義信息的問題[6]。

同時大部分的神經(jīng)網(wǎng)絡(luò)模型著重于抽取向量中部分特征信息,無法覆蓋所有的特征信息。如卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)通過卷積操作提取向量中的局部特征,但由于卷積核大小和步幅的限制,可能導(dǎo)致一些全局上下文相關(guān)的特征被局部特征所掩蓋或丟失[7];雙向長短時記憶網(wǎng)絡(luò)(Bidirectional Long Short-Term Memory,BiLSTM)可以處理長序列數(shù)據(jù),提取全局特征,但無法直接捕捉文本中的詞與詞之間的關(guān)系[8]。

針對上述提到的中文語義復(fù)雜和特征信息抽取不全面,提出一種基于RoBERTa預(yù)訓(xùn)練模型[9]和多層次特征的中文事件抽取方法。本文的主要貢獻(xiàn)在于:

(1)采用RoBERTa預(yù)訓(xùn)練模型訓(xùn)練的詞向量,拼接詞性特征向量,獲取含有豐富語音的向量表示。并在論元抽取中基于Layer Normalization將觸發(fā)詞語義信息融入句子中,拼接字與觸發(fā)詞的距離向量,增強(qiáng)句子與觸發(fā)詞的關(guān)聯(lián)。

(2)利用CNN和BiLSTM抽取詞級特征和句子級特征,并采用注意力機(jī)制將特征聚焦于與事件更相關(guān)的特征上,滿足事件抽取的特征要求。

(3)將事件抽取視為序列標(biāo)注任務(wù),通過CRF和BIO序列標(biāo)注對句子中的每個字進(jìn)行標(biāo)注,得到多個觸發(fā)詞或事件論元,解決多事件抽取問題。


文章詳細(xì)內(nèi)容下載請點(diǎn)擊:基于RoBERTa和多層次特征的中文事件抽取方法AET-電子技術(shù)應(yīng)用-最豐富的電子設(shè)計資源平臺 (chinaaet.com)



【作者信息】

樂楊,胡軍國,李耀

(浙江農(nóng)林大學(xué) 數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院,浙江 杭州 311300)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲午夜激情网站| 亚洲国产精品久久久| 国内精品久久久久久久果冻传媒| 欧美中在线观看| 亚洲免费视频观看| 亚洲一区免费| 亚洲网站在线| 亚洲一区一卡| 亚洲一二三区精品| 亚洲网站在线观看| 亚洲欧美999| 亚洲免费中文| 欧美一区二区免费观在线| 亚洲永久免费| 洋洋av久久久久久久一区| 日韩午夜在线视频| 一本色道久久综合狠狠躁的推荐| 亚洲裸体视频| 这里只有精品视频在线| 亚洲无线观看| 亚洲免费小视频| 午夜视频一区| 久久精品网址| 麻豆精品网站| 久久精品卡一| 久久综合久久美利坚合众国| 免费看成人av| 欧美激情综合亚洲一二区| 欧美日韩高清不卡| 欧美午夜视频| 国产日韩精品一区二区三区| 国产综合香蕉五月婷在线| 娇妻被交换粗又大又硬视频欧美| 一区二区三区在线免费播放| 国产精品久久久久久久久久免费看| 欧美午夜精品久久久久久超碰| 国产精品国产a级| 国产日韩欧美高清| 在线观看欧美| 一区二区av| 西瓜成人精品人成网站| 午夜在线视频一区二区区别| 欧美主播一区二区三区| 亚洲国产一区二区精品专区| 亚洲国产va精品久久久不卡综合| 亚洲精美视频| 欧美另类在线播放| 欧美性猛交一区二区三区精品| 国产精品久久久久高潮| 国产主播一区二区三区四区| 欧美日韩一区二区在线视频 | 亚洲狼人精品一区二区三区| 99热免费精品在线观看| 国产精品久久久久久av福利软件| 久久精品国产999大香线蕉| 狼狼综合久久久久综合网| 欧美日韩精品久久久| 国产免费成人av| 亚洲大片免费看| 国产精品99久久久久久久女警| 亚洲欧美成人| 亚洲免费观看| 久久av一区二区三区| 欧美精品电影在线| 国产亚洲精品一区二555| 亚洲伦理网站| 久久精品国产在热久久| 亚洲视频一区在线| 噜噜噜躁狠狠躁狠狠精品视频| 欧美欧美天天天天操| 国产午夜精品理论片a级探花| 亚洲国产网站| 欧美一区二区三区免费观看视频| 9l国产精品久久久久麻豆| 欧美一区=区| 欧美喷水视频| 黄色成人在线免费| 亚洲一区二区欧美日韩| 亚洲精品一区在线观看| 久久av一区| 欧美视频中文字幕在线| 亚洲成人在线网| 欧美一区二区三区免费视频| 亚洲香蕉网站| 欧美国产一区二区三区激情无套| 国产精品一区亚洲| 99国产精品久久久久老师| 亚洲国产成人久久综合| 欧美一区免费视频| 欧美午夜一区二区福利视频| 在线观看国产精品网站| 午夜精彩国产免费不卡不顿大片| 一区二区三区回区在观看免费视频| 久久午夜影视| 国产日韩欧美黄色| 亚洲一区二区av电影| 在线视频亚洲| 欧美不卡视频一区发布| 国产日韩欧美夫妻视频在线观看| 国产视频亚洲精品| 1000部精品久久久久久久久| 国产欧美日韩综合精品二区| 亚洲精品久久嫩草网站秘色| 亚洲观看高清完整版在线观看| 久久成人精品视频| 久久人人爽人人爽爽久久| 国产欧美一区二区视频| 亚洲视屏在线播放| 99re这里只有精品6| 另类成人小视频在线| 欧美精品免费看| 亚洲国产高清在线观看视频| 亚洲欧美日韩直播| 亚洲五月婷婷| 欧美色欧美亚洲另类二区| 亚洲日本理论电影| 亚洲美女在线观看| 欧美国产日韩一区二区三区| 影音先锋亚洲视频| 亚洲国产中文字幕在线观看| 免费成人av在线看| 在线看日韩av| 亚洲第一综合天堂另类专| 另类酷文…触手系列精品集v1小说| 国内精品嫩模av私拍在线观看| 欧美一区网站| 猫咪成人在线观看| 亚洲高清免费| 亚洲精品孕妇| 欧美日韩人人澡狠狠躁视频| 日韩视频一区二区| 亚洲在线播放| 国产精品一区二区久久国产| 99riav久久精品riav| 亚洲综合另类| 国产精品嫩草99a| 午夜精品一区二区三区四区| 久久丁香综合五月国产三级网站| 国产精品专区h在线观看| 欧美一区二区高清| 欧美一区二区三区免费视频| 国产日韩精品视频一区二区三区| 久久aⅴ国产紧身牛仔裤| 美日韩精品免费观看视频| 亚洲激情自拍| 亚洲欧美精品在线观看| 国产视频精品va久久久久久| 亚洲大胆人体在线| 欧美久久久久| 亚洲免费电影在线观看| 亚洲欧美国产77777| 国产喷白浆一区二区三区| 久久av一区二区三区| 欧美黄色网络| 亚洲综合色视频| 久久蜜臀精品av| 亚洲精品一区中文| 香蕉成人久久| 国产欧美亚洲视频| 亚洲人永久免费| 国产精品九九| 亚洲国产精品久久久久婷婷老年| 欧美日韩国产一中文字不卡| 亚洲女人av| 欧美xart系列高清| 亚洲色图在线视频| 久久先锋资源| 日韩天天综合| 久久亚洲精品视频| 亚洲美洲欧洲综合国产一区| 欧美一区二区三区在线视频| 亚洲国产精品成人久久综合一区| 亚洲网站视频| 伊人久久av导航| 亚洲免费中文字幕| 激情国产一区| 亚洲影视中文字幕| 激情成人在线视频| 亚洲伊人色欲综合网| 怡红院精品视频| 亚洲在线网站| 伊人一区二区三区久久精品| 亚洲专区免费| 国产精品女主播一区二区三区| 91久久精品国产91性色tv| 国产精品久久婷婷六月丁香| 亚洲黄色影片| 国产日韩专区| 亚洲视频一区二区免费在线观看| 国产一区二区三区高清播放| 中文日韩在线| 亚洲国产精品成人精品| 午夜宅男欧美| 亚洲精品久久嫩草网站秘色 | 一区二区免费在线观看| 久久综合图片| 亚洲欧美日韩综合aⅴ视频| 欧美理论电影网| 亚洲国产成人一区| 国产日韩欧美高清|