《電子技術(shù)應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 面向新聞的長文本事件抽取方法
面向新聞的長文本事件抽取方法
網(wǎng)絡安全與數(shù)據(jù)治理
武劍濤,李俊達,李佰文,淮曉永
華北計算機系統(tǒng)工程研究所
摘要: 事件抽取技術(shù)旨在從非結(jié)構(gòu)化文本中識別并結(jié)構(gòu)化描述事件信息,是構(gòu)建知識圖譜與實現(xiàn)輿情分析的核心基礎。針對新聞長文本中多事件共存、復雜敘事結(jié)構(gòu)的特點以及現(xiàn)有模型輸入長度受限等挑戰(zhàn),提出一種層級化新聞長文本事件抽取框架。該框架通過語義邊界分割算法優(yōu)化段落劃分,降低事件要素的跨段落割裂;結(jié)合機器閱讀理解技術(shù)實現(xiàn)局部事件要素提取;并設計事件合并算法完成跨分塊事件的語義融合。實際應用表明,該框架能夠適應新聞文本的結(jié)構(gòu)特性,在多事件場景中可穩(wěn)定提取關(guān)鍵信息,為輿情監(jiān)控、知識圖譜構(gòu)建等任務提供可落地的技術(shù)解決方案。
中圖分類號:TP391.13文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.05.004
引用格式:武劍濤,李俊達,李佰文,等. 面向新聞的長文本事件抽取方法[J].網(wǎng)絡安全與數(shù)據(jù)治理,2025,44(5):21-28.
A method for event extraction from lengthy news texts
Wu Jiantao,Li Junda,Li Baiwen,Huai Xiaoyong
National Computer System Engineering Research Institute of China
Abstract: Event extraction technology, which aims to identify and structurally represent event information from unstructured text, serves as the foundational infrastructure for constructing knowledge graphs and enabling public opinion analysis. To address the challenges of multi-event coexistence, complex narrative structures in lengthy news texts, and input length constraints of existing models, this paper proposes a hierarchical event extraction framework specifically designed for news narratives. The framework features three key innovations: (1) a semantic boundary segmentation algorithm that optimizes paragraph segmentation to minimize cross-paragraph fragmentation of event elements; (2) integration of machine reading comprehension (MRC) technology for localized event element extraction; (3) a cross-chunk event fusion algorithm is designed to achieve semantic integration of distributed event components. Experimental evaluations demonstrate that the proposed framework effectively adapts to the structural characteristics of news texts, can consistently extract critical information in multi-event scenarios, and deliver practically viable technical solutions for public opinion monitoring and knowledge graph construction.
Key words : event extraction; machine reading comprehension; semantic chunking

引言

事件抽取是自然語言處理中的一項關(guān)鍵技術(shù),其核心目標是從非結(jié)構(gòu)化文本中識別并提取出特定事件的信息,包括事件類型、參與者、時間、地點等關(guān)鍵要素,并以結(jié)構(gòu)化形式呈現(xiàn)出來。通過新聞事件抽取技術(shù),能夠從海量新聞文本中實時提取出關(guān)鍵事件信息,為知識圖譜的構(gòu)建提供高質(zhì)量的數(shù)據(jù)支持。同時,基于對這些信息的實時分析,可以快速識別出正在發(fā)酵的熱點事件,評估其輿論熱度及發(fā)展趨勢,從而為輿情監(jiān)控和決策支持提供精準、及時的參考依據(jù)。

文本事件抽取的研究經(jīng)歷了從規(guī)則方法到機器學習,再到深度學習的演進。早期研究主要依賴人工規(guī)則和傳統(tǒng)機器學習方法,例如,Liao等[1]基于條件隨機場事件檢測方法,解決了從文本中識別事件觸發(fā)詞的問題,為事件抽取任務奠定了基礎。Ji等[2]提出了基于支持向量機的論元角色標注方法,通過分類模型識別事件參與者及其角色,提升了事件結(jié)構(gòu)的完整性。隨著深度學習的興起,Chen等[3]提出了基于動態(tài)多池化卷積神經(jīng)網(wǎng)絡的事件抽取方法,解決了傳統(tǒng)方法難以捕捉文本中長距離依賴關(guān)系的問題。近年來,預訓練語言模型(如BERT[4]、GPT[5])的引入進一步推動了該領域的發(fā)展,Li等[6]提出的多階圖卷積網(wǎng)絡方法通過建模事件內(nèi)部關(guān)系,為解決多事件共存場景下的信息抽取難題提供了新思路,但其端到端處理模式仍受限于新聞文本的跨段落特性。與此同時,機器閱讀理解(Machine Reading Comprehension, MRC)技術(shù)也被引入事件抽取任務,Du等[7]提出的基于MRC框架的方法將事件抽取轉(zhuǎn)化為問答問題,通過預訓練語言模型生成答案,有效提升了泛化能力和長文本處理效果。

然而,新聞文本的特殊性對現(xiàn)有方法提出了獨特挑戰(zhàn)。王人玉等[8]的研究表明,新聞報道中多個獨立事件常以倒金字塔結(jié)構(gòu)分布在相鄰段落,導致事件要素的跨段落分散;Li等[9]進一步指出,新聞段落間的敘事非連續(xù)性事件要素定位誤差和敘事跳躍性使得端到端模型難以有效捕捉局部語義焦點。這些結(jié)構(gòu)性特征與BERT等預訓練模型的長度限制共同作用,導致傳統(tǒng)篇章級方法[10]在處理多事件新聞時丟失關(guān)鍵事件要素。以DuEEFin[11]數(shù)據(jù)集中的《安琪酵母股份有限公司關(guān)于股東通過大宗交易減持股份的公告》(下文簡稱為公告)為例,該文本通過“重要提示”“減持情況”和“其他事項”三個獨立章節(jié)分別承載減持主體“湖北日升”的持股信息(5657 41%)、減持操作(5 417 651股)及合規(guī)聲明,形成典型的多段落協(xié)同敘事結(jié)構(gòu)。這種跨段落分布特征與文本中大量非事件信息交織,易使篇章級抽取模型產(chǎn)生兩種典型錯誤:一是全局語義理解導致的冗余信息干擾,二是事件稀疏性引發(fā)的要素漏檢。

針對上述問題,基于文本結(jié)構(gòu)的分段處理方法展現(xiàn)出更強的適應性:通過語義分塊將長文本解構(gòu)為局部信息單元,既可規(guī)避跨段落要素的干擾,又能通過分段抽取-合并策略解決多事件并行處理難題。該方法與新聞文本的多事件分布特性和復雜敘事結(jié)構(gòu)形成映射關(guān)系,在保持事件要素完整性的同時,有效提升了實際業(yè)務場景中的信息抽取準確率。

基于以上研究,本文提出一種層級化事件抽取框架(Hierarchical Event Extraction Framework, HEEF),本框架核心包含:(1) 采用語義分割的長文本分塊技術(shù),通過上下文感知的段落劃分避免事件要素割裂;(2)構(gòu)建基于機器閱讀理解(MRC)的聯(lián)合抽取模型,通過定制問答對實現(xiàn)事件類型與論元角色的精準解析;(3)設計跨分塊事件融合策略,通過時空語義約束實現(xiàn)事件聚合。該框架通過“分塊-抽取-融合”的遞進式處理,有效應對新聞文本中多事件共存、跨段落分布與語義跳躍性等挑戰(zhàn),為長文本事件抽取提供系統(tǒng)性解決方案。


本文詳細內(nèi)容請下載:

http://m.jysgc.com/resource/share/2000006543


作者信息:

武劍濤,李俊達,李佰文,淮曉永

(華北計算機系統(tǒng)工程研究所,北京100083)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲免费在线| 亚洲午夜一区二区三区| 一区二区毛片| 亚洲国产国产亚洲一二三| 国产在线观看一区| 国产一区二区三区免费观看 | 黄色成人在线观看| 国产午夜精品美女视频明星a级| 国产精品美女久久久久久2018| 欧美丝袜一区二区| 欧美亚州一区二区三区| 欧美色大人视频| 欧美亚洲成人精品| 国产精品午夜av在线| 国产精品免费aⅴ片在线观看| 国产精品乱看| 国产欧美日韩三区| 国产午夜精品在线观看| 国内精品伊人久久久久av影院| 国产在线精品自拍| 136国产福利精品导航网址| 亚洲国产一区在线观看| 亚洲精品在线二区| 一区二区三区国产盗摄| 亚洲女同在线| 欧美一区国产二区| 亚洲国产美女| 一区二区三区精品在线| 亚洲午夜精品| 久久成人国产| 免费成人av资源网| 欧美日韩精品一区视频| 国产精品久久99| 国产亚洲综合在线| 亚洲国产精品一区二区第四页av| 亚洲美女在线观看| 亚洲欧美久久久| 亚洲高清精品中出| 99精品国产热久久91蜜凸| 亚洲一级黄色片| 久久精品2019中文字幕| 你懂的亚洲视频| 欧美午夜免费| 狠狠爱综合网| 亚洲看片网站| 午夜天堂精品久久久久 | 欧美成人精品1314www| 欧美日韩国产不卡| 国产精品在线看| 亚洲大片在线观看| 亚洲系列中文字幕| 亚洲成色精品| 亚洲一区免费网站| 久久一区国产| 欧美日韩在线一区二区| 国产午夜精品一区二区三区视频| 91久久久亚洲精品| 亚洲免费一区二区| 99精品免费| 久久久99精品免费观看不卡| 欧美女主播在线| 国产亚洲免费的视频看| 亚洲每日更新| 欧美专区第一页| 亚洲视频在线一区| 久久久久中文| 欧美午夜视频一区二区| 一区视频在线| 亚洲欧美日韩天堂| 一片黄亚洲嫩模| 老司机久久99久久精品播放免费 | 亚洲二区免费| 性欧美videos另类喷潮| 欧美激情欧美激情在线五月| 国产日韩一级二级三级| 99re6这里只有精品| 亚洲福利视频一区| 午夜亚洲性色视频| 欧美日韩和欧美的一区二区| 国内外成人免费视频| 亚洲一级特黄| 一区二区三区欧美| 欧美xxx成人| 国产自产2019最新不卡| 亚洲一区二区三区视频| 一区二区三区高清在线观看| 狂野欧美激情性xxxx| 国产情人节一区| 亚洲视频精品| 中文亚洲免费| 欧美精品二区| 亚洲第一网站免费视频| 久久国产日韩欧美| 欧美一区二区三区在线观看视频 | 亚洲第一精品电影| 欧美中文字幕在线| 欧美一区免费| 国产精品午夜在线观看| 一本久久综合| 在线综合+亚洲+欧美中文字幕| 欧美国产激情| 亚洲国产日韩在线一区模特| 亚洲国产精品va在线看黑人动漫| 久久久www成人免费毛片麻豆| 国产欧美日韩专区发布| 亚洲午夜精品视频| 亚洲影院免费| 国产精品国产三级欧美二区| 一本久久青青| 亚洲一区二区网站| 欧美午夜免费| 亚洲一区欧美二区| 亚洲欧美在线aaa| 国产精品普通话对白| 亚洲一区二区黄| 午夜亚洲福利| 国产欧美日韩一区二区三区在线观看| 亚洲一区二区高清| 香蕉久久夜色| 国产精品一区视频| 欧美一区二区三区在线看| 欧美一级理论性理论a| 国产老女人精品毛片久久| 亚洲一区二区影院| 欧美一区二区三区另类| 国产欧美日韩精品专区| 欧美亚洲综合网| 久久综合99re88久久爱| 亚洲电影免费观看高清完整版在线 | 亚洲夜间福利| 国产精品毛片大码女人| 亚洲无线视频| 久久精品二区亚洲w码| 一区视频在线播放| 亚洲精品久久久久久下一站 | 午夜视黄欧洲亚洲| 久久久人成影片一区二区三区观看| 国产一区三区三区| 亚洲黄一区二区三区| 欧美激情一区二区三级高清视频| 亚洲免费福利视频| 亚洲免费一在线| 国产日韩欧美制服另类| 亚洲高清不卡一区| 欧美精品在线播放| 一二三区精品福利视频| 欧美在线日韩在线| 1000部精品久久久久久久久| 一区二区三区 在线观看视| 国产精品久久久久9999| 欧美在线在线| 欧美精品久久久久久| 亚洲素人在线| 久久免费99精品久久久久久| 亚洲福利久久| 亚洲伊人伊色伊影伊综合网 | 亚洲婷婷综合久久一本伊一区| 欧美一区二区三区视频在线| 一色屋精品亚洲香蕉网站| 一区二区三区欧美在线| 国产精自产拍久久久久久蜜| 亚洲国产色一区| 国产精品99一区二区| 久久精品91久久久久久再现| 欧美美女bbbb| 午夜视频精品| 欧美激情一区二区| 亚洲欧美在线磁力| 欧美黄色网络| 午夜激情综合网| 欧美—级高清免费播放| 亚洲欧美日韩精品久久亚洲区| 欧美高潮视频| 亚洲欧美日韩国产精品 | 宅男66日本亚洲欧美视频| 久久久蜜桃一区二区人| 99香蕉国产精品偷在线观看| 久久久九九九九| aa国产精品| 麻豆精品网站| 国产精品99久久久久久宅男| 快she精品国产999| 亚洲一区二区综合| 欧美二区视频| 午夜国产欧美理论在线播放| 欧美精品亚洲二区| 亚洲第一精品电影| 国产精品日韩在线| 99在线精品视频在线观看| 国产一区二区你懂的| 亚洲视频精选在线| 亚洲国内精品在线| 久久精品一区二区三区中文字幕| 亚洲伦理一区| 免费一级欧美片在线播放| 亚洲欧美激情精品一区二区| 欧美日韩亚洲精品内裤| 亚洲黄色免费电影| 国产一区二区三区在线观看网站 | 国产精品二区影院|