《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 面向新聞的長文本事件抽取方法
面向新聞的長文本事件抽取方法
網(wǎng)絡安全與數(shù)據(jù)治理
武劍濤,李俊達,李佰文,淮曉永
華北計算機系統(tǒng)工程研究所
摘要: 事件抽取技術旨在從非結構化文本中識別并結構化描述事件信息,是構建知識圖譜與實現(xiàn)輿情分析的核心基礎。針對新聞長文本中多事件共存、復雜敘事結構的特點以及現(xiàn)有模型輸入長度受限等挑戰(zhàn),提出一種層級化新聞長文本事件抽取框架。該框架通過語義邊界分割算法優(yōu)化段落劃分,降低事件要素的跨段落割裂;結合機器閱讀理解技術實現(xiàn)局部事件要素提??;并設計事件合并算法完成跨分塊事件的語義融合。實際應用表明,該框架能夠適應新聞文本的結構特性,在多事件場景中可穩(wěn)定提取關鍵信息,為輿情監(jiān)控、知識圖譜構建等任務提供可落地的技術解決方案。
中圖分類號:TP391.13文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.05.004
引用格式:武劍濤,李俊達,李佰文,等. 面向新聞的長文本事件抽取方法[J].網(wǎng)絡安全與數(shù)據(jù)治理,2025,44(5):21-28.
A method for event extraction from lengthy news texts
Wu Jiantao,Li Junda,Li Baiwen,Huai Xiaoyong
National Computer System Engineering Research Institute of China
Abstract: Event extraction technology, which aims to identify and structurally represent event information from unstructured text, serves as the foundational infrastructure for constructing knowledge graphs and enabling public opinion analysis. To address the challenges of multi-event coexistence, complex narrative structures in lengthy news texts, and input length constraints of existing models, this paper proposes a hierarchical event extraction framework specifically designed for news narratives. The framework features three key innovations: (1) a semantic boundary segmentation algorithm that optimizes paragraph segmentation to minimize cross-paragraph fragmentation of event elements; (2) integration of machine reading comprehension (MRC) technology for localized event element extraction; (3) a cross-chunk event fusion algorithm is designed to achieve semantic integration of distributed event components. Experimental evaluations demonstrate that the proposed framework effectively adapts to the structural characteristics of news texts, can consistently extract critical information in multi-event scenarios, and deliver practically viable technical solutions for public opinion monitoring and knowledge graph construction.
Key words : event extraction; machine reading comprehension; semantic chunking

引言

事件抽取是自然語言處理中的一項關鍵技術,其核心目標是從非結構化文本中識別并提取出特定事件的信息,包括事件類型、參與者、時間、地點等關鍵要素,并以結構化形式呈現(xiàn)出來。通過新聞事件抽取技術,能夠從海量新聞文本中實時提取出關鍵事件信息,為知識圖譜的構建提供高質量的數(shù)據(jù)支持。同時,基于對這些信息的實時分析,可以快速識別出正在發(fā)酵的熱點事件,評估其輿論熱度及發(fā)展趨勢,從而為輿情監(jiān)控和決策支持提供精準、及時的參考依據(jù)。

文本事件抽取的研究經(jīng)歷了從規(guī)則方法到機器學習,再到深度學習的演進。早期研究主要依賴人工規(guī)則和傳統(tǒng)機器學習方法,例如,Liao等[1]基于條件隨機場事件檢測方法,解決了從文本中識別事件觸發(fā)詞的問題,為事件抽取任務奠定了基礎。Ji等[2]提出了基于支持向量機的論元角色標注方法,通過分類模型識別事件參與者及其角色,提升了事件結構的完整性。隨著深度學習的興起,Chen等[3]提出了基于動態(tài)多池化卷積神經(jīng)網(wǎng)絡的事件抽取方法,解決了傳統(tǒng)方法難以捕捉文本中長距離依賴關系的問題。近年來,預訓練語言模型(如BERT[4]、GPT[5])的引入進一步推動了該領域的發(fā)展,Li等[6]提出的多階圖卷積網(wǎng)絡方法通過建模事件內(nèi)部關系,為解決多事件共存場景下的信息抽取難題提供了新思路,但其端到端處理模式仍受限于新聞文本的跨段落特性。與此同時,機器閱讀理解(Machine Reading Comprehension, MRC)技術也被引入事件抽取任務,Du等[7]提出的基于MRC框架的方法將事件抽取轉化為問答問題,通過預訓練語言模型生成答案,有效提升了泛化能力和長文本處理效果。

然而,新聞文本的特殊性對現(xiàn)有方法提出了獨特挑戰(zhàn)。王人玉等[8]的研究表明,新聞報道中多個獨立事件常以倒金字塔結構分布在相鄰段落,導致事件要素的跨段落分散;Li等[9]進一步指出,新聞段落間的敘事非連續(xù)性事件要素定位誤差和敘事跳躍性使得端到端模型難以有效捕捉局部語義焦點。這些結構性特征與BERT等預訓練模型的長度限制共同作用,導致傳統(tǒng)篇章級方法[10]在處理多事件新聞時丟失關鍵事件要素。以DuEEFin[11]數(shù)據(jù)集中的《安琪酵母股份有限公司關于股東通過大宗交易減持股份的公告》(下文簡稱為公告)為例,該文本通過“重要提示”“減持情況”和“其他事項”三個獨立章節(jié)分別承載減持主體“湖北日升”的持股信息(5657 41%)、減持操作(5 417 651股)及合規(guī)聲明,形成典型的多段落協(xié)同敘事結構。這種跨段落分布特征與文本中大量非事件信息交織,易使篇章級抽取模型產(chǎn)生兩種典型錯誤:一是全局語義理解導致的冗余信息干擾,二是事件稀疏性引發(fā)的要素漏檢。

針對上述問題,基于文本結構的分段處理方法展現(xiàn)出更強的適應性:通過語義分塊將長文本解構為局部信息單元,既可規(guī)避跨段落要素的干擾,又能通過分段抽取-合并策略解決多事件并行處理難題。該方法與新聞文本的多事件分布特性和復雜敘事結構形成映射關系,在保持事件要素完整性的同時,有效提升了實際業(yè)務場景中的信息抽取準確率。

基于以上研究,本文提出一種層級化事件抽取框架(Hierarchical Event Extraction Framework, HEEF),本框架核心包含:(1) 采用語義分割的長文本分塊技術,通過上下文感知的段落劃分避免事件要素割裂;(2)構建基于機器閱讀理解(MRC)的聯(lián)合抽取模型,通過定制問答對實現(xiàn)事件類型與論元角色的精準解析;(3)設計跨分塊事件融合策略,通過時空語義約束實現(xiàn)事件聚合。該框架通過“分塊-抽取-融合”的遞進式處理,有效應對新聞文本中多事件共存、跨段落分布與語義跳躍性等挑戰(zhàn),為長文本事件抽取提供系統(tǒng)性解決方案。


本文詳細內(nèi)容請下載:

http://m.jysgc.com/resource/share/2000006543


作者信息:

武劍濤,李俊達,李佰文,淮曉永

(華北計算機系統(tǒng)工程研究所,北京100083)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
免费短视频成人日韩| 国产一区二区精品久久91| 欧美在线视屏| 亚洲欧美国产精品桃花| 一区二区电影免费在线观看| 91久久国产综合久久| 久久精品一区二区| 亚洲第一区在线| 久久国产精彩视频| 久久av一区二区| 久久精品国产亚洲一区二区| 欧美伊人久久| 久久精品91| 亚洲大片在线观看| 亚洲国产精品视频| 亚洲人成在线播放| 亚洲精选一区二区| 日韩亚洲欧美在线观看| 一本色道久久综合亚洲精品婷婷| 9i看片成人免费高清| aaa亚洲精品一二三区| 99视频精品免费观看| 夜夜嗨av色一区二区不卡| 一本色道久久| 亚洲一区二区伦理| 欧美一级一区| 久久久久综合网| 免费不卡在线视频| 欧美精品激情| 欧美体内谢she精2性欧美| 国产精品成人一区二区三区夜夜夜 | 羞羞答答国产精品www一本 | 久久九九国产| 欧美mv日韩mv亚洲| 欧美日韩中文在线观看| 国产精品扒开腿爽爽爽视频| 国产日韩av在线播放| 黄色国产精品一区二区三区| 亚洲第一精品在线| 99精品视频免费观看视频| 亚洲欧美日本国产有色| 久久精品国产91精品亚洲| 日韩一区二区精品| 性做久久久久久| 欧美 日韩 国产在线| 欧美日韩在线精品一区二区三区| 国产精品一区在线观看| 亚洲福利视频专区| 亚洲一区在线播放| 亚洲经典在线| 亚洲男同1069视频| 麻豆国产va免费精品高清在线| 欧美日韩国产综合久久| 国产日本精品| 最新热久久免费视频| 亚洲欧美美女| 99国产精品久久久久久久久久| 午夜在线精品偷拍| 欧美激情在线播放| 国产亚洲午夜| 99国产精品视频免费观看| 欧美一区二区三区在线观看| 一本一本a久久| 久久久一本精品99久久精品66| 欧美激情中文不卡| 国产亚洲成年网址在线观看| 亚洲美女av黄| 亚洲国产精品t66y| 午夜欧美电影在线观看| 欧美国产一区在线| 国内自拍一区| 亚洲午夜激情| 亚洲最新在线| 美女精品在线观看| 国产欧美综合一区二区三区| 亚洲精品美女在线观看| 亚洲高清一区二| 欧美在线精品一区| 欧美天堂在线观看| 亚洲国产99精品国自产| 欧美一区二区网站| 亚洲欧美不卡| 欧美另类视频| 亚洲高清在线观看一区| 欧美一区二区视频在线观看2020| 亚洲影视九九影院在线观看| 欧美成人久久| 影音先锋日韩精品| 欧美一区二区精品久久911| 亚洲午夜一二三区视频| 欧美精品三级日韩久久| 影音先锋一区| 久久精品国产成人| 久久精品国产99国产精品| 国产精品日本精品| 一本色道久久99精品综合| 亚洲毛片一区| 欧美承认网站| 精品粉嫩aⅴ一区二区三区四区| 午夜精品美女久久久久av福利| 一区二区三区欧美| 欧美美女bb生活片| 91久久中文| 日韩亚洲国产精品| 欧美精品啪啪| 亚洲欧洲精品一区二区| 亚洲欧洲精品一区二区| 久久久噜噜噜久久中文字幕色伊伊| 国产精品天美传媒入口| 亚洲一区观看| 欧美亚洲在线播放| 国产精品视频久久一区| 亚洲一区三区视频在线观看| 亚洲综合色婷婷| 国产精品久久国产精品99gif| av不卡免费看| 亚洲一区二区精品| 国产精品看片你懂得| 亚洲午夜久久久| 亚洲欧美日韩精品久久奇米色影视 | 欧美久久久久| 99国产精品久久| 亚洲免费影院| 国产精品久久久久影院亚瑟 | 激情成人av| 久久精品国产在热久久| 久久夜色精品国产| …久久精品99久久香蕉国产| 亚洲精美视频| 欧美精品一区二区视频| 亚洲狼人精品一区二区三区| 一区二区三区精品在线| 欧美午夜大胆人体| 亚洲中字黄色| 久久久久久久国产| 精品不卡一区| aa日韩免费精品视频一| 欧美性大战久久久久久久| 中文国产亚洲喷潮| 欧美一区二区三区在线观看| 国产亚洲欧洲一区高清在线观看| 久久精品国产欧美亚洲人人爽| 免费中文日韩| 99精品黄色片免费大全| 亚洲欧美日韩精品久久奇米色影视 | 亚洲美女视频在线观看| 欧美性猛片xxxx免费看久爱| 亚洲一本视频| 久久久久久穴| 亚洲国产精品va在线观看黑人| 在线一区欧美| 国产女人精品视频| 亚洲国产福利在线| 欧美日韩午夜视频在线观看| 亚洲午夜久久久久久尤物| 久久精品国产久精国产一老狼 | 亚洲精品日韩在线| 亚洲女同精品视频| 国模私拍一区二区三区| 亚洲免费av电影| 国产精品露脸自拍| 亚洲大片在线观看| 欧美日韩一区在线| 午夜在线不卡| 欧美日本在线播放| 性伦欧美刺激片在线观看| 欧美激情 亚洲a∨综合| 国产精品99久久久久久久女警| 久久精品亚洲乱码伦伦中文| 亚洲福利视频二区| 午夜影视日本亚洲欧洲精品| 在线观看日韩av电影| 亚洲一区三区电影在线观看| 一区二区三区自拍| 亚洲欧美日韩精品久久亚洲区| 黑人中文字幕一区二区三区 | 国产精品日韩欧美一区二区三区| 久久精品国产亚洲高清剧情介绍 | 亚洲国产一区二区视频| 欧美亚洲网站| 亚洲激情社区| 久久精品一本| 一区二区三区四区五区精品视频 | 一本一本久久a久久精品综合麻豆 一本一本久久a久久精品牛牛影视 | 欧美日韩在线电影| 亚洲激情第一页| 国产精品中文字幕欧美| 夜夜夜久久久| 一区二区三区自拍| 欧美亚洲日本网站| 日韩一级大片在线| 美日韩免费视频| 性欧美8khd高清极品| 欧美特黄a级高清免费大片a级| 亚洲国产欧美另类丝袜| 国产深夜精品福利| 亚洲一区二区欧美日韩| 亚洲高清二区| 久久男人资源视频| 午夜精品视频在线|