基于預訓練模型的基層治理敏感實體識別方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大小:3658 K
標簽: 預訓練語言模型 基層治理 中文命名實體識別
所需積分:0分積分不夠怎么辦?
文檔介紹:基層治理產生的大量敏感數(shù)據(jù)可通過數(shù)據(jù)脫敏去除隱私內容,但這些數(shù)據(jù)包含較多非結構化文本數(shù)據(jù),難以直接進行數(shù)據(jù)脫敏。因此,需要對非結構化文本數(shù)據(jù)進行命名實體識別以提取敏感數(shù)據(jù)。首先把敏感實體分為16類并對信訪文本進行標注,輸入層表示采用預訓練模型BERT,編碼層利用雙向長短時記憶網絡汲取上下文信息,解碼層通過條件隨機場模型優(yōu)化序列,構建了較高精度的基層治理敏感實體識別模型。針對脫敏工作需要,改變假陰性和假陽性的loss權重,并采用敏感實體框選率輔助評價模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進行實驗,F(xiàn)1值分別為88.38%和90.11%,相較于基準模型提升了4.64%和3.78%。該模型可應用于非結構化文本的敏感實體識別,識別成功率高。現(xiàn)有評價指標未能較好地反映敏感實體的間接推理關系,應當探索更完善的敏感實體評價體系。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 四虎网站1515hh四虎| 国自产精品手机在线观看视频| 久青草中文字幕精品视频| 欧美黑人巨大videos极品| 免费精品99久久国产综合精品| 色偷偷人人澡人人爽人人模| 国产女高清在线看免费观看| 五月婷婷俺也去开心| 国产综合色在线视频区| aaaaaav| 婷婷五月在线视频| 中国黄色一级大片| 新婚张燕被两个局长| 久久亚洲色一区二区三区| 日韩精品一区二区三区中文| 亚洲国产一区二区三区在线观看 | 在厨房里挺进美妇雪臀| xxxxx日韩| 婷婷国产偷v国产偷v亚洲| 一级白嫩美女毛片免费| 成人欧美日韩一区二区三区| 久久99精品久久久久久国产| 日本电影里的玛丽的生活| 亚洲AV无码不卡| 欧美a欧美1级| 亚洲专区欧美专区| 欧美三日本三级少妇三级久久| 亚洲国产亚洲综合在线尤物| 欧美成人在线影院| 亚洲日韩AV一区二区三区四区| 欧美香蕉爽爽人人爽| 亚洲精品456在线播放| 波多野结衣中出在线| 亚洲精品国产电影| 波多野结衣种子网盘| 亚洲精品无码久久久久| 波多野吉衣视频| 亚洲男女一区二区三区| 永生动漫免费观看完整版高清西瓜 | 再深点灬舒服灬太大爽| 精品午夜久久网成年网|