數(shù)據(jù)中心最新文章

基于預(yù)訓(xùn)練模型的基層治理敏感實(shí)體識(shí)別方法

基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過(guò)數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進(jìn)行數(shù)據(jù)脫敏。因此,需要對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別以提取敏感數(shù)據(jù)。首先把敏感實(shí)體分為16類并對(duì)信訪文本進(jìn)行標(biāo)注,輸入層表示采用預(yù)訓(xùn)練模型BERT,編碼層利用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過(guò)條件隨機(jī)場(chǎng)模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實(shí)體識(shí)別模型。針對(duì)脫敏工作需要,改變假陰性和假陽(yáng)性的loss權(quán)重,并采用敏感實(shí)體框選率輔助評(píng)價(jià)模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進(jìn)行實(shí)驗(yàn),F(xiàn)1值分別為88.38%和90.11%,相較于基準(zhǔn)模型提升了4.64%和3.78%。該模型可應(yīng)用于非結(jié)構(gòu)化文本的敏感實(shí)體識(shí)別,識(shí)別成功率高。現(xiàn)有評(píng)價(jià)指標(biāo)未能較好地反映敏感實(shí)體的間接推理關(guān)系,應(yīng)當(dāng)探索更完善的敏感實(shí)體評(píng)價(jià)體系。

發(fā)表于:9/25/2023

主站蜘蛛池模板: 久久精品国产欧美日韩| 俺去俺也在线www色官网| 色多多视频在线| 天天射综合网站| 两个人看的www视频日本| 日本欧美大码aⅴ在线播放| 亚洲av永久无码精品秋霞电影影院| 污网站在线观看| 全彩本子里番调教仆人| 色综合天天综合网国产成人网| 国产无人区卡一卡二卡三网站| 2020天天干| 国语对白清晰好大好白| www夜夜操com| 性色a∨精品高清在线观看| 久久久久99精品成人片直播| 日韩欧美卡一卡二卡新区| 亚洲一区二区三区在线观看蜜桃| 欧美综合图区亚欧综合图区| 伊人久久大香线蕉精品| 精品无码久久久久久尤物| 国产一二三区在线观看| 香蕉大伊亚洲人在线观看| 国产成人福利精品视频| 亚洲精品一二区| 国产精品国产三级国产AV主播| 97热久久免费频精品99| 天啪天天久久天天综合啪| √天堂资源在线| 性一交一乱一伦一色一情| 中文字幕成人在线观看| 日本三级在线观看免费| 久久国产精品麻豆映画| 日韩伦理片电影在线免费观看 | 亚洲性色高清完整版在线观看| 波多野吉衣在线电影| 亚洲第一极品精品无码久久| 波多野结大战三个黑鬼| 亚洲熟妇色xxxxx欧美老妇| 波多野结衣办公室33分钟| 亚洲高清无在码在线无弹窗|