《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于TF-IDF進化集成分類器的鐵路安全故障文本分類
基于TF-IDF進化集成分類器的鐵路安全故障文本分類
2021年電子技術應用第4期
高 凡1,王富章1,張 銘1,趙俊華2,李高科1
1.中國鐵道科學研究院,北京100081;2.北京經緯信息技術有限公司,北京100081
摘要: 鐵路安全問題是鐵路運輸保證的核心問題,鐵路安全問題非結構化文本數據量大,文本內容無特定規律,對于綜合分析解決安全故障問題造成很高的難度。針對鐵路安全問題數據智能分類,提出進化集成分類器模型。運用TF-IDF算法,通過分析接觸網安全問題的數據特點提取文本特征。采用決策樹作為基分類器的Bagging集成分類器將文本數據分類,在Bagging分類過程中,針對Bagging算法產生的基分類器組合解集,提出采用遺傳算法(Genetic Algorithm)將其優化,產生分類結果較優的基分類器組合解集。以鐵路局實際安全問題進行實驗分析,實驗證明TF-IDF+Bagging+Genetic Algorithm=Evolutionary Ensemble Classifier進化集成分類器模型在鐵路安全問題文本分類中具有較高的準確性。
中圖分類號: TN02;U284
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200284
中文引用格式: 高凡,王富章,張銘,等. 基于TF-IDF進化集成分類器的鐵路安全故障文本分類[J].電子技術應用,2021,47(4):71-76,81.
英文引用格式: Gao Fan,Wang Fuzhang,Zhang Ming,et al. Text classification of railway safety fault based on TF-IDF evolutionary integrated classifier[J]. Application of Electronic Technique,2021,47(4):71-76,81.
Text classification of railway safety fault based on TF-IDF evolutionary integrated classifier
Gao Fan1,Wang Fuzhang1,Zhang Ming1,Zhao Junhua2,Li Gaoke1
1.China Academy of Railway Science,Beijing 100081,China; 2.Beijing Jingwei Information Technologies Co.,Ltd.,Beijing 100081,China
Abstract: Railway safety is the core of railway transportation guarantee. The unstructured text data of railway safety problems is large, and the content of the text has no specific rules, which makes it very difficult to comprehensively analyze and solve the safety problems. Aiming at the intelligent classification of railway safety data, an evolutionary ensemble classifier model is proposed. By analyzing the characteristics of the catenary security issues of data, TF-IDF model is adopted to realize the feature extraction. Bagging ensemble classifier which uses Decision Tree as the base classifier classifies the text data, in the process of classification of Bagging, for the combined solution set of base classifier generated by Bagging Algorithm, Genetic Algorithm is proposed to optimize it to generate the combined solution set of base classifier with better classification results. Based on the safety problem of power supply contact network of a railway bureau, the experimental analysis shows that the TF-IDF+Bagging+Genetic Algorithm=Evolutionary Ensemble Classifier model has a high classification index in the text classification of railway safety problems.
Key words : software railway safety problems;TF-IDF;base classifier;integrated classifier;evolutionary integration classifier

0 引言

    安全問題歷來是鐵路運輸的重點關注問題,在鐵路安全監控體系中,為減少運營過程中可能存在的安全隱患,減少設備故障,保障系統穩定運行,安全人員根據日常巡檢、專項巡檢、重大節假日排查等計劃定期到現場檢查存在的安全生產故障隱患,并將問題記錄為文本形式存儲。管理人員依據這些問題記錄,分析、總結與整改問題。在長期形成的海量的安全問題文本文件中,采用文本分類技術將安全問題自動歸類,輔助管理人員更好地掌握與處理安全問題,在鐵路安全領域的重要性日漸凸顯。

    一般來說,文本分類過程有以下3個步驟[1]:預處理、文本表示和文本分類。其中,文本預處理包括分詞、去除停頓詞、去除不規則數據等。文本表示即將提取的文本特征轉換為計算機可處理的數據類型(通常用向量表示)。文本表示方法包括詞袋模型(BOW)、詞頻-逆向文件頻率(Term Frequency-Inverse Document Frequency,TF-IDF),以及基于深度學習的Word2vec表示方法等[2]。在構造分類器時使用的技術大體包括單個的基分類器集成分類器以及深度學習模型[3]。集成分類器主要包含Bagging和Boosting兩種,Bagging的主要算法是隨機森林,Boosting的主要算法是梯度提升樹。在深度學習領域,有基于深度信念網絡、卷積神經網絡[4-5]、循環神經網絡等完成文本分類任務[6]

    目前,國內學者在鐵路文本分析領域研究較多。王廣采用貝葉斯網絡的預測模型和自適應增強算法(Adaptive Boosting,AdaBoost)的預測模型實現天氣相關的鐵路道岔故障預測[7];趙陽等以故障文本信息為依據,針對高鐵信號車載設備,提出貝葉斯結構學習算法(HDBN_SL)[8];李佳奇等將面向Agent的分布式人工智能技術引入到信號設備故障診斷系統中[9];楊連報針對信號故障不平衡數據,采用SVM-SMOTE算法對TF-IDF轉換后的小類別文本向量數據隨機生成,分別采用基分類器和集成分類對數據進行分類[10]。本文處理安全問題為事故故障發生前人員檢查時發現的風險、隱患內容,通常包括安全問題發生的時間、地點、問題描述等關鍵要素[11],所以針對每一類安全問題,存在特定的關鍵詞,本文在文本特征抽取上采用TF-IDF表示,針對Bagging集成分類器的基礎上,采用遺傳算法優化,提升分類準確性[12]




本文詳細內容請下載:http://m.jysgc.com/resource/share/2000003467




作者信息:

高  凡1,王富章1,張  銘1,趙俊華2,李高科1

(1.中國鐵道科學研究院,北京100081;2.北京經緯信息技術有限公司,北京100081)

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产有码一区二区| 亚洲欧洲精品一区二区三区| 一本不卡影院| 国产一区在线观看视频| 麻豆精品一区二区综合av | 国产精品入口麻豆原神| 亚洲国产精品电影| 欧美视频中文字幕| 久久精品一区蜜桃臀影院| 欧美精品国产| 久久精品一本久久99精品| 国产精品久久久亚洲一区 | 午夜视频在线观看一区| 国产精品久久国产三级国电话系列| 欧美在线视屏| 国产美女精品视频| 亚洲在线观看视频| 日韩视频免费| 欧美日韩福利| 一区二区三区 在线观看视频| 精品91在线| 欧美日韩另类国产亚洲欧美一级| 国产欧美精品一区二区色综合| 91久久久在线| 日韩视频永久免费| 国产欧美视频一区二区三区| 一本色道久久| 99视频一区二区| 国产日韩欧美一区在线| 99视频在线观看一区三区| 久久精品一二三| 欧美午夜一区二区福利视频| 99在线|亚洲一区二区| 亚洲国产日韩一区| 欧美区一区二| 亚洲一区二区三区视频播放| 亚洲天堂av电影| 国产精品久久久久久久久久久久久久 | 久久大香伊蕉在人线观看热2| 亚洲日本中文字幕免费在线不卡| 欧美激情综合五月色丁香小说| 一本久久综合亚洲鲁鲁| 亚洲无吗在线| 狠狠色综合色综合网络| 欧美精品色一区二区三区| aa成人免费视频| 久久精品久久综合| 国产精品九九| 中文亚洲欧美| 黄色一区二区在线观看| 欧美国产欧美亚州国产日韩mv天天看完整| 亚洲高清视频在线| av不卡免费看| 韩国一区二区在线观看| 欧美欧美天天天天操| 久久成人在线| 狠狠色丁香婷综合久久| 欧美精品日韩三级| 亚洲欧美不卡| 亚洲精品欧美日韩专区| 亚洲女女做受ⅹxx高潮| 亚洲高清在线视频| 国产亚洲精品久久久久婷婷瑜伽| 欧美成人免费小视频| 久久精品最新地址| 亚洲在线一区二区三区| 亚洲精品婷婷| 亚洲福利小视频| 亚洲综合社区| 亚洲视频中文| 日韩网站在线看片你懂的| 精品动漫一区| 久久精品视频在线| 欧美视频免费在线| 欧美国产欧美亚洲国产日韩mv天天看完整 | 99在线视频精品| 亚洲国产精品久久久久秋霞不卡| 一区二区三区 在线观看视| 亚洲国产天堂久久综合| 在线日韩中文| 伊人久久婷婷色综合98网| 国产字幕视频一区二区| 国产视频精品免费播放| 国产精品亚发布| 国产欧美另类| 午夜激情一区| 亚洲一区精品在线| 亚洲欧美日韩综合一区| 欧美在线视频网站| 久久久在线视频| 欧美99久久| 欧美日韩视频专区在线播放 | 激情综合亚洲| 亚洲国产一区二区三区青草影视| 最新国产乱人伦偷精品免费网站 | 亚洲电影天堂av| 亚洲精品国产系列| 亚洲免费成人av| 亚洲一级在线| 久久精彩视频| 一区二区三区欧美亚洲| 亚洲欧美伊人| 久久亚洲捆绑美女| 欧美激情中文字幕在线| 国产精品久久二区二区| 狠狠色综合色综合网络| 亚洲免费成人av| 久久精品国产一区二区电影| 日韩午夜在线播放| 久久精品91久久香蕉加勒比| 免费欧美高清视频| 国产精品久久久久高潮| 在线成人欧美| 亚洲男人的天堂在线aⅴ视频| 久久精品视频99| 性伦欧美刺激片在线观看| 欧美成人精品影院| 国产农村妇女毛片精品久久莱园子| 狠狠久久婷婷| 亚洲免费视频一区二区| 亚洲精品久久久久久久久久久久久 | 久久精品国产一区二区三| 久久免费黄色| 国产精品网站在线播放| 亚洲人成小说网站色在线| 久久成人精品电影| 亚洲欧美另类在线| 欧美系列精品| 亚洲精品中文字幕在线| 最新亚洲电影| 男人天堂欧美日韩| 极品中文字幕一区| 久久av老司机精品网站导航| 午夜精品久久久久久久| 欧美视频四区| 一本色道久久综合亚洲精品不卡 | 亚洲精品乱码久久久久| 久色婷婷小香蕉久久| 国产网站欧美日韩免费精品在线观看 | 亚洲少妇最新在线视频| 欧美成人精品影院| 亚洲二区视频| 亚洲精品一区二区三区福利| 美日韩免费视频| 亚洲国产三级在线| 亚洲视频碰碰| 国产精品日本| 亚洲天堂av在线免费| 午夜一级在线看亚洲| 国产欧亚日韩视频| 欧美在线黄色| 欧美国产日韩a欧美在线观看| 亚洲二区在线视频| 一区二区不卡在线视频 午夜欧美不卡在 | 欧美精品一级| 国产一区999| 亚洲丰满在线| 欧美日韩精品免费看| 一区二区三区久久| 欧美一区二区三区四区高清 | 国产精品video| 欧美专区一区二区三区| 欧美福利一区| 亚洲欧美中文日韩v在线观看| 久久亚洲免费| 一本色道综合亚洲| 久久久欧美精品sm网站| 亚洲精品乱码久久久久久黑人 | 国产精品久久久久久久久久直播| 亚洲伊人久久综合| 欧美成年人视频网站| 一区二区三区精品视频在线观看| 久久成人羞羞网站| 亚洲免费观看| 免费人成精品欧美精品| 亚洲综合首页| 欧美日韩国产一区精品一区 | 欧美中文字幕久久| 宅男噜噜噜66国产日韩在线观看| 久久电影一区| 亚洲欧美国产另类| 欧美日韩精品一二三区| 亚洲国产影院| 国产日韩一区二区| 性色av一区二区三区红粉影视| 亚洲另类自拍| 欧美激情免费在线| 亚洲二区在线视频| 黑人操亚洲美女惩罚| 欧美在线免费观看| 中国日韩欧美久久久久久久久| 欧美sm视频| 亚洲免费精彩视频| 亚洲激情视频网| 欧美不卡在线| 国产小视频国产精品| 久久av老司机精品网站导航| 亚洲影院免费观看| 国产精品综合网站| 久久精品首页|