基于TF-IDF進(jìn)化集成分類(lèi)器的鐵路安全故障文本分類(lèi)
所屬分類(lèi):技術(shù)論文
上傳者:aetmagazine
文檔大?。?span>768 K
標(biāo)簽: 鐵路安全問(wèn)題 TF-IDF 基分類(lèi)器
所需積分:0分積分不夠怎么辦?
文檔介紹:鐵路安全問(wèn)題是鐵路運(yùn)輸保證的核心問(wèn)題,鐵路安全問(wèn)題非結(jié)構(gòu)化文本數(shù)據(jù)量大,文本內(nèi)容無(wú)特定規(guī)律,對(duì)于綜合分析解決安全故障問(wèn)題造成很高的難度。針對(duì)鐵路安全問(wèn)題數(shù)據(jù)智能分類(lèi),提出進(jìn)化集成分類(lèi)器模型。運(yùn)用TF-IDF算法,通過(guò)分析接觸網(wǎng)安全問(wèn)題的數(shù)據(jù)特點(diǎn)提取文本特征。采用決策樹(shù)作為基分類(lèi)器的Bagging集成分類(lèi)器將文本數(shù)據(jù)分類(lèi),在Bagging分類(lèi)過(guò)程中,針對(duì)Bagging算法產(chǎn)生的基分類(lèi)器組合解集,提出采用遺傳算法(Genetic Algorithm)將其優(yōu)化,產(chǎn)生分類(lèi)結(jié)果較優(yōu)的基分類(lèi)器組合解集。以鐵路局實(shí)際安全問(wèn)題進(jìn)行實(shí)驗(yàn)分析,實(shí)驗(yàn)證明TF-IDF+Bagging+Genetic Algorithm=Evolutionary Ensemble Classifier進(jìn)化集成分類(lèi)器模型在鐵路安全問(wèn)題文本分類(lèi)中具有較高的準(zhǔn)確性。
現(xiàn)在下載
VIP會(huì)員,AET專(zhuān)家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。