文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.201234
中文引用格式: 張露,劉家鵬,江敏祺. 集成機器學習模型在不平衡樣本財務預警中的應用[J].電子技術(shù)應用,2021,47(8):34-38.
英文引用格式: Zhang Lu,Liu Jiapeng,Jiang Minqi. The application of the integrated machine learning model in the financial crisis of imbalanced sample[J]. Application of Electronic Technique,2021,47(8):34-38.
0 引言
進入大數(shù)據(jù)時代以來,對信息的敏感程度和預測能力變得尤為重要,而對企業(yè)而言,無論是在經(jīng)營活動還是投資活動中,財務危機預警一直是個問題和難題。機器學習的興起為大數(shù)據(jù)的處理和應用提供了新的方式。
目前,許多學者將機器學習與金融危機預警相結(jié)合,取得了重大突破。OHLSON J A[1]建議將邏輯回歸應用于分類的后概率,來估計公司的破產(chǎn)概率。Zou Hui和HASTIE T[2]提出了彈性網(wǎng)絡,克服了嶺回歸和Lasso的缺點[3]。決策樹學習是一種強大的分類器[4],在樹分類器的基礎(chǔ)上,有學者提出了隨機森林[5]和XGBoost[6],在計算機[7]、圖像分類[8]等領(lǐng)域被證明有效。
但在過去的研究中,大多采用人工設(shè)定樣本量,而忽視了實際上財務預警企業(yè)與正常企業(yè)的數(shù)量對比的懸殊[9]。數(shù)據(jù)不平衡的問題是財務預警研究領(lǐng)域的難題[10]。VEGANZONES D和SEVERIN E[11]提出采樣技術(shù)可用于提高不平衡樣本預測的分類器性能,隨機上采樣技術(shù)[12]、隨機下采樣技術(shù)[13]和人工合成少數(shù)抽樣技術(shù)(SMOTE)[14]的應用解決了集成復雜分類器在不平衡的財務預警研究數(shù)據(jù)中失效的問題。而集成學習機制可以通過集成不同的模型來整合多種算法的優(yōu)點[15],目前在個人信貸領(lǐng)域已經(jīng)有了一定的應用[16]。
本文詳細內(nèi)容請下載:http://www.theprogrammingfactory.com/resource/share/2000003695。
作者信息:
張 露1,劉家鵬1,江敏祺2
(1.中國計量大學 經(jīng)濟與管理學院,浙江 杭州310018;2.上海財經(jīng)大學 信息管理與工程學院,上海200000)