摘要:隨機森林算法是一類在機器學習中較為常見的算法,其在數(shù)據(jù)的分類以及非參數(shù)回歸中都有重要的作用。如何更好地處理數(shù)據(jù),進行特征選擇是隨機森林的重點研究領域。自編碼神經(jīng)網(wǎng)絡在深度學習中有著不可替代的作用,其在數(shù)據(jù)壓縮、特征提取等方面有著優(yōu)異的性能。結(jié)合兩者優(yōu)點,提出一種基于使用稀疏降噪自編碼器對原始數(shù)據(jù)進行特征提取的隨機森林算法。采用多種常用數(shù)據(jù)集進行實驗分析,對原始數(shù)據(jù)分別采用不同的特征提取方法,并利用隨機森林將提取后的特征進行分類。實驗結(jié)果表明,利用稀疏降噪自編碼神經(jīng)網(wǎng)絡進行特征提取所得到的特征,能夠使隨機森林的分類精度得到一定程度的提高。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社