摘要:通過對比人工選擇特征、相關(guān)性檢驗(yàn)、降維算法以及基于集成學(xué)習(xí)的自適應(yīng)特征提取方法,找出不同的特征選擇方法以及不同的分類算法對微博水軍的識(shí)別帶來的影響。實(shí)驗(yàn)驗(yàn)證了高區(qū)分度的自適應(yīng)特征提取方法對水軍的識(shí)別效果帶來較大提高,由于特征數(shù)量的減少,水軍識(shí)別所需要的時(shí)間花費(fèi)也明顯降低,對于微博網(wǎng)絡(luò)海量數(shù)據(jù)的識(shí)別具有一定意義。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社