噜噜噜噜私人影院,少妇人妻综合久久中文字幕888,AV天堂永久资源网,5566影音先锋

基于分層抽樣的不均衡數(shù)據(jù)集成分類

作者:王馨月; 景麗萍 北京交通大學計算機與信息技術學院; 北京100044

摘要:不均衡數(shù)據(jù)分類是數(shù)據(jù)挖掘領域的一個難點問題,對多數(shù)類樣本進行降采樣可簡單且有效地解決不均衡數(shù)據(jù)處理面臨的兩大核心問題,即如何從數(shù)類占絕對優(yōu)勢的數(shù)據(jù)集合中最大程度地挖掘少數(shù)類信息;如何確保在不過度損失多數(shù)類信息的前提下構建學習器.但現(xiàn)有的降采樣方法往往會破壞原始數(shù)據(jù)結構特性或造成嚴重的信息損失.本研究提出一種基于分層抽樣的不均衡數(shù)據(jù)集成分類方法(簡記為EC-SS),通過充分挖掘多數(shù)類樣本的結構信息,對其進行聚類劃分;再在數(shù)據(jù)塊上進行分層抽樣來構建集成學習數(shù)據(jù)成員,以確保單個學習器的輸入數(shù)據(jù)均衡且保留原始數(shù)據(jù)的結構信息,提升后續(xù)集成分類性能.在不均衡數(shù)據(jù)集Musk1、Ecoli3、Glass2和Yeast6上,對比EC-SS方法與基于隨機抽樣的不均衡數(shù)據(jù)集成分類方法、自適應采樣學習方法、基于密度估計的過采樣方法和代價敏感的大間隔分類器方法的分類性能,結果表明,EC-SS方法能有效提升分類性能.

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

深圳大學學報·人文社會科學版

CSSCI南大期刊 下單

國際刊號:1000-260X

國內(nèi)刊號:44-1030/C

雜志詳情
相關熱門期刊

服務介紹LITERATURE

正規(guī)發(fā)表流程 全程指導

多年專注期刊服務,熟悉發(fā)表政策,投稿全程指導。因為專注所以專業(yè)。

保障正刊 雙刊號

推薦期刊保障正刊,評職認可,企業(yè)資質(zhì)合規(guī)可查。

用戶信息嚴格保密

誠信服務,簽訂協(xié)議,嚴格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉(zhuǎn)刊。資金受第三方支付寶監(jiān)管,安全放心。