摘要:目的 通過(guò)TCGA數(shù)據(jù)庫(kù)基因突變信息結(jié)合機(jī)器學(xué)習(xí)軟件RapidMiner構(gòu)建肝細(xì)胞癌患者復(fù)發(fā)模型。方法 首先通過(guò)TCGA數(shù)據(jù)庫(kù)收集316例肝細(xì)胞癌患者的臨床資料和全基因組測(cè)序的突變基因信息;然后利用R語(yǔ)言和SPSS19.0篩選出前127個(gè)高頻突變基因和12個(gè)與無(wú)疾病生存期(disease-free survival period,DFS)顯著相關(guān)的高頻突變基因;通過(guò)RapidMiner8.0機(jī)器學(xué)習(xí)軟件,利用316例患者的突變基因信息訓(xùn)練決策樹(shù)和支持向量機(jī)(support vector machine,SVM)模型。結(jié)果 通過(guò)利用 TCGA數(shù)據(jù)庫(kù)篩選的基因構(gòu)建的決策樹(shù)模型準(zhǔn)確率為77.42%,通過(guò)構(gòu)建SVM模型佐證決策樹(shù)模型的最大準(zhǔn)確率為77.42%。結(jié)論 通過(guò)公共數(shù)據(jù)庫(kù)構(gòu)建的肝細(xì)胞癌患者的復(fù)發(fā)模型,可在臨床上用來(lái)分析患者的基因檢測(cè)報(bào)告,除了提供藥物治療靶點(diǎn)的信息外,還可初步判斷患者的預(yù)后;此外,對(duì)于部分經(jīng)濟(jì)條件受限的患者可重點(diǎn)針對(duì)決策樹(shù)中的基因進(jìn)行檢測(cè),來(lái)預(yù)測(cè)預(yù)后及復(fù)發(fā)可能。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社