摘要:為了挖掘民族文化的傳承規(guī)律和內(nèi)涵,根據(jù)少數(shù)民族文化特點(diǎn),設(shè)計(jì)了一種XML子樹的序列表示方法,有效保存了XML節(jié)點(diǎn)的結(jié)構(gòu)信息。從XML文檔的路徑、節(jié)點(diǎn)層次、權(quán)重綜合計(jì)算出發(fā),提出一種基于子樹的XML相似度計(jì)算方法,提高了文本相似度計(jì)算的準(zhǔn)確性,最后設(shè)計(jì)了一種新的增量式聚類算法應(yīng)用于少數(shù)民族文化挖掘。實(shí)驗(yàn)證明了該算法在民族文化挖掘中的可行性。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社