摘要:近年來,隨著XML數(shù)據(jù)的爆炸式增長(zhǎng),對(duì)XML關(guān)鍵字查詢技術(shù)的研究日益受到關(guān)注。數(shù)據(jù)編碼是關(guān)鍵字查詢的基礎(chǔ),目前主要有2種方式--基于路徑的編碼及區(qū)間編碼。區(qū)間編碼可更好地適應(yīng)對(duì)查詢中的XML數(shù)據(jù)進(jìn)行動(dòng)態(tài)的更新,因而具有更多的優(yōu)勢(shì)。本文研究基于區(qū)間編碼的關(guān)鍵字查詢問題,提出一種新的查詢算法。該算法首先根據(jù)預(yù)留的區(qū)間值建立索引,再根據(jù)最小范圍值對(duì)索引進(jìn)行選擇遍歷,減少了不必要的比較,達(dá)到了提高查詢效率的目的。研究發(fā)現(xiàn),預(yù)留空間的選擇對(duì)查詢效率有一定的影響。為此,本文設(shè)計(jì)一種基于節(jié)點(diǎn)自身進(jìn)行區(qū)間預(yù)留的編碼方式(Interval Reservation Based on Node, IRBN),為節(jié)點(diǎn)設(shè)置權(quán)值,并根據(jù)權(quán)值進(jìn)行區(qū)間值的設(shè)定,形成根據(jù)節(jié)點(diǎn)自身分配區(qū)間的較為均衡的編碼。實(shí)驗(yàn)表明,IRBN編碼是合理的,有較高的查詢效率。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
統(tǒng)計(jì)源期刊 下單
國(guó)際刊號(hào):1006-2475
國(guó)內(nèi)刊號(hào):36-1137/TP
雜志詳情