摘要:目前存在的中文命名實(shí)體識(shí)別方法依賴于大量標(biāo)注數(shù)據(jù),但是某些領(lǐng)域標(biāo)注數(shù)據(jù)的獲取成本十分高昂.通過引入遷移學(xué)習(xí)技術(shù),降低了實(shí)體識(shí)別模型對(duì)于大量標(biāo)注數(shù)據(jù)的需求.論文從大規(guī)模非結(jié)構(gòu)化文本數(shù)據(jù)出發(fā),利用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建語言預(yù)測(cè)模型,將其作為遷移學(xué)習(xí)源模型;同時(shí),基于上下文特征的字符級(jí)向量生成算法遷移源模型知識(shí)至實(shí)體識(shí)別模型,最終構(gòu)建出遷移學(xué)習(xí)模型:Trans-NER.實(shí)驗(yàn)結(jié)果顯示,提出的模型表現(xiàn)優(yōu)于其他實(shí)體識(shí)別模型.
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社