首頁 > 期刊 > 計算機技術(shù)與發(fā)展 > 基于自然語言處理的醫(yī)學(xué)實體識別與標(biāo)簽提取【正文】

基于自然語言處理的醫(yī)學(xué)實體識別與標(biāo)簽提取

自然語言處理醫(yī)學(xué)數(shù)據(jù) 非結(jié)構(gòu)化實體識別標(biāo)簽提取

作者：趙君珂; 張振宇; 蔡開裕國防科技大學(xué); 湖南長沙410073

摘要：隨著信息化建設(shè)的快速發(fā)展,數(shù)據(jù)產(chǎn)生了爆炸式的增長,醫(yī)院每天也同樣產(chǎn)生大量的醫(yī)療記錄與數(shù)據(jù)。其中大部分內(nèi)容是非結(jié)構(gòu)化數(shù)據(jù),具有真實性、主觀性和不規(guī)范性,不利于解讀和處理。由于醫(yī)療數(shù)據(jù)是以非結(jié)構(gòu)化的文本形式存儲的,因此無法直接通過計算機直接處理和分析,不僅效率低下,分析質(zhì)量也無法保證。目前的信息抽取研究中使用的方法的可擴展性都較差,具有一些局限性,故自動化程度不高。文中通過自然語言處理中的規(guī)則描述語言方法,對數(shù)據(jù)中非結(jié)構(gòu)化的醫(yī)學(xué)命名實體進行識別,并通過語義分析進行標(biāo)簽提取,使非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化,讓數(shù)據(jù)中的描述更為準(zhǔn)確、統(tǒng)一。優(yōu)化了目前信息抽取方法中存在的可擴展性差的缺點,能夠根據(jù)情況適應(yīng)不同的情景。

注：因版權(quán)方要求，不能公開全文，如需全文，請咨詢雜志社

期刊咨詢免費咨詢雜志訂閱

計算機技術(shù)與發(fā)展

統(tǒng)計源期刊下單

國際刊號：1673-629X

國內(nèi)刊號：61-1450/TP

雜志詳情

相關(guān)熱門期刊

湖北民族大學(xué)學(xué)報·哲學(xué)社會科學(xué)版

統(tǒng)計源期刊下單

國際刊號：2096-7586

國內(nèi)刊號：42-1907/C
馬克思主義與中華文化研究

統(tǒng)計源期刊下單
電腦迷

統(tǒng)計源期刊下單

國際刊號：1672-528X

國內(nèi)刊號：50-1163/TP
世界歷史評論

統(tǒng)計源期刊下單

國際刊號：2096-6733

國內(nèi)刊號：31-2160/K1