首頁 > 期刊 > 中文信息學報 > 注意力機制在深度學習中的研究進展【正文】

注意力機制在深度學習中的研究進展

作者：朱張莉; 饒元; 吳淵; 祁江楠; 張鈺西安交通大學軟件學院社會智能與復雜數(shù)據(jù)處理實驗室; 陜西西安710049; 陜西師范大學計算機科學學院; 陜西西安710119

摘要：注意力機制逐漸成為目前深度學習領域的主流方法和研究熱點之一,它通過改進源語言表達方式,在解碼中動態(tài)選擇源語言相關信息,從而極大改善了經(jīng)典Encoder-Decoder框架的不足。該文在提出傳統(tǒng)基于Encoder-Decoder框架中存在的長程記憶能力有限、序列轉化過程中的相互關系、模型動態(tài)結構輸出質量等問題的基礎上,描述了注意力機制的定義和原理,介紹了多種不同的分類方式,分析了目前的研究現(xiàn)狀,并敘述了目前注意力機制在圖像識別、語音識別和自然語言處理等重要領域的應用情況。同時,進一步從多模態(tài)注意力機制、注意力的評價機制、模型的可解釋性及注意力與新模型的融合等方面進行了探討,從而為注意力機制在深度學習中的應用提供新的研究線索與方向。

注：因版權方要求，不能公開全文，如需全文，請咨詢雜志社

期刊咨詢免費咨詢雜志訂閱