摘要:注意力機制逐漸成為目前深度學習領域的主流方法和研究熱點之一,它通過改進源語言表達方式,在解碼中動態(tài)選擇源語言相關信息,從而極大改善了經(jīng)典Encoder-Decoder框架的不足。該文在提出傳統(tǒng)基于Encoder-Decoder框架中存在的長程記憶能力有限、序列轉化過程中的相互關系、模型動態(tài)結構輸出質量等問題的基礎上,描述了注意力機制的定義和原理,介紹了多種不同的分類方式,分析了目前的研究現(xiàn)狀,并敘述了目前注意力機制在圖像識別、語音識別和自然語言處理等重要領域的應用情況。同時,進一步從多模態(tài)注意力機制、注意力的評價機制、模型的可解釋性及注意力與新模型的融合等方面進行了探討,從而為注意力機制在深度學習中的應用提供新的研究線索與方向。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社