摘要:“神威·太湖之光”是我國全自主研發(fā)的千萬核超級計算機,目前已有很多大型應用程序在此先進架構(gòu)上進行了移植優(yōu)化。然而,高能物理領(lǐng)域的格點量子色動力學(LQCD)數(shù)值模擬軟件在神威平臺上尚未進行過移植優(yōu)化,這引起了科學工作者們的關(guān)注。針對LQCD在神威平臺上的移植優(yōu)化問題展開研究。首先,論述了國內(nèi)外對LQCD在不同硬件架構(gòu)上進行并行優(yōu)化的發(fā)展歷程。其次,通過對其熱點模塊Dslash的重構(gòu),實現(xiàn)了在神威平臺上的成功移植。再次,針對申威26010芯片異構(gòu)眾核的架構(gòu)和并行模式,實現(xiàn)了從核陣列異構(gòu)并行、從核本地設(shè)備存儲器(LDM)與主存之間的直接存儲訪問(DMA)通訊、主核之間的消息傳遞接口(MPI)通訊及全局歸約等操作。最后,經(jīng)過實驗測試,單核組優(yōu)化程序與16核組優(yōu)化程序相比單主核程序分別獲得了165倍和25倍的加速比,并發(fā)現(xiàn)了一些重要的性能瓶頸問題,為進一步優(yōu)化提升整體效率奠定重要基礎(chǔ)。同時,對國產(chǎn)超算平臺的推廣使用具有積極意義。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社