摘要:Gauss-Seidel算法作為線性方程組的求解器,在并行計(jì)算領(lǐng)域具有廣泛應(yīng)用,而面向異構(gòu)眾核架構(gòu)開發(fā)其細(xì)粒度并行性一直是具有挑戰(zhàn)性的問題.針對(duì)非結(jié)構(gòu)網(wǎng)格問題,基于代數(shù)分塊并行思路提出了面向異構(gòu)眾核架構(gòu)的塊Gauss-Seidel/Jacobi算法,將其作為區(qū)域分解算法的子區(qū)域求解器.面向神威太湖之光超級(jí)計(jì)算機(jī)的異構(gòu)眾核架構(gòu),設(shè)計(jì)并實(shí)現(xiàn)了該算法.為充分利用神威太湖之光國產(chǎn)SW26010芯片中每個(gè)CPE擁有的高速LDM(Local Data Memory),緩解通信瓶頸,設(shè)計(jì)了多行塊通信打包、計(jì)算與通信重疊性能優(yōu)化策略和丟棄非關(guān)鍵元素的低通信復(fù)雜性數(shù)值優(yōu)化方法.數(shù)值實(shí)驗(yàn)結(jié)果顯示,相較于串行Gauss-Seidel算法,優(yōu)化后的塊Gauss-Seidel/Jacobi算法預(yù)處理過程加速比最高可達(dá)到4.16倍.以1040核的測試數(shù)據(jù)為基準(zhǔn),在處理器核數(shù)達(dá)到33280時(shí),塊Gauss-Seidel/Jacobi預(yù)條件算法的并行效率達(dá)到61%.
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社