• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      三維線彈性問題有限元方程的一種并行DDM預(yù)條件子*

      2018-04-20 04:31:57馮春生梁文濤
      關(guān)鍵詞:進(jìn)程算子子系統(tǒng)

      馮春生, 舒 適, 梁文濤

      (湘潭大學(xué) 數(shù)學(xué)與計(jì)算科學(xué)學(xué)院,科學(xué)工程計(jì)算與數(shù)值仿真湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 湘潭 411105)

      彈性力學(xué)問題是固體力學(xué)中的一種基本模型,它廣泛應(yīng)用于建筑、機(jī)械、化工、航天等領(lǐng)域. 有限元方法是求解彈性力學(xué)問題的最常用的離散化方法之一.由于有限元方程系數(shù)矩陣的條件數(shù)會(huì)隨著網(wǎng)格尺寸的減小而迅速增大,用經(jīng)典迭代法求解時(shí)收斂較慢.因此,研究求解大規(guī)模彈性問題有限元離散系統(tǒng)的快速算法非常必要.

      非重疊DDM 是為大規(guī)模偏微分方程離散系統(tǒng)構(gòu)造有效并行預(yù)條件子的一類非常重要的方法[1-3].標(biāo)量橢圓方程方面研究工作已比較成熟,[1]針對H(grad)型橢圓問題設(shè)計(jì)了非重疊DDM 預(yù)條件子.非重疊DDM預(yù)條件子經(jīng)過近幾十年的發(fā)展,先后形成了如BPS型[1]、Neumann型[2]和FETI型[3]等構(gòu)造預(yù)條件子的模式.最近,[4]為標(biāo)量橢圓問題線性元方程設(shè)計(jì)了一種基于簡單粗空間的非重疊DDM 高效預(yù)條件子.多層網(wǎng)格法[5-7]是高效求解規(guī)模偏微分方程離散系統(tǒng)的另一類重要方法.代數(shù)多層網(wǎng)格(AMG)法誕生于20世紀(jì)80年代初[8],它是求解大規(guī)模偏微分方程離散化系統(tǒng)的最為有效的迭代方法之一.20世紀(jì)90年代以來,受實(shí)際應(yīng)用問題的驅(qū)動(dòng),AMG 法得以迅速發(fā)展[9-10].目前常用的AMG 法包括經(jīng)典AMG法(簡稱C-AMG法)[11],基于能量極小基的AMG法[12],自適應(yīng)AMG法[13]和GAMG 法等,其中GAMG法是指針對不同特性的問題,通過利用其中部分容易獲得的幾何或分析信息而設(shè)計(jì)的依賴于問題的AMG 法,如AMGe法[14]和基于光滑聚集的AMG法[15]等.GAMG法由于具有更高的運(yùn)算效率,已成為當(dāng)前國際AMG 法研究領(lǐng)域中的熱點(diǎn).

      1 線彈性模型問題與線性有限元方程

      考慮如下三維線彈性問題:

      (1)

      (2)

      其中

      (3)

      (4)

      變分問題式(2)的線性有限元近似變分問題為:求uh∈Vh(Ω),使得

      a(uh,vh)=(f,vh),?vh∈Vh(Ω),

      (5)

      則式(5)的代數(shù)形式為

      Au=f.

      (6)

      下面我們利用代數(shù)多層網(wǎng)格法與非重疊DDM預(yù)條件子[4], 為求解式(6)的PCG法構(gòu)造一種并行預(yù)條件子.

      2 一種并行預(yù)條件子

      為了給出方程式(6)中系數(shù)矩陣A的一種基于非重疊DDM的預(yù)條件行為B的構(gòu)造算法,只需給出求向量w=Bg的算法, 其中g(shù)為任給的已知向量,其計(jì)算公式為

      (7)

      其中,關(guān)于求解式(7)右端中的各個(gè)向量的算法可描述如算法1 (這里設(shè)wd,wW,wl,g分別為以wd,wW,wl和g的分量為自由度的線性有限元函數(shù)):

      算法1非重疊DDM的預(yù)條件子

      (1) 求wd∈Vd(Ω),滿足如下變分子問題:

      a(wd,vd)=(g,vd),?vd∈Vd(Ω).

      (8)

      (2) 求wW∈VW(Ω),滿足如下變分子問題:

      a(wW,vW)=(g,vW),?vW∈VW(Ω).

      (9)

      (3) 對內(nèi)交界面循環(huán),設(shè)當(dāng)前交界面號為l(它對應(yīng)內(nèi)交界面Γij),求wl∈Vl(Ωij),滿足如下變分子問題:

      a(wl,vl)=(g,vl),?vl∈Vl(Ωij).

      (10)

      第一類子系統(tǒng)式(8):由于其自由度較少,使用經(jīng)典迭代法CG 或C-AMG都可求解;第二類子系統(tǒng)式(9):由于其系數(shù)矩陣性態(tài)較好,使用CG求解即可;第三類子系統(tǒng)式(10):每個(gè)內(nèi)界面對應(yīng)一個(gè),此類子問題求解性態(tài)的好壞,將直接影響整個(gè)預(yù)條件子系統(tǒng)求解的效率.針對第三類子系統(tǒng)式(10)的求解,研究發(fā)現(xiàn)隨著子系統(tǒng)規(guī)模的增大,使用經(jīng)典迭代法如CG求解時(shí),迭代次數(shù)隨子問題規(guī)模的擴(kuò)大增長很快,而使用C-AMG求解該類子系統(tǒng)時(shí),迭代次數(shù)不穩(wěn)定,且求解效率較低.因此,需要設(shè)計(jì)新的高效AMG 法.特別地,通過改變C-AMG 中的粗化策略和提升算子的構(gòu)造方法,我們?yōu)榈谌愖酉到y(tǒng)設(shè)計(jì)了一種新的AMG (簡記為AMG-T)法.

      3 并行實(shí)現(xiàn)

      記Ad:Vd(Ω)→Vd(Ω),AW:VW(Ω)→VW(Ω) 和Al:Vl(Ωij)→Vl(Ωij)為三個(gè)對稱正定算子;記Qd,QW和Ql分別表示Vh(Ω) 到相應(yīng)子空間Vd(Ω),VW(Ω)和Vl(Ωij)的L2投影算子.記變分子問題式(8)、(9)、(10)對應(yīng)的離散系統(tǒng)分別為:

      Adud=Qdg,

      (11)

      AWuW=QWg,

      (12)

      Alul=Qlg.

      (13)

      這里,在不與算子Ad,AW,Al產(chǎn)生混淆的情況下,記其對應(yīng)的矩陣為Ad,AW,Al(l=1,…,M).

      接下來,針對AW規(guī)模較大,且子系統(tǒng)式(13) 的求解占主要工作量的情形簡要給出MPI + OpenMP二級并行實(shí)現(xiàn)策略.關(guān)于第一類子系統(tǒng)式(11):由于其自由度較少, 通??梢栽诘?#進(jìn)程上采用BoomerAMG[16]進(jìn)行OpenMP 并行求解.如果直接調(diào)用BoomerAMG,求解效率不夠理想,可以采用我們新設(shè)計(jì)的一種解法器AMG-T(與前者不同之處在于粗化策略考慮方向性).由表1可知, 當(dāng)md較大時(shí),AMG-T的迭代次數(shù)比較穩(wěn)定.

      關(guān)于第二類子系統(tǒng)式(12):由于其系數(shù)矩陣性態(tài)較好,調(diào)用OpenMP 并行CG在第1#進(jìn)程上求解即可.由表2可知,并行CG的迭代次數(shù)與網(wǎng)格規(guī)模和進(jìn)程數(shù)均無關(guān).

      關(guān)于第三類子系統(tǒng)式(13),注意以下兩個(gè)事實(shí):

      表1 求解第一類子系統(tǒng)(11)的平均迭代次數(shù)

      表2 并行 CG 求解第二類子系統(tǒng)(12)的迭代次數(shù)

      事實(shí)2該類子系統(tǒng)的求解可同步進(jìn)行,且可自由組合聚集到不同進(jìn)程并行計(jì)算.

      因此,我們將第三類子系統(tǒng)平衡分配到余下進(jìn)程并行計(jì)算.進(jìn)一步,在各進(jìn)程上將分配到該進(jìn)程上的第三類子系統(tǒng)再平均分配到各線程上,采用OpenMP并行求解.

      (14)

      (15)

      |Ni-Nj|≤1, |Ni, l-Ni, m|≤1, ?i≠j,?l≠m.

      (16)

      m=1(1)Nmyid, l,分別表示第myid號進(jìn)程上的第l個(gè)線程上的第m個(gè)轉(zhuǎn)換算子對應(yīng)的矩陣和相應(yīng)子系統(tǒng)的系數(shù)矩陣.

      算法2MPI+OpenMP并行非重疊DDM的預(yù)條件子

      Step 1初始化并行向量z.

      Step 2將并行向量r轉(zhuǎn)為串行向量, 不妨仍記為r.

      Step 3若myid=0,則zmyid:= (PdTBdPd)r;

      若myid=1, 則zmyid:= (PWTBWPW)r;

      若myid≠0 且myid≠1并行做以下循環(huán)

      form=1,…,nts

      Step 3.1求Ft(l,m):=Pmyid(l,m)r.

      Step 3.2求yt(l,m)=Bmyid(l,m)Ft(l,m)

      Step 3.3求zmyid:=zmyid+(Pmyid(l,m))Tyt(l,m).

      end for

      注1若子問題規(guī)模 (存儲(chǔ)規(guī)模) 能由一個(gè)計(jì)算結(jié)點(diǎn)容納時(shí),子問題求解調(diào)用HYPRE[16]中串行AMG 或AMG-T;否則,當(dāng)子問題規(guī)模超過一個(gè)計(jì)算結(jié)點(diǎn)的容納能力時(shí),子問題求解調(diào)用HYPRE中并行AMG或并行AMG-T求解.本文數(shù)值實(shí)驗(yàn)部分的子問題求解調(diào)用HYPRE中的串行AMG 或AMG-T.

      4 數(shù)值實(shí)驗(yàn)

      在線彈性模型問題式(1)中, 取單位立方體Ω:=(0,1)×(0,1)×(0,1);E=3 000,v=

      0.3;f=(f1,f2,f3)T, 其中

      f1(x,y,z)=(λ+4μ)π2sin(πx)sin(πy)sin(πz)-(λ+μ)(3x2-4x3)πcos(πy)sin(πz)-

      (λ+μ)π2y3(1-y)cos(πx)cos(πz),

      f2(x,y,z)=-(λ+μ)π2cos(πx)cos(πy)sin(πz)-(λ+μ)(3y2-4y3)πsin(πx)cos(πz)+

      [(12x2-6x)μ+π2x3(1-x)(λ+3μ)]sin(πy)sin(πz),

      f3(x,y,z)=(λ+μ)π2cos(πx)sin(πy)cos(πz)-(λ+μ)π2x3(1-x)cos(πx)cos(πz)+

      [(12y2-6y)μ+π2y3(1-y)(λ+3μ)]sin(πx)sin(πz).

      數(shù)值實(shí)驗(yàn)硬件環(huán)境為某2路4核工作站(CPU: Intel Xeon W5590*2, Mem:24 GB); 軟件環(huán)境為Linux Redhat 5.3,gcc v4.1.2,gfortran v4.1.2,mpich2-1.3.2p1,hypre-2.7.0b.由于該工作站總共只有8 個(gè)核,因此我們只針對進(jìn)程數(shù)和線程數(shù)不大于8 的情形進(jìn)行數(shù)值實(shí)驗(yàn),這樣可以保證進(jìn)程或線程與核一一對應(yīng).實(shí)驗(yàn)中取PCG迭代控制精度為10-6.

      算法可擴(kuò)展性表4給出了不同網(wǎng)格剖分Τmd,k和不同進(jìn)程數(shù)np下PCG算法的外迭代次數(shù).

      由表4可知,當(dāng)d/h不變時(shí),條件數(shù)κ(BA) 為常量,表明該預(yù)條件子的算法可擴(kuò)展性達(dá)到最優(yōu);當(dāng)d不變,h變小時(shí),條件數(shù)κ(BA) 僅弱依賴于d/h=k.

      第三類子系統(tǒng)的并行可擴(kuò)展性表5給出了相應(yīng)的CPU時(shí)間與并行效率.

      由表5可知,當(dāng)進(jìn)程數(shù)np=8 時(shí)加速比達(dá)到95%以上而未達(dá)到100%.可能的原因?yàn)椋贺?fù)載不夠平衡.可以預(yù)測,在更多進(jìn)程參與計(jì)算的情況下,該類子問題的求解加速性能不差.若進(jìn)程數(shù)足夠多,該類子問題的求解時(shí)間將大幅下降.

      表4 不同Τmd,k與np下PCG的外迭代次數(shù)

      表5 不同Τmd,k與np下求解第三類子系統(tǒng)的CPU時(shí)間與并行效率

      表6 在不同并行模式下求解的時(shí)間比值

      實(shí)驗(yàn)結(jié)果表明在曙光5000上求解該DDM預(yù)條件系統(tǒng)時(shí),采用MPI+OpenMP 模式比MPI模式計(jì)算效率更高.

      感謝湘潭大學(xué)王俊仙博士在并行DDM 算法設(shè)計(jì)方面提供的良好建議.

      [1]DRYJA M, SMITH F,WIDLUND O.Schwarz analysis of iterative substructuring algorithms for elliptic problems in three dimensions[J].SIAM J Numer Anal, 1994,31(6):1662-1694.

      [2]DRYJA M,WIDLUND O. Schwarz methods of neumann type for three-dimensional elliptic finite element problems[J].Comm Pure Appl Math, 1995, 48:121-155.

      [3]HU Q,SHI Z,YU D.Efficient solvers for saddle point problems arising from domain decompositions with lagrange multipliers[J].SIAM J Numer Anal, 2004,42(3):905-933.

      [4]HU Q,SHU S,WANG J.Nonoverlapping domain decomposition methods with simplified coarse spaces for solving three-dimensional elliptic problems[J].Math Comp, 2010, 79(272): 2059-2078.

      [5]FENG C,SHU S, XU J,et al.Numerical study of geometric multigrid methods on CPU-GPU heterogeneous computers[J].AAMM, 2014, 6(1):1-23.

      [6]FENG C,ZHANG S.Optimal solver for morley element discretization of biharmonic equation on shape-regular grids[J].JCM, 2016, 34(2):159-173.

      [7]譚林, 江軍, 舒適, 一種三角形網(wǎng)格下保對稱有限體元方法的預(yù)條件技術(shù)[J].湘潭大學(xué)自然科學(xué)學(xué)報(bào), 2006,28(1):1-6.

      [8]BRANDT A, MCCORMICK S,RUGE J.Algebraic multigrid (AMG) for automatic multigrid solution with application to geodetic computations[P].Institute for Computational Studies, POB 1852, Fort Collins, Colorado, 1982.

      [9]STERCK H D,YANG U M,HEYS J J.Reducing complextity in parallel algebraic multigrid preconditioners[J].SIAM J Mat Anal Appl,2006,27(4):1019-1039.

      [10]BIENZ A,FALGOUT R D,GROPP W,et al.Reducing parallel communication in algebraic multigrid through sparsification[J].SIAM J Sci Comp, 2016, 38(5): S332-S357.

      [11]RUGE J W, STüBEN K. Algebraic multigrid[M]//Multigrid Methods.Philadelphia:SIAM,1987:73-130.

      [12]XU J,ZIKATANOV L.On the energy minimizing base for algebraic multigrid methods[J].Computing and Visualization in Science, 2004, 7:121-127.

      [13]BREZINA M,FALGOUT R D,MACLACHLAN S,et al.Addaptive smoothed aggregation(αSA)[J].SIAM Review, 2005, 47(2):317-346.

      [14]CHARTIER T,FALGOUT R D,HENSON V E,et al.Spectral AMGe(ρAMGe)[J].SIAM J Sci Comp,2003,20(1):1-20.

      [15]VANEK P,MANDEL J,BREZINA M.Algebraic multigrid by smoothedaggregation for second and fourth order elliptic problems[J].Computing, 1996, 56:179-196.

      [16]趙永華, 遲學(xué)斌.基于SMP集群的MPI+OpenMP混合編程模型及有效實(shí)現(xiàn)[J].微電子學(xué)與計(jì)算機(jī),2005,22(10):7-11.

      [17]FALGOUT R D,BAKER A,CHOW E,et al.HYPRE: High performance preconditioner[OL].https://computation.llnl.gov/casc/hypre/software.html.

      猜你喜歡
      進(jìn)程算子子系統(tǒng)
      不對中轉(zhuǎn)子系統(tǒng)耦合動(dòng)力學(xué)特性研究
      擬微分算子在Hp(ω)上的有界性
      GSM-R基站子系統(tǒng)同步方案研究
      各向異性次Laplace算子和擬p-次Laplace算子的Picone恒等式及其應(yīng)用
      債券市場對外開放的進(jìn)程與展望
      中國外匯(2019年20期)2019-11-25 09:54:58
      一類Markov模算子半群與相應(yīng)的算子值Dirichlet型刻畫
      駝峰測長設(shè)備在線監(jiān)測子系統(tǒng)的設(shè)計(jì)與應(yīng)用
      Roper-Suffridge延拓算子與Loewner鏈
      車載ATP子系統(tǒng)緊急制動(dòng)限制速度計(jì)算
      社會(huì)進(jìn)程中的新聞學(xué)探尋
      翼城县| 乐昌市| 大厂| 文昌市| 清河县| 曲周县| 宁陵县| 锦屏县| 永安市| 辽阳县| 敦化市| 察雅县| 五常市| 维西| 重庆市| 三明市| 平乡县| 石林| 宜兰县| 鄂托克前旗| 和平县| 游戏| 承德县| 申扎县| 旌德县| 屏东县| 黄平县| 精河县| 荃湾区| 汝南县| 鄯善县| 多伦县| 铜山县| 长葛市| 新宾| 康平县| 恩平市| 千阳县| 蚌埠市| 五峰| 中西区|