劉小久,何遠德
( 西南民族大學計算中心,四川 成都 610041)
隨著信息技術的不斷進步,計算材料學經(jīng)過幾十年的發(fā)展,已經(jīng)從最初的對已知材料電子結構和基本特性的近似計算發(fā)展到能對材料新結構、組成進行準確預測,并發(fā)現(xiàn)材料未知的構效關系等.近年來我國對材料基因組計劃[1]也有了自己的規(guī)劃,將材料計算列為與制備和表征同等重要的地位.該計劃已經(jīng)從以前的對已有材料的物性解釋與實驗對照,發(fā)展到指導實驗研究與材料合成方向的作用.要達到這樣的目的,材料的高通量計算將是最關鍵的手段.材料性能的高通量計算[2],已經(jīng)在新材料的發(fā)現(xiàn)中展示了巨大的作用.同時,我們看到在高通量計算的基礎上,利用大數(shù)據(jù)相關技術[3],特別是機器學習[4-6]的方法、理論,為材料性能快速預測提供了新的途徑和方法.材料數(shù)據(jù)科學[7]以及其相關的材料信息學[8-9]正在發(fā)展成為一門新的學科,助力材料相關研究,為新材料的研發(fā)提供全新、快捷、高效的手段.
材料的高通量計算是材料信息學的重要手段和基礎,它包含三個要素[10]:材料物性的可算性、數(shù)據(jù)輸入和輸出的自動化以及計算任務的并行化.所謂物性的可算性,即要求材料的相關性質(zhì)能夠通過計算可靠地獲得,它可以是能夠直接計算的物理性質(zhì)或者可以通過計算的物理量直接決定的特性.前者如材料的基態(tài)特性:晶體晶格常數(shù)、彈性常數(shù)以及磁化強度等等[11],這些物理量可以方便地通過基于電子密度泛函的理論計算獲得;后者如拓撲絕緣體的判斷,可以通過材料在相對論情況下和非相對論情況下的能帶比較得到[12].自動化和并行化,是為了解決大量的計算任務提出的,只有實現(xiàn)了這兩點,才能在有限的時間內(nèi)對材料進行快速計算和篩選.比如,受電聲耦合機制所決定的材料的電阻率,原則上可以通過計算的方式進行估計[13],但在目前階段,該計算仍然需要大量的計算資源,因而無法快速地進行海量材料的計算.鑒于以上三點,目前通過高通量計算建立的數(shù)據(jù)庫,主要包括合金的力學性能、化學特性[14]、Heusler化合物的輸運特性[15-16],材料光催化等方面[17].除了進行第一性原理計算外,某些數(shù)據(jù)庫也提供了多尺度的材料仿真和設計,實現(xiàn)了從材料微觀到宏觀性能的自動計算預測[18-19].
在實現(xiàn)高通量計算過程中,有必要對材料的元數(shù)據(jù)進行規(guī)范化,以便不同代碼間實現(xiàn)數(shù)據(jù)的共享,實現(xiàn)計算代碼的異質(zhì)集成,以及材料的跨尺度計算.歐洲的NOMAD在材料電子結構的元數(shù)據(jù)標準化方面提供了一個參考[20].美國的Materials Commons[21]提供了結構材料數(shù)據(jù)的共享規(guī)范,美國國家標準局也在材料基因工程的框架下構建了材料信息學平臺及相關規(guī)范(MDCS)[22].我國以北京科技大學為牽頭單位也建設了材料數(shù)據(jù)庫及公共服務平臺[23].
為實現(xiàn)材料的高通量計算以及不同尺度的材料計算設計集成,需要開發(fā)相應的計算平臺,以實現(xiàn)對數(shù)據(jù)及計算過程的自動高效管理.MIT的Ceder小組建議了一種支持高通量計算的計算基礎平臺以及元數(shù)據(jù)設計,并在Materials Projects平臺中給出了應用的示范[24].類似的平臺如美國的AFLOW[25-26],Granda MI等系統(tǒng).中國科學院信息中心開發(fā)了材料計算平臺Matcloud[27],主要用于二元合金的高通量計算.Material explore公司在其材料集成計算軟件MedeA中也開發(fā)了相應的高通量計算模塊MedeA-HT[28].以上計算平臺的第一性原理計算引擎均是商業(yè)化代碼VASP[29].王果等人對材料數(shù)據(jù)高性能計算數(shù)據(jù)庫分配策略[30]做了相應研究,該研究著手于優(yōu)化高通量計算過程中的數(shù)據(jù)庫分配方案.PWscf作為一款開源的基于密度泛函理論的材料電子結構計算軟件,由于其功能全面、高效可靠的特點,得到了廣泛的應用,然而,基于其開發(fā)的集成計算環(huán)境以及高通量計算接口卻很少,目前僅僅在AFLOW中實現(xiàn)了其集成化.由于開源代碼的靈活性以及商業(yè)上的廉價,利用開源代碼的計算平臺將具有更大的市場優(yōu)勢及開發(fā)價值.
因而,我們基于PWscf作為計算引擎,開發(fā)了實現(xiàn)高通量計算的自動計算平臺.在該平臺中,實現(xiàn)了計算輸入的準備、計算任務的調(diào)度管理以及數(shù)據(jù)信息的提取與分析等功能.并以二維半導體材料作為應用示范,通過自動計算,獲得優(yōu)化后的原子位置、生成的材料電子能帶、態(tài)密度,自動計算導帶低和價帶頂?shù)碾娮雍涂昭ㄔ诓煌较虻挠行з|(zhì)量.同時,我們對材料的相關性能進行了統(tǒng)計分析,為材料構效關系的建立奠定了基礎.
本系統(tǒng)為高通量的二維材料原子位置優(yōu)化、電子性能計算數(shù)據(jù)管理系統(tǒng).具有可視化交互式材料原子位置錄入、晶體結構顯示、電子結構顯示以及材料關鍵輸運參數(shù).如帶隙大小及類型,電子和空穴有效質(zhì)量自動地計算功能.針對高通量的材料計算及新材料初始結構產(chǎn)生,我們采用原子的組合替換方法.系統(tǒng)能夠?qū)崿F(xiàn)計算任務的自動生成和管理,計算過程的監(jiān)控以及計算結果的提取、分析和收集入庫的功能.
在總體設計上以數(shù)據(jù)庫為核心,包括如下三大功能部分:材料基本信息數(shù)據(jù)庫,計算節(jié)點控制作業(yè)調(diào)度管理,以及輸入輸出信息解析.其主要的構件及信息/數(shù)據(jù)流如下圖1所示,圖中箭頭的方向表明數(shù)據(jù)的流向,橫線定義了平臺界面、軟件和硬件.在該設計中,計算服務器和存儲服務器由相互獨立的硬件承擔.計算代碼和數(shù)據(jù)庫條目之間的信息交換通過文件進行:由專門的腳本分析不同計算代碼的輸入輸出文件,并利用關鍵字檢索的方法,形成數(shù)據(jù)庫條目.數(shù)據(jù)庫作為數(shù)據(jù)交換的樞紐,不同代碼的數(shù)據(jù)讀取和存放均通過與數(shù)據(jù)庫中間件的API交互完成.我們采用瀏覽器與數(shù)據(jù)庫的交互,實現(xiàn)相關數(shù)據(jù)的增、刪、改、查的工作以及數(shù)據(jù)的統(tǒng)計分析及后續(xù)處理.
圖1 系統(tǒng)的總體架構示意圖
根據(jù)材料基本屬性的構成,我們選擇關系數(shù)據(jù)庫MySQL作為材料的關鍵信息存儲平臺.主要基于以下三點考慮:首先從材料的數(shù)據(jù)級別上來看本系統(tǒng)屬于百萬級數(shù)據(jù)量,但元數(shù)據(jù)構成復雜;其次材料計算周期長,數(shù)據(jù)的成本高昂,數(shù)據(jù)需要考慮容災備份;最后系統(tǒng)能夠方便進行數(shù)據(jù)建模和遷移,具備未來和Hadoop大數(shù)據(jù)平臺對接的基礎.
根據(jù)材料基因數(shù)據(jù)的系統(tǒng)相關性,建立基礎數(shù)據(jù)表general_data,以此為基礎建立空穴、電子、帶隙、贗勢文件(UPF文件)等數(shù)據(jù)信息表等,見下圖2.整個系統(tǒng)主要完成兩個核心流程:
1)自動計算流程
“計算任務運維中心”基于輸入條件生成批量計算腳本,“計算調(diào)度中心”收到計算任務之后分發(fā)到計算集群,由集群管理系統(tǒng)(PBS)完成計算任務指派和計算資源分配,并調(diào)用PWscf的相關計算模塊進行計算;計算調(diào)度中心實時跟蹤計算任務狀態(tài),并回報運維中心,在瀏覽器頁面顯示.
2)結果分析流程
在PBS腳本中,實現(xiàn)計算完成之后,回調(diào)到計算結果分析中心,對計算結果進行解讀,解析計算輸出文件.該流程主要獲得相關體系不同k點的能量本征值,帶隙以及本征能級的占據(jù)數(shù)等信息,并由計算調(diào)度中心將解析結果傳遞給計算運維中心,回寫到數(shù)據(jù)庫中.
本系統(tǒng)涉及數(shù)據(jù)查看、查找、篩選、數(shù)據(jù)統(tǒng)計、材料母體結構輸入、原子組合替換、原子位置優(yōu)化以及材料電子結構及物性計算等過程.
為實現(xiàn)跨軟件的計算平臺,在準備計算任務的數(shù)據(jù)表示中,我們采用XML結構,將計算控制信息用偽代碼表示,在生成具體計算任務時,再映射為相應的計算代碼輸入文件.在對輸出信息提取時,我們直接讀取分析PWscf所生成結果中的XML文件信息.在該文件中,包含了所有的計算輸入和輸出信息,包括晶格常數(shù)、原子坐標、晶體對稱性等結構信息以及不同k點的本征值、Fermi能級及相應本征態(tài)的占據(jù)數(shù)等電子結構信息.它具有格式統(tǒng)一的特性,以及不同版本間數(shù)據(jù)結構差異小等特征,便于相關代碼的編寫及重用.
為實現(xiàn)交互式原子輸入及更新內(nèi)容,我們采用JMOL提供的晶體顯示插件顯示晶體結構.在原子位置信息表示中,我們采用較通用的POSCAR文件格式.該插件提供了對顯示畫面的旋轉(zhuǎn),縮放,長度和角度測量等功能,便于直觀檢查輸入的正確性.其顯示效果如圖3所示.
圖3 基于JMOL的晶體結構顯示和交互界面
為實現(xiàn)高通量的計算并能夠比較不同計算的結果,需要對計算精度和能帶結構的輸出信息做統(tǒng)一控制.對于PWscf,其主要的精度控制是通過控制平面波的截斷動能,以及不可約布里淵區(qū)(IBZ)劃分密度,即k點的間距決定.我們主要采用控制k點間距的方法,將缺省的k點間距控制在0.2 ?-1,這樣的缺省值相當于在正空間的邊長為3 nm立方體原胞,可以滿足通常二維材料在厚度方向相互作用可以忽略的間距要求.另外,本平臺同時提供自由的腳本編輯和修改功能,能夠方便地根據(jù)需要設定相關的計算控制參數(shù).
在材料的設計和計算中,材料的組合計算是產(chǎn)生海量不同材料的有效方法,它在新材料的發(fā)現(xiàn)中有重要的作用.通過計算機自動產(chǎn)生不同位置的元素替代,并結合第一性原理的計算,可以快速尋找到合適的材料.在二維材料中,我們也利用該方法進行新材料的產(chǎn)生.與通常的合金或化合物材料不同,在二維材料的生長過程中,如利用原子層沉積工藝(ALD)[31],我們能夠控制新加入的原子種類,實現(xiàn)原子按層生長,在第三維進行材料原子剪裁.因而,在我們系統(tǒng)設計中,考慮到與實驗的結合,采用分組的方法,實現(xiàn)原子替換:即將原子按原子層分組,相同分組的原子作為同一分組,同時替換.這樣減少了替換的組合數(shù),實現(xiàn)高效快速的計算,同時能夠為實驗的材料合成提供更直接相關參考.
在本數(shù)據(jù)庫中,計算并存儲特了定方向的有效質(zhì)量m[ijk],其中[ijk]為晶向指數(shù),其缺省值為[100]、[010]及[001]三個正交的方向.態(tài)密度有效質(zhì)量
(1)
(2)
二維半導體是目前研究的熱點,目前,自然存在的已經(jīng)發(fā)現(xiàn)及合成的材料僅僅幾十種[32].我們可以通過不同元素的合理替代,形成新的二維材料,同時,由于不同材料在z方向弱的相互作用,這為我們利用不同的二維材料構成異質(zhì)結提供了基礎,因而可以利用組合的方法形成所謂的van der Waals異質(zhì)結材料[33-35],為材料的特性調(diào)控中增加了新的手段和方法.利用材料組合的自動計算技術我們能迅速對材料的基本性能進行計算,并對性能變化的規(guī)律和關聯(lián)性進行分析.
本數(shù)據(jù)庫中我們對總共兩千多種可能的單層二維材料及幾類典型的van der Waals異質(zhì)結二維材料進行了計算.這些單層的二維材料結構分別為MX2型, MX3型,K-C6型以及MXene,異質(zhì)結材料由1H-MX2組合構成.
在本文中,我們以典型的MX2型材料為例,分析其計算獲得的信息及相關統(tǒng)計結果.
MX2型的二硫過渡金屬化合物是目前研究的熱點材料,其結構如圖4(a)所示:在兩層硫族元素(X)中間,是過渡元素(M),根據(jù)結構是否具有中心反演對稱,可以分為1H型和1T型.在平面內(nèi),MX2型二維材料的晶格為正六邊形.為獲得在晶格參數(shù)優(yōu)化過程中的穩(wěn)定性,我們采用正交的超原胞晶格.在平面內(nèi),該四邊形超原胞與原來的六邊形原胞的變換對應關系如圖4(b)所示.
(a)結構示意圖
在組合替代時,上下兩層的硫族原子同時做不同的元素替換,同時過渡金屬也在3d和4d元素中變化,形成X1-M-X2的化合物,這樣可以獲得金屬到半導體(包括直接帶隙和間接帶隙半導體)不同帶隙人工設計的新材料.并且對這些不同材料進行結構優(yōu)化:包括平面內(nèi)xy方向晶格常數(shù)的優(yōu)化以及原子位置在z方向的弛豫以獲得新材料的晶格常數(shù),并更新數(shù)據(jù)庫中用弛豫后的結構獲得的電子結構、態(tài)密度、電子和空穴有效質(zhì)量以及帶隙等信息.這樣我們可以得到材料的性能的統(tǒng)計信息如下:
1)物性關聯(lián)
同一結構化合物的電子和空穴有效質(zhì)量分布見圖5(a).由圖可見,有效質(zhì)量具有關于45度線的對稱性.從而我們可以獲得電子和空穴有效質(zhì)量類似的材料.同時有效質(zhì)量分布具有明顯的聚類特征:分布集中在圖片的左下角,意味著在二維半導體中,大多數(shù)材料的電子和空穴有效質(zhì)量均很小,為性能材料的選擇提供了一定的空間.因為對于二維材料,粒子態(tài)密度正比于有效質(zhì)量的平方根,因而,說明該體系的粒子態(tài)密度較低,這是sp電子主導的態(tài)密度的重要特征.
(a)電子和空穴平均有效質(zhì)量
所計算的二維材料,其電子的有效質(zhì)量和帶隙關系的散點圖如圖5(b)所示.從圖中可以看到,MX2型二維材料有效質(zhì)量絕大部分集中在5 me以下.同時,二維材料的帶隙最高可以到1.8 eV,在紅光和紅外光范圍內(nèi),因而該類材料可能成為紅外探測材料的很好候選.同時空穴有效質(zhì)量普遍高于電子的有效質(zhì)量,這也是通常半導體材料的共性.
2)特性統(tǒng)計分布
通過我們的計算,對于MX2型材料,其在[100]方向的空穴和電子的有效質(zhì)量分布如圖6(a)所示.從圖中可以看出,材料的有效質(zhì)量分布隨往小的有效質(zhì)量聚集,隨著有效質(zhì)量的增加呈明顯的衰減.這個分布規(guī)律預示著我們可以在多數(shù)二維材料中獲得較高的高載流子遷移率,因為在類似的材料中,其電聲耦合的相互作用所形成的形變勢變化在相同量級[36-37],因而,有效質(zhì)量決定了材料的載流子遷移率.
(a)電子和空穴的有效質(zhì)量分布
對于其帶隙值的分布也可以做類似的統(tǒng)計信息,如圖6(b).可以看到帶隙大小為0.3~0.4 eV時具有最可幾分布.我們知道,在共價化合物半導體中,其帶隙通常由原子的成鍵軌道和反成鍵軌道的能量差決定,而這個能量差由陰離子間相互作用決定,這種相互作用對于同族的原子相差不大,因而帶隙在某一值附近獲得最可幾分布.
文章介紹了本團隊開發(fā)的以PWscf為計算引擎的二維半導體材料高通量計算平臺的設計、實現(xiàn)及測試過程.該平臺能夠?qū)崿F(xiàn)對計算任務的管理和調(diào)度、材料的組合計算、結構優(yōu)化、基本輸運性能計算,能夠以友好的圖形交互界面完成材料結構的輸入與查看.通過在二維材料中的應用,展示了其任務管理和數(shù)據(jù)管理的功能.經(jīng)過簡單的數(shù)據(jù)統(tǒng)計,能夠發(fā)現(xiàn)一些材料性能的變化規(guī)律,隨著數(shù)據(jù)量的不斷積累,有望通過數(shù)據(jù)挖掘技術、機器學習等,獲得半導體關鍵性能的構效關系.隨著材料信息學的發(fā)展以及材料大數(shù)據(jù)挖掘技術的發(fā)展和應用,平臺功能的進一步完善和補充,必將為新材料的研發(fā)做出應有的貢獻.