• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      開放骨架磷酸鋁定向合成反應(yīng)預(yù)測研究

      2020-10-09 07:13:08姚明海李勁松
      渤海大學學報(自然科學版) 2020年1期
      關(guān)鍵詞:分子篩定向模板

      姚明海,李勁松

      (渤海大學 信息科學與技術(shù)學院,遼寧 錦州121013)

      0 引言

      分子篩因其獨特的結(jié)構(gòu)特征,大量應(yīng)用于氣體的吸附、分離和凈化方面,以及石油煉制中催化和離子交換方面.目前,對于無機微孔材料如何定向合成的問題仍然是國內(nèi)外材料領(lǐng)域和分子工程學領(lǐng)域研究熱點[1-3].在過去幾年里,諸多學者試圖通過將數(shù)據(jù)挖掘思想和方法引入到分子篩問題中,建立相關(guān)預(yù)測模型來對無機微孔材料進行更好地定向合成,一些數(shù)學統(tǒng)計方法已經(jīng)大量使用于化學分子材料分析問題中并取得了部分研究成果,但是關(guān)于開放的骨架磷酸鋁定向合成的預(yù)測實驗和相關(guān)數(shù)據(jù)仍然較少.文獻[4]將支持向量機運用于各種催化劑來預(yù)測催化性能的實驗.實驗結(jié)果說明,與各種決策樹相比,在一定催化條件下支持向量機取得更好的分類性能.齊妙等人在合成參數(shù)對實驗產(chǎn)物類型影響的預(yù)測實驗中,采取了將Logistic回歸與偏最小二乘法相結(jié)合的統(tǒng)計方法(PLS-LR)[5].

      近年來,國內(nèi)學者開始尋找開放骨架磷酸鋁結(jié)構(gòu)與合成因子之間的對應(yīng)關(guān)系.在文獻[6]和[7]中,齊妙等人分別提出了利用加權(quán)融合思想的特征選擇方法和基于隨機子空間的特征選擇方法來分析定向合成(12,6)元環(huán)分子篩的合成因子的重要程度.這些方法為利用數(shù)據(jù)挖掘思想和特征選擇來進行實驗分析和預(yù)測合成參數(shù)對相應(yīng)合成產(chǎn)物間對應(yīng)關(guān)系的有效性和可行性提供了證明.吉林大學的“無機合成與制備國家重點實驗室”創(chuàng)建了磷酸鋁合成反應(yīng)的數(shù)據(jù)庫,供國內(nèi)外的諸多學者和科研人員免費使用,為分子篩的設(shè)計與定向合成相關(guān)研究提供了數(shù)據(jù)基礎(chǔ).該數(shù)據(jù)庫的建立不僅為分子篩的預(yù)測與定向合成提供了相關(guān)的實驗數(shù)據(jù)和基礎(chǔ)信息,還開辟了如何設(shè)計和定向合成無機微孔材料的新通道.但是,在實驗中發(fā)現(xiàn)大約29%的數(shù)據(jù)有不同情況的缺失.為了進一步完善數(shù)據(jù)庫信息,減少對實驗結(jié)果的影響,文獻[8]提出了利用BP神經(jīng)網(wǎng)絡(luò)建立補值模型對缺失數(shù)據(jù)進行估計補值,通過大量的實驗證明了補值算法具有一定的有效性和可行性,但是該文在對凝膠組成建模過程中僅考慮了摩爾比關(guān)系而沒有考慮到溶劑和模板劑的影響.文獻[9]證明即使同樣的摩爾比值,使用不同模板劑或溶劑生成的結(jié)構(gòu)也會不同.所以為了更好的建立凝膠組成補值模型,應(yīng)當考慮進溶劑和模板劑因素.因此本文在國內(nèi)外學者的研究基礎(chǔ)上,將研究重點放在了建立更精確的預(yù)測和補值模型上,在完善數(shù)據(jù)庫的同時,為定向合成提供指導.

      本文首先通過大量隨機實驗,選擇出能提供正確分類信息的樣本;然后使用這些樣本建立更精確的預(yù)測模型和補值模型,并利用補值模型對部分錯誤樣本進行矯正;最后利用得到的預(yù)測模型和補值模型建立定向合成(12,6)元環(huán)分子篩的預(yù)測系統(tǒng).

      1 相關(guān)工作

      1.1 系統(tǒng)流程

      為了更好的挖掘定向合成分子篩的規(guī)律,建立更精確的判別模型,給定向合成提供指導性意見,本文在充分分析了國內(nèi)外學者研究工作的基礎(chǔ)上,以定向合成(12,6)元環(huán)分子篩為目標,建立更精確的判別系統(tǒng).該系統(tǒng)流程圖如圖1所示.

      從圖1可以看出,本文的工作主要包括系統(tǒng)構(gòu)建和系統(tǒng)測試兩部分,核心工作是構(gòu)建分子篩定向合成預(yù)測系統(tǒng).該過程首先對原始樣本數(shù)據(jù)進行篩選,得到能夠?qū)?gòu)建判別模型提供有用信息的富信息數(shù)據(jù)和提供錯誤信息或無法提供信息的負信息數(shù)據(jù).然后利用富信息數(shù)據(jù)構(gòu)建SVM判別模型和BP補值模型.基于判別模型和補值模型構(gòu)建分子篩定向合成預(yù)測系統(tǒng).最后通過分子篩定向合成預(yù)測系統(tǒng)實現(xiàn)分子篩定向合成反應(yīng)的預(yù)測.同時,可以利用補值模型實現(xiàn)負信息數(shù)據(jù)的矯正.

      1.2 數(shù)據(jù)篩選

      從文獻[6-7]可以發(fā)現(xiàn),不管是經(jīng)典的預(yù)測方法或特征選擇方法等對定向預(yù)測的準確率都無法超過90%,這與其他領(lǐng)域(如生物認證、生物信息學)動輒95%甚至100%的準確率相差甚遠.遺憾的是造成識別率不高的原因至今還無法查明.本文僅給出部分分析與猜測.首先,該數(shù)據(jù)庫除了收錄吉林大學“無機合成與制備國家重點實驗室”的按照統(tǒng)一標準記錄的研究結(jié)果外,還整理收錄了1936年至今的大量會議、專利、學位論文、文獻期刊上的研究成果,這些研究成果可能由于各種原因造成了實驗數(shù)據(jù)的偏差;其次,由于是不同的科研機構(gòu)的研究成果,使得在記錄的過程中有些實驗數(shù)據(jù)沒有記錄或是沒有精確記錄;再次,為了更好地利用數(shù)據(jù)挖掘方法建立預(yù)測模型,眾多學者普遍對這些數(shù)據(jù)進行了預(yù)處理,從原始數(shù)據(jù)中選出認為重要的參數(shù)用于后續(xù)實驗,這一過程可能忽略了一些還沒有被認識到但是非常重要的合成因子(如溫度、時間等);最后,定向合成實驗有著非常復(fù)雜的反應(yīng)過程,不是簡單輸入與輸出的關(guān)系,可能還需要中間過程,但是現(xiàn)階段對中間過程的描述并不多.以上這些僅是對造成目前眾多學者的研究結(jié)果識別率不高進行的初步分析.因為短時間內(nèi)無法對數(shù)據(jù)庫數(shù)據(jù)進行重新實驗驗證,目前僅能在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上進行實驗研究,因此為了避免存在偏差的數(shù)據(jù)對建立預(yù)測模型的影響,本文在數(shù)據(jù)預(yù)處理階段對數(shù)據(jù)進行了篩選.數(shù)據(jù)篩選階段的具體方法是將現(xiàn)有數(shù)據(jù)樣本分別作為訓練數(shù)據(jù)和測試數(shù)據(jù),根據(jù)正確分類情況將數(shù)據(jù)分為對預(yù)測能夠提供有用信息的富信息數(shù)據(jù)和對預(yù)測建模無法提供幫助的負信息數(shù)據(jù).具體算法描述如下:

      給定正樣本集X+和負樣本集X-,迭代次數(shù)n0和n1.

      1.3 判別方法

      支持向量機(Support Vector Machine,SVM)[10]是尋找一個超平面來對樣本進行分割,分割的原則是間隔最大化,最終轉(zhuǎn)化為一個凸二次規(guī)劃問題的分類模型,能有效解決局部極小點、全局最優(yōu)解、非線性和高維數(shù)等相關(guān)問題,在機器學習、模式識別、文本分類等領(lǐng)域廣泛應(yīng)用并成為研究熱點問題[11-13].算法描述如下:

      輸出:權(quán)重向量w,二次解a*,

      函數(shù)f 既是由超平面表示的決策規(guī)則

      在文獻[6-8]中均采用了SVM作為判別分類器,展示了不錯的分類性能,因此本文在構(gòu)建判別模型過程中選用SVM作為分類器.具體判別模型算法如下:

      給定正樣本集XP和負樣本集XN,迭代次數(shù)n.

      1.4 補值方法

      BP神經(jīng)網(wǎng)絡(luò)具有較強的非線性映射能力[14],以任意精度逼近任何非線性連續(xù)函數(shù),適合于求解內(nèi)部機制復(fù)雜的問題.此外,BP神經(jīng)網(wǎng)絡(luò)具有將學習成果應(yīng)用于新知識的泛化能力、魯棒性、容錯性以及高度自學習和自適應(yīng)的能力.鑒于BP神經(jīng)網(wǎng)絡(luò)存在的諸多優(yōu)勢及磷酸鋁合成反應(yīng)數(shù)據(jù)的各項參數(shù)之間存在相關(guān)性的特點,本文采用了BP神經(jīng)網(wǎng)絡(luò)的補值方法.本文BP神經(jīng)網(wǎng)絡(luò)選取三層結(jié)構(gòu)(輸入層、中間層、輸出層)來訓練樣本并形成模型.在實驗訓練樣本中的數(shù)據(jù)Y篩選出k個不含參數(shù)缺失信息的樣本y1,y2,…,yk,再從樣本數(shù)據(jù)中篩選出第h個參數(shù)缺失信息的樣本yj用作實驗測試樣本. BP神經(jīng)網(wǎng)絡(luò)的補值方法在應(yīng)用于缺失值估計時,一般分為兩個階段進行,即模型的訓練階段與缺失值的估計階段. 在模型訓練階段,每個實驗訓練樣本y1,y2,…,yk中,將p-h(p全體參數(shù))個數(shù)據(jù)參數(shù)視為BP神經(jīng)網(wǎng)絡(luò)的輸入量,該模型的輸出結(jié)果為實驗訓練樣本的第h個數(shù)據(jù)參數(shù),構(gòu)建三層BP神經(jīng)網(wǎng)絡(luò)模型. 在缺失值估計階段,通過將實驗測試樣本yj的p-h個數(shù)據(jù)參數(shù)放入BP神經(jīng)網(wǎng)絡(luò)訓練模型中,該模型的輸出結(jié)果即為數(shù)據(jù)缺失值yjh的相應(yīng)估計值.

      文獻[8]將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用到磷酸鋁合成反應(yīng)數(shù)據(jù)的缺失值處理上,當完備數(shù)據(jù)較多、缺失率較小時,BP神經(jīng)網(wǎng)絡(luò)訓練的越充分,對數(shù)據(jù)參數(shù)間相應(yīng)關(guān)系的建模就越精確,實驗結(jié)果補值的相應(yīng)誤差就越小.但是,該方法在補值過程中僅考慮了合成材料的摩爾比,沒有考慮到溶劑和模板劑對合成結(jié)果的影響.因此本文對補值方法進行了重新的設(shè)計,在補值過程中充分考慮了溶劑和模板劑對合成結(jié)果的影響.

      2 實驗結(jié)果與分析

      2.1 數(shù)據(jù)庫

      本文選用了磷酸鋁合成反應(yīng)數(shù)據(jù)庫(http://zeobank.jlu.edu.cn/)數(shù)據(jù),采用同文獻[7]相同的數(shù)據(jù)處理方式,以定向合成(12,6)元環(huán)結(jié)構(gòu)作為目標開展實驗.實驗結(jié)果得到生成(12,6)元環(huán)結(jié)構(gòu)的合成物398條視為正樣本,884條(不包含(12,6)元環(huán)結(jié)構(gòu))的合成物視為負樣本.每個樣本中有21維含反應(yīng)物屬性的參數(shù),參數(shù)說明如表1所示.

      2.2 實驗數(shù)據(jù)篩選

      經(jīng)過對實驗數(shù)據(jù)的統(tǒng)計和篩選后發(fā)現(xiàn),共有432條樣本存在不同程度的錯誤判別,其中正樣本186條,錯誤統(tǒng)計分布如圖2所示.在全部被錯誤判別的樣本中有9條樣本錯誤率為100%,全部為正樣本被錯誤判別為負樣本.為了后續(xù)試驗的順利進行,本文將錯誤率大于0.3的樣本定為負信息樣本,共132條,其中正樣本86條,允許錯誤率不大于0.3的樣本參與后續(xù)試驗.

      2.3 數(shù)據(jù)判別實驗

      經(jīng)過數(shù)據(jù)篩選后剩余樣本數(shù)量為1150條,其中正樣本312條.為了建立預(yù)測模型用于后續(xù)實驗,必須充分利用現(xiàn)有數(shù)據(jù)對模型進行訓練.因此,本文在樣本的選擇上正負樣本的數(shù)量比設(shè)置為1:1.但是,訓練和測試的樣本數(shù)量會發(fā)生改變,嘗試不同的訓練樣本數(shù)量,達到預(yù)測性能的最大化.這里嘗試將每類訓練樣本的數(shù)量Nr分別取為150,200,250和300四種數(shù)量.實驗結(jié)果如圖3所示.

      圖3顯示了預(yù)測準確率隨訓練樣本數(shù)量增加而變化的曲線圖.由圖3可以看出經(jīng)過篩選樣本后構(gòu)建的分類器的準確率非常高,隨著訓練樣本數(shù)量的增加準確率升高超過了99%.考慮到運行時間以及避免過擬合的情況發(fā)生,本文選用由正負樣本各選200個作為訓練樣本得到的SVM模型作為判別模型.

      2.4 數(shù)據(jù)補值實驗

      文獻[8]通過大量的隨機實驗證明了BP補值算法的有效性,但是該方法沒有考慮到溶劑和模板劑的組成.從文獻[7]通過對合成因子重要性的分析可以知道溶劑和模板劑在磷酸鋁合成反應(yīng)過程中發(fā)揮著重要作用.因此本文結(jié)合文獻[7]對合成因子的重要性的分析,提出在建立補值模型時增加F6和F12這兩個合成因子來標明溶劑和模板劑的成分.

      本文采取均方誤差根(normalized root mean squared error,NRMSE)的標準來對補值模型進行評價,公式如下:

      其中,ytrue是真實值,yestimated是通過補值方法獲得的估計值.NRMSE值越小說明算法性能越好,誤差越小.

      文獻[8]雖然使用了BP、KNN、LS和SVD四種補值方法,但是補值效果較好的是BP補值方法和KNN補值方法.因此本文在提出新的補值模型構(gòu)建理論后同文獻[8]使用的BP補值模型和KNN補值模型進行對比.表2列出了不同的補值模型在不同的缺失率下的實驗結(jié)果.由實驗結(jié)果可以看出本文提出的模型構(gòu)建理論在缺失率較低時,得到補值誤差有了明顯的降低.針對F2參數(shù),BP補值方法下降更顯著.隨著缺失率增加訓練樣本的減少,BP補值方法的性能有所降低.同時從表2可以看出考慮了溶劑和模板劑影響的KNN算法明顯好于文獻[8]中的KNN算法.KNN補值方法依然展現(xiàn)了不隨缺失率增大而發(fā)生較大波動的特點,但是,相對于BP補值方法來說,KNN補值方法的缺陷在于補值過程中要完全依賴于數(shù)據(jù)集,而BP補值方法則不需要.

      為了對BP補值模型的性能有更直觀的對比,本文將各種方法在不同缺失率獲得的平均NRMSE在圖4中進行了展示.由圖中可以看出本文提出的融入了溶劑和模板劑信息的BP補值方法和KNN補值方法補值誤差明顯降低.在缺失率較低的情況下,本文得到BP補值模型具有最低的錯誤率,補值性能最高.因為BP模型構(gòu)建后不再受到樣本庫的影響,而KNN模型的補值依賴數(shù)據(jù)集,考慮到系統(tǒng)的可擴展性,本文提出的系統(tǒng)選用BP補值模型.

      表2 不同缺失率下各種補值方法的均方誤差根(NRMSE)

      在補值模型建立后,本文還進行了對被錯誤判別的正樣本進行矯正工作.經(jīng)矯正后,原有錯誤率不同的186條正樣本有149條樣本被矯正,矯正率達到80.1%,正樣本的判定準確率也從84.38%上升到85.74%.

      3 系統(tǒng)構(gòu)建與測試

      3.1 構(gòu)建分子篩定向合成預(yù)測系統(tǒng)

      在上述模型構(gòu)建上兩個關(guān)鍵模型的建立雖然極大的方便了使用者,但是為了方便更多的科研工作者的使用,本文建立了用于定向合成(12,6)元分子篩的定向合成預(yù)測系統(tǒng).該系統(tǒng)主界面如圖5(a)所示.界面由4個可編輯文本框、兩個下拉菜單、兩個按鈕和一個輸出顯示區(qū)域幾部分組成.四個可編輯文本框?qū)?yīng)的是反應(yīng)物的凝膠組成,其中Al2O3是必填項,只有這項填入數(shù)值后后續(xù)菜單和按鈕才能被激活使用,而其他三個摩爾值允許使用者不填.當存在摩爾值未填寫情況而使用者又要求進行預(yù)測判斷時系統(tǒng)自動調(diào)用補值估計機制.兩個下拉菜單分別顯示的可選的溶劑和模板劑種類,也是必選項.預(yù)測結(jié)果在顯示區(qū)域顯示.

      該系統(tǒng)為可執(zhí)行程序,用戶可以直接運行,不需要預(yù)先打開任何編程軟件.此外系統(tǒng)還以excel表格形式自動對每次的判別過程進行保存,包括輸入的凝膠組成、溶劑和模板劑的成分、判別結(jié)果和未填參數(shù)后的系統(tǒng)給出的各參數(shù)估計推薦值,方便了后續(xù)的實驗記錄.

      3.2 系統(tǒng)測試

      在系統(tǒng)構(gòu)建完成后,對系統(tǒng)進行了簡單測試.效果圖如圖5所示.圖5(a)為系統(tǒng)主界面,用戶需要首先填入Al2O3的摩爾量來激活溶劑的菜單(圖5(b)),其他三個摩爾量該系統(tǒng)允許用戶不確定輸入.選擇溶劑后激活模板劑菜單(圖5(c)),再選擇模板劑后激活執(zhí)行按鈕(圖5(d)),這時就達到了該系統(tǒng)運行的最低條件,用戶可以繼續(xù)輸入其余摩爾量也可以選擇在此條件下進行估計預(yù)測.當用戶僅輸入了Al2O3、溶劑和模板劑的種類后,系統(tǒng)會根據(jù)用戶的輸入給出推薦的實驗參數(shù)值(如圖5(e)).圖5(g)和圖5(h)分別是用戶輸入全部參數(shù)后,系統(tǒng)直接給出的判斷結(jié)果.圖5(f)是當用戶的輸入不符合實際情況時系統(tǒng)的錯誤提示.該系統(tǒng)簡單、直觀、快捷、便利,用戶在使用時無需進行任何培訓就可直接使用,為科研工作者提供了幫助.

      4 結(jié)論

      為了更好地為分子篩的定向合成服務(wù),本文在總結(jié)國內(nèi)外學者大量研究工作的基礎(chǔ)上,建立了一個簡單、易用的定向合成預(yù)測系統(tǒng).在建立的過程中首先對數(shù)據(jù)進行篩選,通過篩選后的數(shù)據(jù)構(gòu)建更精確的預(yù)測模型和補值估計模型.在建立補值估計模型時,提出新的模型設(shè)計方案,考慮了溶劑和模板劑對合成結(jié)果的影響,使補值模型更精確.

      本文系統(tǒng)的構(gòu)建,將為分子篩如何定向合成以及后續(xù)工作者的相關(guān)研究提供相應(yīng)的幫助與基礎(chǔ),在建立系統(tǒng)的過程中也為數(shù)據(jù)庫的完善做出了貢獻.同時這一模式也可以向其他行業(yè)擴展.但是本文還存在僅針對單一種類定向合成研究這一局限,在今后會將該系統(tǒng)擴展到判斷更多分子篩結(jié)果的預(yù)測工作上.

      猜你喜歡
      分子篩定向模板
      鋁模板在高層建筑施工中的應(yīng)用
      鋁模板在高層建筑施工中的應(yīng)用
      沸石分子篩發(fā)展簡述
      云南化工(2021年10期)2021-12-21 07:33:24
      偏序集上的相對定向集及其應(yīng)用
      定向越野
      鋁模板在高層建筑施工中的應(yīng)用
      城市綜改 可推廣的模板較少
      定向馴化篩選耐毒酵母
      ZSM-5分子篩膜制備方法的研究進展
      簡述ZSM-5分子篩水熱合成工藝
      达州市| 揭东县| 隆德县| 远安县| 洱源县| 吉水县| 广灵县| 兰坪| 融水| 清镇市| 出国| 阳泉市| 驻马店市| 洛阳市| 富阳市| 宁武县| 黄陵县| 织金县| 波密县| 抚松县| 玉树县| 洪湖市| 米林县| 宝丰县| 光泽县| 达日县| 扶绥县| 丹阳市| 西充县| 嘉兴市| 房产| 黎川县| 搜索| 敦煌市| 措美县| 鹿泉市| 凯里市| 宜兰县| 同仁县| 游戏| 吕梁市|