• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于定量結(jié)構(gòu)-性質(zhì)關(guān)系預(yù)測(cè)含水二元共沸物的共沸溫度與組成

      2020-08-22 09:40:56曾行艷呂利平
      化學(xué)工業(yè)與工程 2020年4期
      關(guān)鍵詞:沸物描述符含水

      曾行艷,諸 林*,呂利平,,李 兵

      (1. 西南石油大學(xué)化學(xué)化工學(xué)院,成都 610500; 2. 長(zhǎng)江師范學(xué)院化學(xué)化工學(xué)院,重慶 408100)

      由于水具有安全、無(wú)毒、可再生能力強(qiáng)及溶解性能好的特點(diǎn),被廣泛應(yīng)用于化工和醫(yī)藥等行業(yè)。在生產(chǎn)過(guò)程中,水和其他原料直接或間接的參與生產(chǎn)過(guò)程,會(huì)產(chǎn)生大量的含水共沸廢液,如乙腈/水[1]、乙二胺/水[2]及四氫呋喃/水[3]等二元共沸物。 為了實(shí)現(xiàn)資源循環(huán)利用及環(huán)境保護(hù)的目的,需要采用特殊精餾對(duì)其進(jìn)行分離。

      共沸特性數(shù)據(jù)是分離工藝設(shè)計(jì)、模擬及優(yōu)化的基礎(chǔ)。 如果僅僅依靠實(shí)驗(yàn)來(lái)獲取該類(lèi)數(shù)據(jù),會(huì)花費(fèi)大量的時(shí)間和經(jīng)濟(jì)成本。 相比之下,狀態(tài)方程法[4-5]、活度系數(shù)法[6-7]、經(jīng)驗(yàn)法[8-9]以及定量結(jié)構(gòu)-性質(zhì)關(guān)系(QSPR)模型[10-11]等理論計(jì)算方法就具有簡(jiǎn)單、快速的特點(diǎn)。 目前,很多研究者利用理論計(jì)算方法預(yù)測(cè)了部分共沸物及混合物的相平衡數(shù)據(jù),并取得了較好的效果[4,7-8,12-13]。 但是,前3 種方法在預(yù)測(cè)共沸物的共沸特性數(shù)據(jù)時(shí),需要一些必要的實(shí)驗(yàn)參數(shù)或擬合參數(shù),而通常這類(lèi)參數(shù)的獲取難度是比較大的。 QSPR模型具有計(jì)算量小、耗時(shí)短及精度高等優(yōu)點(diǎn),而且相關(guān)所需參數(shù)均可由分子結(jié)構(gòu)計(jì)算所得,并不需要任何額外的實(shí)驗(yàn)數(shù)據(jù),被廣泛應(yīng)用于化工等領(lǐng)域[14-17],如Liang 等從QSPR 中探索變壓蒸餾過(guò)程設(shè)計(jì)和動(dòng)態(tài)控制的關(guān)系,且利用QSPR 確定萃取精餾中溶劑對(duì)分離混合物相對(duì)揮發(fā)性的影響[18-20]。

      基于此,本研究以125 種含水二元共沸物為研究對(duì)象,利用定量結(jié)構(gòu)-性質(zhì)關(guān)系分別構(gòu)建可以高精度預(yù)測(cè)含水二元共沸物共沸溫度及組成的QSPR 模型,以獲取常壓下該類(lèi)共沸物的共沸特性數(shù)據(jù);同時(shí),也可為其他特殊種類(lèi)二元共沸物共沸數(shù)據(jù)的預(yù)測(cè)提供參考和思路。

      1 樣本數(shù)據(jù)獲取及分子描述符篩選

      1.1 樣本數(shù)據(jù)的獲取

      為保證所建的QSPR 模型不受數(shù)據(jù)源的影響,本文涉及到的125 種含水二元共沸物的共沸特性數(shù)據(jù)均選自溶劑手冊(cè)[21]。 同時(shí),本研究根據(jù)“Mixtures out”樣本劃分法[22]隨機(jī)將整個(gè)數(shù)據(jù)集分為訓(xùn)練集(80%)和測(cè)試集(20%),以達(dá)到有效表征各類(lèi)含水二元共沸物體系的目的,詳見(jiàn)附件1 表1。 其中,訓(xùn)練集用于篩選特征描述符及建立QSPR 模型,測(cè)試集則用于評(píng)估所建模型的預(yù)測(cè)能力及泛化推廣能力[13]。

      1.2 分子結(jié)構(gòu)的優(yōu)化

      常見(jiàn)分子結(jié)構(gòu)繪制和優(yōu)化軟件有Symyx Draw、HyperChem、Gauss 和ChemOffice 等[15,23]。 本 研 究采用HyperChem 8.0 軟件繪制和優(yōu)化純組分的三維分子結(jié)構(gòu)以獲取分子的最小能量構(gòu)象。 相關(guān)優(yōu)化步驟如下:先通過(guò)分子力學(xué)方法(MM+)預(yù)優(yōu)化;再由量子力學(xué)半經(jīng)驗(yàn)方法(PM3)進(jìn)一步優(yōu)化。 在優(yōu)化過(guò)程中采用Polack-Ribiere 算法,且所有計(jì)算在Hartree-Fock 能級(jí)進(jìn)行,至均方根梯度極限達(dá)到4.18×107kJ·m-1·mol-1[24]。

      2 共沸溫度及共沸組成QSPR 模型

      2.1 分子描述符的篩選與模型構(gòu)建

      2.1.1 分子描述符的篩選

      為準(zhǔn)確的表征分子的結(jié)構(gòu)特性,需要對(duì)分子描述符進(jìn)行篩選,包括預(yù)篩選和進(jìn)一步篩選,其篩選過(guò)程示意圖如圖1 所示。 本研究利用Materials Studio 8.0 軟件計(jì)算純物質(zhì)的分子描述符,得到包括拓?fù)涿枋龇⒔Y(jié)構(gòu)描述符及空間描述符等的15 類(lèi)共344 種分子描述符;再以何培等選用的2 個(gè)基本原則[25]對(duì)其進(jìn)行預(yù)篩選,以消除無(wú)用及冗余信息,減少共線(xiàn)性出現(xiàn)的概率,經(jīng)預(yù)篩選后得到76 種分子描述符;再根據(jù)“Kay’s mixing rule”混合規(guī)則[26]計(jì)算得到二元共沸物的混合描述符,并采用遺傳算法對(duì)其進(jìn)一步篩選[27]。

      2.1.2 共沸溫度及組成模型的構(gòu)建

      經(jīng)篩選后的混合描述符即可用于建立共沸溫度及組成的QSPR 模型,模型的構(gòu)建過(guò)程如圖1 所示。 式(1)~(6)給出了不同混合描述符個(gè)數(shù)(4 ~9)的共沸溫度預(yù)測(cè)模型,模型中的描述符以Ai表示;而式(7) ~(11)給出了不同混合描述符個(gè)數(shù)(2 ~6)的共沸組成預(yù)測(cè)模型,模型中的描述符以Bi表示,表1 列出了建模所涉及的全部描述符。

      圖1 特征描述符篩選及多元線(xiàn)性回歸建模選示意圖Fig.1 A schematic diagram of feature descriptor screening and multiple linear regression modeling

      2.1.2.1 共沸溫度模型

      模型1:

      表1 共沸溫度及組成預(yù)測(cè)模型構(gòu)建所涉及的全部描述符Table 1 The descriptors involved in the establishment of the azeotropic temperature and composition prediction models

      2.1.2.2 共沸組成模型

      2.2 模型篩選

      圖2 和圖3 分別為所建共沸溫度及組成預(yù)測(cè)模型的復(fù)相關(guān)系數(shù)( R2),調(diào)整復(fù)相關(guān)系數(shù)( R2adj)和留一法交叉驗(yàn)證系數(shù)( Q2LOO)與混合描述符個(gè)數(shù)(n)的變化趨勢(shì)關(guān)系圖。 從圖2 可以看出,當(dāng)n 由4 增加到8 時(shí),共沸溫度預(yù)測(cè)模型的R2,R2adj和Q2LOO曲線(xiàn)穩(wěn)健上升,而當(dāng)增加第9 個(gè)混合描述符時(shí)3 個(gè)參數(shù)曲線(xiàn)均變得十分平緩,說(shuō)明增加第9 個(gè)混合描述符對(duì)模型的擬合能力及穩(wěn)定性提升不大。 從圖3 可以看出,當(dāng)n 由2 增加到3 時(shí),共沸組成預(yù)測(cè)模型的R2,R2adj和Q2LOO曲線(xiàn)急劇上升;當(dāng)n 由3 增加到5 時(shí),3 個(gè)參數(shù)曲線(xiàn)緩慢上升;當(dāng)增加第6 個(gè)混合描述符時(shí)參數(shù)曲線(xiàn)幾乎沒(méi)有變化;這說(shuō)明增加第6 個(gè)混合描述符對(duì)模型的擬合能力及穩(wěn)定性幾乎不影響。由此可知,最適宜共沸溫度及組成預(yù)測(cè)模型的最適宜描述符個(gè)數(shù)是8/5。

      圖2 共沸溫度預(yù)測(cè)模型的描述符個(gè)數(shù)與R2,的關(guān)系Fig.2 The relationship between the number of descriptors and R2, of azeotropic temperature prediction models

      圖3 共沸組成預(yù)測(cè)模型的描述符個(gè)數(shù)與R2,R2adj, 的關(guān)系Fig.3 The relationship between the number of descriptors and R2,, of azeotropic composition prediction models

      2.2.2 過(guò)擬合及顯著性比較

      擬合缺失分?jǐn)?shù)(LOF)作為遺傳函數(shù)算法的適度函數(shù),其變化趨勢(shì)可用于判斷模型是否出現(xiàn)過(guò)擬合;而F 檢驗(yàn)值的大小代表著方程的顯著性,F 檢驗(yàn)值越大則表明該模型的回歸假設(shè)因果關(guān)系顯著性越高。 圖4 和圖5 分別是共沸溫度及組成預(yù)測(cè)模型的LOF 和F 值與混合描述符個(gè)數(shù)的關(guān)系圖。 由圖4可知,當(dāng)n 由4 增加到8 時(shí),LOF 值隨n 的增加而快速下降,說(shuō)明利用8 個(gè)特征描述符構(gòu)建的模型不存在過(guò)擬合現(xiàn)象;而F 檢驗(yàn)值隨n 的增加有略微降低,但當(dāng)n 增加到8 時(shí),F 值也比較高(280.51),說(shuō)明混合描述符數(shù)為8 時(shí),共沸溫度模型的回歸假設(shè)因果關(guān)系顯著性良好。 由圖5 可知,當(dāng)n 由2 變化到5 時(shí),LOF 值隨n 的增加先急劇下降隨后逐漸減小,說(shuō)明利用5 個(gè)特征描述符數(shù)構(gòu)建的模型不存在過(guò)擬合現(xiàn)象,而F 檢驗(yàn)值隨n 的增加先快速增加隨后在一定范圍內(nèi)波動(dòng),當(dāng)混合描述符數(shù)為5 時(shí),模型的回歸假設(shè)因果關(guān)系顯著性稍弱。 綜上所述,利用8/5 個(gè)混合描述符所構(gòu)建的共沸溫度及組成預(yù)測(cè)模型不存在過(guò)擬合問(wèn)題,且模型的假設(shè)因果關(guān)系顯著性高。

      2.3 最適宜模型分析

      圖4 共沸溫度預(yù)測(cè)模型的混合描述符個(gè)數(shù)與LOF 和F 的關(guān)系Fig.4 The relationship between the number of mixed descriptors and the LOF and F of azeotropic temperature prediction models

      圖5 共沸組成預(yù)測(cè)模型的混合描述符個(gè)數(shù)與LOF 和F 的關(guān)系Fig.5 The relationship between the number of mixed descriptors and the LOF and F of azeotropic composition prediction models

      表2 給出了最適宜的共沸溫度及組成QSPR 模型(模型5/模型10)的特征描述符(以下稱(chēng)之為變量)及統(tǒng)計(jì)學(xué)參數(shù)。 從表2 中可知,模型5 的8 個(gè)變量的標(biāo)準(zhǔn)系數(shù)分別為0.784、0.287、-0.235、0.184、0.156、0.097、0.150 和0.104,由 此 可 知 其 中 僅 有Chi (5): path/cluster 與共沸溫度呈負(fù)相關(guān);模型10的5 個(gè)變量的標(biāo)準(zhǔn)系數(shù)分別為- 0.131、0.252、0.457、0.497 和-0.118,由此可知其中Hydroxy 和Vertex adjacency/magnitude 描述符與共沸組成呈負(fù)相關(guān),2 個(gè)模型各變量的具體數(shù)據(jù)如附件1 表2 和表3 所示。 此外,上述的13 個(gè)變量t-概率值均小于或等于0.005,說(shuō)明這些變量對(duì)含水二元共沸物的共沸溫度及組成的影響均是顯著的。 模型5 和模型10 的R2和R2adj分別為0.960 6/0.997 0 和0.957 2/0.996 9,2 個(gè)模型的MAE 和RMSE 的值均較小,分別為1.890 0/0.010 4 和2.940 0/0.016 1,說(shuō)明2 個(gè)模型分別對(duì)訓(xùn)練集共沸溫度及組成的實(shí)驗(yàn)數(shù)據(jù)具有較好的擬合能力和預(yù)測(cè)能力。

      圖6 和圖7 分別是變量對(duì)各QSPR 模型的影響占比情況。 從圖6 可以看出模型5 的8 個(gè)變量對(duì)含水二元共沸物共沸溫度的影響程度由大到小排序?yàn)?Hydrogen bond donor >Chi (4): path >Chi (5): path/cluster >Chi (4): path/cluster (valence modified)>Complementary information content (CIC)>Estate keys (indicators): I_sCH3>Molecular shadow area fraction: ZX plane >E-state keys (sums): S_dO。從圖7 中可以看出模型10 的5 個(gè)變量對(duì)含水二元共沸物共沸組成的影響程度由大到小排序?yàn)镾tructural information content (SIC)>Complementary information content ( CIC) >Bond information content (BIC)>Hydroxy>Vertex adjacency/magnitude。

      表2 最適宜的QSPR 模型的變量及統(tǒng)計(jì)學(xué)參數(shù)Table 2 The variables and statistical parameters of the optimal QSPR model

      圖6 特征描述符對(duì)共沸溫度預(yù)測(cè)模型的影響Fig.6 Effect of each feature descriptors on the optimal azeotropic temperature model

      2.4 模型驗(yàn)證

      2.4.1 內(nèi)部及外部驗(yàn)證

      圖7 特征描述符對(duì)共沸組成預(yù)測(cè)模型的影響Fig.7 Effect of each feature descriptors on the optimal azeotropic composition model

      利用留一法交叉驗(yàn)證對(duì)模型的內(nèi)部穩(wěn)定性進(jìn)行了分析,2 個(gè)模型的留一法交叉驗(yàn)證系數(shù)Q2LOO分別為0.947 5 和0.995 7,說(shuō)明數(shù)據(jù)的擬合度良好,所建模型非常穩(wěn)定。 在內(nèi)部驗(yàn)證的基礎(chǔ)上進(jìn)行外部驗(yàn)證能進(jìn)一步證明模型的真實(shí)有效性及外部預(yù)測(cè)能力,因此,本研究對(duì)測(cè)試集樣本的共沸溫度及組成進(jìn)行了預(yù)測(cè)。 圖8 和圖9 是共沸溫度及組成的實(shí)驗(yàn)值與預(yù)測(cè)值的關(guān)系圖,從圖8 和圖9 中可以看出,2 個(gè)模型的測(cè)試集的預(yù)測(cè)效果和訓(xùn)練集的預(yù)測(cè)效果一致,散點(diǎn)均位于對(duì)角線(xiàn)附近,僅存在1 個(gè)共沸組成預(yù)測(cè)數(shù)據(jù)偏離對(duì)角線(xiàn)稍遠(yuǎn),2 個(gè)模型的外部驗(yàn)證系數(shù)分別為0.943 9 和0.997 6,說(shuō)明2 個(gè)模型的預(yù)測(cè)準(zhǔn)確性高,泛化推廣能力好。

      圖8 共沸溫度的實(shí)驗(yàn)值和預(yù)測(cè)值的比較Fig.8 Comparison of experimental and predicted values of azeotropic temperature

      圖9 共沸組成的實(shí)驗(yàn)值與預(yù)測(cè)值的比較Fig.9 Comparison of experimental and predicted values of azeotropic composition

      2.4.2 殘差分析

      為了排除“偶然相關(guān)”的可能,需對(duì)2 個(gè)所建模型進(jìn)行殘差分析。 圖10 和圖11 分別是模型5 和模型10 的殘差關(guān)系圖,由圖10 和圖11 可知,2 個(gè)模型的計(jì)算殘差均隨機(jī)且無(wú)規(guī)律的均勻分布于基準(zhǔn)線(xiàn)(0 線(xiàn))兩側(cè),說(shuō)明在建模過(guò)程中均未產(chǎn)生系統(tǒng)誤差。 同時(shí),可以發(fā)現(xiàn)所有殘差分布點(diǎn)均集中于基線(xiàn)附近,且大部分離基線(xiàn)較近,這也說(shuō)明2 個(gè)模型的預(yù)測(cè)誤差較小。

      2.4.3 應(yīng)用域分析

      應(yīng)用域分析最常用的方法是利用標(biāo)準(zhǔn)化殘差和leverage 值作圖,即Williams 圖[26]。 圖12 和 圖13 分別是對(duì)模型5 和模型10 應(yīng)用域分析的直觀呈現(xiàn)圖。 從圖12 可以清晰的看出絕大部分樣本落在該應(yīng)用域以?xún)?nèi),只有8 個(gè)樣本落在應(yīng)用域以外;由圖13 可知,只有2 個(gè)樣本落在應(yīng)用域以外,另外有2 個(gè)樣本落在邊界線(xiàn)上。 究其原因可能是這類(lèi)共沸物中有1 個(gè)分子的某些結(jié)構(gòu)對(duì)于整個(gè)樣本集來(lái)說(shuō)比較特殊。 綜上可知,最適宜共沸溫度及組成模型具有較強(qiáng)的泛化推廣能力。

      圖10 最適宜的共沸溫度預(yù)測(cè)模型的殘差與實(shí)驗(yàn)值的關(guān)系圖Fig. 10 The Residuals versus experimental values of the optimal azeotropic temperature prediction model

      圖11 最適宜的共沸組成QSPR 模型的殘差與實(shí)驗(yàn)值的關(guān)系圖Fig.11 The Residuals versus experimental values of the optimal azeotropic composition prediction mode

      圖12 最適宜的共沸溫度預(yù)測(cè)模型的應(yīng)用領(lǐng)域的Williams 圖Fig.12 Plot of Williams of AD of the optimal azeotropic temperature prediction model

      圖13 最適宜的共沸組成預(yù)測(cè)模型的應(yīng)用領(lǐng)域的Williams 圖Fig.13 Plot of Williams of AD of the optimal azeotropic composition prediction model

      3 模型比較

      將這2 個(gè)模型與同類(lèi)文獻(xiàn)模型及UNIFAC 基團(tuán)貢獻(xiàn)法進(jìn)行比較,表3 列出了不同來(lái)源的共沸溫度及組成預(yù)測(cè)模型的主要性能參數(shù)。 從表3 中可以看出,所建模型所涉及的變量個(gè)數(shù)與已有模型相近,但是本研究所建模型的R2和比其他QSPR 模型高,說(shuō)明本研究所建模型的擬合能力和內(nèi)部穩(wěn)定性比其他模型高;從各個(gè)模型的外推預(yù)測(cè)效果來(lái)看,可以發(fā)現(xiàn)所建模型的遠(yuǎn)大于其他模型及UNIFAC 基團(tuán)貢獻(xiàn)法,且UNIFAC 基團(tuán)貢獻(xiàn)法對(duì)一些含水二元共沸體系存在無(wú)法計(jì)算的問(wèn)題,即對(duì)所選數(shù)據(jù)集中的26 種二元共沸體系都未能計(jì)算出共沸溫度及組成的預(yù)測(cè)值,表明所建模型的預(yù)測(cè)能力和泛化推廣能力均優(yōu)于現(xiàn)有模型,其預(yù)測(cè)結(jié)果數(shù)據(jù)詳見(jiàn)附件1;從各個(gè)模型的RMSE 和AAE 來(lái)看,本研究所建模型的RMSE 和AAE 也遠(yuǎn)小于其他現(xiàn)有模型,這說(shuō)明所建模型的預(yù)測(cè)精度高。 綜上,可以看出所建立的模型不但擬合能力和內(nèi)部穩(wěn)定性有所提高,而且具備較強(qiáng)的預(yù)測(cè)能力和泛化推廣能力。

      表3 不同共沸溫度及組成預(yù)測(cè)模型的主要性能參數(shù)Table 3 The main statistical parameters of QSPR model of azeotropic temperature and composition in different literatures

      4 結(jié)論

      本研究基于定量結(jié)構(gòu)-性質(zhì)關(guān)系探究含水二元共沸物的共沸溫度及組成與分子結(jié)構(gòu)之間的內(nèi)在關(guān)系,對(duì)共沸溫度及組成數(shù)據(jù)進(jìn)行了預(yù)測(cè)。 得出以下結(jié)論:

      1)經(jīng)分子的三維結(jié)構(gòu)繪制、優(yōu)化,分子描述符的計(jì)算、篩選以及QSPR 模型構(gòu)建與分析比較,確定最適宜的共沸溫度預(yù)測(cè)模型和共沸組成預(yù)測(cè)模型分別是利用8/5 個(gè)特征描述符所建立的模型(模型5/模型10),2 個(gè)模型均具有方程顯著性高、不存在過(guò)擬合、對(duì)實(shí)驗(yàn)數(shù)據(jù)具有良好擬合能力等優(yōu)點(diǎn),即含水二元共沸物的共沸溫度及組成能被所建模型準(zhǔn)確的預(yù)測(cè)。 模型5 和模型10 的F,LOF,R2,,RMSE 及MAE 分別為280.51/6 373.60、39.880 0/0.001 1、0.960 6/0.997 0、0.957 2/0.996 9、2.940 0/0.016 1 和1.890 0/0.010 4。

      2)對(duì)2 個(gè)模型分別進(jìn)行內(nèi)部驗(yàn)證、外部驗(yàn)證、應(yīng)用域分析,發(fā)現(xiàn)所建的2 個(gè)模型均具有較強(qiáng)的預(yù)測(cè)能力和泛化推廣性能,其O和分別為0.947 5/0.995 7 和0.9439/0.997 6。

      3)與同類(lèi)模型和UNIFAC 基團(tuán)貢獻(xiàn)法相比,結(jié)果表明,本研究所建共沸溫度及組成QSPR 模型對(duì)測(cè)試集樣本的預(yù)測(cè)準(zhǔn)確性和泛化推廣能力均優(yōu)于現(xiàn)有模型,可為工程上其他特殊種類(lèi)的共沸特性數(shù)據(jù)的獲取提供一定的參考和借鑒。

      猜你喜歡
      沸物描述符含水
      國(guó)產(chǎn)太陽(yáng)能光熱發(fā)電有機(jī)熱載體再生工藝研究
      濃度響應(yīng)型水觸變材料及在含水漏層堵漏技術(shù)的應(yīng)用
      基于結(jié)構(gòu)信息的異源遙感圖像局部特征描述符研究
      鎮(zhèn)北油田某油藏延長(zhǎng)低含水采油期技術(shù)研究
      化工管理(2021年7期)2021-05-13 00:46:46
      含水乙醇催化制氫催化劑研究
      氯乙烯精餾高沸物提純系統(tǒng)的改進(jìn)
      聚氯乙烯(2018年2期)2018-07-05 09:49:06
      Linux單線(xiàn)程并發(fā)服務(wù)器探索
      催化裂解法處理有機(jī)硅高沸物
      利用CNN的無(wú)人機(jī)遙感影像特征描述符學(xué)習(xí)
      土洞施工中含水段塌方處理方案探討
      板桥市| 肇东市| 苍山县| 龙胜| 色达县| 百色市| 平原县| 赞皇县| 西充县| 闽侯县| 门头沟区| 台山市| 鄂托克旗| 浏阳市| 晋城| 辽宁省| 梁河县| 泽州县| 贵州省| 宝坻区| 宜宾市| 红桥区| 石屏县| 方正县| 成武县| 都江堰市| 富川| 抚宁县| 揭阳市| 泸西县| 彭泽县| 开封市| 息烽县| 酉阳| 文安县| 潞城市| 喀喇沁旗| 博爱县| 阜阳市| 福建省| 荔浦县|