姚建華 李佳 徐雯麗 蔣舒仰 胡靜 李靖靖 王宇飛
1中國(guó)科學(xué)院能量調(diào)控材料重點(diǎn)實(shí)驗(yàn)室,中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所(上海 200032)
2鄭州工程技術(shù)學(xué)院 (河南鄭州 450044)
化學(xué)的發(fā)展史表明化學(xué)是從煉金術(shù)發(fā)展而來(lái)?;瘜W(xué)學(xué)科的定義也隨著人們對(duì)化學(xué)本質(zhì)的認(rèn)識(shí)和理解,得到不斷修改。從1661年起的化學(xué)是混合物的物質(zhì)原理的學(xué)科,到1998年,發(fā)展為化學(xué)是研究物質(zhì)及其變化的學(xué)科。從本質(zhì)上說(shuō),物質(zhì)的變化、特性與物質(zhì)的化學(xué)結(jié)構(gòu)密切相關(guān)。也就是說(shuō),要研究化合物的各種性質(zhì)、變化過(guò)程,確定的化合物的化學(xué)結(jié)構(gòu)是必不可少的基本數(shù)據(jù)。
本文將介紹計(jì)算機(jī)輔助結(jié)構(gòu)確定的方法。
確定化合物的化學(xué)結(jié)構(gòu)主要由以下3部分組成:結(jié)構(gòu)解析、譜圖獲取和譜圖比較(見(jiàn)圖1)。
圖1 結(jié)構(gòu)確定示意圖
所謂結(jié)構(gòu)解析即根據(jù)該化合物的多種化學(xué)分析結(jié)果數(shù)據(jù),如質(zhì)譜(MS)、紅外(IR)、拉曼(RAMAN)、核磁(NMR)、紫外(UV)、元素分析等數(shù)據(jù),推斷出一個(gè)或一組對(duì)應(yīng)的候選化學(xué)結(jié)構(gòu)。目前,在結(jié)構(gòu)解析中,用質(zhì)譜、紅外、拉曼和核磁數(shù)據(jù)用作結(jié)構(gòu)解析的主要依據(jù)。
所謂譜圖獲取即根據(jù)化合物的化學(xué)結(jié)構(gòu),采用相應(yīng)的技術(shù),獲得對(duì)應(yīng)的譜圖數(shù)據(jù),如質(zhì)譜、紅外、拉曼、核磁和紫外等譜圖數(shù)據(jù)。
圖1的內(nèi)容表明了結(jié)構(gòu)解析與譜圖獲取的關(guān)系。
譜圖比較即比較用于結(jié)構(gòu)解析的譜圖數(shù)據(jù)與根據(jù)推測(cè)的化學(xué)結(jié)構(gòu)獲得的譜圖。如果比較結(jié)果相同,則結(jié)構(gòu)解析推測(cè)的化學(xué)結(jié)構(gòu)即為被確定的化合物的化學(xué)結(jié)構(gòu)。如果比較結(jié)果不同,則表明結(jié)構(gòu)解析推測(cè)的化學(xué)結(jié)構(gòu)不是被確定的化合物的化學(xué)結(jié)構(gòu)。
經(jīng)驗(yàn)型的結(jié)構(gòu)解析和譜圖獲取的工作流程分別如圖2和圖3所示。
圖2顯示的流程表明,工作人員通過(guò)查文獻(xiàn)或譜圖手冊(cè),判斷該譜圖是否已有對(duì)應(yīng)的結(jié)構(gòu)報(bào)道。如果工作人員未能在文獻(xiàn)和譜圖手冊(cè)中查到對(duì)應(yīng)的化合物結(jié)構(gòu),則將完全憑工作人員的經(jīng)驗(yàn),推測(cè)出一組或一個(gè)對(duì)應(yīng)的化學(xué)結(jié)構(gòu)。
圖3顯示的流程表明,工作人員通過(guò)查文獻(xiàn)或譜圖手冊(cè),判斷該推測(cè)的化學(xué)結(jié)構(gòu)是否已有對(duì)應(yīng)的譜圖報(bào)道。如果工作人員未能在文獻(xiàn)和譜圖手冊(cè)中查到對(duì)應(yīng)的譜圖數(shù)據(jù),那么采用購(gòu)買(mǎi)或合成化合物的方式,獲得推測(cè)的化學(xué)結(jié)構(gòu)的化合物。然后,用對(duì)應(yīng)的儀器獲取該化合物的譜圖數(shù)據(jù)。
圖2 經(jīng)驗(yàn)型結(jié)構(gòu)解析的流程
圖3 經(jīng)驗(yàn)型獲取譜圖的流程
完成了以上兩部分工作后,比較被分析的譜圖和實(shí)驗(yàn)測(cè)得的譜圖數(shù)據(jù),根據(jù)比較結(jié)果,判斷推測(cè)的化學(xué)結(jié)構(gòu)是否正確。如果推測(cè)的化學(xué)結(jié)構(gòu)不正確,將重復(fù)以上的工作,直到獲得正確的化學(xué)結(jié)構(gòu)。
所謂計(jì)算機(jī)輔助化學(xué)結(jié)構(gòu)確定,即借助結(jié)構(gòu)解析軟件和工作人員的經(jīng)驗(yàn),完成結(jié)構(gòu)解析工作,推測(cè)一組或一個(gè)候選結(jié)構(gòu);使用譜圖預(yù)測(cè)軟件,完成獲取候選結(jié)構(gòu)的譜圖數(shù)據(jù);然后,使用譜圖比較軟件,比較被解析譜圖和預(yù)測(cè)得到譜圖的相似度。根據(jù)相似度,決定購(gòu)買(mǎi)或合成化合物,獲取測(cè)試譜圖;或重復(fù)以上工作,重新推測(cè)候選結(jié)構(gòu)。
計(jì)算機(jī)輔助結(jié)構(gòu)確定的方法主要有3種:基于數(shù)據(jù)(D)、基于邏輯(L)和基于原理(P)(如圖 4所示)。
圖4 計(jì)算機(jī)輔助結(jié)構(gòu)確定的3種方法
基于數(shù)據(jù)即利用數(shù)據(jù)庫(kù)系統(tǒng),獲得相應(yīng)的譜圖和結(jié)構(gòu)數(shù)據(jù);基于邏輯即利用譜圖與結(jié)構(gòu)之間的關(guān)系及規(guī)則,預(yù)測(cè)一個(gè)結(jié)構(gòu)片段,并按規(guī)則將片段連接成候選結(jié)構(gòu);基于原理即利用量化計(jì)算的方法計(jì)算化學(xué)結(jié)構(gòu)對(duì)應(yīng)的譜圖。
計(jì)算機(jī)輔助的結(jié)構(gòu)解析和譜圖預(yù)測(cè)流程分別如圖5和6所示。
圖5 計(jì)算機(jī)輔助結(jié)構(gòu)解析的流程
圖5 顯示的流程表明,計(jì)算機(jī)輔助結(jié)構(gòu)解析過(guò)程中,先利用數(shù)據(jù)庫(kù)系統(tǒng)查詢(xún)信息(即基于數(shù)據(jù)的方法)。如果數(shù)據(jù)庫(kù)中已收錄了對(duì)應(yīng)的數(shù)據(jù),則可以不用做實(shí)驗(yàn)驗(yàn)證;如果該譜圖尚未被收錄到數(shù)據(jù)庫(kù)中,則需要利用譜圖與結(jié)構(gòu)之間的關(guān)系及規(guī)則,同時(shí)結(jié)合工作人員的經(jīng)驗(yàn),預(yù)測(cè)一組結(jié)構(gòu)片段,然后根據(jù)化學(xué)理論和片段連接規(guī)則,同時(shí)結(jié)合工作人員的經(jīng)驗(yàn),推測(cè)一個(gè)或一組候選化學(xué)結(jié)構(gòu)。
圖6 計(jì)算機(jī)輔助獲取譜圖的流程
圖6 顯示的流程表明,計(jì)算機(jī)輔助獲取譜圖過(guò)程中,先利用數(shù)據(jù)庫(kù)系統(tǒng)查詢(xún)候選結(jié)構(gòu)的譜圖(即基于數(shù)據(jù)的方法)。如果數(shù)據(jù)庫(kù)中已收錄了對(duì)應(yīng)的譜圖數(shù)據(jù),則可以從數(shù)據(jù)庫(kù)中提取該譜圖數(shù)據(jù);如果該譜圖尚未被收錄到數(shù)據(jù)庫(kù)中,則需要利用譜圖與結(jié)構(gòu)之間的關(guān)系及規(guī)則,預(yù)測(cè)該候選結(jié)構(gòu)的譜圖,隨后使用譜圖比較軟件,比較被解析譜圖和預(yù)測(cè)得到譜圖的相似度,根據(jù)相似度制定實(shí)驗(yàn)方案。
自1946年計(jì)算機(jī)出現(xiàn)起,化學(xué)家們就期盼使用計(jì)算機(jī)技術(shù)來(lái)輔助開(kāi)展結(jié)構(gòu)確定的工作。基于譜圖數(shù)據(jù)來(lái)推斷正確結(jié)構(gòu)的專(zhuān)家系統(tǒng)的實(shí)質(zhì)是模擬波譜學(xué)家結(jié)構(gòu)解析過(guò)程的每個(gè)步驟。早在20世紀(jì)60年代末和70年代初期,就有人開(kāi)始致力于開(kāi)發(fā)專(zhuān)家系統(tǒng)[1]。
目前,譜圖數(shù)據(jù)庫(kù)系統(tǒng)有商業(yè)和非商業(yè)兩大類(lèi)。商業(yè)類(lèi)的有美國(guó)Bio-Rad公司[2]已建立的紅外、核磁、質(zhì)譜等數(shù)據(jù)庫(kù)系統(tǒng)等。非商業(yè)類(lèi)的有日本國(guó)家先進(jìn)工業(yè)科學(xué)技術(shù)研究所 (National Institute of Advanced Industrial Science and Technology)建立的化合物多譜圖數(shù)據(jù)庫(kù)系統(tǒng),該系統(tǒng)中包含了有機(jī)化合物的各類(lèi)NMR、IR、RAMAN、MS和ESR(電子自旋共振譜)等化學(xué)譜圖[3];中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所建立的紅外等譜圖數(shù)據(jù)庫(kù)系統(tǒng)[4]。非商業(yè)類(lèi)的譜圖數(shù)據(jù)庫(kù)系統(tǒng)比較分散,這里就不一一列舉。
基于譜圖結(jié)構(gòu)確定的相關(guān)的商業(yè)軟件為數(shù)不多,如加拿大Advanced Chemistry Development有限公司的“ACD/Structure Elucidator Suite”。該軟件具有根據(jù)核磁,質(zhì)譜,紫外,紅外和色譜數(shù)據(jù)處理功能,以及根據(jù)這些數(shù)據(jù)推測(cè)出相應(yīng)的候選結(jié)構(gòu),預(yù)測(cè)候選結(jié)構(gòu)的NMR譜及譜圖比較功能[5]。
中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所在20世紀(jì)90年代末,完成了基于2DNMR的結(jié)構(gòu)解析方法研究和模塊(CISOC-SES)的開(kāi)發(fā)[6]。
關(guān)于譜圖預(yù)測(cè)的工作,在20世紀(jì)50年代已有報(bào)道[7],隨著預(yù)測(cè)方法研究的深入,譜圖預(yù)測(cè)的方法從采用取代基常數(shù)逐步轉(zhuǎn)化成采用化合物結(jié)構(gòu)與譜圖關(guān)系的規(guī)則[8-10]。經(jīng)測(cè)試,采用基于結(jié)構(gòu)信息的預(yù)測(cè)方法開(kāi)發(fā)出的系統(tǒng),其預(yù)測(cè)性能較前一種好。目前,商業(yè)的譜圖預(yù)測(cè)系統(tǒng)有采用基于邏輯的預(yù)測(cè)軟件如加拿大Advanced Chemistry Development有限公司的核磁預(yù)測(cè)系統(tǒng)[11]等;也有基于原理預(yù)測(cè)方法的軟件,如HyperChem[12],Gaussian[13]等等。
中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所與法國(guó)國(guó)家科研中心ITODYS研究所聯(lián)合建立了基于邏輯的紅外譜圖預(yù)測(cè)方法,并開(kāi)發(fā)了紅外譜圖預(yù)測(cè)系統(tǒng)SIRSSS[9-10];中國(guó)科學(xué)院上海有機(jī)化學(xué)研究所還建立了基于邏輯的核磁譜圖預(yù)測(cè)方法,并分別開(kāi)發(fā)了具有自主知識(shí)產(chǎn)權(quán)的C-13(CISOC-SCNMR),H-1(CISOCSHNMR)核磁譜圖預(yù)測(cè)系統(tǒng)[6]。這些譜圖預(yù)測(cè)系統(tǒng)已應(yīng)用于結(jié)構(gòu)確定的工作中。
與經(jīng)驗(yàn)型的結(jié)構(gòu)確定方法相比,計(jì)算機(jī)輔助結(jié)構(gòu)確定方法提高了結(jié)構(gòu)確定的準(zhǔn)確率和效率,降低了實(shí)驗(yàn)的盲目性。