• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)據(jù)驅(qū)動(dòng)的超導(dǎo)臨界溫度預(yù)測(cè)方法研究

      2019-10-15 02:21李韜偉王龍趙宸立
      軟件導(dǎo)刊 2019年8期
      關(guān)鍵詞:數(shù)據(jù)驅(qū)動(dòng)相關(guān)性分析

      李韜偉 王龍 趙宸立

      摘 要:超導(dǎo)體具有零電阻特性、完全抗磁性、通量量子化等優(yōu)點(diǎn),但受限于物理實(shí)驗(yàn)環(huán)境與材料自身特性,其臨界溫度測(cè)試一直是超導(dǎo)實(shí)驗(yàn)中的難點(diǎn)。對(duì)公開超導(dǎo)數(shù)據(jù)集進(jìn)行研究分析,以期發(fā)現(xiàn)其臨界溫度與物理特性及化學(xué)元素組成之間的關(guān)系,進(jìn)而構(gòu)建能夠輔助預(yù)測(cè)超導(dǎo)體臨界溫度的模型,降低實(shí)測(cè)獲得臨界溫度的難度。結(jié)合數(shù)據(jù)挖掘領(lǐng)域的相關(guān)性分析與多元線性回歸分析等理論,分別基于超導(dǎo)臨界溫度實(shí)驗(yàn)的物理屬性數(shù)據(jù)及元素構(gòu)成數(shù)據(jù)構(gòu)建預(yù)測(cè)模型,為通過數(shù)據(jù)驅(qū)動(dòng)實(shí)驗(yàn)獲取其它超導(dǎo)體臨界溫度提供了有益嘗試。通過對(duì)兩個(gè)模型進(jìn)行對(duì)比,結(jié)果表明,基于元素的預(yù)測(cè)模型效果略優(yōu)于基于屬性的預(yù)測(cè)模型。

      關(guān)鍵詞:超導(dǎo)體數(shù)據(jù)集;數(shù)據(jù)驅(qū)動(dòng);相關(guān)性分析;多元線性擬合

      DOI:10. 11907/rjdk. 182872 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

      中圖分類號(hào):TP301 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2019)008-0029-04

      A Data-driven Research on Critical Temperature Prediction of Superconductors

      LI Tao-wei1, WANG Long1, ZHAO Chen-li2

      (1. National University of Defense Technology,Wuhan 450001,China;2. Unity of 32023 of PLA,Dalian 116000,China)

      Abstract: The superconductor has the advantages of zero resistance, complete diamagnetism, flux quantization and the like. Because of the critical temperature test and the material's own characteristics, its critical temperature test has always been a difficult point in superconducting experiments. In this paper, we study and analyze the open superconductor dataset in CUI, and try to find the relationship between its critical temperature and its physical properties and chemical element composition. Then we can construct a model that can help predict the critical temperature of superconductors. Combining the correlation analysis and multiple linear regression analysis theory in the field of data mining, this paper separately predicts the model based on attribute data and element data, and provides a useful attempt for data-driven experiments to obtain the TC of superconductors. The results show that element-based model effect is better than the that of attribute-based model.

      Key Words: superconductor data dataset; data-driven; correlation analysis; multiple linear regression analysis

      基金項(xiàng)目:教育部聯(lián)合基金項(xiàng)目(6141A02011607)

      作者簡(jiǎn)介:李韜偉(1990-),男,國(guó)防科技大學(xué)信息通信學(xué)院助教,研究方向?yàn)閿?shù)據(jù)挖掘、數(shù)據(jù)分析、虛擬現(xiàn)實(shí)。

      0 引言

      超導(dǎo)體(Superconductor)是指一種電阻在某一溫度下為零的導(dǎo)體,具有零電阻特性、完全抗磁性、通量量子化的特點(diǎn)。超導(dǎo)體的零電阻特性與外界環(huán)境的磁場(chǎng)及溫度緊密相關(guān),很容易受到溫度場(chǎng)和磁場(chǎng)變化影響而被破壞;完全抗磁性則與材料本身屬性相關(guān),是指在磁場(chǎng)中磁力線無(wú)法穿過導(dǎo)體的現(xiàn)象;通量量子化則是當(dāng)兩個(gè)超導(dǎo)體之間的絕緣層薄至原子尺寸時(shí),電子對(duì)可以穿過絕緣層產(chǎn)生隧道電流的現(xiàn)象。

      超導(dǎo)體臨界溫度測(cè)量一直以來(lái)都是超導(dǎo)實(shí)驗(yàn)中的難點(diǎn)[1]。游彪等[2]通過測(cè)量加熱過程中超導(dǎo)體電阻變化記錄其臨界溫度,需要考慮樣品與銅底座接觸率、恒溫器熱平衡狀態(tài)等,難度較大;趙林等[3]從不同體系鐵基超導(dǎo)體電子結(jié)構(gòu)的角分辨率電子能譜角度,提出鐵基超導(dǎo)新理論,為解決高溫超導(dǎo)機(jī)理問題提供了依據(jù);殷培環(huán)[4]研究了鋇元素?fù)诫s用Pb對(duì)Bi位替代得到的超導(dǎo)體臨界溫度變化;吳平[5]也利用電阻—溫度特性測(cè)量釔鋇銅氧超導(dǎo)材料的臨界溫度。通過常用物理手段測(cè)量超導(dǎo)溫度,對(duì)精密測(cè)量?jī)x器、實(shí)驗(yàn)員經(jīng)驗(yàn)及實(shí)驗(yàn)環(huán)境等要求非常嚴(yán)格,往往需要耗費(fèi)大量人力、物力才能獲取近似測(cè)量值。

      近年來(lái),隨著大數(shù)據(jù)、人工智能等數(shù)據(jù)技術(shù)的發(fā)展,基于數(shù)據(jù)驅(qū)動(dòng)的方法越來(lái)越廣泛地被應(yīng)用于各個(gè)領(lǐng)域。楊麗潔[6]利用衛(wèi)星采集數(shù)據(jù)與模擬水文及氣候,成功實(shí)現(xiàn)了洪水預(yù)報(bào);聶虹等[7]通過分析地質(zhì)、物探、化探、遙感等數(shù)據(jù),構(gòu)建礦產(chǎn)預(yù)測(cè)模型。數(shù)據(jù)驅(qū)動(dòng)方法的特點(diǎn)為:①建模方法具有一般通用流程;②模型固定效果好,模型主要集中于幾個(gè)常用類別,如VM[8]、決策樹[9]、深度學(xué)習(xí)[10]等,適用于絕大多數(shù)應(yīng)用場(chǎng)合;③數(shù)據(jù)預(yù)處理過程簡(jiǎn)單,相比于傳統(tǒng)方法,需要領(lǐng)域?qū)<医槿氲沫h(huán)節(jié)較少。

      本文擬采用數(shù)據(jù)驅(qū)動(dòng)方法,在已知數(shù)據(jù)集的前提下,抽取數(shù)據(jù)集屬性特征,通過機(jī)器學(xué)習(xí)方法訓(xùn)練相應(yīng)模型,得到一種基于數(shù)據(jù)的超導(dǎo)體臨界溫度預(yù)測(cè)方法,進(jìn)而通過超導(dǎo)化合物的化學(xué)元素即能給出相應(yīng)超導(dǎo)體臨界溫度。

      1 數(shù)據(jù)集

      2018年10月12日,UCI[11]數(shù)據(jù)庫(kù)更新了一份超導(dǎo)數(shù)據(jù)集。UCI數(shù)據(jù)庫(kù)是加州大學(xué)歐文分校(University of CaliforniaIrvine)提出的用于機(jī)器學(xué)習(xí)的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)的數(shù)據(jù)集一直在不斷增加。該機(jī)構(gòu)是比較權(quán)威的數(shù)據(jù)發(fā)布機(jī)構(gòu),表1列出了常用數(shù)據(jù)集。

      表1 UCI常用數(shù)據(jù)集

      UCI提供的超導(dǎo)數(shù)據(jù)集(Superconductor Data Dataset)中詳細(xì)記錄了已知21 263種超導(dǎo)體的臨界溫度,其中train.csv列舉了從21 263種超導(dǎo)體中提取的81個(gè)特征及臨界溫度;unique_m.csv列出21 263種超導(dǎo)體的化學(xué)式及其臨界溫度,主要列出了每種超導(dǎo)體中包含的86種化學(xué)元素及摩爾質(zhì)量。例如第一種超導(dǎo)體Ba0.2La1.8Cu1O4中包含4種化學(xué)元素,其摩爾質(zhì)量分別為Ba 0.2、La 1.8、Cu 1、O 4。

      將數(shù)據(jù)分成兩類,一類作為訓(xùn)練集,用于學(xué)習(xí)預(yù)測(cè)超導(dǎo)體臨界溫度的模型參數(shù),占數(shù)據(jù)量的70%,剩下的30%作為測(cè)試集,用于檢測(cè)模型效果。

      2 超導(dǎo)數(shù)據(jù)集分析

      目前對(duì)超導(dǎo)體臨界溫度的研究有針對(duì)其特有元素類型進(jìn)行的相關(guān)測(cè)試研究,如對(duì)鐵系超導(dǎo)體技術(shù)的研究,還有針對(duì)元素組成的測(cè)試研究[3-5,13,14],以及針對(duì)η-配對(duì)超導(dǎo)體臨界溫度的研究等[15]。本文通過對(duì)數(shù)據(jù)集中超導(dǎo)體化學(xué)元素的分析,旨在找到其臨界溫度與化學(xué)式元素的關(guān)系,以此預(yù)測(cè)超導(dǎo)體臨界溫度。

      2.1 超導(dǎo)體屬性數(shù)據(jù)分析

      超導(dǎo)體特性中,除元素?cái)?shù)量外,其它幾個(gè)特性相互之間影響較大,需要先進(jìn)行相關(guān)性分析與主成分分析[16]。利用R語(yǔ)言分析屬性數(shù)據(jù)中每個(gè)特性下10個(gè)屬性的相關(guān)度,如圖1所示。

      圖1 超導(dǎo)體每個(gè)特性屬性間相關(guān)性

      如圖1所示,每種特性中,前4個(gè)屬性(mean, wtd_mean, gmean, wtd_gmean)相關(guān)性較高,5、6兩個(gè)屬性(entropy,wtd_entropy)相關(guān)性較高,最后兩個(gè)屬性(std_rang,wtd_std_rang)相關(guān)性較高。據(jù)此確定特性選擇方案,在每個(gè)特性中選擇mean、entropy和std_rang 3個(gè)屬性作為特征。

      對(duì)特性數(shù)據(jù)集進(jìn)行處理后,利用R語(yǔ)言采用多元線性回歸方式建立學(xué)習(xí)模型, 多元線性回歸相關(guān)理論可參考文獻(xiàn)[17-23],最后得到各元素回歸系數(shù)如表2所示。

      表2中回歸系數(shù)代表超導(dǎo)體中該屬性大小對(duì)臨界溫度的作用,大于0表示起正向作用,屬性值越大,超導(dǎo)體臨界溫度越高;小于 0表示起負(fù)向作用,屬性值越大,超導(dǎo)體臨界溫度越低。

      表2 基于屬性數(shù)據(jù)的多元線性模型回歸系數(shù)

      將該模型與屬性數(shù)據(jù)測(cè)試集中結(jié)果進(jìn)行對(duì)比,對(duì)比結(jié)果如表3、表4所示。

      表3 屬性數(shù)據(jù)模型預(yù)測(cè)結(jié)果(部分)

      表4 屬性數(shù)據(jù)模型測(cè)試結(jié)果統(tǒng)計(jì)

      [溫度相差范圍\&超導(dǎo)體數(shù)量\&10華氏度以內(nèi)\&2 380\&20華氏度以內(nèi)\&1 768\&30華氏度以內(nèi)\&751\&40華氏度以內(nèi)\&283\&50華氏度以上\&130\&]

      對(duì)于測(cè)試集中的6 379種超導(dǎo)體,對(duì)其臨界溫度預(yù)測(cè)效果較好(誤差在10華氏度以內(nèi))的只有2 380種,占比為37.3%,還需要對(duì)算法作進(jìn)一步改進(jìn)。

      2.2 超導(dǎo)體元素?cái)?shù)據(jù)分析

      由化學(xué)元素組成的化合物,在穩(wěn)定形態(tài)下各元素都有固定化學(xué)鍵,取正價(jià)的元素鍵之和必須等于取負(fù)價(jià)的元素鍵之和。因此,分析各元素之間的相關(guān)性是十分必要的。對(duì)數(shù)據(jù)集中86個(gè)元素組成化合物的相關(guān)性進(jìn)行分析,結(jié)果如圖2所示。

      圖2 元素相關(guān)性分析結(jié)果

      由圖2可知,每個(gè)元素除與自身有強(qiáng)關(guān)聯(lián)性外,與其它元素的相關(guān)性不高。具體而言,相關(guān)系數(shù)高于0.5的元素對(duì)有7組,如表5所示。

      表5 高相關(guān)性元素對(duì)

      86種元素中,涉及元素相關(guān)性較高(大于0.5)的只有7對(duì)14種元素,而數(shù)據(jù)集的21 263種超導(dǎo)體材料中,除氧O和銅Cu等常見元素外,其它高相關(guān)性的超導(dǎo)體只有? ? ?3 189種,占總數(shù)量的15%。高相關(guān)性(大于0.8)元素對(duì)只有鐵元素Fe與砷元素As,同時(shí)包含鐵砷的化合物有1 374種,占比為6.5%。關(guān)于鐵砷元素的超導(dǎo)體研究方法可參考陳寧、劉洋等[13]的研究?jī)?nèi)容。

      針對(duì)高關(guān)聯(lián)性元素占比較少的特點(diǎn),對(duì)元素?cái)?shù)據(jù)集同樣采用多元線性回歸方式建立學(xué)習(xí)模型,得到各元素回歸系數(shù)如表6所示。

      表6中元素項(xiàng)對(duì)應(yīng)的回歸系數(shù)代表超導(dǎo)體中該元素含量對(duì)臨界溫度的作用,大于0表示起正向作用,含有該元素越多,超導(dǎo)體臨界溫度越高;小于 0表示起負(fù)向作用,含有該元素越少,超導(dǎo)體臨界溫度越低;等于0表示不起作用,共有10種元素的回歸系數(shù)為0,分別是稀有氣體惰性元素氦He、氖Ne、氬Ar、氪Kr、氙Xe、氡Rn,以及稀土元素钷Pm,稀有元素釙Po和砹At,數(shù)據(jù)集中的超導(dǎo)體都不包含這些元素。例如,第3種化合物為Ba0.1La1.9 Cu1O4,臨界溫度為19,利用該模型預(yù)測(cè)的臨界溫度計(jì)算方式為:

      [14.481 92+0.1×23.973 66+1.9×(-0.087 78)+1×0.463 187+4×(-0.362 83)=15.72]

      預(yù)測(cè)結(jié)果與真實(shí)臨界溫度相差不超過4華氏度。

      表6 基于元素?cái)?shù)據(jù)的多元線性模型回歸系數(shù)

      將該模型與測(cè)試集中數(shù)據(jù)進(jìn)行對(duì)比,對(duì)比結(jié)果如表7、表8所示。

      表7 元素?cái)?shù)據(jù)模型預(yù)測(cè)結(jié)果(部分)

      表8 元素?cái)?shù)據(jù)模型測(cè)試結(jié)果統(tǒng)計(jì)

      [溫度相差范圍\&超導(dǎo)體數(shù)量\&10華氏度以內(nèi)\&2 632\&20華氏度以內(nèi)\&1 926\&30華氏度以內(nèi)\&1 006\&40華氏度以內(nèi)\&473\&50華氏度以上\&274\&]

      對(duì)于測(cè)試集中的6 379種超導(dǎo)體,對(duì)臨界溫度預(yù)測(cè)較準(zhǔn)確(誤差在10華氏度以內(nèi))的只有2 632種,占比為41.3%,差距超過100華氏度的有14種。雖然結(jié)果相比屬性數(shù)據(jù)模型略優(yōu),但該模型仍需要作進(jìn)一步改進(jìn)。

      3 結(jié)語(yǔ)

      本文以超導(dǎo)體數(shù)據(jù)集為基礎(chǔ)研究影響其臨界溫度的屬性及元素組成,為條件嚴(yán)苛的物理實(shí)驗(yàn)提供了數(shù)據(jù)驅(qū)動(dòng)的分析視角。實(shí)驗(yàn)結(jié)果表明,基于元素的模型預(yù)測(cè)結(jié)果略優(yōu)于基于屬性的元素模型預(yù)測(cè)結(jié)果。在后續(xù)研究中將嘗試根據(jù)屬性取值與元素質(zhì)量分段建立模型,研究相關(guān)性較強(qiáng)的部分超導(dǎo)體的特殊性,并分析臨界溫度與實(shí)測(cè)臨界溫度差距超過100華氏度的具體原因。

      參考文獻(xiàn):

      [1] 胡殿才,段旭如,夏元良. 超導(dǎo)體臨界溫度的測(cè)量[J].大連理工大學(xué)學(xué)報(bào),1988(3):113-116.

      [2] 游彪,吳衛(wèi)國(guó),吳小山. 綜合研究性實(shí)驗(yàn)試題:高溫超導(dǎo)體特性測(cè)量綜合實(shí)驗(yàn)[J]. 物理實(shí)驗(yàn), 2018, 38(10):36-39.

      [3] 趙林,劉國(guó)東,周興江. 鐵基高溫超導(dǎo)體電子結(jié)構(gòu)的角分辨光電子能譜研究[J]. 物理學(xué)報(bào),2018,67(20):246-271.

      [4] 殷培環(huán). Ba位摻雜對(duì)BaPb_(0.77)Bi_(0.23)O_(3-δ)超導(dǎo)電性的影響[D]. 南京:南京大學(xué),2018.

      [5] 吳平. 高T_c超導(dǎo)材料YBCO臨界溫度測(cè)量方法[J]. 大學(xué)物理實(shí)驗(yàn),2006(3):5-7.

      [6] 楊麗潔. 數(shù)據(jù)驅(qū)動(dòng)模型在洪水預(yù)報(bào)中的應(yīng)用及其發(fā)展趨勢(shì)[J]. 電腦知識(shí)與技術(shù),2018,14(17):275-277.

      [7] 聶虹,朱月琴,常力恒,等. 數(shù)據(jù)驅(qū)動(dòng)下的礦產(chǎn)預(yù)測(cè)模型構(gòu)建方法研究[J]. 中國(guó)礦業(yè),2018,27(9):82-87.

      [8] CORTES C,VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20(3):273-297.

      [9] QUINLAN J R. Induction of decision trees[J]. Machine Learning, 1986 (1):81-106.

      [10] HINTON G. A practical guide to training restricted Boltzmann machines[J]. Momentum, 2010, 9(1):926-947.

      [11] UCI Machine Learning Repository. UCI數(shù)據(jù)集[EB/OL]. http://archive.ics.uci.edu/ml/index.php.

      [12] 師瑞華. BP神經(jīng)網(wǎng)絡(luò)在糧倉(cāng)平均溫度預(yù)測(cè)中的應(yīng)用[J]. 軟件導(dǎo)刊,2015,14 (8): 42-44.

      [13] 陳寧,劉洋,賈亞魁,等. FeAs超導(dǎo)體臨界溫度的鍵長(zhǎng)和半徑效應(yīng)[J]. 中國(guó)科學(xué),2009(9): 1295-1299.

      [14] HAMIDIEH K. A data-driven statistical model for predicting the critical temperature of a superconductor[J]. Computational Materials Science, 2018, 154:346-354.

      [15] 王志君,邱孝明,肖業(yè)高. η-配對(duì)超導(dǎo)體的臨界溫度[J].低溫物理學(xué)報(bào), 1994(6):462-467.

      [16] 趙薔.主成分分析方法綜述[J].軟件工程,2016,19(6):1-3.

      [17] 紀(jì)欽洪,孫洋洲,于航,等. 基于多元線性回歸的碳配額價(jià)格預(yù)測(cè)模型研究[J].現(xiàn)代化工,2018,38(4):220-224.

      [18] 陳崇雙,唐家銀,何平. 方差分析法的線性回歸建模重構(gòu)[J]. 統(tǒng)計(jì)與決策,2018(7):71-75.

      [19] 李金海. 多元回歸分析在預(yù)測(cè)中的應(yīng)用[J]. 河北工業(yè)大學(xué)學(xué)報(bào), 1996(3):57-61.

      [20] 郭會(huì)利. 多元回歸分析的逐步回歸預(yù)測(cè)模型[J]. 考試周刊, 2009(26):92-93.

      [21] 王惠文,孟潔. 多元線性回歸的預(yù)測(cè)建模方法[J]. 北京航空航天大學(xué)學(xué)報(bào), 2007, 33(4):500-504.

      [22] 胡澤文,武夷山. 科技產(chǎn)出影響因素分析與預(yù)測(cè)研究——基于多元回歸和BP神經(jīng)網(wǎng)絡(luò)的途徑[J]. 科學(xué)學(xué)研究,2012,30(7):992-1004.

      [23] 張洪祥,毛志忠. 基于提取綜合特征因素的投影尋蹤多元線性回歸分析[J]. 統(tǒng)計(jì)與決策,2010(24):31-34.

      (責(zé)任編輯:黃 ?。?/p>

      猜你喜歡
      數(shù)據(jù)驅(qū)動(dòng)相關(guān)性分析
      基于網(wǎng)絡(luò)與數(shù)據(jù)智能化的數(shù)碼印花產(chǎn)品設(shè)計(jì)定制模式研究
      數(shù)據(jù)驅(qū)動(dòng)理念在大學(xué)英語(yǔ)課程中的應(yīng)用
      土默特左旗| 喀喇| 静海县| 通州市| 塔河县| 华宁县| 甘德县| 长寿区| 巫溪县| 太白县| 徐闻县| 兴业县| 泸溪县| 铁力市| 成安县| 贺州市| 三亚市| 安宁市| 潮州市| 卓资县| 元江| 德江县| 吴江市| 上饶县| 集贤县| 拉孜县| 长垣县| 屯留县| 上杭县| 香港 | 镇平县| 乌兰县| 怀来县| 赣榆县| 吉首市| 改则县| 崇左市| 商都县| 龙里县| 宁明县| 六盘水市|