惠姣姣 曹紅寶
摘? 要:近年來,玻璃文物受到的關(guān)注度越來越高。為了鑒定玻璃文物的類型、分析玻璃文物中的主要化學(xué)成分,該文基于高鉀、鉛鋇玻璃的14種化學(xué)成分和表面風(fēng)化情況,構(gòu)建基于支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)和Logistic回歸(LR)的玻璃文物鑒定算法,對(duì)63種玻璃文物進(jìn)行分類鑒定。結(jié)果顯示:算法的預(yù)測(cè)精度均高于95%,可以將其應(yīng)用到玻璃文物的實(shí)際鑒定中。
關(guān)鍵詞:玻璃文物鑒定;支持向量機(jī);人工神經(jīng)網(wǎng)絡(luò);Logistic回歸
中圖分類號(hào):TP18;G124? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2023)13-0101-04
Identification of Glass Cultural Relics Based on Machine Learning
Classification Algorithm
HUI Jiaojiao, CAO Hongbao
(School of Mathematics and Information Science, Baoji University of Arts and Sciences, Baoji? 721013, China)
Abstract: In recent years, glass cultural relics have received more and more attention. In order to identify the types of glass cultural relics and analyze the main chemical components in glass cultural relics, based on 14 chemical components and surface weathering situation of high potassium and lead barium glass, this paper constructs a glass cultural relics identification algorithm based on Support Vector Machine (SVM), Artificial Neural Network (ANN) and Logistic Regression (LR), and classifies and identifies the 63 types of glass cultural relics. The results show that the prediction accuracy of the algorithm is higher than 95%, which can be applied to the actual identification of glass cultural relics.
Keywords: identification of glass cultural relics; Support Vector Machine; Artificial Neural Network; Logistic Regression
0? 引? 言
玻璃是人類最早發(fā)明的人造材料之一,它的出現(xiàn)與使用在人類生活中已有幾千年歷史。如今,隨著科學(xué)技術(shù)的高速發(fā)展,它們被廣泛應(yīng)用于建筑、通信、交通、生命健康、新能源、航空航天、藝術(shù)等領(lǐng)域,是日常生活和高技術(shù)領(lǐng)域十分重要的材料,在人類文明和科技發(fā)明史上占據(jù)著重要地位[1]。
我國(guó)古代出土的玻璃中有很大一部分是含鉀量高的玻璃和鉛鋇型玻璃,即高鉀玻璃和鉛鋇玻璃,這兩類玻璃的儲(chǔ)存環(huán)境完全不同。為了使不同類型的古代玻璃在儲(chǔ)存中完好保存且不被腐蝕,對(duì)高鉀、鉛鋇玻璃的分類顯得尤為重要。然而,古代玻璃極易受埋藏環(huán)境的影響而風(fēng)化,在風(fēng)化過程中,內(nèi)部元素與環(huán)境元素進(jìn)行大量交換,導(dǎo)致其化學(xué)成分比例發(fā)生改變,從而影響對(duì)其類別的正確判斷。為了解決這一問題,考古和科研人員在玻璃文物鑒定方面做了大量工作。薛呂從物理和化學(xué)角度分析了玻璃文物衰變損毀的主要原因,并闡述了玻璃文物保護(hù)與修復(fù)的原則[2]。侯志力對(duì)秦皇島市玻璃博物館內(nèi)部分文物的具體年代進(jìn)行考證,并闡述了隋唐宋玻璃文物的演變歷程與發(fā)展趨勢(shì)[3]。王宜飛等利用光譜分析技術(shù)對(duì)湖南省博物館館藏部分玻璃文物進(jìn)行無(wú)損檢測(cè),并對(duì)其化學(xué)成分進(jìn)行分析[4]。殷宇龍建立了文物風(fēng)化與玻璃類型、紋飾、顏色之間的關(guān)系模型,并依照風(fēng)化點(diǎn)的檢測(cè)數(shù)據(jù)對(duì)風(fēng)化前后玻璃制品的化學(xué)成分含量進(jìn)行分析[5]。王祉皓等通過K-means聚類建立分類模型,對(duì)鉛鋇玻璃和高鉀玻璃進(jìn)行分類鑒定[6]。
以上研究成果體現(xiàn)了玻璃文物在我國(guó)受到了較高的關(guān)注度。然而,目前對(duì)高鉀、鉛鋇玻璃的分類大多只是通過外觀判斷,通過構(gòu)建模型定量地對(duì)玻璃文物進(jìn)行分類鑒定的研究成果相對(duì)較少,這導(dǎo)致玻璃文物鑒定準(zhǔn)確性不高。為了提高高鉀、鉛鋇玻璃分類的準(zhǔn)確率,本文設(shè)計(jì)機(jī)器學(xué)習(xí)分類算法對(duì)高鉀、鉛鋇玻璃的分類規(guī)律進(jìn)行研究,以實(shí)現(xiàn)玻璃文物的精準(zhǔn)分類。
1? 玻璃文物鑒定指標(biāo)體系
由于高鉀玻璃是以含鉀量高的物質(zhì)(如草木灰)作為助熔劑燒制而成的;而鉛鋇玻璃在制作過程中加入鉛礦石作為助熔劑,其氧化鉛(PbO)的含量較高。這兩類玻璃在其他化學(xué)成分上也存在顯著差異[7]。因此,本文選取影響高鉀、鉛鋇玻璃鑒定的14種化學(xué)成分和表面風(fēng)化情況構(gòu)建玻璃文物鑒定指標(biāo)體系,設(shè)14種化學(xué)成分含量和表面風(fēng)化情況分別對(duì)應(yīng)15個(gè)變量,并依次記為X1,X2,…,X15,具體變量名稱如表1所示。
在表1中,X1~X14為數(shù)值型變量,代表玻璃中15種化學(xué)成分含量;X15為屬性變量,取值分為兩類,A表示風(fēng)化,B表示未風(fēng)化。下面,基于這15個(gè)變量,利用機(jī)器學(xué)習(xí)分類算法對(duì)高鉀、鉛鋇玻璃文物進(jìn)行鑒定。
2? 基于機(jī)器學(xué)習(xí)分類算法的高鉀、鉛鋇玻璃鑒定
為了對(duì)高鉀、鉛鋇兩種類型的玻璃進(jìn)行鑒定,從考古資源庫(kù)獲取63個(gè)玻璃文物樣本(其中18個(gè)高鉀玻璃樣本,45個(gè)鉛鋇玻璃樣本)的14種化學(xué)成分?jǐn)?shù)據(jù)、表面風(fēng)化情況及其對(duì)應(yīng)類型。為方便建模,將玻璃類型記為Y,取值包括高鉀、鉛鋇兩類。本文利用機(jī)器學(xué)習(xí)分類算法,構(gòu)建基于支持向量機(jī)(Support Vector Machine, SVM)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)、邏輯回歸(Logistic Regression, LR)的高鉀、鉛鋇玻璃分類算法,借此對(duì)高鉀、鉛鋇玻璃的分類規(guī)律進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)兩類玻璃的精準(zhǔn)鑒定。
2.1? 基于SVM的高鉀、鉛鋇玻璃分類算法
支持向量機(jī)(Support Vector Machine, SVM)是一種按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二分類的廣義線性分類器,其決策邊界是求解學(xué)習(xí)樣本的最大邊距超平面,并將問題化為一個(gè)求解凸二次規(guī)劃的問題[8]。在分類過程中,通過算法不斷迭代、優(yōu)化,尋找最優(yōu)懲罰參數(shù)和核函數(shù)。
本文在構(gòu)建SVM分類模型時(shí),自變量為玻璃文物鑒定指標(biāo)體系中的15個(gè)變量(即14種化學(xué)成分含量與表面風(fēng)化情況),因變量為玻璃類型(即高鉀、鉛鋇兩類);核函數(shù)分別采用徑向基(radial)核函數(shù)[9]、線性(linear)核函數(shù)、多項(xiàng)式(polynomial)核函數(shù)和神經(jīng)網(wǎng)絡(luò)(sigmoid)核函數(shù),基于此,針對(duì)玻璃文物的樣本數(shù)據(jù)訓(xùn)練SVM分類模型?;谒姆N核函數(shù)的SVM分類模型的混淆矩陣如表2至表5所示。
2.1.1? 基于徑向基核函數(shù)的SVM分類模型
懲罰參數(shù)選擇為0.735,支持向量個(gè)數(shù)為62,混淆矩陣如表2所示。
即基于徑向基核函數(shù)的SVM分類模型的準(zhǔn)確率為98.41%。
2.1.2? 基于線性核函數(shù)的SVM分類模型
懲罰參數(shù)選擇為1,支持向量個(gè)數(shù)為60,混淆矩陣如表3所示。
即基于線性核函數(shù)的SVM分類模型的準(zhǔn)確率為95.24%。
2.1.3? 基于多項(xiàng)式核函數(shù)的SVM分類模型
懲罰因子選擇為1,支持向量個(gè)數(shù)為63,混淆矩陣如表4所示。
即基于多項(xiàng)式核函數(shù)的SVM分類模型的準(zhǔn)確率為100%。
2.1.4? 基于神經(jīng)網(wǎng)絡(luò)核函數(shù)的SVM分類模型
懲罰因子選擇為1,支持向量個(gè)數(shù)為63,混淆矩陣如表5所示。
即基于多項(xiàng)式核函數(shù)的SVM分類模型的準(zhǔn)確率為100%。
為了明顯看出四種核函數(shù)的優(yōu)勢(shì)與差異,將基于徑向基核函數(shù)、線性核函數(shù)、多項(xiàng)式核函數(shù)和神經(jīng)網(wǎng)絡(luò)核函數(shù)的SVM分類模型的分類結(jié)果總結(jié)如表6所示,其中高鉀、鉛鋇玻璃樣本數(shù)為18、45。
顯然,在訓(xùn)練SVM分類模型時(shí),基于多項(xiàng)式核函數(shù)和神經(jīng)網(wǎng)絡(luò)核函數(shù)的SVM分類算法的分類正確率均為100%;雖然基于徑向基核函數(shù)、線性核函數(shù)的SVM分類算法存在一定的錯(cuò)誤率,但其正確率依然大于95%,也可以較為精準(zhǔn)地對(duì)玻璃文物進(jìn)行分類鑒定。
2.2? 基于ANN的高鉀、鉛鋇玻璃分類算法
人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks, ANN)綜合評(píng)價(jià)方法是由Rumelhart和McCelland等于1986年提出的一種交互式評(píng)價(jià)方法,它能夠客觀地進(jìn)行多指標(biāo)綜合評(píng)價(jià),是目前應(yīng)用最廣泛的評(píng)價(jià)方法之一[10]。它通過一個(gè)或者多個(gè)神經(jīng)元將輸入層、隱藏層和輸出層連接起來,并對(duì)其賦予相關(guān)的權(quán)重,訓(xùn)練算法會(huì)在迭代過程中不斷調(diào)整這些權(quán)重,從而使得預(yù)測(cè)誤差最小化。通過設(shè)置網(wǎng)絡(luò)的訓(xùn)練條件,控制訓(xùn)練的停止條件以及網(wǎng)絡(luò)結(jié)構(gòu),讓算法自動(dòng)選擇最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)[11]。
在訓(xùn)練基于ANN的高鉀、鉛鋇玻璃分類算法時(shí),首先隨機(jī)選取47個(gè)樣本作為訓(xùn)練集、16個(gè)樣本作為測(cè)試集。本文設(shè)計(jì)的ANN分類算法中,輸入層包含15個(gè)變量(即14種化學(xué)成分含量與表面風(fēng)化情況),中間層為隱藏層,輸出層為玻璃類型(即高鉀、鉛鋇兩類)。首先,基于訓(xùn)練集中的47個(gè)樣本訓(xùn)練ANN分類模型。
訓(xùn)練出的ANN分類模型中,輸入層到隱藏層的激活函數(shù)為雙曲正切函數(shù):
隱藏層到輸出層的激活函數(shù)為Softmax函數(shù):
然后,利用訓(xùn)練的ANN分類模型對(duì)測(cè)試集中的16個(gè)樣本進(jìn)行分類,得到ANN分類模型的混淆矩陣如表7所示。
由表7可以看出,基于ANN的高鉀、鉛鋇玻璃分類算法的分類正確率為100%,算法精確度非常高,因此,可以用該算法對(duì)高鉀、鉛鋇玻璃進(jìn)行分類。
2.3? 基于Logistic回歸的高鉀、鉛鋇玻璃分類算法
邏輯回歸(Logistic Regression, LR)是一種廣義的線性回歸分析模型,通常用來解決因變量不是連續(xù)變量的問題[12]。目前更多適用于對(duì)二分類因變量的分析。本文在R語(yǔ)言軟件中,設(shè)計(jì)基于Logistic回歸的高鉀、鉛鋇玻璃分類算法,對(duì)玻璃文物進(jìn)行分類鑒定,算法結(jié)果如表8所示。
顯然,基于Logistic回歸的高鉀、鉛鋇玻璃分類算法的分類正確率為100%,模型精確度非常高。因此,可以用該模型對(duì)高鉀、鉛鋇玻璃進(jìn)行分類。
綜上所述,基于SVM、ANN、Logistic回歸的玻璃文物鑒定算法的預(yù)測(cè)精度較高,可以將三種分類算法應(yīng)用到玻璃文物類型鑒定的實(shí)際應(yīng)用中。
為了明確本文構(gòu)建的基于機(jī)器學(xué)習(xí)分類算法的高鉀、鉛鋇玻璃鑒定方法,繪制模型流程圖如圖1所示。
3? 結(jié)? 論
為了使不同類型的古代玻璃在長(zhǎng)久儲(chǔ)存中不易被腐蝕,對(duì)高鉀、鉛鋇玻璃的分類顯得尤為重要。本文設(shè)計(jì)了基于SVM、ANN和Logistic回歸的高鉀、鉛鋇玻璃分類算法,并利用三種算法對(duì)高鉀、鉛鋇玻璃的分類規(guī)律進(jìn)行訓(xùn)練,借此實(shí)現(xiàn)玻璃文物的精準(zhǔn)鑒定。三種算法的分類準(zhǔn)確率都高于95%,這說明文章所做的研究、設(shè)計(jì)的算法、得到的結(jié)果具有較高的普適性,可將其應(yīng)用到玻璃文物的實(shí)際鑒別中。
參考文獻(xiàn):
[1] 周靜.中國(guó)鉛鋇玻璃藝術(shù)執(zhí)念之通觀 [J].美術(shù)大觀,2021(3):184-186.
[2] 薛呂.玻璃文物保護(hù)與修復(fù) [C]//中國(guó)文物保護(hù)技術(shù)協(xié)會(huì)第七次學(xué)術(shù)年會(huì)論文集,中國(guó)江蘇鎮(zhèn)江:科學(xué)出版社,2012:89-92.
[3] 侯志力.秦皇島市玻璃博物館唐宋玻璃文物具體年代考證——淺談隋唐宋玻璃文物的演變與發(fā)展 [J].大眾文藝,2015(13):47.
[4] 王宜飛,劉亮,李園.湖南省博物館藏玻璃器無(wú)損分析檢測(cè)及產(chǎn)地初步研究[J].湖南省博物館館刊,2017:592-599.
[5] 殷宇龍.通過關(guān)聯(lián)預(yù)測(cè)對(duì)古代玻璃制品成分分析 [J].當(dāng)代化工研究,2023(1):122-126.
[6] 王祉皓,趙薌溦,李智群,等.基于機(jī)器學(xué)習(xí)的風(fēng)化硅酸鹽玻璃原成分預(yù)測(cè)及亞分類方法 [J].硅酸鹽學(xué)報(bào),2023,51(2):416-426.
[7] 趙志強(qiáng).湖南里耶麥茶戰(zhàn)國(guó)墓地出土玻璃制品的檢測(cè)與分析 [J].湖南考古輯刊,2020:288-301.
[8] 劉玉菲,陳素根.改進(jìn)的最小二乘孿生支持向量機(jī)聚類 [J].安慶師范大學(xué)學(xué)報(bào):自然科學(xué)版,2022,28(3):12-19.
[9] 劉路民根.支持向量機(jī)徑向基核參數(shù)優(yōu)化研究 [J].科學(xué)技術(shù)創(chuàng)新,2018(26):48-49.
[10] 程顯毅.R語(yǔ)言 [M].北京:清華大學(xué)出版社,2019:73-91.
[11] 王力賓.多元統(tǒng)計(jì)分析:模型、案例及SPSS應(yīng)用 [M].北京:經(jīng)濟(jì)科學(xué)出版社,2010:66-71.
[12] 孫紅衛(wèi).基于截尾的穩(wěn)健懲罰Logistic回歸和穩(wěn)健懲罰Cox回歸及在組學(xué)數(shù)據(jù)分析中的應(yīng)用 [D].太原:山西醫(yī)科大學(xué),2020.
作者簡(jiǎn)介:惠姣姣(1995—),女,漢族,陜西西安人,助教,碩士,研究方向:函數(shù)型數(shù)據(jù)分析。
收稿日期:2023-02-25
基金項(xiàng)目:陜西省教育廳自然科學(xué)研究項(xiàng)目(202310592)