黃瑞
摘要:由于不同因素會對催化裂化汽油精制過程中辛烷值的損失產(chǎn)生一定影響,所以采用聚類的方法對其進(jìn)行降維。通過動態(tài)聚類法中的K-Means聚類算法對涉及的367個變量聚類,得出40個聚類中心,再根據(jù)歐式距離計算公式選出距離聚類中心點最近的變量作為其代表性變量。然后對所得的40個代表性變量做斯皮爾曼相關(guān)性檢驗,在一定的顯著性水平下篩選出最具代表性的22個主要變量,代表對汽油辛烷值影響較大的因素。
關(guān)鍵詞:k-means聚類模型;斯皮爾曼相關(guān)性檢驗;汽油辛烷值
一、研究目的與意義
辛烷值是反映汽油機燃油抗爆性能的重要指標(biāo),列入車用汽油規(guī)范第一項。汽油辛烷值越高,抗爆性越好,發(fā)動機可以使用更高的壓縮比。也就是說,如果煉油廠生產(chǎn)的汽油辛烷值繼續(xù)增加,汽車生產(chǎn)廠家可以提高發(fā)動機的壓縮比,這樣可以增加發(fā)動機功率,增加里程,節(jié)約燃油,對提高汽油的動力性和經(jīng)濟(jì)性具有重要意義。
二、建立K-means聚類模型
已知模型變量樣本集{X}中有n個樣本和k個模式分類{sj,j=1,2,3...k},以每個樣本到聚類中心的距離之和達(dá)到最小為目標(biāo),建立聚類問題數(shù)學(xué)模型如下:
其中:
公式(1)為目標(biāo)函數(shù),表示每個樣本變量到聚類中心的距離之和達(dá)到最小;
公式(2)表示每一變量樣本能且只能分配到一個聚類中心上;
公式(3)表示對變量樣本的均值向量進(jìn)行求解;
公式(4)中yij為0-1變量,即yij為1是表示變量樣本i分配在j聚類中心上,否則yij為0;
三、K-means聚類模型求解
第一步:任意選擇k個初始的聚類中心為c1,c2,...ck;
第二步:逐一將樣本集{X}中的各個樣本按照最小距離原則分配給k個聚類中心的其中一個cj;
第三步:由上計算新的聚類中心c'j= ∑X(j=1,2,3,...,k),其中Nj表示第j個聚類中心包含的變量樣本個數(shù);
第四步:若滿足c'j≠cj,轉(zhuǎn)至第二步,否則即為算法收斂,結(jié)束算法。
根據(jù)以上進(jìn)行數(shù)據(jù)處理后可得40個聚類中心。
四、歐式距離計算公式篩選主要因素
歐式距離也稱歐幾里得距離,是最常見的距離度量,衡量的是多維空間中兩個點之間的絕對距離。也可以理解為:m維空間中兩個點之間的真實距離,或者向量的自然長度(即該點到原點的距離)。在二維和三維空間中的歐氏距離就是兩點之間的實際距離,計算公式為:
六、結(jié)論
綜合以上數(shù)據(jù),通過對40個代表性聚類中心變量進(jìn)行斯皮爾曼相關(guān)性檢驗可得22個對辛烷值有影響的關(guān)鍵性主要變量
參考文獻(xiàn)
[1]胥紅玉.淺談汽油辛烷值的影響因素[J].石化技術(shù)與應(yīng)用2019,37(5): 345-348.DOI:10.3969/j.issn.1674-4977.2020.05.016
[2]程杰.基于聯(lián)立方程模型的保障房建設(shè)對房價影響研究[D].揚州大學(xué),2019.
[3]JuanA.Herrada-Vidales,JuanM.García-González&JavierGuzmán-Pantoja(2020). Integralprocessforobtainingacetinsfromcrudeglycerolandtheireff ectontheoctaneindex.207(2),231-241.