蔡清秀,李超,于海岐,崔福祥,李海峰,趙文濤
(鞍鋼股份有限公司鲅魚圈鋼鐵分公司,遼寧 營口 115007)
鞍鋼股份有限公司鲅魚圈鋼鐵分公司煉鋼部(以下簡稱“煉鋼部”)設計年產鋼坯650萬t,生產鋼種覆蓋船板、磨具、管線、汽車板等29大系列588個牌號。煉鋼部為保證重點鋼種質量受控,通過統計大量的質量數據,分析確定了恒拉速、出鋼氧值、Als燒損等21個涉及轉爐、精煉、連鑄各工序的質量控制關鍵點。由于關鍵點數據來源于各工序各自獨立的生產報表內,傳統的作法主要是手工方式,利用關鍵字將各EXCEL報表內所需要的數據通過篩選、復制、粘貼等方式提取到一個報表內,進而形成跨工序的新EXCEL報表。這是一個繁雜的工作,效率和準確性取決于操作者對軟件的掌握熟練度。為保證質量控制關鍵點監(jiān)控的時效性,減輕工程技術人員手工數據提取過程的勞動強度,煉鋼部建立了基于SPSS Modeler的數據挖掘模型,將數據提取過程固化在SPSS Modeler數據流中,實現數據的自動化提取。同時由于建立了各工序數據的關聯,可以實現跨工序生產履歷查詢,并利用關鍵點數據對現行質量過程控制標準進一步優(yōu)化,實現質量管理的提升與改進。
煉鋼生產是一個異常復雜的過程,每天都會產生海量數據,涉及到設備、生產、質量、安全、環(huán)保等各個方面。質量控制關鍵點數據是從這些海量數據中,抽取出的質量控制方面相對比較重要的記錄數據,是長期生產總結的成果,表1為關鍵點工藝參數及提取模式。
表1 關鍵點工藝參數及提取模式Table 1 Process Parameters for Key Points and Mode of Extracting Them
這些數據存放在MES終端導出的《轉爐熔煉記錄信息表》、《LF 精煉信息》、《RH 精煉信息》、《連鑄澆鑄信息》、《連鑄作業(yè)圖表》等7個文件內。將關鍵點數據按照一定的邏輯先后順序從上述圖表中抽取出來是數據讀取階段的主要任務,主要完成以下幾方面工作:
(1)由于導出Excel文件字段格式不標準,部分圖表需完成字段重建工作;
(2)理清生產邏輯關系,按照邏輯關系將各個圖表中的記錄關聯在一起,建立數據集合;
(3)過濾掉與質量控制關鍵點無關的字段。
圖1 為 Excel源節(jié)點對話框。SPSS Modeler通過源節(jié)點對數據進行讀取,支持數據庫、可變文件、固定文件、SAS文件、Statistics文件、Excel等數據存儲格式文件的讀取。讀取Excel文件使用Excel源節(jié)點進行導入。
圖1 Excel源節(jié)點對話框Fig.1 Dialog Box for Excel Source Node
數據導入后通過過濾器和類型選項卡對數據進行字段過濾和字段重建。對于任務(2),通過考察工藝路徑特點,按圖2所示的①~⑥邏輯關系載入各電子表,進行數據預處理。
圖2 各電子表格載入順序Fig.2 Loading Orders for Individual Spreadsheet
經過上述分析后,確定數據讀取過程的數據流見圖3。由圖3看出,數據讀取過程通過“熔煉號”將各工序生產報表關聯在一起,實現了跨工序數據的整合,建立了全工序數據集合,為跨工序數據分析、全工序生產過程履歷查詢做好了充分的準備。
圖3 數據讀取過程的數據流Fig.3 Data Stream for Reading Data Process
數據經過合并、字段過濾后,仍屬于原始數據,需要進一步處理。此環(huán)節(jié)需要解決數據類型轉換、數據篩選、字段衍生、字段重排、字段進一步過濾以及字段匯總等問題。
由于電子表是通過MES終端導出表格,存在大量按文本格式存儲的數值型數據,需要通過導出節(jié)點,使用“to_number(ITEM)”函數進行批量處理。導出節(jié)點數據類型轉換功能實現對話框見圖4所示。
圖4 導出節(jié)點數據類型轉換功能實現對話框Fig.4 Dialog Box Display by Exporting Changeover Function for Types of Node Data
由于數據存在缺失、異常等情況,需要對數據進行篩選,去除異常值,確保分析使用的數據更加穩(wěn)定。另外,對原始數據加工計算過程中會衍生出新字段,這就是字段衍生。數據篩選和字段衍生是數據預處理的重要方法。二者主要通過導出節(jié)點,使用條件函數進行處理。由于處理字段較多,以衍生字段“增氮”為例予以說明。導出節(jié)點數據篩選和字段衍生功能實現對話框見圖5。由圖5看出,“增氮”作為評價保護澆鑄好壞的重要指標,如果不好,鋼水澆鑄過程會出現顯著增氮現象,導出原始圖表并不包含“增氮”字段,需要通過計算成品氮含量與精煉搬出氮含量之差作為“增氮”字段,但根據專業(yè)判斷,搬出氮含量和成品氮含量都不可能為0,所以計算前對數據進行篩選。
圖5 導出節(jié)點數據篩選和字段衍生功能實現對話框Fig.5 Dialog Box Display by Exporting Functions for Node Data Filtering and Fields Deriving
本對話框實現功能如下:如果成品氮含量與精煉搬出氮含量都不為0,則輸出二者之差 (單位:10),否則輸出空值(即 undef)。
為實現輸出數據具有較好的邏輯上的可讀性,可使用字段重排節(jié)點實現字段重新排序,圖6為字段重排功能實現對話框。
圖6 字段重排功能實現對話框Fig.6 Dialog Box Display by Exporting Function for Field Rearrangement
連鑄機澆鑄過程中,采用多爐鋼水連續(xù)澆鑄方式,即連續(xù)澆鑄的若干罐次(熔煉號)組成一個澆次。評價澆次質量則需要對澆次內若干罐次的指標進行匯總計算,這一過程需使用“匯總”節(jié)點進行數據處理。圖7為數據匯總功能實現對話框。由圖7看出,數據匯總節(jié)點功能可實現數據的求和、平均數、最小值、最大值、標準差、中位數、計數、方差、第一分位數、第四分位數等統計指標的計算。
圖7 數據匯總功能實現對話框Fig.7 Dialog Box Display by Exporting Function for Summarizing Data
SPSS Modeler的設計思想是盡量用簡單方式進行數據挖掘,盡可能的屏蔽數據挖掘算法的復雜性和軟件操作的繁瑣性,目的是使用先進的數據挖掘技術解決問題而不是軟件操作本身。因此,SPSS Modeler將節(jié)點依次連接構建數據流實現數據挖掘過程,可以清晰的看到數據是如何被加工處理的,而且方便選擇執(zhí)行部分還是全部數據處理過程。對經過讀取、合并的數據流進行字段過濾以及數據類型轉換、數據篩選、字段衍生等一系列節(jié)點連接后,自然形成數據流,見圖8。數據流形成后,實現關鍵點數據按要求的數據格式進行輸出、提取,為后續(xù)的質量數據分析提供重要幫助。
圖8 數據流功能實現Fig.8 Function Display for Data Flow
質量控制關鍵點數據是質量控制方面高度濃縮的高質量數據,可提高數據的應用價值,舉例如下。
提取的關鍵點數據,可針對特定的指標繪制分布圖、直方圖、散點圖、網絡圖等,從而實現數據運行情況的監(jiān)控。圖9為SPSS Modeler圖形選項卡輸出的S含量趨勢圖例。
圖9 SPSS Modeler圖形選項卡輸出的S含量趨勢圖例Fig.9 Trend Legend for Content of Sulfur Output from Tab of SPSS Modeler Graphics
根據圖9可以掌握冶煉過程中S含量的變化趨勢,采取相應措施以滿足生產需要。
對關鍵點數據采用SPSS軟件進一步挖掘,可實現對過程參數的進一步優(yōu)化。例如有客戶反饋部分鋼種存在夾雜缺陷,為尋找影響夾雜缺陷的原因,對關鍵點數據進一步挖掘,圖10為夾雜缺陷率與部分控制參數關系。由圖10看出,夾雜缺陷率與關鍵點數據終端RH-OB升溫幅度、是否加入改質鋁線段、RH終點氧含量以及轉爐出鋼氧含量存在較大的相關性。具體分析如下:
圖10 部分控制參數與夾雜率的關系Fig.10 Relationship between Some Control Parameters and Inclusion Ratio
(1)RH-OB升溫幅度在30℃以下,夾雜缺陷率基本保持在1.2%左右,但如果高于30℃,則會升至1.6%左右,所以生產中要嚴格控制RH-OB升溫幅度;
(2)改質鋁線段的加入也會對夾雜缺陷率產生影響,加入改質鋁線段與否會直接導致產品的夾雜缺陷率相差0.3%左右;
(3)轉爐終點氧含量與夾雜率存在高-低-高的關系,即轉爐終點氧含量小于0.03%時夾雜率較高,0.03%~0.04%時最低,大于0.06%時,夾雜率顯著增加。分析認為,轉爐終點氧含量小于0.03%時,轉爐存在補吹操作,會增加夾雜缺陷的產生,所以轉爐終點氧含量要控制在0.03%~0.06%。
(4)RH終點氧含量是幾個因素中影響較大的一個,在RH終點氧含量小于0.06%時,夾雜缺陷率與RH終點氧含量存在簡單的線性關系,即隨著RH終點氧含量的升高,夾雜缺陷率從0.6%升至1.6%。但高于0.06%時,夾雜缺陷率急劇上升,由1.6%升至3.3%,所以RH終點氧含量要盡可能控制在較低水平,尤其不能高于0.06%。
(1)通過采用SPSS Modeler軟件,將數據提取過程固化在數據流中,實現數據的自動化提取,不僅提高了工作效率,更有利于數據監(jiān)控和分析,有利于質量問題的解決。
(2)通過關鍵字段將各工序生產報表關聯在一起,建立了跨工序數據集合,有利于跨工序數據分析和全工序生產過程履歷查詢。
(3)對關鍵點數據進一步挖掘,可對現行質量控制標準進一步優(yōu)化,提高生產質量管理水平。