員天佑,劉 金,李興蘭
(中國工程物理研究院 計(jì)算機(jī)應(yīng)用研究所,綿陽 621900)
超精密光學(xué)制造不同于傳統(tǒng)的機(jī)械加工,產(chǎn)品質(zhì)量受環(huán)境、設(shè)備、工藝等多種因素的制約,無法實(shí)現(xiàn)定量化,加工質(zhì)量往往依賴于工人的加工經(jīng)驗(yàn)[1]。加工過程大都采取邊加工,邊檢測、邊調(diào)整的加工模式,一個(gè)元件往往需要反復(fù)加工多次,制造效率和成品率低,重復(fù)精度差,產(chǎn)品指標(biāo)個(gè)體差異明顯。因此有必要對光學(xué)制造的各種影響因素進(jìn)行綜合分析,從大量加工數(shù)據(jù)中挖掘有用信息,尋找隱含的規(guī)律和確定性關(guān)系,形成工藝知識(shí),指導(dǎo)設(shè)計(jì)和生產(chǎn),使光學(xué)元件加工質(zhì)量和效率得到提升。
近年來大數(shù)據(jù)分析技術(shù)得到突飛猛進(jìn)的發(fā)展,在許多行業(yè)得到廣泛應(yīng)用。文章將以此為契機(jī),通過對光學(xué)加工過程中各種數(shù)據(jù)的綜合分析,發(fā)掘這些數(shù)據(jù)對光學(xué)元件加工質(zhì)量的影響規(guī)律,建立它們與光學(xué)元件技術(shù)指標(biāo)之間的關(guān)聯(lián)關(guān)系,并和專家經(jīng)驗(yàn)結(jié)合形成工藝知識(shí),指導(dǎo)光學(xué)元件的設(shè)計(jì)和加工,實(shí)現(xiàn)光學(xué)制造過程的數(shù)字化、定量化、知識(shí)化。目前以美國、法國、德國和日本為代表的西方發(fā)達(dá)國家均在國防光學(xué)系統(tǒng)的需求牽引下,大力發(fā)展該項(xiàng)技術(shù)[2,3]。本項(xiàng)目組在國家重大專項(xiàng)的支持下也開展了相關(guān)研究,文章將以某拋光設(shè)備為例對光學(xué)制造過程中的大數(shù)據(jù)分析模型及方法進(jìn)行論述。
工藝知識(shí)庫系統(tǒng)采用MAS(Multi-Agent system)結(jié)構(gòu),由五個(gè)Agent和三個(gè)支撐庫組成。Agent之間是一種松耦合關(guān)系,每個(gè)Agent相互獨(dú)立、高度自治[4,5],支持分布式應(yīng)用,它們之間相互通訊,彼此協(xié)作,在系統(tǒng)中的具體分工如下:
1)數(shù)據(jù)采集Agent:主要負(fù)責(zé)光學(xué)元件制造過程中的環(huán)境信息、設(shè)備狀態(tài)信息、工藝信息和各種過程數(shù)據(jù)的自動(dòng)采集與集中存儲(chǔ),同時(shí)具備一定的預(yù)處理能力,能夠?qū)?shù)據(jù)進(jìn)行過濾、清洗、轉(zhuǎn)換和分類。數(shù)據(jù)采集Agent相對獨(dú)立,與其他Agent之間不存在數(shù)據(jù)交互,但和光學(xué)元件制造裝備和現(xiàn)場檢測設(shè)備之間存在密切聯(lián)系,需通過驅(qū)動(dòng)程序或OPC接口與其交互數(shù)據(jù)。
2)數(shù)據(jù)管理Agent:主要負(fù)責(zé)原始數(shù)據(jù)的集中管理、交互控制和前期處理,為用戶提供開放的數(shù)據(jù)管理與查詢接口,同時(shí)根據(jù)數(shù)據(jù)分析Agent的需要,從原始數(shù)據(jù)庫中提取有用數(shù)據(jù),并對其進(jìn)行結(jié)構(gòu)化處理。處理后的數(shù)據(jù)以數(shù)據(jù)包的方式傳遞給數(shù)據(jù)分析Agent。另外,該Agent還負(fù)責(zé)數(shù)據(jù)庫的日常管理與維護(hù),為異構(gòu)數(shù)據(jù)庫之間的交互提供支撐[4]。
3)數(shù)據(jù)分析Agent:主要負(fù)責(zé)從復(fù)雜的元件加工數(shù)據(jù)中,通過統(tǒng)計(jì)、聚類、關(guān)聯(lián)、回歸等數(shù)據(jù)挖掘方法,分析出與元件加工質(zhì)量有關(guān)的各種輸入信息與元件加工指標(biāo)之間的關(guān)聯(lián)關(guān)系,計(jì)算出關(guān)聯(lián)度,推導(dǎo)出擬合函數(shù),形成最終的工藝知識(shí)。
4)智能交互Agent:充當(dāng)人機(jī)信息交互的橋梁,向用戶提供可視化的操作界面,允許操作人員對各種Agent進(jìn)行操控、配置和管理。智能交互Agent具備自主性和學(xué)習(xí)性能夠根據(jù)用戶輸入的元件加工指標(biāo)要求,在知識(shí)庫的支持下自動(dòng)推演出一套最優(yōu)的加工參數(shù),同時(shí)能夠?qū)﹀e(cuò)誤的操作進(jìn)行判別和屏蔽,并向操作著提供在線幫助。
圖1 工藝知識(shí)庫系統(tǒng)基本框架
大數(shù)據(jù)分析是工藝知識(shí)庫系統(tǒng)的核心,如何發(fā)現(xiàn)光學(xué)制造過程中所產(chǎn)生的大數(shù)據(jù)中的隱含規(guī)律和有用信息是本文的研究重點(diǎn),為此構(gòu)建了圖2所示的分析模型。該模型以數(shù)據(jù)挖掘引擎為核心,以數(shù)據(jù)庫、模型庫和工藝知識(shí)庫為基礎(chǔ),采用大閉環(huán)結(jié)構(gòu):系統(tǒng)先從數(shù)據(jù)采集過程入手,實(shí)現(xiàn)原始數(shù)據(jù)的積累,再通過數(shù)據(jù)挖掘引擎發(fā)現(xiàn)變量之間的關(guān)聯(lián)規(guī)則和依賴關(guān)系,形成工藝知識(shí)指導(dǎo)實(shí)際的設(shè)計(jì)和加工,然后再對加工環(huán)節(jié)產(chǎn)生的新數(shù)據(jù)進(jìn)行分析處理,實(shí)現(xiàn)工藝知識(shí)驗(yàn)證和優(yōu)化。隨著加工過程的延續(xù),積累的可供分析的原始數(shù)據(jù)越來越多,分析得到的工藝知識(shí)也越發(fā)豐富和精確。
數(shù)據(jù)挖掘是大數(shù)據(jù)分析的最有效的技術(shù)手段,能夠從大量的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)集中識(shí)別出有效的、潛在的規(guī)律和有用信息。數(shù)據(jù)挖掘過程主要包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)選擇、數(shù)據(jù)挖掘和結(jié)果表達(dá)五個(gè)基本環(huán)節(jié),本文以光學(xué)元件拋光環(huán)節(jié)的去除效率指標(biāo)分析為例,對數(shù)據(jù)挖掘的具體過程和方法進(jìn)行闡述。
光學(xué)元件制造過程中采集到的原始數(shù)據(jù)非常豐富,既包括元件的屬性信息、加工參數(shù)、檢測數(shù)據(jù)也包括與之相關(guān)的環(huán)境信息、設(shè)備狀態(tài)信息等,這些數(shù)據(jù)不都完全相關(guān)。數(shù)據(jù)準(zhǔn)備就是針對需要分析的某項(xiàng)光學(xué)元件加工指標(biāo),根據(jù)工藝規(guī)則選出可能與之相關(guān)的影響參數(shù),并對其做結(jié)構(gòu)化處理,形成初始樣本集,該樣本集以光學(xué)元件編號(hào)作為關(guān)鍵字,將要分析的加工數(shù)據(jù)和檢測指標(biāo)關(guān)聯(lián)起來形成K個(gè)數(shù)據(jù)樣本。
圖2 大數(shù)據(jù)分析模型
數(shù)據(jù)選擇是在數(shù)據(jù)準(zhǔn)備的基礎(chǔ)上對初始數(shù)據(jù)樣本進(jìn)行清理和選擇,剔除沒有明顯特征的對后續(xù)分析作用不大的數(shù)據(jù)樣本,選擇光學(xué)元件檢測指標(biāo)不合格及優(yōu)良的特征樣本作為分析對象,提高數(shù)據(jù)挖掘的效率和質(zhì)量。
對于光學(xué)元件拋光環(huán)節(jié)的去除效率指標(biāo)分析而言,需要提取可能對去除效率指標(biāo)產(chǎn)生影響的加工參數(shù)進(jìn)行分析,通過數(shù)據(jù)準(zhǔn)備和選擇形成表1所示的樣本集,行代表數(shù)據(jù)對象,列代表數(shù)據(jù)對象的基本屬性[6],Xij表示具體數(shù)值,為了便于分析將該數(shù)據(jù)集可用矩陣D來表示。
由于影響光學(xué)元件表面粗糙度的因素是多方面的,直接對數(shù)據(jù)集D進(jìn)行分析比較困難,需要進(jìn)行分類處理,根據(jù)對象屬性的相似性通過聚類方法將數(shù)據(jù)集D中的數(shù)據(jù)對象分為4組,分別用D1、D2、D3、D4四個(gè)簇表示。它們具有以下特性:
D1:拋光壓力存在明顯差異,其他屬性相似;
D2:拋光轉(zhuǎn)速存在明顯差異,其他屬性相似;
D3:工件擺幅存在明顯差異,其他屬性相似;
表1 數(shù)據(jù)樣本集
圖3 數(shù)據(jù)樣本集矩陣
D4:工件擺速存在明顯差異,其他屬性相似;
對象間的相似性通過歐幾里德距離進(jìn)行測量,計(jì)算公式如式(1)所示,式中x代表簇中的任意對象,y代表簇心,xi、yi代表對象的屬性,即需要進(jìn)行相似性分析的特征參數(shù)。相似性判斷需要工藝人員預(yù)先確定一個(gè)參考閾值σ,參考閾值越小對象間的相似性越強(qiáng),但能夠聚于簇中的對象數(shù)目越小,因此需要權(quán)衡處理。
關(guān)聯(lián)分析是研究變量之間是否存在某種依存關(guān)系,并對依存關(guān)系的相關(guān)方向及相關(guān)程度進(jìn)行統(tǒng)計(jì)分析的數(shù)學(xué)方法[8],通過相似度計(jì)算公式(2)能夠計(jì)算出變量之間的相關(guān)程度。為此需要對D1、D2、D3、D4四個(gè)數(shù)據(jù)集進(jìn)行二元化處理,即,剔除對象的相似屬性,僅保留存在明顯差異的去除率影響參量和去除率檢測值,形成新的數(shù)據(jù)集D'1、D'2、D'3、D'4。再利用公式(2)計(jì)算出兩者之間的關(guān)聯(lián)度R。
回歸分析是研究變量之間內(nèi)在變動(dòng)關(guān)系的數(shù)學(xué)方法,對于二元回歸分析而言可以通過數(shù)據(jù)擬合得到自變量與因變量之間的回歸方程的擬合曲線,用于參數(shù)分析與估算。對于光學(xué)元件加工數(shù)據(jù)的回歸分析而言,將數(shù)據(jù)集D'1、D'2、D'3、D'4中的元素作為擬合函數(shù)的型值點(diǎn),在確定了逼近函數(shù)類型后,通過數(shù)據(jù)擬合的方法可以得到變量與變量之間的擬合函數(shù)[8]。關(guān)于曲線擬合原理及方法的資料很多,這里不再贅述。
關(guān)聯(lián)分析的結(jié)果是光學(xué)元件加工指標(biāo)與各種影響因素之間的關(guān)聯(lián)程度,用關(guān)聯(lián)度表示,能夠?yàn)楣に囋O(shè)計(jì)提供定性參考?;貧w分析的結(jié)果是元件加工指標(biāo)與各種影響因素之間的關(guān)聯(lián)關(guān)系,用擬合函數(shù)表示,能夠?yàn)楣に囋O(shè)計(jì)提供定量參考。關(guān)聯(lián)度和擬合函數(shù)作為工藝知識(shí)存放在知識(shí)庫中,用戶通過智能交互Agent進(jìn)行訪問。
本文從超精密光學(xué)制造的特點(diǎn)和面臨的問題出發(fā),提出了基于大數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)的超精密光學(xué)元件制造系統(tǒng)的工藝知識(shí)庫構(gòu)建技術(shù),對系統(tǒng)架構(gòu)、分析模型、實(shí)現(xiàn)過程和基本方法進(jìn)行了論述,具有一定得參考價(jià)值。通過在某重大專項(xiàng)工程中的應(yīng)用,初步驗(yàn)證了各項(xiàng)技術(shù)的可行性,對超精密光學(xué)制造的數(shù)字化、定量化和知識(shí)化起到了推進(jìn)作用,具有較好的應(yīng)用價(jià)值。但由于影響光學(xué)元件加工質(zhì)量和效率的因素非常復(fù)雜,本文僅在聚類分析和二元化的基礎(chǔ)上分析了單個(gè)參數(shù)對某個(gè)特定指標(biāo)的影響,沒有評(píng)判多個(gè)因素的綜合影響,后續(xù)工作還有很大的研究空間。
[1]唐定勇,李興蘭.先進(jìn)光學(xué)制造執(zhí)行系統(tǒng)研究與開發(fā)[J].制造業(yè)自動(dòng)化,2011.10:116-118.
[2]楊力.跨入21世紀(jì)的先進(jìn)光學(xué)制造技術(shù)[J].光電工程,2002.12(增刊):1-4.
[3]楊力.先進(jìn)光學(xué)制造技術(shù)[M].北京:科學(xué)出版社,2001.
[4]劉俊.基于大數(shù)據(jù)流的Multi-Agent系統(tǒng)模型研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2007,5:166-169.
[5]張潔,高亮,李培根.多Agent技術(shù)在先進(jìn)制造中的應(yīng)用[M].科學(xué)出版社,2004.
[6]胡可云,田鳳占,黃厚寬.數(shù)據(jù)挖掘理論與應(yīng)用[M].北京:清華大學(xué)出版社,北京交通大學(xué)出版社,2008.
[7]王暉,王琪,何瓊.數(shù)據(jù)挖掘理論與實(shí)例[M].北京:經(jīng)濟(jì)科學(xué)出版社,2012.
[8]程正興.數(shù)據(jù)擬合[M].西安:西安交通大學(xué)出版社,1986.