陳向榮
河北白沙煙草有限責(zé)任公司保定卷煙廠
計量型數(shù)據(jù)簡要分析三步法
陳向榮
河北白沙煙草有限責(zé)任公司保定卷煙廠
當(dāng)今世界設(shè)備先進(jìn),機(jī)械自動化程度越來越高,生產(chǎn)線數(shù)據(jù)每時每刻成千上萬條累計疊加,要將數(shù)據(jù)轉(zhuǎn)化為反映事物變化或特征的信息,則必須采取數(shù)據(jù)處理、加工、解釋等統(tǒng)計分析手段,進(jìn)而依據(jù)“數(shù)據(jù)信息”解決難題或質(zhì)量改進(jìn)。本論文針對生產(chǎn)中數(shù)據(jù)量較大的計量型數(shù)據(jù)類型,通過均值、極差、標(biāo)準(zhǔn)差及過程能力指數(shù)等統(tǒng)計量的案例講解,由淺入深得闡述數(shù)據(jù)分析的三種常用方法,通過統(tǒng)計方法將數(shù)字轉(zhuǎn)化為有價值的準(zhǔn)確結(jié)論。
計量型數(shù)據(jù);均值;標(biāo)準(zhǔn)差;過程能力指數(shù)
二十一世紀(jì)是科技飛速發(fā)展的世紀(jì),企業(yè)的自動化、機(jī)械化、信息化程度迅猛提升,面對“大量化”、“多樣化”和“快速化”的生產(chǎn)檢測數(shù)據(jù),必須采取數(shù)據(jù)分析、數(shù)據(jù)處理及數(shù)據(jù)顯示等方法,將其轉(zhuǎn)化為較高價值的能明確表述生產(chǎn)狀況或變化的信息,進(jìn)而指導(dǎo)生產(chǎn)達(dá)到精益求精的目的。
下面我們以表1中的4組計量型檢測數(shù)據(jù)為例,由淺入深,由易到難,簡要講解計量型數(shù)據(jù)的三種常用分析方法。(見表1)
中心趨勢是數(shù)據(jù)最基本的定位點,表現(xiàn)計量型數(shù)據(jù)中心趨勢的統(tǒng)計量有均值、中值和眾數(shù)。中值不受極大、極小數(shù)值的影響,眾數(shù)有時不唯一或不存在,而生產(chǎn)過程中現(xiàn)場采集或樣品檢測連續(xù)數(shù)據(jù)一般符合數(shù)據(jù)正態(tài),考慮到受每個檢測數(shù)據(jù)的影響,我們一般采用“均值”作為中心趨勢統(tǒng)計量。
計算1-4組數(shù)據(jù)均值,分別為24.26mm、24.26mm、24.19mm、24.23mm。假設(shè)此產(chǎn)品圓周標(biāo)準(zhǔn)要求為(24.25±0.20)mm,計算均值與規(guī)格中心值24.25mm的偏差,分別為0.01mm、0.01mm、-0.06mm、-0.02mm,可以初步判定第1組、2組數(shù)據(jù)優(yōu)于第4組、3組數(shù)據(jù),證據(jù)充分嗎?我們只是定位了檢測數(shù)據(jù)的一個均值點,在不清楚各個數(shù)據(jù)總體分布狀態(tài)的情況下,其實無法判定數(shù)據(jù)的優(yōu)劣,需進(jìn)一步深入分析。
數(shù)據(jù)離散程度是數(shù)據(jù)分布情況的一種度量,表現(xiàn)計量型數(shù)據(jù)離散的統(tǒng)計量有全距、標(biāo)準(zhǔn)差和方差。全距又稱為極差(R),是指一組測量數(shù)據(jù)中最大值與最小值之差,是檢測值變動的最大范圍。由于它忽略了最大值與最小值之間的其他數(shù)據(jù),一般只適用于樣本容量較小情況。標(biāo)準(zhǔn)差(S)是方差(S2)的算數(shù)平均根,是每個測量值與均值之差的平方和除以(n-1)后再開方,計算公式如下:
由計算公式可知,每個檢測值對標(biāo)準(zhǔn)差(方差)均有影響。統(tǒng)計分析中方差是能直接進(jìn)行加減運(yùn)算的,而標(biāo)準(zhǔn)差不能,但實踐應(yīng)用中,我們一般將標(biāo)準(zhǔn)差做為衡量每個數(shù)據(jù)圍繞平均值上下波動的量尺。
表1 某產(chǎn)品圓周檢測數(shù)據(jù)匯總表(單位mm)
表2 檢測數(shù)據(jù)離散程度統(tǒng)計量匯總表(單位:mm)
計算案例中數(shù)據(jù)組的極差(見表2),能明顯看出檢測數(shù)據(jù)分布范圍的寬窄,第3組0.13最小,第2組0.38最大。有時我們也使用最大值(MAX)與最小值(MIN)兩個統(tǒng)計量,將其與產(chǎn)品規(guī)格上下限直接比較,如第2組最大值達(dá)到24.45,等同于規(guī)格上限,存在檢測數(shù)據(jù)超出標(biāo)準(zhǔn)上限的風(fēng)險,因此必須進(jìn)行調(diào)整。計算案例每組數(shù)據(jù)的標(biāo)準(zhǔn)差,將它與極差數(shù)值分別排序,大小趨勢大致接近,但也不盡相同。如第2組、第4組極差與標(biāo)準(zhǔn)差優(yōu)劣判斷存在矛盾??紤]到計算標(biāo)準(zhǔn)差時要兼顧到每一個檢測數(shù)值,我們一般將它作為衡量數(shù)據(jù)離散程度的標(biāo)尺。因此,第3組、第1組數(shù)據(jù)要優(yōu)于第2組、第4組數(shù)據(jù)。
綜合考慮中心趨勢與離散程度的判定結(jié)論,判定結(jié)果明顯存在差異性,我們無法準(zhǔn)確斷定那組數(shù)據(jù)狀態(tài)最佳,數(shù)據(jù)不好是均值跑偏影響大還是離散變異影響大,數(shù)據(jù)不好又將如何進(jìn)行調(diào)整改進(jìn)呢?因此我們需進(jìn)一步深入分析,將技術(shù)標(biāo)準(zhǔn)規(guī)格納為衡量依據(jù)。
過程能力指數(shù)是依據(jù)“小概率事件”原理,將過程的自然波動范圍定義為6ó(ó為總體標(biāo)準(zhǔn)差,一般用樣本標(biāo)準(zhǔn)差s替代),計算過程輸出能力與要求容差(即標(biāo)準(zhǔn)規(guī)格范圍)的比值,它是一個能量比的概念。由于實際生產(chǎn)過程中均值與規(guī)格中心值多數(shù)情況不重合,因此過程能力分析時,我們多使用PPK指標(biāo)進(jìn)行衡量。在生產(chǎn)過程穩(wěn)定或統(tǒng)計受控前提下,過程能力指數(shù)PPK能將數(shù)據(jù)均值偏移、數(shù)據(jù)離散與標(biāo)準(zhǔn)規(guī)格要求三者之間的關(guān)系表達(dá)出來,其計算公式如下:
其中Usl、Lsl分別為規(guī)格上限與規(guī)格下限,由公式可知,數(shù)據(jù)均值越接近規(guī)格中心值,且標(biāo)準(zhǔn)差S越小,則PPK值越大。
計算1-4組檢測數(shù)據(jù)的PPK值,分別為1.66、0.73、1.29、0.68,經(jīng)比較,第1組、第3組數(shù)據(jù)明顯優(yōu)于第2組、第4組數(shù)據(jù),對比第一步、第二步分析結(jié)論,各組數(shù)據(jù)受離散程度的影響較大一些,而數(shù)據(jù)離散較大的真正原因則需結(jié)合實際對各影響因素進(jìn)一步分析驗證。
此外,由于現(xiàn)場數(shù)據(jù)采集或產(chǎn)品檢測后,數(shù)據(jù)均值與標(biāo)準(zhǔn)差均容易直接得到,而過程能力指數(shù)則需進(jìn)一步計算推導(dǎo)。為了實現(xiàn)依據(jù)數(shù)據(jù)快速指導(dǎo)生產(chǎn)的目的,我們可以建立一個均值偏移量與標(biāo)準(zhǔn)差的對應(yīng)查找表(窮舉法)。首先明確PPK標(biāo)準(zhǔn)下限值,一般是PPK≥1,然后通過查找列表,找到均值偏移量或標(biāo)準(zhǔn)差對應(yīng)的統(tǒng)計量的下限值,由檢測統(tǒng)計量判定產(chǎn)品檢測數(shù)據(jù)是否合格,不合格則依據(jù)兩個統(tǒng)計量的所處水平指導(dǎo)現(xiàn)場進(jìn)行原因排查或設(shè)備調(diào)整,以確保產(chǎn)品質(zhì)量的合格受控狀態(tài)。