齊雪良,袁惠芬,王 旭,2
?
上海地區(qū)成年女性批量定制服裝號型分類研究
齊雪良1,袁惠芬1*,王 旭1,2
(1. “紡織面料”安徽省高校重點(diǎn)實(shí)驗(yàn)室 安徽工程大學(xué),安徽 蕪湖 241000; 2. 安徽工程大學(xué) 紡織行業(yè)科技公共服務(wù)平臺,安徽 蕪湖 241000)
為確定批量定制服裝合理板型數(shù)及提高合體度,以上海地區(qū)520名成年女性為研究對象,選擇身高、胸圍、腰圍、領(lǐng)圍為變量,提出了基于K-means聚類分析的非國標(biāo)規(guī)格的號型分類方法。探討了初始聚心的選擇和最佳聚類數(shù)的確定,并以Calinski-Harabasz(CH)指標(biāo)、變異系數(shù)和相對偏差為指標(biāo),對聚類效果進(jìn)行評價(jià)。研究表明:以國標(biāo)號型規(guī)格為初始聚心,號型被分為30類;相同CH指標(biāo)時(shí),以非國標(biāo)規(guī)格號型為初始聚心,號型被分為20類,即板型數(shù)減少,且變異系數(shù)和相對偏差明顯降低。
K-means算法;批量定制;號型分類;聚類分析
服裝批量定制是在批量生產(chǎn)條件下滿足顧客個(gè)性化需求和合體性要求的企業(yè)生產(chǎn)新模式[1],相比普通定制加工模式具有低成本和快速度等特點(diǎn)。企業(yè)在批量定制生產(chǎn)前,需要對獲取的人體測量數(shù)據(jù)進(jìn)行號型歸檔。目前我國定制服裝企業(yè),主要采用傳統(tǒng)國標(biāo)號型規(guī)格,以人工歸檔方法進(jìn)行歸檔,存在周期長、錯(cuò)歸、漏歸等問題,從而制約合同交貨期和產(chǎn)品質(zhì)量[2]。近年來,根據(jù)測量數(shù)據(jù)的相似性,運(yùn)用聚類分析方法,采用計(jì)算機(jī)輔助進(jìn)行服裝號型歸檔已逐漸成為該領(lǐng)域的研究熱點(diǎn),其中運(yùn)用K-means算法進(jìn)行號型分類較為常用。方方等[3]運(yùn)用K-means算法對219名女性進(jìn)行了號型分類。鄭艷等[4]研究發(fā)現(xiàn)以胸腰差和羅氏指數(shù)為分類變量時(shí)運(yùn)用K-means分類效果較好。目前基于K-means聚類的號型分類,尚未形成標(biāo)準(zhǔn)的、系統(tǒng)的分類和評價(jià)方法。本文以上海地區(qū)成年女性為研究對象,結(jié)合K-means聚類分析算法,提出適合大批量定制服裝號型分類和提高服裝合體度的非國標(biāo)號型分類方法,并以反映類間類內(nèi)距離比的Calinski- Harabasz(CH)值[5]、變異系數(shù)和相對偏差作為評價(jià)聚類效果好壞的指標(biāo)。K-means聚類研究表明,在相同CH指標(biāo)條件下,以最大最小距離法選擇的非國標(biāo)規(guī)格初始聚心的號型分類結(jié)果與以國標(biāo) GB/T 1335.2-2008規(guī)格初始聚心按一次性擇近原則分類結(jié)果對比,板型數(shù)從30減少為20。此外,變異系數(shù)和相對偏差,非國標(biāo)規(guī)格號型也明顯優(yōu)于國標(biāo)規(guī)格。研究結(jié)果為確定批量定制服裝合理板型數(shù)及提高服裝合體度具有一定參考價(jià)值。
上海市某行政事業(yè)單位520名30歲-55歲的成年女性,身高150~175cm之間。
被測試者穿緊身內(nèi)衣,不能佩戴首飾和手表,兩腳并攏目視前方,手臂自然下垂。
根據(jù)要求本次測量項(xiàng)目包括:身高、胸圍、腰圍、領(lǐng)圍。每項(xiàng)目重復(fù)測量3次取均值[6]。
聚類分析前的數(shù)據(jù)預(yù)處理[7],包括異常值和正態(tài)分布檢驗(yàn)?;赪alsh檢驗(yàn)和一般經(jīng)驗(yàn)法[8],本文520個(gè)樣品各測量項(xiàng)目無異常值且滿足正態(tài)分布。
根據(jù)GB/T 1335.2-2008女子服裝號型和南京某定制服裝公司胸圍與領(lǐng)圍的搭配關(guān)系,根據(jù)測量數(shù)據(jù)分布范圍,選擇國標(biāo)號型初始聚心47個(gè)(略)。運(yùn)行SPSS軟件,讀入初始聚心,以僅分類方式執(zhí)行K-means聚類。聚類結(jié)果發(fā)現(xiàn)有17個(gè)號型類別無樣品分入,即520個(gè)樣品被分為30類,其結(jié)果如表1。
表1 以國標(biāo)號型為初始聚心的K-means分類結(jié)果
1. 非國標(biāo)號型初始聚心的選擇
經(jīng)典K-means算法聚類結(jié)果易受到初始聚心的影響。本文以最大最小距離法產(chǎn)生出非國標(biāo)規(guī)格的初始聚心。基于最大最小距離法的初始聚心選擇是一種改進(jìn)的方法,其思想是取盡可能遠(yuǎn)離的樣品做為聚類中心, 避免了隨機(jī)確定初始聚心時(shí)出現(xiàn)由于聚心過于接近導(dǎo)致分類效果不理想的情況。其步驟如下[9]:
(1)取距離所有樣本中心最近樣品作為第1初始聚心Z1;
(2)取距離Z1最遠(yuǎn)的樣品作為第2聚心Z2;
(3)計(jì)算其他樣品Xi與Z1和Z2間距離di1和di2,若,(為比例系數(shù),表示第i次聚類中心最大改變量),則樣品Xi為第3聚心Z3,否則歸入到其中一個(gè)聚類中;
(4)重復(fù)上述操作,直到找不到符合條件的新聚心為止。
表2 非國標(biāo)初始聚心與聚類結(jié)果
2. 聚類數(shù)K的確定
基于K-means的聚類分析,聚類數(shù)的選擇對聚類結(jié)果產(chǎn)生重要影響[10]。對于大批量定制服裝數(shù)據(jù),聚類數(shù)K的確定直接關(guān)系到板型數(shù)及服裝合體度。本文結(jié)合CH指標(biāo)及與國標(biāo)號型分類情況,進(jìn)行聚類數(shù)K的確定。CH指標(biāo)的計(jì)算如式(1)。
其中:D1表示類內(nèi)距離和,如式(2);D2表示類間距離和,如式(3);
通常CH越大,聚類效果越好,但聚類數(shù)K會增加,CH越小,聚類效果越差,聚類數(shù)K會減少,導(dǎo)致服裝合體性差。故為節(jié)約成本,可在不影響聚類效果的情況下,盡量減少板型數(shù)。本文以非國標(biāo)規(guī)格為初始聚心的聚類數(shù)K,是以國標(biāo)聚類結(jié)果(K=30,CH=0.2166)為基準(zhǔn),根據(jù)CH值接近為原則確定。運(yùn)行SPSS軟件,執(zhí)行K-means算法,讀入29個(gè)非國標(biāo)號型初始聚心,以迭代(最大20次)并分類方式將520個(gè)樣品依次從K=2到K=29進(jìn)行28次聚類。注意到當(dāng)K=20時(shí),即520個(gè)樣品分為20類時(shí)CH=0.2186,接近按國標(biāo)K=30的CH值,故最終確定將520個(gè)樣品分為20類,即按照前20個(gè)初始聚心(Z1,Z2,…,Z20),執(zhí)行聚類,結(jié)果如表2所示,其中括號內(nèi)的數(shù)據(jù)為經(jīng)過K-means聚類后,各類的均值并按四舍五入取整,即產(chǎn)生的20個(gè)非國標(biāo)的規(guī)格,將作為板型設(shè)計(jì)的依據(jù)。上述結(jié)果表明,本文提出的按非國標(biāo)初始聚心的K-means聚類結(jié)果,在和國標(biāo)歸檔相比具有更少的板型數(shù),且按CH指標(biāo)分類效果接近。
3. 合體度的評價(jià)指標(biāo)
CH指標(biāo)對分類數(shù)的確定有一定的參考意義,反映了聚類效果的好壞。從定制服裝合體性角度,評價(jià)每個(gè)類內(nèi)樣品測量項(xiàng)目和最終聚心(類均值)的變異系數(shù)和相對偏差,在一定程度上更具有指導(dǎo)意義。變異系數(shù)cv和相對偏差分別是衡量數(shù)據(jù)變異和偏離均值程度的指標(biāo),計(jì)算式分別如式(4)、(5):
為了對比按照國標(biāo)號型與按非國標(biāo)規(guī)格為初始聚心的K-means聚類效果,分別計(jì)算了兩種聚類結(jié)果各測量項(xiàng)目的變異系數(shù)和相對偏差,結(jié)果如表3所示。
表3 國標(biāo)與非國標(biāo)分類變異系數(shù)與相對偏差對比
表3中某測量項(xiàng)目總變異系數(shù)和平均變異系數(shù),分別為各類別的變異系數(shù)之和及變異系數(shù)的均值。相對偏差大于3%樣品所占比例,表示各類別中樣品測量值超過該類別均值達(dá)3%樣品所占的比例。
由表3可知,4個(gè)測量項(xiàng)目中非國標(biāo)分類結(jié)果總變異系數(shù)均小于國標(biāo)分類結(jié)果,表明非國標(biāo)方式聚類效果優(yōu)于國標(biāo)。但平均變異系數(shù)國標(biāo)優(yōu)于非國標(biāo),其原因是由于國標(biāo)聚類數(shù)30大于非國標(biāo)聚類數(shù)20所導(dǎo)致。測量項(xiàng)目腰圍的變異系數(shù)最大,說明樣本反映的成年女性群體腰圍變異較大。
根據(jù)國標(biāo)檔差在4個(gè)測量項(xiàng)目中,相對偏差小于3%具有實(shí)際意義。各測量項(xiàng)目相對偏差腰圍最大,其次是胸圍、領(lǐng)圍和身高。當(dāng)相對偏差為3%時(shí),國標(biāo)和非國標(biāo)腰圍超標(biāo)比例分別減少為44.81%和10.38%,其他3個(gè)項(xiàng)目身高、胸圍和領(lǐng)圍超標(biāo)比例國標(biāo)和非國標(biāo)對應(yīng)關(guān)系為0.58%和0.38%,8.65%和2.12%,1.54%和1.92%。綜上分析,非國標(biāo)分類結(jié)果變異系數(shù)和相對偏差均小于國標(biāo)分類結(jié)果,表明數(shù)據(jù)偏離程度小,按非國標(biāo)的分類結(jié)果,板型的合體性更好。
(1)以最大最小距離法選擇的非國標(biāo)規(guī)格作為K-means聚類初始聚心,在相同CH指標(biāo)時(shí),具有比以國標(biāo)規(guī)格為初始聚心更少的聚類數(shù)。
(2)以變異系數(shù)和相對偏差作為合體性依據(jù),以非國標(biāo)規(guī)格作為K-means聚類初始聚心,聚類效果板型更合體。
(3)樣本反映成年女性4個(gè)測量項(xiàng)目中,變異系數(shù)從大到小依次為,腰圍、胸圍、領(lǐng)圍、身高。
[1] 項(xiàng)鈴鈴.基于服裝批量定制的華東青年女性體形分析[D].無錫:江南大學(xué),2007.
[2] 毋濤,王銀.服裝批量定制量體服務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].陜西科技大學(xué)學(xué)報(bào),2011,29(8):54-56.
[3] 方方,王子英.K-means聚類分析在人體體型分類中的應(yīng)用[J].東華大學(xué)學(xué)報(bào):自然科學(xué)版,2014,40(10):593-598.
[4] 鄭艷,張欣.我國三地區(qū)女大學(xué)生體型分類研究[J].西安工程科技學(xué)院學(xué)報(bào),2004,18(3):210-214.
[5] 劉燕馳,高學(xué)東,國宏偉,等.聚類有效性的組合評價(jià)方法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(19):15-17,30.
[6] 張寧,王宏付.基于三維人體測量的江浙女模特體型分類[J].紡織學(xué)報(bào),2012,33(6):71-75.
[7] 齊靜,李毅,張欣.我國西部地區(qū)青年男性體型描述與體型分類研究[J].紡織學(xué)報(bào),2010,31(5):107-111.
[8] 郁崇文,汪軍,王新厚.工程參數(shù)的最優(yōu)化設(shè)計(jì)[M].上海:東華大學(xué)出版社,2003.4-6.
[9] 周涓,熊忠陽,張玉芳,等.基于最大最小距離法的多中心聚類算法[J].計(jì)算機(jī)應(yīng)用,2006,26(6):1425-1427.
[10] 周世兵,徐振源,唐旭清.新的K-均值算法最佳聚類數(shù)確定方法[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(16):27-31.
Investigation on Shanghai Adult Female Mass Customization Clothing Shape Classification
QI Xue-liang1,YUAN Hui-fen1,WANG Xu1,2
(1. Anhui Provincial Key Lab of Textile Fabric, Anhui Polytechnic University, Wuhu Anhui 241000, China;2. The Science and Technology Public Service Platform for Textile industry, Anhui Polytechnic University, Wuhu Anhui 241000, China)
In order to determine reasonable patterns number of mass customization and improve clothing fitness, this paper analyzed 520 Shanghai adult female body data by K-means cluster algorithm with four classified variables such as height, bust circumference, waist circumference and collar circumference.A new non-GB shape classification method based K-means cluster was proposed. Initial cluster centers and optimal clusters were discussed. Classification result in each cluster was evaluated in Calinski-Harabasz index, coefficient of variation and relative deviation. It showed that the number of clusters was 30 when the GB shape was as initial cluster centers. According to parity of Calinski-Harabasz principle, the number of clusters of non-GB standard shape was 20 and coefficient of variation and relative deviation was decreased obviously.
K-means algorithm; mass customization; shape analysis; cluster analysis
TS941-09
A
2095-414X(2016)04-0008-05
袁惠芬(1972-),女,教授,研究方向:服裝數(shù)字化.
“紡織面料”安徽省高校重點(diǎn)實(shí)驗(yàn)室開放基金(2015FZ001);安 程大 學(xué)研究生創(chuàng)新項(xiàng)目(2015).