鄭文靖
(西安工程大學 計算機科學學院,陜西 西安710048)
當前時代下,隨著消費者對個性化穿著以及對服裝尺寸適宜度要求的擴大,服裝定制模式漸漸在國內(nèi)占據(jù)了重要的市場份額。定制化是能夠滿足消費者對個性化追求的重要途徑,在“互聯(lián)網(wǎng)+”時代中,定制行為模式正發(fā)生著重要的變革[1-2]。
隨著消費者需求的擴大,傳統(tǒng)的定制模式可能對于眾多的消費者來說,無法及時滿足所有消費者的需求,因此實現(xiàn)服裝定制推薦是當前服裝定制市場的一種趨勢。針對服裝定制領域,目前國內(nèi)主要聚焦于三維人體建模參與定制,并且多數(shù)強調(diào)的是款式、面料、部件樣式的選擇,忽略了消費者歷史數(shù)據(jù)中有用的信息,因此,目前國內(nèi)外服裝定制推薦領域研究較少。文獻[3]通過交互日志挖掘,采用有限狀態(tài)機技術描述客戶需求的會話交互行為模型,并運用約束滿足理論和多屬性效用理論,開發(fā)了一種基于約束滿足和情感效用的個性化西服定制推薦系統(tǒng);文獻[4]基于Kinect描述了一種人體及服裝重構的方法,由多個Kinect捕獲人體模型,對服裝進行3D建模,將其變形以適合人體,然后應用縫合將這些模式縫合在一起;文獻[5]設計和開發(fā)了基于專家知識的個性化服裝搭配系統(tǒng),提供了個性化的服裝搭配服務;文獻[6]采用BDEU決策樹算法,構筑了用戶類別偏好模型,向用戶提供了個性化的推薦服務。以上研究對于服裝定制推薦領域的涉及有限,因此,本文致力于研究服裝定制領域中的量體數(shù)據(jù)與服裝版型。
在大數(shù)據(jù)時代下,為方便消費者快速選擇適合自己的定制服裝版型以及面料繡花搭配,通過SV M分類算法對眾多量體數(shù)據(jù)進行挖掘分析,根據(jù)用戶自身的量體數(shù)據(jù)進行計算后推薦給用戶適合的版型,從而根據(jù)版型進一步實現(xiàn)用戶的個性化定制搭配推薦。個性化的定制推薦與傳統(tǒng)的定制選擇相結(jié)合,才能為用戶提供更好的定制服務。
設量體數(shù)據(jù)為輸入樣本X,以上衣量體數(shù)據(jù)為例,x1、x2、x3、…、xn分別為代表不同部位的量體特征值,如衣長、胸圍、下擺、中腰、肩寬、袖長等部位,輸入n個特征值作為樣本值X(Xi)
建立量體數(shù)據(jù)參數(shù)集X={x1,x2,x3,…,xn}
由于量體特征值之間存在較大差異,如胸圍與肩寬之間的差異。需對量體數(shù)據(jù)集進行歸一化處理,使得參數(shù)空間在各維度分布均勻,模型具有較優(yōu)的迭代速度和分類預測效果。歸一化方法為:
以上衣為例,設X={YC,X W,ZY,XB,JK,XC},YC、X W、ZY、XB、JK、XC分別代表衣長、胸圍、中腰、下擺、肩寬、袖長,設Y=版型分類值,X與Y可表示為:
{(x1,y1),(x2,y2),…,(xn,yn),xt∈Rd,yt∈ {y1,y2,…,yn}}
此關系模式下必然存在n-1個超平面,將這些樣本分別兩兩區(qū)分,最終實現(xiàn)分類效果,超平面可表示為:
式中,w∈Rd為該平面的權值法向量,b∈R為偏置量。
則樣本到超平面的分類間隔為:2/‖w‖,由于原始樣本空間數(shù)據(jù)的線性不可分性,因此,引入懲罰參數(shù)C來調(diào)整支持向量機對已知訓練樣本構建最優(yōu)分類超平面時分類錯誤容忍程度[7]。所以要建立最優(yōu)超平面的問題變成在有約束的條件下求:
為了解決構造最優(yōu)超平面的問題,引入Lagrange函數(shù)[8]:
式中,ai≥0,i=1,2,…,n為拉格朗日乘子,為了求得w和b的最小值,對w和b求偏導數(shù),并使得它們的偏導數(shù)為零,即:
對于已知訓練樣本 (xi,yi),求使得L(w,b,a)取得最大值時的ai,將二次規(guī)劃問題轉(zhuǎn)化為相應的對偶問題,根據(jù)Lagrange對偶性原理,將問題中的參數(shù)全部轉(zhuǎn)變?yōu)閮H以Lagrange乘子作為參數(shù)變量的目標式[9-10]:
解得最優(yōu)解a*=(a1*,a2*,…,an*)'。最優(yōu)法向量w和最優(yōu)偏置量b分別為:
根據(jù)最優(yōu)值,從而求得最優(yōu)分類超平面(w*·x)+b*=0,則其對應的最優(yōu)分類函數(shù)為:
為實現(xiàn)樣本空間從線性分劃到非線性分劃的過渡,引入徑向基(RBF)核函數(shù),將樣本空間從低維映射到高維[11-12]。徑向基核函數(shù)表達式為:
則最優(yōu)分類函數(shù)為
懲罰參數(shù)C和核函數(shù)參數(shù)g是影響SV M分類器性能的關鍵參數(shù)[13],其中C表示模型對誤差的容忍度。C值太大容易導致過擬合的現(xiàn)象,使得測試集的數(shù)據(jù)分類效果不佳;C值太小容易導致欠擬合,模型不能有效捕捉樣本的數(shù)據(jù)特征,泛化能力變差。g是選擇RBF函數(shù)作為kernel后,該函數(shù)自帶的一個參數(shù),隱含地決定了數(shù)據(jù)映射到新的特征空間后的分布,g越大,支持向量越少,g值越小,支持向量越多。g值過大過小,表明原始樣本被映射至并不適用的高維空間,無法建立較優(yōu)的分類模型[14-15]。
Grid Search是用在Libsv m中的參數(shù)搜索方法[16],在C和g組成的二維參數(shù)矩陣中,依次遍歷網(wǎng)格內(nèi)所有的點進行取值,對于取定的C和g利用K-CV方法得到在此組C和g下訓練集驗證分類準確率,最終取使得訓練集驗證分類準確率最高的那組C和g作為最佳參數(shù)。使用Grid Search算法可以得到全局最優(yōu),且C、g相互獨立,便于并行化進行[17-18]。
基于Grid Search-SV M算法的服裝版型分類識別,具體操作是在MATLAB軟件中利用LIBSV M3.14工具包中的SV Mcg For Class.m函數(shù),使用meshgrid方法構建網(wǎng)格,尋找最佳C和g參數(shù),實現(xiàn)用Grid Search優(yōu)化SV M參數(shù)和服裝版型識別,算法如表1所示。
在版型分類預測的過程中,提取量體數(shù)據(jù)特征值,并進行歸一化處理后,引入RBF核函數(shù),將樣本數(shù)據(jù)映射到高維空間,再進行SV M模型訓練、參數(shù)尋優(yōu)以及模型驗證,整個版型的預測模型如圖1所示。
表1 Grid Search-SV M算法流程
圖1 Grid Search-SV M版型預測模型
(1)選定訓練集與測試集,對數(shù)據(jù)集進行劃分。
(2)樣本數(shù)據(jù)預處理:為了避免各個樣本因子之間量級的差異,減少樣本之間的相互影響,同時保證程序運行收斂加快,需要對樣本因子進行歸一化處理[19-20],在MATLAB中用map min max函數(shù)實現(xiàn)其歸一化。
式中,x、min(x)、max(x)分別是原始樣本數(shù)據(jù)及其最小值、最大值;min(y)、max(y)分別代表歸一化后樣本的最大值、最小值。
(3)引入徑向基核函數(shù)(RBF),通過調(diào)整g參數(shù)實現(xiàn)樣本從低維空間到高維空間的映射,從而實現(xiàn)線性可分。
(4)使用二度Grid Search算法進行SV M模型訓練及C&g參數(shù)尋優(yōu)。
粗略搜索階段 定義初始網(wǎng)格,設置大步距,獲得局部最優(yōu)參數(shù)區(qū)間;
精確搜索階段 以最優(yōu)參數(shù)組為搜索中心,設置小步距,不斷擴大搜索范圍,逐步跳出局部最優(yōu),獲得全局最優(yōu)解,從而實現(xiàn)分類效果最優(yōu)。
(1)試驗數(shù)據(jù)來自于某大型服裝企業(yè)平臺,試驗共采用169組量體數(shù)據(jù)與版型之間的對應數(shù)據(jù),隨機選取131個樣本作為訓練集,38個樣本作為測試集,見表2。
表2 量體數(shù)據(jù)版型數(shù)據(jù)集(上衣部分示例)
(2)首先設定所要搜索的(C,g)參數(shù)的初始網(wǎng)格搜索范圍及初始步長,其中,C&g的初始網(wǎng)格搜索范圍為[2-10,210],初始步長為4.5,通過交叉驗證方法獲得局部最優(yōu)參數(shù)組;
(3)在其附近進行小范圍的精確網(wǎng)格搜索,其C的網(wǎng)格搜索范圍為[2-2,24],g的網(wǎng)格搜索范圍為[2-4,24],其搜索步長為0.05;
(4)將最終得到的參數(shù)(C,g)重新傳入到支持向量機的和函數(shù)中,建立基于二度網(wǎng)格搜索的支持向量機模型。
試驗結(jié)果如圖2所示。
從試驗結(jié)果看出,將Grid Search-SVM算法運用于服裝版型的預測分類研究中,有良好的分類效果,且將Grid Search網(wǎng)格搜索算法分步搜索,可大大縮短參數(shù)尋優(yōu)時間,本次試驗運行時間為4.47 s,最佳C參數(shù)為36.7,g參數(shù)為1.3,最終試驗的版型分類準確率在90%以上,收斂情況好時可達到100%。
為挖掘量體數(shù)據(jù)與服裝版型的關系,構造出量體數(shù)據(jù)及服裝版型之間的SV M數(shù)據(jù)模型,并通過Matlab進行仿真試驗,使用SV M算法進行模型訓練及模型驗證,實現(xiàn)分類效果,并通過Grid Search二度網(wǎng)格搜索算法進行參數(shù)尋優(yōu),使準確率達到理想狀態(tài)。量體數(shù)據(jù)及版型的預測研究實現(xiàn)了在服裝定制推薦過程中根據(jù)量體數(shù)據(jù)進行版型推薦的過程,使得服裝定制推薦的過程向前推進,逐步實現(xiàn)服裝定制元素的推薦。針對量體數(shù)據(jù)及版型的研究對服裝定制推薦有重要的理論與實踐意義。
圖2 試驗結(jié)果