張文斌,明 勇,褚維偉,黃哲學(xué)
(深圳大學(xué),廣東 深圳 518000)
購(gòu)物籃分析對(duì)零售業(yè)是非常重要的技術(shù)分析,尤其近年來(lái)網(wǎng)絡(luò)零售的突飛猛進(jìn),產(chǎn)生了海量的交易數(shù)據(jù),從而對(duì)購(gòu)物籃分析提出了更高的要求。購(gòu)物籃分析可以為超市和網(wǎng)絡(luò)商城中的各種促銷提供參考,去庫(kù)存,商品布局優(yōu)化。購(gòu)物籃分析能為決策者提供快速、準(zhǔn)確、節(jié)約、多元的信息參考。提高零售產(chǎn)業(yè)綜合效益、提高國(guó)際競(jìng)爭(zhēng)力、建設(shè)節(jié)約型社會(huì)購(gòu)物籃分析都有重要的宏觀意義[1]。
但是在傳統(tǒng)的購(gòu)物籃分析中,得出的結(jié)果通常是一些常規(guī)商品的組合。這些組合的購(gòu)物籃支持度很高,但是它們已經(jīng)被大家所認(rèn)知,對(duì)企業(yè)的價(jià)值和意義不大。此外,傳統(tǒng)購(gòu)物籃分析一個(gè)很大的局限性在于它并不能預(yù)測(cè),通常只對(duì)歷史數(shù)據(jù)進(jìn)行分析,而不是對(duì)購(gòu)物籃按時(shí)間的序列做出演化和預(yù)測(cè)。往往精準(zhǔn)的預(yù)測(cè)能給企業(yè)帶來(lái)很大的利益,也能提高對(duì)風(fēng)險(xiǎn)的控制。還有,傳統(tǒng)的購(gòu)物籃分析只給出比較簡(jiǎn)單的結(jié)果,沒(méi)有實(shí)現(xiàn)數(shù)據(jù)可視化。一幅圖勝過(guò)千言萬(wàn)語(yǔ),人類對(duì)外界過(guò)多的信息約有80%以上來(lái)自于視覺(jué)系統(tǒng),當(dāng)大數(shù)據(jù)以直觀可視化的圖形形式展示在分析者面前時(shí),分析者往往能夠一眼洞悉數(shù)據(jù)背后隱藏的信息并轉(zhuǎn)化為知識(shí)以及智慧。購(gòu)物籃可視化結(jié)果實(shí)現(xiàn)友好人機(jī)交互界面就需要研究數(shù)據(jù)可視化,同時(shí),大數(shù)據(jù)本身的新特點(diǎn)也對(duì)可視化提出了更為迫切的需求。
針對(duì)購(gòu)物籃分析的現(xiàn)狀,結(jié)合企業(yè)實(shí)際應(yīng)用中的需求,在購(gòu)物籃壓縮研究分析的基礎(chǔ)上,設(shè)計(jì)并建立了購(gòu)物籃可視化系統(tǒng)。其中,通過(guò)購(gòu)物籃壓縮來(lái)壓縮并篩選更有價(jià)值的購(gòu)物籃,購(gòu)物籃可視化讓購(gòu)物籃分析結(jié)果實(shí)現(xiàn)友好的人機(jī)交互界面及可視化[2]。
通常說(shuō)的購(gòu)物籃分析指的是通過(guò)購(gòu)物籃中顯示出來(lái)的交易信息來(lái)分析顧客的購(gòu)買行為,顧客在購(gòu)買商品的過(guò)程中通常會(huì)一次購(gòu)買多個(gè)商品,從而使得這些商品之間具有很強(qiáng)的關(guān)聯(lián)性。因此,可以認(rèn)為顧客的購(gòu)買行為是一種整體的行為,是否購(gòu)買一件商品會(huì)影響到其他商品的購(gòu)買,從而影響到每個(gè)購(gòu)物籃的利潤(rùn)。所以,購(gòu)物籃分析的目標(biāo)就是找出重要且有價(jià)值的購(gòu)物籃[3]。
關(guān)聯(lián)規(guī)則挖掘是購(gòu)物籃數(shù)據(jù)挖掘最經(jīng)典的應(yīng)用之一,用來(lái)從大量的數(shù)據(jù)中挖掘出一些令人感興趣的規(guī)則,分析產(chǎn)品之間的關(guān)聯(lián)性,從而指導(dǎo)人們做出一些有利的決策和安排。例如在超市中將啤酒和尿布放在一起會(huì)增加啤酒的銷量等。
關(guān)聯(lián)規(guī)則挖掘問(wèn)題最早是在1993年由AGRAWAL等提出的,主要是為了幫助零售企業(yè)分析交易數(shù)據(jù),對(duì)一些商業(yè)決策提供支持,如怎樣制定促銷方案,怎樣擺放商品來(lái)提升銷售業(yè)績(jī),怎樣決定供貨數(shù)量來(lái)減少庫(kù)存,等等。他們認(rèn)為,關(guān)聯(lián)規(guī)則挖掘問(wèn)題主要通過(guò)兩部分來(lái)解決,即先挖掘出大項(xiàng)集集合,再?gòu)拇箜?xiàng)集集合中挖掘出關(guān)聯(lián)規(guī)則。同時(shí)提出了語(yǔ)法約束和支持度約束的概念,并且提出了AIS算法來(lái)生成大項(xiàng)集集合[4]。
關(guān)聯(lián)規(guī)則挖掘問(wèn)題可以表述為:設(shè)I=[i1,i2,…,in]是所有項(xiàng)目的集合,即所有商品類別的集合;D=[T1,T2,…,Tn]是所有事務(wù)的集合,即所有交易記錄的集合。事務(wù)T可以表示為:T=[TID,
購(gòu)物籃分析在實(shí)際場(chǎng)景中應(yīng)用時(shí)往往得出的是數(shù)以千計(jì)的購(gòu)物籃,企業(yè)很難從這數(shù)量繁多的購(gòu)物籃中找出真正感興趣的、對(duì)自己有價(jià)值的部分。購(gòu)物籃分析中最經(jīng)典的案例莫過(guò)于“啤酒和尿布”了,可是這之后就很少有類似的購(gòu)物籃分析結(jié)果了。購(gòu)物籃數(shù)量的問(wèn)題給購(gòu)物籃分析的應(yīng)用造成了很大的阻礙。為了解決這個(gè)問(wèn)題,自然而然就會(huì)想到去壓縮這些數(shù)量龐大的購(gòu)物籃,例如,用一種簡(jiǎn)潔的表達(dá)來(lái)描述一類購(gòu)物籃。對(duì)購(gòu)物籃通過(guò)聚類進(jìn)行壓縮,再?gòu)木垲惤Y(jié)果中找出代表性的購(gòu)物籃,從而大大減少購(gòu)物籃數(shù)量[5]。
K-Means算法是基于劃分的聚類算法,簡(jiǎn)潔易懂且有較高的效率,因此應(yīng)用十分廣泛。用戶給定一個(gè)期望得到的聚類數(shù)k,K-Means算法就可以通過(guò)某種距離函數(shù)反復(fù)地把數(shù)據(jù)集中的點(diǎn)分到這k個(gè)類中,直到滿足某個(gè)終止條件。
設(shè)數(shù)據(jù)點(diǎn)的集合為X=[x1,x2,…,xn],其中xi=[xi1,xi2,…,xir]為r維向量,K-Means算法將把給定的數(shù)據(jù)集劃分成r類,每個(gè)類有一個(gè)聚類中心。聚類中心為這個(gè)類中所有點(diǎn)的均值,通常用聚類中心來(lái)表示這個(gè)類。K-Means聚類算法描述如下:
輸入:數(shù)據(jù)集D,聚類個(gè)數(shù)k
輸出:k個(gè)類
步驟:
選擇k個(gè)數(shù)據(jù)點(diǎn)作為原始聚類中心
repeat
for each data pointx?Ddo
compute the distance fromxto each centroid
計(jì)算x到每個(gè)聚類中心點(diǎn)的距離
assignxto the closest centroid //將x分配到距離最近的類中
endfor
re-compute the centroid //重新計(jì)算每個(gè)類中的聚類中心點(diǎn)
until the stopping criterion is met
首先從數(shù)據(jù)集中隨機(jī)抽取k個(gè)點(diǎn)作為原始聚類中心,然后計(jì)算每個(gè)數(shù)據(jù)點(diǎn)到這k個(gè)聚類中心的距離,并根據(jù)這個(gè)距離值將每個(gè)數(shù)據(jù)點(diǎn)分到最近的聚類中心,當(dāng)分配完所有的數(shù)據(jù)點(diǎn)之后,重新計(jì)算每個(gè)類中的聚類中心。不斷重復(fù)這一過(guò)程直到滿足某個(gè)終止條件。終止條件為以下三個(gè)中的任何一個(gè):
(1)沒(méi)有(或最小數(shù)目)數(shù)據(jù)點(diǎn)被重新分配給不同的類;
(2)沒(méi)有(或最小數(shù)目)聚類中心發(fā)生變化;
(3)誤差平方和局部最小。
(1)
均值為使得簇的誤差平方和最小的質(zhì)心,即:
(2)
其中,k為用戶設(shè)定的聚類簇個(gè)數(shù);x為對(duì)象;Ci為第i個(gè)簇;ci為第i個(gè)簇的質(zhì)心;dist(x,ci)為數(shù)據(jù)點(diǎn)x到簇中心ci的距離;mi為第i個(gè)簇中包含的數(shù)據(jù)點(diǎn)個(gè)數(shù)。
證明過(guò)程如下:
對(duì)于一維數(shù)據(jù),式(1)可以寫成:
(3)
其中,Ci表示第i個(gè)簇;x表示Ci中的點(diǎn);ci表示簇Ci的均值。
然后求解第k個(gè)質(zhì)心ck,最小化式(3),也就是對(duì)SSE求偏導(dǎo)數(shù),令偏導(dǎo)數(shù)為0,再求解ck。
(4)
(5)
因此,簇中各點(diǎn)的均值是簇的最小化誤差平方和的最優(yōu)質(zhì)心。
K-Means算法雖然簡(jiǎn)潔易懂、效率較高,但是實(shí)際應(yīng)用中也有很多不足之處。這里運(yùn)用K-Means算法進(jìn)行購(gòu)物籃聚類存在的問(wèn)題主要為用戶需要指定聚類數(shù)目k,這個(gè)k值的選定是非常難以估計(jì)的。很多時(shí)候,事先并不知道給定的數(shù)據(jù)集應(yīng)該分成多少個(gè)類別才最合適。若k值設(shè)置過(guò)大,會(huì)導(dǎo)致聚類數(shù)目過(guò)多,達(dá)不到壓縮購(gòu)物籃集合的目的;若k值設(shè)置過(guò)小,會(huì)導(dǎo)致聚類結(jié)果過(guò)于粗糙,不夠準(zhǔn)確[6-7]。
購(gòu)物籃集合壓縮方法與代表模式方法類似,也是通過(guò)聚類實(shí)現(xiàn)的。不同的是,聚類的對(duì)象不再是購(gòu)物籃表達(dá)式本身,而是由一系列特征屬性表示的購(gòu)物籃[8]。
在數(shù)據(jù)挖掘的整體過(guò)程中,海量的原始數(shù)據(jù)中存在著大量雜亂的、重復(fù)的、不完整的數(shù)據(jù),嚴(yán)重影響了數(shù)據(jù)挖掘算法的執(zhí)行效率,甚至可能導(dǎo)致挖掘結(jié)果的偏差[9]。為此,在數(shù)據(jù)挖掘算法執(zhí)行之前,必須對(duì)收集的原始數(shù)據(jù)進(jìn)行預(yù)處理,以改進(jìn)數(shù)據(jù)的質(zhì)量,提高數(shù)據(jù)挖掘過(guò)程的效率、精度和性能。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)交換與數(shù)據(jù)歸約等[10]。
數(shù)據(jù)預(yù)處理可以補(bǔ)全殘缺的數(shù)據(jù),糾正錯(cuò)誤的數(shù)據(jù),刪除多余的數(shù)據(jù),篩選出所需的數(shù)據(jù)并進(jìn)行數(shù)據(jù)的集成操作,轉(zhuǎn)化數(shù)據(jù)為需要的格式,從而實(shí)現(xiàn)數(shù)據(jù)類型的相同化、數(shù)據(jù)格式的一致化、數(shù)據(jù)信息的精練化以及數(shù)據(jù)存儲(chǔ)的集中化[11]。通過(guò)數(shù)據(jù)預(yù)處理后,可以得到數(shù)據(jù)挖掘所需要的數(shù)據(jù)集,從而使數(shù)據(jù)挖掘具有可行性;同時(shí)也可以在一定程度上減少進(jìn)行挖掘所需付出的代價(jià),提高挖掘結(jié)果的可理解性與有效性[12]。
為了對(duì)上面得出的購(gòu)物籃進(jìn)行聚類以達(dá)到壓縮購(gòu)物籃集合的目的,首先對(duì)購(gòu)物籃進(jìn)行屬性構(gòu)造。通過(guò)對(duì)交易數(shù)據(jù)的仔細(xì)分析與深入理解,首先對(duì)每個(gè)購(gòu)物籃構(gòu)造了13個(gè)屬性。
另一方面,有的購(gòu)物籃具有較強(qiáng)的時(shí)間特征,會(huì)受到季節(jié)、節(jié)假日等時(shí)間因素的影響?;诖?,將用于產(chǎn)生購(gòu)物籃的原始交易數(shù)據(jù)按月分割,計(jì)算每個(gè)購(gòu)物籃在每個(gè)月中這13個(gè)屬性的值。這樣得到的購(gòu)物籃屬性就形成了一個(gè)12個(gè)月的時(shí)間序列,其中每個(gè)月都有13個(gè)屬性,最后每個(gè)購(gòu)物籃共有156個(gè)屬性。在構(gòu)造完這些屬性之后,發(fā)現(xiàn)像支持度和銷售額占比這些屬性值都非常小。而在聚類的過(guò)程中,如果屬性值太小,在計(jì)算距離時(shí)權(quán)重就很小,近似為0,對(duì)聚類結(jié)果影響較大。因此,在聚類之前還要進(jìn)行屬性值的正規(guī)化操作,將所有屬性值都映射到[0,1]區(qū)間[13]。
針對(duì)K-Means算法應(yīng)用在購(gòu)物籃集合壓縮中的不足之處,結(jié)合基于劃分和基于層次的聚類方法,提出一種基于K-Means的層次聚類算法。算法詳細(xì)描述如下:
(1)將原始數(shù)據(jù)集D用K-Means()算法分裂成k個(gè)子聚類;
(2)分別對(duì)上一次聚類產(chǎn)生的所有子聚類運(yùn)行K-Means()算法;
(3)重復(fù)第2步,直到滿足終止條件。
算法的主要思想是自上而下的分裂聚類。聚類過(guò)程從整個(gè)數(shù)據(jù)集的聚類(根)開(kāi)始,根據(jù)用戶指定的k值,運(yùn)用K-Means算法將根節(jié)點(diǎn)聚類分裂成k個(gè)子聚類。每個(gè)子聚類再遞歸地繼續(xù)往下分裂直到滿足某個(gè)終止條件。終止條件為以下任何一個(gè):
(1)所有的葉節(jié)點(diǎn)中數(shù)據(jù)點(diǎn)的個(gè)數(shù)都小于k;
(2)沒(méi)有葉子節(jié)點(diǎn)再分裂成子聚類。
圖1為聚類結(jié)果示例,聚類結(jié)果為一棵聚類樹(shù)。樹(shù)的葉子節(jié)點(diǎn)有5個(gè)聚類(5個(gè)數(shù)據(jù)點(diǎn)),在上一層中,聚類4包含葉子節(jié)點(diǎn)5和6,聚類3包含葉子節(jié)點(diǎn)8和9。用到的結(jié)果只需要最底層的葉子節(jié)點(diǎn)的聚類信息,即5和6為一個(gè)聚類,7為一個(gè)聚類,8和9為一個(gè)聚類[14]。
圖1 聚類結(jié)果示例
通過(guò)上文所述的聚類方法,將購(gòu)物籃集合劃分成n個(gè)聚類。接下來(lái)從每個(gè)聚類中找出一個(gè)購(gòu)物籃來(lái)表示這個(gè)聚類中的所有購(gòu)物籃,這樣就將原始的購(gòu)物籃集合壓縮成n個(gè)購(gòu)物籃。在每個(gè)聚類中,根據(jù)購(gòu)物籃中商品出現(xiàn)的頻次來(lái)構(gòu)造代表購(gòu)物籃。
為了檢驗(yàn)購(gòu)物籃聚類方法在實(shí)際應(yīng)用中的效果,采用購(gòu)物籃集合作為輸入數(shù)據(jù)對(duì)效果和性能進(jìn)行驗(yàn)證。輸入數(shù)據(jù)為500個(gè)購(gòu)物籃,并按3.1的方法進(jìn)行了數(shù)據(jù)預(yù)處理和屬性構(gòu)造,這樣每個(gè)購(gòu)物籃為一個(gè)聚類對(duì)象,有156個(gè)特征屬性。通過(guò)文中提出的購(gòu)物籃聚類方法,將500個(gè)購(gòu)物籃劃分成了50個(gè)類,在每個(gè)類中找出一個(gè)代表購(gòu)物籃,從而實(shí)現(xiàn)了購(gòu)物籃壓縮。下面首先對(duì)聚類效果進(jìn)行評(píng)估與分析。
圖2為聚類結(jié)果中每個(gè)聚類中的點(diǎn)到聚類中心的距離分布圖,用來(lái)評(píng)估聚類結(jié)果中的類內(nèi)是否緊密。
從圖中可以看出,聚類中點(diǎn)到聚類中心的距離主要集中分布在0.05到0.2之間,其中距離在0.1至0.15之間點(diǎn)的占比達(dá)到50%以上。圖1表明聚類結(jié)果中每個(gè)聚類比較緊湊,聚類效果較好,達(dá)到了使相同類中樣本盡可能相似的目的。
采用雷達(dá)圖的形式來(lái)對(duì)比購(gòu)物籃聚類前后的差別。圖3為購(gòu)物籃聚類之前的購(gòu)物籃數(shù)據(jù)雷達(dá)圖,這里考慮到購(gòu)物籃在不同月份的表現(xiàn)具有較大差異,將購(gòu)物籃屬性按月劃分,由每個(gè)月的購(gòu)物籃數(shù)據(jù)得到一張雷達(dá)圖。其中每個(gè)月份的雷達(dá)圖有13個(gè)頂點(diǎn),代表3.1中構(gòu)造的13個(gè)基本屬性,通過(guò)觀察每個(gè)雷達(dá)圖的形狀就可以判斷購(gòu)物籃的分布情況。如果雷達(dá)圖中購(gòu)物籃的軌跡比較雜亂、分散,則說(shuō)明購(gòu)物籃集合差異性較大。反之,如果雷達(dá)圖中購(gòu)物籃形成的軌跡具有明顯的相似性,則說(shuō)明這些購(gòu)物籃具有很強(qiáng)的共性。由圖3可以看出,購(gòu)物籃聚類前較為分散,沒(méi)有什么規(guī)律性。
圖4為聚類結(jié)果中聚類中心點(diǎn)間距離分布直方圖,用來(lái)評(píng)估聚類結(jié)果中類間是否遠(yuǎn)離。由圖中可以看出,聚類中心點(diǎn)間的距離主要分布在0.2至0.4之間,占比達(dá)到60%以上。而由圖2可知,每個(gè)聚類中點(diǎn)到聚類中心的距離主要分布在0.05到0.2之間,對(duì)比實(shí)驗(yàn)結(jié)果可表明聚類結(jié)果中不同類間較為分散。
圖4 聚類中心點(diǎn)間距離分布直方圖
由以上兩個(gè)實(shí)驗(yàn),可以得出所提出的購(gòu)物籃聚類算法滿足類內(nèi)緊密、類間遠(yuǎn)離的聚類有效性評(píng)估標(biāo)準(zhǔn),有較好的聚類效果。
(a)聚類1的購(gòu)物籃數(shù)據(jù)雷達(dá)圖
(b)聚類2的購(gòu)物籃數(shù)據(jù)雷達(dá)圖
在實(shí)驗(yàn)得到的50個(gè)聚類中,選擇兩個(gè)作為購(gòu)物籃聚類結(jié)果示例。由圖5可以看出,每個(gè)聚類中的12張雷達(dá)圖形狀非常相似,每張雷達(dá)圖中的購(gòu)物籃軌跡也基本重疊,有明顯的相似性。通過(guò)對(duì)比可以看出,聚類后同一個(gè)類中的購(gòu)物籃具有較高的相似度,說(shuō)明提出的購(gòu)物籃聚類方法具有較好的聚類效果。
下面對(duì)從聚類結(jié)果中選擇代表購(gòu)物籃進(jìn)行評(píng)估與分析,以代表購(gòu)物籃中的商品在類中出現(xiàn)的頻次占比作為評(píng)估代表購(gòu)物籃的標(biāo)準(zhǔn),顯然占比越高則說(shuō)明選擇的購(gòu)物籃越有代表性。圖6為代表購(gòu)物籃中商品在類中出現(xiàn)的頻次占比分布直方圖。
圖6 代表購(gòu)物籃中商品在類中出現(xiàn)的頻次占比
由圖6可以看出,這一占比值普遍較高,都在50%以上,主要分布在60%至80%之間,表明所采用方法具有較高的有效性與實(shí)用價(jià)值。
根據(jù)算法描述以及實(shí)驗(yàn)結(jié)果,可以總結(jié)出文中提出的購(gòu)物籃壓縮方法具有以下優(yōu)點(diǎn):
(1)結(jié)合基于劃分和基于層次的聚類方法,提出基于K-Means的層次聚類算法。算法簡(jiǎn)單高效,不用人工輸入k值,避免了因k值設(shè)置不當(dāng)導(dǎo)致的聚類效果不理想。
(2)根據(jù)聚類中商品出現(xiàn)的頻次來(lái)構(gòu)造代表購(gòu)物籃,保留了聚類中影響最大的商品,具有較高的代表性與有效性。
購(gòu)物籃數(shù)量過(guò)多是購(gòu)物籃分析在實(shí)際應(yīng)用中不可避免的問(wèn)題,而傳統(tǒng)的壓縮方法中關(guān)注的對(duì)象都是購(gòu)物籃表達(dá)式本身,效果并不是很理想。文中提出的購(gòu)物籃壓縮方法為每個(gè)購(gòu)物籃構(gòu)造了具有時(shí)間序列特征的屬性,然后根據(jù)這些屬性值對(duì)購(gòu)物籃進(jìn)行聚類,再?gòu)木垲惤Y(jié)果中挑選出代表購(gòu)物籃,從而達(dá)到了壓縮購(gòu)物籃集合的效果。
[1] 余 穎.購(gòu)物籃分析在網(wǎng)絡(luò)零售業(yè)中的應(yīng)用研究[D].天津:天津大學(xué),2007.
[2] 褚維偉,張文斌,陳小軍,等.一種帶約束條件的購(gòu)物籃分析方法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2016,26(8):69-74.
[3] DIPPOLD K,HRUSCHKA H.Variable selection for market basket analysis[J].Computational Statistics,2013,28(2):519-539.
[4] 黃 鶴.關(guān)聯(lián)規(guī)則算法綜述[J].軟件導(dǎo)刊,2009,8(3):56-57.
[5] 羅 芳.基于聚類和壓縮矩陣的加權(quán)關(guān)聯(lián)規(guī)則算法的研究與應(yīng)用[D].上海:華東師范大學(xué),2010.
[6] 高 瀅,劉大有,齊 紅,等.一種半監(jiān)督K均值多關(guān)系數(shù)據(jù)聚類算法[J].軟件學(xué)報(bào),2008,19(11):2814-2821.
[7] RUPALI S,SHAH T,CHAVAN T,et al.Survey on implementation of market basket analysis using Hadoop framework[J].International Journal of Computer Applications,2016,134(10):6-9.
[8] SOLNET D,BOZTUG Y, DOLNICAR S. An untapped gold mine? Exploring the potential of market basket analysis to grow hotel revenue[J].International Journal of Hospitality Management,2016,56:119-125.
[9] 張平庸,歐陽(yáng)為民,萬(wàn)志華.基于密度的購(gòu)物籃數(shù)據(jù)聚類方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2005,26(1):180-181.
[10] CHEN Y L,TANG K,SHEN R J,et al.Market basket analysis in a multiple store environment[J].Decision Support Systems,2005,40(2):339-354.
[12] KOCSOR A,KERTéSZ-FARKAS A,KAJN L,et al.Application of compression-based distance measures to protein sequence classification:a methodological study[J].Bioinformatics,2006,22(4):407-412.
[13] 李雷定,馬鐵華,尤文斌.常用數(shù)據(jù)無(wú)損壓縮算法分析[J].電子設(shè)計(jì)工程,2009,17(1):49-50.
[14] 彭喜元,俞 洋.基于變游程編碼的測(cè)試數(shù)據(jù)壓縮算法[J].電子學(xué)報(bào),2007,35(2):197-201.