羅國(guó)亮,王 賀,趙 昕,曹義親,黃曉生,鄔昌興,冼楚華
基于數(shù)據(jù)結(jié)構(gòu)化的三維動(dòng)畫壓縮方法研究
羅國(guó)亮1,王 賀1,趙 昕1,曹義親1,黃曉生1,鄔昌興1,冼楚華2
(1. 華東交通大學(xué)軟件學(xué)院,江西 南昌 330013; 2.華南理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,廣東 廣州 510641)
在三維動(dòng)畫應(yīng)用日益廣泛的背景下,研究三維動(dòng)畫數(shù)據(jù)壓縮方法對(duì)其數(shù)據(jù)的存儲(chǔ)、傳播和渲染技術(shù)至關(guān)重要?;趫D像數(shù)據(jù)的結(jié)構(gòu)化特征,計(jì)算機(jī)視覺領(lǐng)域提出了一系列高效圖像壓縮技術(shù)。鑒于三維動(dòng)畫數(shù)據(jù)與圖像數(shù)據(jù)結(jié)構(gòu)的差異,探討三維動(dòng)畫數(shù)據(jù)結(jié)構(gòu)化方法,進(jìn)而探索改進(jìn)圖像算法以實(shí)現(xiàn)一種新的三維動(dòng)畫數(shù)據(jù)壓縮方法。具體而言,首先研究對(duì)三維模型頂點(diǎn)序列進(jìn)行優(yōu)化調(diào)整;進(jìn)而基于圖像壓縮算法的模塊研究動(dòng)畫數(shù)據(jù)的子塊尺寸優(yōu)化以及圖像壓縮算法量化矩陣優(yōu)化方法;最后,通過(guò)采用不同類型動(dòng)畫數(shù)據(jù)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明優(yōu)化圖像壓縮算法在壓縮比和時(shí)效均得到有效提升和保障。
壓縮;三維動(dòng)畫;圖像壓縮算法;聚類;離散卷積變換系數(shù)
伴隨著網(wǎng)絡(luò)通信技術(shù)的發(fā)展,流媒體的廣泛應(yīng)用催生了眾多新技術(shù)興起。其中,決定了多媒體傳播、存儲(chǔ)效率的壓縮技術(shù)是學(xué)者們長(zhǎng)期關(guān)注的研究方向。目前,人們熟知的圖像壓縮方法包括JPEG,PNG,BMP,AVI和MPEG等。其中,有損的JPEG方法及其衍生的JPEG2000(可選無(wú)損)方法具有極高的運(yùn)算效率,是當(dāng)前使用最廣泛的圖像壓縮方法之一。
近年來(lái),虛擬現(xiàn)實(shí)技術(shù)發(fā)展方興未艾,“工業(yè)4.0”同樣成為國(guó)內(nèi)外熱門產(chǎn)業(yè)化方向。作為這些未來(lái)技術(shù)的共同數(shù)據(jù)基礎(chǔ),三維模型是相關(guān)產(chǎn)業(yè)發(fā)展不可或缺的重點(diǎn),相關(guān)產(chǎn)業(yè)迅速崛起,隨之而來(lái)的是針對(duì)三維模型數(shù)據(jù)高效處理技術(shù)的迫切需求。其中,三維壓縮技術(shù)是涉及海量三維模型數(shù)據(jù)存儲(chǔ)、傳輸?shù)暮诵募夹g(shù)之一。然而,三維模型不同于傳統(tǒng)的圖像數(shù)據(jù),不具備圖像數(shù)據(jù)的矩陣存儲(chǔ)幾何結(jié)構(gòu),且對(duì)噪音極其敏感,也使得傳統(tǒng)的圖像壓縮技術(shù)將不能直接應(yīng)用于三維數(shù)據(jù)。
本文提出對(duì)傳統(tǒng)圖像壓縮算法的改進(jìn)方法和基于改進(jìn)圖像壓縮算法的三維動(dòng)畫數(shù)據(jù)壓縮框架,使圖像壓縮算法適應(yīng)于三維數(shù)據(jù),以實(shí)現(xiàn)對(duì)三維動(dòng)畫數(shù)據(jù)的高效壓縮。
本文首先將圖像壓縮算法應(yīng)用于三維動(dòng)畫數(shù)據(jù),接著探索算法中各參數(shù)在三維動(dòng)畫數(shù)據(jù)上的表現(xiàn),針對(duì)三維動(dòng)畫數(shù)據(jù)與二維圖像數(shù)據(jù)的差別,對(duì)傳統(tǒng)算法進(jìn)行調(diào)整,在數(shù)據(jù)層面提出了對(duì)頂點(diǎn)順序的調(diào)整方法,在算法層面通過(guò)改變輸入DCT變換的分割子塊大小以及量化矩陣的數(shù)據(jù)分布,兼顧時(shí)間效應(yīng),實(shí)現(xiàn)更好的壓縮效果。
自從1992年靜止圖像壓縮(joint photographic experts group,JPEG)標(biāo)準(zhǔn)提出以來(lái)[1],JPEG2000也應(yīng)運(yùn)而生[2-3],其作為一個(gè)成熟的解決方案,在多媒體的傳輸、存儲(chǔ)及其應(yīng)用技術(shù)發(fā)展等方面做出重要貢獻(xiàn)。JPEG算法也在圖像質(zhì)量評(píng)估方法、圖像取證、產(chǎn)權(quán)保護(hù)、信息隱藏等領(lǐng)域起到關(guān)鍵作用。WANG等[4]提出了基于JPEG有損壓縮誤差的可視化實(shí)現(xiàn)圖像質(zhì)量評(píng)估的方法。LUO等[5]也通過(guò)類似的方法實(shí)現(xiàn)了圖像取證的應(yīng)用驗(yàn)證,這在當(dāng)前天網(wǎng)高度密集部署情況下,圖像的司法合理性論證具有現(xiàn)實(shí)意義?;贘PEG的信息隱藏也得到了廣泛的研究[6-12]。文獻(xiàn)[6]在2004年提出了基于特征提取的圖像信息隱藏方法框架。隨后,PEVNY和FRIDRICH[7]融合馬爾科夫及離散卷積變換提出了多類的信息隱藏方法。而后人也在圖像尺度等方向?qū)π畔㈦[藏方法提出了多種性能優(yōu)化方案[8-10],并進(jìn)一步研究了可逆的信息隱藏方法[11-12]。近年來(lái),隨著深度網(wǎng)絡(luò)方法及硬件計(jì)算性能的同步提升,學(xué)者們基于JPEG算法融合高性能深度網(wǎng)絡(luò)方法,研發(fā)了一系列新的視覺應(yīng)用。例如,在圖像壓縮領(lǐng)域,TODERICI等[13]聯(lián)合回歸神經(jīng)網(wǎng)絡(luò)提出了高性能的圖像壓縮方法。RIPPEL和BOURDEV[14]提出的自適應(yīng)實(shí)時(shí)圖像壓縮方法對(duì)當(dāng)前主流的直播等應(yīng)用至關(guān)重要。REN和SHAKHNAROVICH[15]基于級(jí)聯(lián)區(qū)域聚集的圖像分割方法,對(duì)圖像進(jìn)行分層分割,其可應(yīng)用于三維網(wǎng)格。最后,學(xué)者們提出的雙JPEG算法通過(guò)不同的2個(gè)量化矩陣對(duì)圖像進(jìn)行2次壓縮操作,通過(guò)觀察離散卷積變換的雙峰統(tǒng)計(jì)特性實(shí)現(xiàn)更豐富的圖像特征提取[16]。
隨著顯示技術(shù)和數(shù)據(jù)捕捉方法的優(yōu)化,三維數(shù)據(jù)得到了廣泛應(yīng)用。由于三維數(shù)據(jù)尺度大且容錯(cuò)性差等特點(diǎn),三維數(shù)據(jù)壓縮方法在近二十多年一直備受關(guān)注[17-18]。文獻(xiàn)[17]對(duì)屆時(shí)的壓縮算法進(jìn)行了系統(tǒng)梳理及性能評(píng)估。
JPEG算法的核心是離散余弦變換(discrete cosine transform,DCT),以其為代表的頻譜變換也經(jīng)常出現(xiàn)在對(duì)三維模型的壓縮中,如離散傅里葉變換、圖傅里葉變換、小波變換等。三維模型根據(jù)結(jié)構(gòu)差異,可分為網(wǎng)格模型和點(diǎn)云模型[19]。網(wǎng)格模型不僅包括空間點(diǎn)坐標(biāo)數(shù)據(jù),也包含了點(diǎn)間拓?fù)湫畔?。針?duì)網(wǎng)格模型的壓縮,文獻(xiàn)[20-21]提出了基于譜分析的壓縮方法。KHODAKOVSKY等[22]提出了基于小波變換的漸進(jìn)幾何壓縮算法(progressive geometry compression,PGC)。LEE等[23]則提出了綜合壓縮比和壓縮質(zhì)量的三維模型漸進(jìn)式壓縮方法,該方法對(duì)于基于網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)顯示意義顯著。YANG等[24]基于圖傅里葉變換和多級(jí)樹集合分裂算法對(duì)網(wǎng)格序列進(jìn)行簇內(nèi)壓縮的方法。點(diǎn)云數(shù)據(jù)作為最自然和普遍的三維模型數(shù)據(jù),針對(duì)該數(shù)據(jù)的壓縮方法論述更為廣泛[25-31]。學(xué)者們提出了一系列的壓縮方法探索,包括經(jīng)典的八叉樹法[25]、圖形自適應(yīng)變換方法[26]、幾何變形評(píng)估[27]和動(dòng)作補(bǔ)償[28]等方法。同時(shí)也對(duì)點(diǎn)云的屬性開展了基于圖形變換壓縮方法研究[29-30],以及點(diǎn)云模型的高性能實(shí)時(shí)壓縮方法研究[31]。
首先,將圖像從RGB顏色空間轉(zhuǎn)換為YCrCb顏色空間,對(duì),和3個(gè)分量進(jìn)行采樣后分別存放到3張表中。然后將表分割成8×8的子塊,對(duì)每個(gè)子塊單獨(dú)進(jìn)行DCT變換,得到DCT系數(shù)矩陣,并對(duì)其進(jìn)行量化。最后采用Huffman編碼對(duì)量化結(jié)果進(jìn)行熵編碼[2]。
使用JPEG算法壓縮二維圖像數(shù)據(jù),可以獲得很好的壓縮效果。但鑒于三維動(dòng)畫數(shù)據(jù)和規(guī)則二維圖像數(shù)據(jù)的結(jié)構(gòu)性差異,這一優(yōu)秀算法并不能直接使用在三維動(dòng)畫的壓縮中。經(jīng)過(guò)數(shù)據(jù)變換,本文借鑒標(biāo)準(zhǔn)的JPEG壓縮算法,將其運(yùn)用到三維動(dòng)畫壓縮中。
首先,本文將三維動(dòng)畫的時(shí)間和空間對(duì)應(yīng)圖像的長(zhǎng)度和寬度。然后,將其每個(gè)頂點(diǎn)的三維坐標(biāo)(,,)對(duì)應(yīng)圖像每個(gè)像素點(diǎn)的3個(gè)顏色通道(,,),如圖1所示。
基于以上對(duì)應(yīng)關(guān)系,本文將三維動(dòng)畫的頂點(diǎn)集當(dāng)作圖像的像素集進(jìn)行JPEG壓縮,并針對(duì)三維動(dòng)畫數(shù)據(jù)的特點(diǎn),無(wú)需進(jìn)行顏色模式轉(zhuǎn)換及采樣,具體流程如下:
(2) 對(duì)每個(gè)子塊B進(jìn)行DCT變換,得到DCT系數(shù)矩陣,將(0,0)稱為DC系數(shù),其余63個(gè)稱為AC系數(shù)。變換公式為
其中
(3) 對(duì)DCT系數(shù)矩陣進(jìn)行量化,將中每一個(gè)DCT系數(shù)除以量化表中對(duì)應(yīng)位置的量化值并進(jìn)行取整,得到量化后的DCT系數(shù)矩陣,即
(4) 使用JPEG標(biāo)準(zhǔn)推薦的哈夫曼表對(duì)量化后的DCT系數(shù)矩陣進(jìn)行熵編碼,其中,對(duì)DC系數(shù)和AC系數(shù)使用不同的哈夫曼表進(jìn)行編碼,得到壓縮后的數(shù)據(jù)_。
壓縮流程如圖2所示。
圖2 三維動(dòng)畫中運(yùn)用的JPEG壓縮流程圖
在對(duì)每個(gè)子塊B進(jìn)行DCT變換時(shí),B中數(shù)據(jù)之間值差別越小,DCT系數(shù)矩陣的值越向左上角集中,右下角越多的值為零或接近零,在進(jìn)行熵編碼時(shí)可以更好的達(dá)到數(shù)據(jù)壓縮的目的。
然而三維動(dòng)畫中每一幀的頂點(diǎn)排列順序是沒有規(guī)律的,即頂點(diǎn)集中列數(shù)據(jù)間的值差別是不可預(yù)料的。為了使列數(shù)據(jù)間的值差別盡量小,在進(jìn)行壓縮之前需要對(duì)頂點(diǎn)集的列數(shù)據(jù)進(jìn)行重排序。本文擬使用聚類算法來(lái)達(dá)到這一目的。為匹配具有高性能的JPEG算法,本文使用了等簇大小的K-means算法,即eK-Means算法,對(duì)頂點(diǎn)集進(jìn)行聚類。
雖然eK-Means算法會(huì)受到初始聚類中心和離群點(diǎn)的影響,導(dǎo)致結(jié)果不穩(wěn)定,并且容易收斂到局部最優(yōu)解,但是三維動(dòng)畫數(shù)據(jù)在時(shí)間和空間上均具有平滑性,使得這些缺陷對(duì)結(jié)果的影響很小。同時(shí),算法中初始聚類中心隨機(jī)選擇,僅當(dāng)所有初始點(diǎn)均在模型邊界點(diǎn),如均在馬尾的尾端時(shí),才會(huì)對(duì)結(jié)果造成影響,而這種情況很少。基于以上考慮,使用eK-Means算法進(jìn)行頂點(diǎn)集聚類的結(jié)果具有可靠性。
計(jì)算聚類中心時(shí)可以采取2種策略:①使用對(duì)頂點(diǎn)集的第一列數(shù)據(jù)1聚類后的結(jié)果對(duì)進(jìn)行重排序;②計(jì)算所有列的聚類中心后取平均值得到聚類結(jié)果。相對(duì)策略①,策略②需要取得所有幀數(shù)據(jù)后才能進(jìn)行壓縮,且只能進(jìn)行離線壓縮。為達(dá)到實(shí)時(shí)壓縮的目的,本文使用策略①進(jìn)行頂點(diǎn)集重排序,具體步驟如下:
步驟3.計(jì)算每個(gè)類的均值,作為新的聚類中心,即令=。
步驟4.依據(jù)式(4)判斷是否收斂,收斂或達(dá)到最大迭代次數(shù)則結(jié)束聚類,否則重復(fù)進(jìn)行步驟2和步驟3。
總體流程如圖3所示。
圖3 基于eK-Means聚類算法的三維動(dòng)畫數(shù)據(jù)重排序
Fig. 3 3D animation data reordering based on eK-Means clustering algorithm
本文將使用上述算法得到的個(gè)類合并為一個(gè)數(shù)組,作為索引值序列,使用對(duì)進(jìn)行重新排序,得到新的頂點(diǎn)集_,即_new=V(i)。
針對(duì)DCT變換能量集中的特性,DCT系數(shù)矩陣左上角存儲(chǔ)著變換前子塊B的主要數(shù)據(jù),尺寸越大存儲(chǔ)主要數(shù)據(jù)所需的存儲(chǔ)空間越小,因?yàn)榕cB尺寸相等,本文將B尺寸設(shè)置為×,同時(shí)修改量化表,并按圖4所示的3種方式生成尺寸為×的量化表。
三維動(dòng)畫數(shù)據(jù)大多是浮點(diǎn)數(shù),所需精度很高,而經(jīng)過(guò)量化之后變成了整型數(shù)據(jù),在進(jìn)行數(shù)據(jù)還原時(shí)會(huì)損失浮點(diǎn)部分,導(dǎo)致三維動(dòng)畫產(chǎn)生形變。本文在數(shù)據(jù)擴(kuò)大倍之后進(jìn)行量化,使數(shù)據(jù)的浮點(diǎn)部分得到一定程度保留,以減少數(shù)據(jù)的損失,計(jì)算公式為
[b1]
反量化公式為
其中,(,)為還原后的DCT系數(shù)矩陣。
本文使用“Cloth”,“Chicken”,“Horse”,“Michael”等三維動(dòng)畫數(shù)據(jù)進(jìn)行測(cè)試(表1)。
針對(duì)本文提出的優(yōu)化壓縮模型,給出以下幾個(gè)評(píng)估實(shí)驗(yàn)結(jié)果:
(1) 不同量化表數(shù)值變化方式(線性/拋物線/指數(shù))對(duì)壓縮效果的影響。實(shí)驗(yàn)結(jié)果展示不同量化表數(shù)值變化方式對(duì)數(shù)據(jù)的壓縮效果,同時(shí)進(jìn)行了不同子塊尺寸的實(shí)驗(yàn),說(shuō)明在不同子塊尺寸下,量化表數(shù)值變化方式對(duì)數(shù)據(jù)壓縮的影響趨勢(shì)均保持一致,如圖5所示。
(2) 子塊尺寸對(duì)壓縮效果的影響。實(shí)驗(yàn)結(jié)果展示不同子塊尺寸對(duì)數(shù)據(jù)的壓縮效果及耗費(fèi)時(shí)間,量化表的設(shè)置方式為線性,說(shuō)明不同子塊尺寸對(duì)數(shù)據(jù)壓縮的影響趨勢(shì)基本保持一致,如圖6所示。
表1 三維動(dòng)畫模型數(shù)據(jù)
圖5 3種量化表設(shè)置方式對(duì)數(shù)據(jù)的壓縮性能影響評(píng)估((a) Cloth數(shù)據(jù),子塊尺寸為8×8;(b) Cloth數(shù)據(jù),子塊尺寸為16×16;(c) Chicken數(shù)據(jù),子塊尺寸為8×8;(d) Chicken數(shù)據(jù),子塊尺寸為16×16;(e) Horse數(shù)據(jù),子塊尺寸為8×8;(f) Horse數(shù)據(jù),子塊尺寸為16×16;(g) Michael數(shù)據(jù),子塊尺寸為8×8;(h) Michael數(shù)據(jù),子塊尺寸為16×16)
圖6 子塊尺寸對(duì)數(shù)據(jù)的壓縮性能影響評(píng)估,量化表采用linear設(shè)置((a) Cloth,壓縮效果;(b) Cloth,壓縮時(shí)間; (c) Chicken,壓縮效果;(d) Chicken,壓縮時(shí)間;(e) Horse,壓縮效果;(f) Horse,壓縮時(shí)間; (g) Michael,壓縮效果;(h) Michael,壓縮時(shí)間)
(3) 與標(biāo)準(zhǔn)JPEG算法及Cascaded比較。上述實(shí)驗(yàn)兼顧了時(shí)間效率,選取子塊大小為32,量化表的設(shè)置方式為線性,同時(shí)采用頂點(diǎn)重排的方式。對(duì)比使用如3.2節(jié)所述未經(jīng)優(yōu)化的JPEG算法流程以及Cascaded[15]進(jìn)行壓縮,優(yōu)化后的JPEG算法在Horse上的表現(xiàn)如圖7所示。
圖7 優(yōu)化JPEG算法針對(duì)horse的壓縮性能評(píng)估,子塊尺寸為32×32,量化表采用linear設(shè)置
(1) 量化表對(duì)壓縮效果的影響。不同量化表在Cloth,Chicken,Horse和Michael數(shù)據(jù)上的表現(xiàn)均相似。顯然對(duì)量化表線性賦值或拋物線賦值,可以達(dá)到比指數(shù)賦值更好的壓縮效果。同時(shí),指數(shù)賦值的效果隨著分割子塊增大而更差。指數(shù)型分布的量化表相較另外2種,更強(qiáng)調(diào)DCT系數(shù)矩陣左上角的信息,對(duì)右下角的信息壓縮更大。這種偏向隨著尺寸的擴(kuò)大而更為明顯,使得壓縮效果不盡如人意,因此,在量化表的選擇上應(yīng)注意不要過(guò)于忽視DCT系數(shù)矩陣右下角部分。
(2) 子塊尺寸對(duì)壓縮效果的影響。隨著子塊的增大,壓縮所需時(shí)間減少,說(shuō)明進(jìn)行離散余弦變換的次數(shù)和壓縮時(shí)間正相關(guān)。在bpvf小于5時(shí),使用尺寸為32的子塊能取得最好的壓縮效果和時(shí)間效應(yīng),但當(dāng)bpvf較大時(shí),壓縮效果不如較小尺寸如8,16時(shí)的效果好。因?yàn)閷?duì)于每一個(gè)分塊,尺寸增大意味著對(duì)DCT系數(shù)矩陣右下角的信息壓縮更甚,所帶來(lái)的誤差也越大,考慮到壓縮的實(shí)際需求,均衡誤差、時(shí)間和存儲(chǔ)空間的考量。尺寸設(shè)定在32是較優(yōu)的選擇。
(3) 壓縮效果的影響。結(jié)合上述實(shí)驗(yàn)結(jié)果,采用尺寸為32的分割子塊,對(duì)量化矩陣采用線性設(shè)置,防止對(duì)數(shù)據(jù)的過(guò)壓縮,同時(shí)對(duì)動(dòng)畫頂點(diǎn)進(jìn)行重排,增加頂點(diǎn)間的相關(guān)性,使得DCT系數(shù)矩陣左上角的數(shù)值包含更多的信息,右下角可以被壓縮的概率增大,于傳統(tǒng)的JPEG算法相比,改進(jìn)后的算法明顯優(yōu)于原來(lái)算法,與同樣是將圖像的操作轉(zhuǎn)移到模型壓縮上的文獻(xiàn)[15]方法相比,改進(jìn)后的JPEG算法依舊可以取得較好的效果。
本文結(jié)合傳統(tǒng)圖像壓縮算法,根據(jù)三維動(dòng)畫數(shù)據(jù)特征,提出基于優(yōu)化圖像壓縮的動(dòng)畫壓縮框架。對(duì)動(dòng)畫數(shù)據(jù)結(jié)構(gòu)化的子塊尺寸優(yōu)化提升了算法的時(shí)間性能,對(duì)圖像壓縮算法量化矩陣優(yōu)化方法實(shí)現(xiàn)了相同壓縮比下對(duì)準(zhǔn)確度的要求,修改三維模型頂點(diǎn)序列進(jìn)行優(yōu)化調(diào)整增大了數(shù)據(jù)子塊內(nèi)的相關(guān)性,使得后續(xù)DCT部分能發(fā)揮更大作用,優(yōu)化后的圖像壓縮算法可以明顯提升對(duì)三維動(dòng)畫數(shù)據(jù)的壓縮效果。作為本文工作的延續(xù),將繼續(xù)針對(duì)JPEG算法中離散余弦的變換模塊,如根據(jù)數(shù)據(jù)本身的結(jié)構(gòu)化特性自適應(yīng)選擇子塊尺寸,進(jìn)一步開展優(yōu)化三維動(dòng)畫壓縮方法的探索研發(fā)工作。
[1] WALLACE G K. The JPEG still picture compression standard[J]. IEEE Transactions on Consumer Electronics, 1991, 34(4): 30-44.
[2] CHRISTOPOULOS C, SKODRAS A, EBRAHIMI T. The JPEG2000 still image coding system: an overview[J]. IEEE Transactions on Consumer Electronics, 2000, 46(4): 1103-1127.
[3] RABBANI M, JOSHI R. An overview of the JPEG 2000 still image compression standard[J]. Signal Processing: Image Communication, 2002, 17(1): 3-48.
[4] WANG Z, BOVIK A C, SHEIKH H R, et al. Image quality assessment: from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.
[5] LUO W Q, HUANG J W, QIU G P. JPEG error analysis and its applications to digital image forensics[J]. IEEE Transactions on Information Forensics and Security, 2010, 5(3): 480-491.
[6] FRIDRICH J. Feature-based steganalysis for JPEG images and its implications for future design of steganographic schemes[EB/OL]. [2021-03-18]. http://citeseerx.ist.psu.edu/ viewdoc/summary?doi=10.1.1.160.1596&rank=4.
[7] PEVNY T, FRIDRICH J. Merging Markov and DCT features for multi-class JPEG steganalysis[C]//Conference on Security Steganography and Watermarking of Multimedia Contents. Washington: SPIE Press, 2007.
[8] LI F Y, WU K, QIN C, et al. Anti-compression JPEG steganography over repetitive compression networks[J]. Signal Processing, 2020, 170: 107454.
[9] ZENG J S, TAN S Q, LI B, et al. Large-scale JPEG image steganalysis using hybrid deep-learning framework[J]. IEEE Transactions on Information Forensics and Security, 2018, 13(5): 1200-1214.
[10] CHEN M, SEDIGHI V, BOROUMAND M, et al. JPEG-phase-aware convolutional neural network for steganalysis of JPEG images[C]//Proceedings of the 5th ACM Workshop on Information Hiding and Multimedia Security - IHMMSec’17. New York: ACM Press, 2017: 75-84.
[11] QIAN Z X, ZHANG X P, WANG S Z. Reversible data hiding in encrypted JPEG bitstream[J]. IEEE Transactions on Multimedia, 2014, 16(5): 1486-1491.
[12] LI N, HUANG F J. Reversible data hiding for JPEG images based on pairwise nonzero AC coefficient expansion[J]. Signal Processing, 2020, 171: 107476.
[13] TODERICI G, VINCENT D, JOHNSTON N, et al. Full resolution image compression with recurrent neural networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE Press, 2017: 5435-5443.
[14] RIPPEL O, BOURDEV L. Real-time adaptive image compression[EB/OL]. [2020-03-18]. http://proceedings.mlr. press/v70/rippel17a.html.
[15] REN Z L, SHAKHNAROVICH G. Image segmentation by cascaded region agglomeration[C]//2013 IEEE Conference on Computer Vision and Pattern Recognition. New York: IEEE Press, 2013: 2011-2018.
[16] BARNI M, BONDI L, BONETTINI N, et al. Aligned and non-aligned double JPEG detection using convolutional neural networks[J]. Journal of Visual Communication and Image Representation, 2017, 49: 153-163.
[17] MAGLO A, LAVOUé G, DUPONT F, et al. 3D mesh compression: survey, comparisons, and emerging trends[J]. ACM Computing Surveys, 2015, 47(3): 44.
[18] PENG J L, KIM C S, JAY KUO C C. Technologies for 3D mesh compression: a survey[J]. Journal of Visual Communication and Image Representation, 2005, 16(6): 688-733.
[19] DEERING M F. Geometry compression for regular and irregular mesh structures: US6525722[P]. 2003-02-25.
[20] KARNI Z, GOTSMAN C. Spectral compression of mesh geometry[C]//27th Annual Conference on Computer Graphics and Interactive Techniques - SIGGRAPH. New York: ACM Press, 2000: 279-286.
[21] BEN-CHEN M, GOTSMAN C. On the optimality of spectral compression of mesh data[J]. ACM Transactions on Graphics, 2005, 24(1): 60-80.
[22] KHODAKOVSKY A, SCHR?DER P, SWELDENS W. Progressive geometry compression[C]//27th Annual Conference on Computer Graphics and Interactive Techniques - SIGGRAPH. New York: ACM Press, 2000: 271-278.
[23] LEE H, LAVOUE G, DUPONT F. Rate-distortion optimization for progressive compression of 3D mesh with color attributes[J]. The Visual Computer, 2012, 28(2): 137-153.
[24] YANG B L, ZHANG L H, LI F W B, et al. Motion-aware compression and transmission of mesh animation sequences[J]. ACM Transactions on Intelligent Systems and Technology, 2019, 10(3): 25.
[25] SCHNABEL R, KLEIN R. Octree-based point-cloud compression[EB/OL]. [2021-03-18]. https://xueshu.baidu.com/ usercenter/paper/show?paperid=806a63abd78d8f1be4e74d996f98ef9c&site=xueshu_se.
[26] COHEN R, TIAN D, VETRO A. Point cloud compression using prediction and shape-adaptive transforms: US20170214943[P]. 2017-07-27.
[27] TIAN D, OCHIMIZU H, FENG C, et al. Geometric distortion metrics for point cloud compression[C]//2017 IEEE International Conference on Image Processing (ICIP). New York: IEEE Press, 2017: 3460-3464.
[28] DE QUEIROZ R L, CHOU P A. Motion-compensated compression of dynamic voxelized point clouds[J]. IEEE Transactions on Image Processing, 2017, 26(8): 3886-3895.
[29] ZHANG C, FLORêNCIO D, LOOP C. Point cloud attribute compression with graph transform[C]//2014 IEEE International Conference on Image Processing (ICIP). New York: IEEE Press, 2014: 2066-2070.
[30] COHEN R A, TIAN D, VETRO A. Attribute compression for sparse point clouds using graph transforms[C]//2016 IEEE International Conference on Image Processing (ICIP). New York: IEEE Press, 2016: 1374-1378.
[31] KAMMERL J, BLODOW N, RUSU R B, et al. Real-time compression of point cloud streams[C]//2012 IEEE International Conference on Robotics and Automation. New York: IEEE Press, 2012: 778-785.
Research on the structured 3D animation and the compression
LUO Guo-liang1, WANG He1, ZHAO Xin1, CAO Yi-qin1, HUANG Xiao-sheng1, WU Chang-xing1, XIAN Chu-hua2
(1. School of Software, East China Jiaotong University, Nanchang Jiangxi 330013, China; 2. School of Computer Science and Engineering, South China University of Technology, Guangzhou Guangdong 510641, China)
With the increasingly wide applications of 3D animation, the compression methods of 3D animation data have become significant for the technologies in data storage, transmission, and rendering. There are multiple efficient technologies for 2D image compression in the domain of computer vision. Based on the structural differences between t3D animation data and 2D image data, the improvement of the image compression algorithm was explored for a new method of 3D animation compression. Specifically, the optimal vertex sequence of the 3D model towards compression was first computed. Then, based on the classical image compression algorithm flow, the sub-block size optimization and the quantization matrix optimization was formulated to improve compression. Finally, with different types of animation, experimental results show that the optimized image compression algorithm can guarantee both effectiveness and efficiency for the compression.
compression; 3D animation; image compression algorithm; clustering; discrete convolution transform coefficients
TP 391
10.11996/JG.j.2095-302X.2021020182
A
2095-302X(2021)02-0182-08
2020-09-19;
19 September,2020;
2020-10-09
9 October,2020
國(guó)家自然科學(xué)基金項(xiàng)目(61962021);江西省自然科學(xué)基金重點(diǎn)項(xiàng)目(20202ACBL202008);中國(guó)博士后科學(xué)基金(2020T130264);江西省研究生創(chuàng)新專項(xiàng)資金項(xiàng)目(YC2020-S353)
National Natural Science Foundation of China (61962021); Key Research Program of Jiangxi Province (20202ACBL202008); China Postdoctoral Science Foundation (2020T130264); Graduate Student Innovation Special Foundation of Jiangxi Province (YC2020-S353)
羅國(guó)亮(1985-),男,江西南昌人,副教授,博士后。主要研究方向?yàn)橛?jì)算機(jī)圖形學(xué)。E-mail:luoguoliang@ecjtu.edu.cn
LUO Guo-liang (1985-), male, associate professor, postdoctoral. His main research interest covers computer graphics. E-mail:luoguoliang@ecjtu.edu.cn
冼楚華(1982–),男,廣東肇慶人,副教授,博士。主要研究方向?yàn)橛?jì)算機(jī)圖形學(xué)。E-mail:chhxian@scut.edu.cn
XIAN Chu-hua (1982–), male, associate professor, Ph.D. His main research interest covers computer graphics. E-mail:chhxian@scut.edu.cn