陳 斌(國家知識(shí)產(chǎn)權(quán)局專利局專利審查協(xié)作廣東中心,廣州 510530)
?
3D字幕專利技術(shù)分析
陳 斌
(國家知識(shí)產(chǎn)權(quán)局專利局專利審查協(xié)作廣東中心,廣州 510530)
摘 要:3D字幕技術(shù)主要涉及3D字幕視差調(diào)整、字幕視差數(shù)據(jù)的傳輸,本文結(jié)合相關(guān)專利文獻(xiàn)對3D字幕技術(shù)進(jìn)行簡單的分析。
關(guān)鍵詞:3D字幕;視差調(diào)整;索尼公司
字幕是電影中不可或缺的元素。3D電影中的字幕不同于傳統(tǒng)2D電影的字幕,3D字幕本身具有一定的立體效果。3D字幕由字幕添加器在合適的立體深度位置疊加原有的3D視頻內(nèi)容從而生成具有3D效果的立體電影。3D字幕的立體效果由3D字幕視差決定。區(qū)別于傳統(tǒng)的2D字幕技術(shù),3D字幕技術(shù)主要涉及3D字幕的視差調(diào)整、3D字幕視差數(shù)據(jù)的傳輸。
有兩種類型的字幕可以添加至視頻中:對話字幕(subtitle)和屏幕字幕(caption)。一般而言,對話字幕適用于有聽力的觀眾,屏幕字幕適用于耳聾的觀眾。對話字幕可以將對話翻譯成不同語言,但是很少示出全部音頻。例如,屏幕字幕示出音效(例如,“電話鈴響”和“腳步聲”),而對話字幕則不這樣做。對于屏幕字幕,用戶可以根據(jù)實(shí)際需要選擇是否添加。
作為3D電影或者3D視頻中的附加信息或者輔助信息,在應(yīng)用層面上,早期立體電影往往直接將字幕放置在立體圖像的最前端,字幕始終漂浮在顯示屏的前面,這樣做的好處在于技術(shù)簡單,然而面對立體效果不加考慮。隨著人們對立體效果的要求不斷提高以及計(jì)算機(jī)處理技術(shù)的提高,不斷出現(xiàn)新的3D字幕視差調(diào)整的相關(guān)技術(shù)。下面結(jié)合相關(guān)專利文獻(xiàn)分析了三種典型的3D字幕視差調(diào)整技術(shù):
2.1將最大視差設(shè)置為字幕視差
為了適應(yīng)不斷變化的3D對象的視差以及不遮擋觀眾對3D對象的觀賞,專利文獻(xiàn)CN101653011A中提出了在與3D內(nèi)容中最大深度值相同的水平處插入字幕,并進(jìn)一步地公開了逐幀求取最大深度值以及多幀求取最大深度值兩種思路,對于每一個(gè)對話字幕,在深度映射中深度值等于最大深度值處添加文本框。由此產(chǎn)生與3D內(nèi)容相結(jié)合的文本,其中所述文本不阻礙3D內(nèi)容中的3D效果并且在觀看者觀看時(shí)不產(chǎn)生視覺疲勞。
2.2基于聲音數(shù)據(jù)調(diào)整字幕視差
為了增加字幕與視頻內(nèi)容的互動(dòng)效果,提高字幕的顯示效果,專利文獻(xiàn)CN102111631A中基于接收的音頻數(shù)據(jù)的音頻音量級(jí)來自適應(yīng)地修改3D字幕的視差,從而以更好的效果來顯示3D字幕。通過預(yù)先存儲(chǔ)音頻音量級(jí)與字幕視差的對應(yīng)關(guān)系值,使得當(dāng)聲音增大時(shí),字幕更加突出地顯示。與此同時(shí),當(dāng)聲音大于一閾值時(shí),還將字幕的圖形數(shù)據(jù)相應(yīng)地改變?yōu)榻档土送该鞫鹊?、紅色的圖形數(shù)據(jù),使得以更好的效果顯示3D字幕。
2.3以線性模型的方式傳輸字幕視差數(shù)據(jù)
針對逐幀改變字幕視差而產(chǎn)生的字幕視差數(shù)據(jù)量大的問題,專利文獻(xiàn)CN102783159A通過線性模型來擬合字幕視差變化曲線,具體地,設(shè)計(jì)數(shù)據(jù)結(jié)構(gòu)[幀間隔,斜率],視差數(shù)據(jù)的序列將預(yù)定斜率假設(shè)為斜率變化的基準(zhǔn),在每一幀中使用視差數(shù)據(jù),以確定閉合字幕顯示的左、右眼視圖的水平偏移,進(jìn)而確定感知到的z軸位置。提供用于觀眾在3DTV環(huán)境中觀看字幕的優(yōu)化機(jī)制,避免視頻對象可能會(huì)出現(xiàn)在字幕前方或者后方;減少用于傳輸視差數(shù)據(jù)的數(shù)據(jù)量,最小化對用于字幕服務(wù)的可用帶寬的影響。
索尼公司的專利申請涉及3D字幕視差調(diào)整、字幕數(shù)據(jù)傳輸,在3D字幕技術(shù)領(lǐng)域占據(jù)了主導(dǎo)地位。索尼公司的申請?zhí)朠CT/ JP2010/060579(20100622)提出在立體圖像數(shù)據(jù)的接收側(cè),可以使用已經(jīng)根據(jù)圖像內(nèi)的各個(gè)物體的遠(yuǎn)近感而被施加了視差調(diào)整的重疊信息,從而使得可以在重疊信息的顯示中保持遠(yuǎn)近感的一致性。申請?zhí)朩O2011US26291(20110225)提出通過接收由幀間隔與斜率變化的值組成的數(shù)據(jù)結(jié)構(gòu)的視差數(shù)據(jù),從而減少用于傳輸視差數(shù)據(jù)的數(shù)據(jù)量,最小化對用于字幕服務(wù)的可用帶寬的影響。申請?zhí)朠CT/ JP2011/071564(20110922)提出字幕的顯示范圍設(shè)置以及信息內(nèi)容的設(shè)置,從而以最佳狀態(tài)保持關(guān)于每個(gè)對象的透視的一致性。申請?zhí)朠CT/JP2011/074368(20111021)提出使用具有用于發(fā)送用作3D字幕的管理信息的顯示控制信息的數(shù)據(jù)單元的第二數(shù)據(jù)流和插入數(shù)據(jù)單元中的視差信息,從而在接收側(cè)可以向已經(jīng)疊加在左眼圖像和右眼圖像上的字幕單元施加適當(dāng)?shù)囊暡睢?/p>
3D字幕的相關(guān)專利文獻(xiàn)主要涉及3D字幕視差調(diào)整以及視差數(shù)據(jù)的傳輸,本文結(jié)合相關(guān)專利文獻(xiàn)分析了幾種典型的3D字幕視差調(diào)整技術(shù),這些技術(shù)旨在根據(jù)現(xiàn)有的計(jì)算機(jī)處理能力以及人們對于立體效果的追求而不斷改進(jìn)3D字幕的顯示效果。索尼公司的專利申請涉及3D字幕視差調(diào)整、字幕數(shù)據(jù)傳輸,在3D字幕技術(shù)領(lǐng)域占據(jù)了主導(dǎo)地位。
參考文獻(xiàn):
[1]袁敏,趙劍,李偉華等.3D電視技術(shù)專利分析[J].電視技術(shù),2013,37(S2).
[2]梁麗.3D字幕技術(shù)研究[J].中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(電子期刊)信息科技輯,2012(08).
DOI:10.16640/j.cnki.37-1222/t.2016.13.133