段峰峰 段思遙
摘要:立體視覺(jué)資源與二維視覺(jué)資源相比,在結(jié)構(gòu)原理、內(nèi)容表達(dá)、視覺(jué)呈現(xiàn)等方面更為復(fù)雜,以二維視覺(jué)資源的分類(lèi)方式對(duì)其進(jìn)行管理存在缺乏資源特點(diǎn)、描述不準(zhǔn)確、處理復(fù)雜度高等問(wèn)題。對(duì)立體視覺(jué)資源分類(lèi)方式進(jìn)行了研究,闡述了基于存儲(chǔ)形式、編碼格式、顯示原理、顯示分辨率、結(jié)構(gòu)格式、視差類(lèi)型、內(nèi)容類(lèi)型的分類(lèi)方式及原理,為更好地實(shí)現(xiàn)立體視覺(jué)資源的管理、利用及研究提供思路和借鑒。
關(guān)鍵詞:立體視覺(jué)資源;分類(lèi);編目存儲(chǔ);檢索
DOIDOI:10.11907/rjdk.181071
中圖分類(lèi)號(hào):TP301
文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào)文章編號(hào):16727800(2018)009005204
英文標(biāo)題Research on the Classification of Stereo Vision Resources
--副標(biāo)題
英文作者DUAN Fengfeng1,2,DUAN Siyao1,2
英文作者單位(1.School of Journalism and Communication,Hunan Normal University,Changsha 410081,China;
2.Hunan Social Public Opinion Monitoring and Network Public Opinion Research Center,Changsha 410081,China)
英文摘要Abstract:Compared with two-dimensional visual resources,stereo visual resources are more complex in structure principle,content expression,visual presentation etc.There are many problems,such as lack of resource features,inaccuracy of description,high complexity for processing when managing the stereo visual resources by the classification methods of two-dimensional visual resources.The classification methods are studied for stereo visual resources to better facilitate catalogue,management,retrieval and utilization.In the paper,classification methods and principle based on storage form,encoding format,display principle,display resolution,structure format,disparity type and content type are discussed.The purpose is to provide ideas and references for better management,utilization and related research of stereo vision resources.
英文關(guān)鍵詞Key Words:stereo vision resources; classification; catalogue; retrieval
0引言
隨著立體視覺(jué)技術(shù)不斷成熟,其產(chǎn)業(yè)迅速發(fā)展。不同于傳統(tǒng)的二維視覺(jué)資源,立體視覺(jué)資源關(guān)鍵在于存在深度信息,能夠以全新立體化方式將視覺(jué)內(nèi)容呈現(xiàn)給用戶,使用戶具有立體全真的體驗(yàn),而立體視頻技術(shù)則給用戶帶來(lái)了更加真實(shí)的體驗(yàn)效果。立體視覺(jué)技術(shù)及資源在影視娛樂(lè)、科技、教育、醫(yī)療、工業(yè)等諸多領(lǐng)域都具有廣泛應(yīng)用,隨著相關(guān)領(lǐng)域的發(fā)展,立體視覺(jué)技術(shù)產(chǎn)業(yè)在未來(lái)社會(huì)發(fā)展中將不斷增長(zhǎng),產(chǎn)生更大的應(yīng)用價(jià)值。
計(jì)算機(jī)技術(shù)、數(shù)字媒體技術(shù)、互聯(lián)網(wǎng)技術(shù)的發(fā)展促使網(wǎng)絡(luò)數(shù)字資源不斷增加,以立體視覺(jué)技術(shù)為支撐的數(shù)字立體視覺(jué)資源和內(nèi)容迅速增多,資源類(lèi)型也呈多樣化,如圖像、視頻等立體視覺(jué)資源,半結(jié)構(gòu)化、非結(jié)構(gòu)化立體視覺(jué)資源,以及其它各種結(jié)構(gòu)形式的立體視覺(jué)資源等。其在管理和利用方面與二維視覺(jué)資源相比具有一定的特殊性和差異性,對(duì)其進(jìn)行分類(lèi)研究,能較好地支持海量立體視覺(jué)資源的有效管理,實(shí)現(xiàn)高效的編目存儲(chǔ)和檢索,促進(jìn)立體視覺(jué)資源更好地發(fā)展和利用。
1基于存儲(chǔ)形式的立體視覺(jué)資源分類(lèi)
1.1立體視覺(jué)文本資源
立體視覺(jué)文本資源包括立體視覺(jué)文本和立體視覺(jué)資源文本描述。立體視覺(jué)文本指文檔和文件中的立體視覺(jué)文字,是立體視覺(jué)資源的呈現(xiàn)形式之一。該類(lèi)立體視覺(jué)資源可以增強(qiáng)文本呈現(xiàn)的藝術(shù)性和視覺(jué)的真實(shí)感,是最簡(jiǎn)單的立體視覺(jué)資源。立體視覺(jué)資源文本描述指立體視覺(jué)資源元數(shù)據(jù),即基于文本對(duì)立體視覺(jué)資源進(jìn)行的描述和說(shuō)明,目的是更好地實(shí)現(xiàn)立體視覺(jué)資源高效、精確的編目管理,更好地實(shí)現(xiàn)基于文本的立體視覺(jué)資源獲取。
1.2立體視覺(jué)圖像資源
立體視覺(jué)圖像資源是基于立體視覺(jué)原理和技術(shù)的圖像數(shù)據(jù)。立體視覺(jué)是雙眼觀察景物能分辨物體遠(yuǎn)近形態(tài)的感覺(jué),即包含有重構(gòu)場(chǎng)景的三維幾何信息。立體視覺(jué)圖像獲取有多種方式,目前主要是通過(guò)立體相機(jī)或攝像機(jī)實(shí)現(xiàn)。從原理上分析,立體視覺(jué)圖像獲取和實(shí)現(xiàn)方式有[1]:①利用測(cè)距器獲取范圍數(shù)據(jù)(Range data)信息或深度信息,并通過(guò)此信息建立三維場(chǎng)景;②根據(jù)近大遠(yuǎn)小原理,利用一幅圖像所提供的深度信息建立三維場(chǎng)景和立體描述;③利用不同視點(diǎn)拍攝的圖像進(jìn)行三維場(chǎng)景構(gòu)建,即通過(guò)兩幅或兩幅以上圖像信息重構(gòu)三維場(chǎng)景。
1.3立體視覺(jué)視頻資源
立體視覺(jué)視頻是隨時(shí)間連續(xù)的具有語(yǔ)義關(guān)聯(lián)的立體視覺(jué)圖像集合,是一種連續(xù)動(dòng)態(tài)的視覺(jué)表達(dá)形式,本質(zhì)上基于立體視覺(jué)圖像原理和技術(shù)。它能提供一種具有全新立體感的視頻表達(dá)形式,增強(qiáng)用戶的真實(shí)感體驗(yàn)。與單通道二維視頻相比,立體視頻一般有兩個(gè)或兩個(gè)以上視頻通道,數(shù)據(jù)量遠(yuǎn)遠(yuǎn)大于單通道視頻,所以對(duì)立體視頻的高效壓縮尤為重要。目前對(duì)立體視頻的研究主要有視差估計(jì)、信息隱藏、錯(cuò)誤隱藏、壓縮編碼、網(wǎng)絡(luò)傳輸、質(zhì)量評(píng)價(jià)等[2]。
1.4立體視覺(jué)3D模型資源
3D模型是通過(guò)3D建模工具制作和生成的立體視覺(jué)文件形式,如3Ds Max、Maya等生成的3D模型源文件。盡管3D模型構(gòu)建和呈現(xiàn)方式多樣,但其本質(zhì)依然是基于雙目或多目視覺(jué)原理。隨著3D技術(shù)的發(fā)展, 3D模型文件在不同的應(yīng)用領(lǐng)域以多種不同的文件格式存在[3]。
2基于編碼格式的立體視覺(jué)資源分類(lèi)
2.1基于不同編碼存儲(chǔ)方案的立體視覺(jué)資源
雙目或多目立體視覺(jué)圖像及視頻的存儲(chǔ)主要有兩種方案:①直接對(duì)各個(gè)單視點(diǎn)文件進(jìn)行獨(dú)立編碼存儲(chǔ);②采用“單視點(diǎn)+深度”方式進(jìn)行編碼存儲(chǔ)。單視點(diǎn)獨(dú)立編碼存儲(chǔ)是針對(duì)雙目或多目立體視覺(jué)圖像或視頻,對(duì)每個(gè)視點(diǎn)獨(dú)立進(jìn)行編碼存儲(chǔ),其本質(zhì)是基于二維圖像或視頻的方法和技術(shù),對(duì)每個(gè)視點(diǎn)文件進(jìn)行獨(dú)立處理。該方式主要通過(guò)單通道內(nèi)冗余信息的處理和壓縮實(shí)現(xiàn)立體視覺(jué)圖像或視頻的優(yōu)化及編碼存儲(chǔ)[4]。對(duì)于單視點(diǎn)深度編碼存儲(chǔ),每個(gè)單視點(diǎn)并不是獨(dú)立存在,而是具有一定關(guān)聯(lián)關(guān)系,其在內(nèi)容獲取時(shí)通過(guò)同步設(shè)備對(duì)同一場(chǎng)景進(jìn)行捕捉,因而在編碼存儲(chǔ)時(shí)可根據(jù)視點(diǎn)間的關(guān)系和依賴性進(jìn)行處理,即采用“單視點(diǎn)+深度”的方式。單視點(diǎn)一般選取左視點(diǎn),而深度則是通過(guò)視點(diǎn)間的匹配形成視差,進(jìn)而計(jì)算出深度信息而獲取[5]。通過(guò)“單視點(diǎn)+深度”的形式可以大大減少立體視覺(jué)圖像或視頻的數(shù)據(jù)量,不僅可實(shí)現(xiàn)單通道內(nèi)冗余信息的壓縮,而且可根據(jù)關(guān)聯(lián)關(guān)系實(shí)現(xiàn)通道間的冗余信息壓縮,在顯示時(shí)通過(guò)視點(diǎn)間的信息實(shí)現(xiàn)再現(xiàn)。
2.2基于不同編碼類(lèi)別的立體視覺(jué)資源
主要是基于有損壓縮和無(wú)損壓縮形式存在的立體視覺(jué)資源。有損壓縮利用人類(lèi)對(duì)立體視覺(jué)圖像或視頻中的某些頻率成分不敏感特性,允許壓縮過(guò)程中損失一定的信息。雖然不能完全恢復(fù)原始數(shù)據(jù),但所損失的部分對(duì)理解原始圖像影響較小,由此換來(lái)較大的壓縮比。無(wú)損壓縮是利用數(shù)據(jù)的統(tǒng)計(jì)冗余進(jìn)行壓縮,可完全恢復(fù)原始數(shù)據(jù)而不引起任何失真,但壓縮率通常受到數(shù)據(jù)統(tǒng)計(jì)冗余度的限制。該方法常用于立體視覺(jué)文本數(shù)據(jù)和特殊應(yīng)用場(chǎng)合的圖像數(shù)據(jù)(如指紋圖像、醫(yī)學(xué)圖像等)壓縮,用于視頻資源壓縮較少。
2.3基于不同編碼算法的立體視覺(jué)資源
基于存儲(chǔ)和呈現(xiàn)形式的立體視覺(jué)資源類(lèi)型很多,各種類(lèi)型所采取的編碼算法也不盡相同,根據(jù)不同的存儲(chǔ)和傳輸需要,編碼算法也可能不同。立體視覺(jué)資源往往數(shù)據(jù)量較大,在傳輸中尤其需要高效的編碼算法?;诖耍恍﹥?yōu)秀算法在立體視覺(jué)資源編碼存儲(chǔ)中具有重要應(yīng)用,如JPEG、PCM、MPEG、H.264等。
2.4基于不同文件格式的立體視覺(jué)資源
以立體視覺(jué)形式存在的內(nèi)容資源,最終表示的格式多種多樣,根據(jù)文件編碼和存儲(chǔ)形式所形成的文件格式也有多種類(lèi)型,這些類(lèi)型的文件格式分別以不同的擴(kuò)展名存在,如.jpg、.avi,以及3D模型文件格式.stl、.3ds、.obj等。
3基于顯示原理的立體視覺(jué)資源分類(lèi)
3.1雙目立體視覺(jué)資源
雙目立體視覺(jué)資源主要包括雙目立體視覺(jué)圖像資源和雙目立體視頻資源。雙目立體視覺(jué)是機(jī)器視覺(jué)領(lǐng)域的重要技術(shù)之一,它基于視差原理并利用成像設(shè)備,從不同位置或角度獲取被測(cè)物體的兩幅圖像,通過(guò)計(jì)算圖像對(duì)應(yīng)點(diǎn)間的位置偏差獲取物體三維幾何信息。成像時(shí)根據(jù)不同視角的雙目圖像,基于視差原理恢復(fù)為物體及場(chǎng)景的立體信息,重建物體三維輪廓及位置,與平面視覺(jué)圖像的最大區(qū)別在于其擁有深度信息[6]。雙目立體視頻是對(duì)同一物體或場(chǎng)景進(jìn)行拍攝所獲取的兩路合成或兩路分離的視頻形式,并基于雙目立體視覺(jué)圖像原理進(jìn)行顯示,達(dá)到立體呈現(xiàn)畫(huà)面的效果。
3.2多目立體視覺(jué)資源
多目立體視覺(jué)資源包括多目立體視覺(jué)圖像資源和多目立體視頻資源。多目立體視覺(jué)圖像和視頻是基于雙目立體視覺(jué)原理,用多臺(tái)相機(jī)或攝像機(jī)從多個(gè)不同角度對(duì)同一物體或場(chǎng)景進(jìn)行圖像獲取,并基于一定結(jié)構(gòu)形式進(jìn)行顯示,從而產(chǎn)生立體視覺(jué)效果的方式。多目立體視覺(jué)是雙目立體視覺(jué)的拓展和延伸,具有更為真實(shí)、全方位的立體呈現(xiàn)效果。通常所見(jiàn)的多目立體視覺(jué)有8目立體視覺(jué)、16目立體視覺(jué)、32目立體視覺(jué)等。多目立體視頻往往比雙目立體視頻更為復(fù)雜,需要解決獲取和顯示的同步性問(wèn)題。
3.3體顯示立體視覺(jué)資源
體三維顯示是在一個(gè)具有寬度、高度和深度的真實(shí)三維空間內(nèi)進(jìn)行圖像信息再現(xiàn)的技術(shù),也稱(chēng)空間加載顯示(Space-Filling Display)。它以體素作為圖像信息顯示的基本要素,因具有真實(shí)體積和深度,故也稱(chēng)為“真三維顯示技術(shù)”。體三維顯示通過(guò)適當(dāng)方式激勵(lì)位于透明顯示體積內(nèi)的物質(zhì),利用可見(jiàn)輻射的產(chǎn)生、吸收或散射而形成體素。當(dāng)體積內(nèi)許多方位的物質(zhì)都被激勵(lì)后,便形成由許多分散體素構(gòu)成的三維圖像,浮在真實(shí)三維空間即觀察者所在的物質(zhì)世界中。就像一個(gè)現(xiàn)實(shí)三維物體一樣,能自動(dòng)滿足幾乎所有生理和心理深度暗示,可多人多角度同時(shí)裸視觀察,完全符合“真三維交互、自由裸視”要求,是一種支持人機(jī)交互的理想三維顯示方式。體三維顯示包括基于切片式投影的體顯示和基于掃描旋轉(zhuǎn)螺旋面的體顯示[7]。
3.4全息立體視覺(jué)資源
全息立體成像是基于幻影成像方式,將物體的全息影像投射到透明介質(zhì)上,利用干涉原理和光束疊加產(chǎn)生3D立體觀感。全息成像是先利用干涉原理記錄物體光波信息,實(shí)現(xiàn)影像拍攝;然后利用衍射原理再現(xiàn)物體光波信息,達(dá)到成像效果[8]。
3.5三維全景立體視覺(jué)資源
三維全景是基于全景圖像的真實(shí)場(chǎng)景虛擬現(xiàn)實(shí)技術(shù),通常是把相機(jī)環(huán)360°拍攝一組或多組照片拼接成一個(gè)全景圖像,經(jīng)過(guò)一系列數(shù)學(xué)計(jì)算得到其球形全景的矩形投影圖或立方體圖,然后通過(guò)計(jì)算機(jī)技術(shù)實(shí)現(xiàn)全方位互動(dòng)式觀看。三維全景技術(shù)主要包括全景圖生成技術(shù)和后期制作合成技術(shù)。全景圖生成技術(shù)包括全景圖像采集技術(shù)、圖像預(yù)處理技術(shù)、像素坐標(biāo)及相機(jī)焦距估計(jì)技術(shù)、全景圖投影模型技術(shù)等[9]。后期制作合成技術(shù)是針對(duì)前期拍攝的全景素材,基于全景拼合技術(shù)并使用全景拼合軟件進(jìn)行圖像拼合處理,從而實(shí)現(xiàn)大視角的全景展示以及立體化場(chǎng)景體驗(yàn)[10]。三維全景有360°全景和720°全景兩種形式。360°全景展示能體驗(yàn)到水平方向的全方位展示效果,而720°全景展示既能體驗(yàn)到水平方向,也能體驗(yàn)到垂直方向的全方位立體效果,是完全的場(chǎng)景展示。
3.63D動(dòng)畫(huà)立體視覺(jué)資源
三維動(dòng)畫(huà)通?;谥谱鬈浖ㄈ?Ds MAX、Maya等)在計(jì)算機(jī)中首先建立一個(gè)虛擬世界,按照要表現(xiàn)對(duì)象的形狀尺寸建立模型及場(chǎng)景,設(shè)定模型的運(yùn)動(dòng)軌跡、虛擬攝影機(jī)的運(yùn)動(dòng)和其它動(dòng)畫(huà)參數(shù),然后按要求為模型賦上特定材質(zhì)并打上燈光,最后通過(guò)渲染生成動(dòng)畫(huà)資源。它是基于時(shí)間線的3D序列模型文件的集合,將現(xiàn)實(shí)世界場(chǎng)景以更加真實(shí)、立體化的方式全方位呈現(xiàn)出來(lái),給用戶全真的感官體驗(yàn)。
4基于顯示分辨率的立體視覺(jué)資源分類(lèi)
4.1標(biāo)清立體視覺(jué)資源
標(biāo)清(Standard Definition,簡(jiǎn)稱(chēng)SD)是物理分辨率在720p以下不足以達(dá)到高清標(biāo)準(zhǔn)的一種視頻格式,其分辨率在400線左右。常見(jiàn)的標(biāo)清形式有480×320像素、640×480 像素視頻。以標(biāo)清分辨率標(biāo)準(zhǔn)表示和呈現(xiàn)的立體視覺(jué)資源即為標(biāo)清立體視覺(jué)資源。
4.2高清立體視覺(jué)資源
高清(High Definition,簡(jiǎn)稱(chēng)HD)最早由美國(guó)電影電視工程師協(xié)會(huì)(SMPTE)等權(quán)威機(jī)構(gòu)制定相關(guān)標(biāo)準(zhǔn)。國(guó)際上公認(rèn)的高清標(biāo)準(zhǔn)是:視頻垂直分辨率超過(guò)720p(逐行掃描)或1080i(隔行掃描),視頻寬高比為16∶9。常見(jiàn)的高清分辨率為1 024×720p 和1 920×1 080i。以高清分辨率標(biāo)準(zhǔn)表示和呈現(xiàn)的立體視覺(jué)資源即為高清立體視覺(jué)資源[11]。
4.3全高清立體視覺(jué)資源
全高清(Full High Definition,簡(jiǎn)稱(chēng)Full HD)指垂直分辨率為1 080p的視頻形式,即分辨率為1 920×1 080p。以全高清分辨率標(biāo)準(zhǔn)表示和呈現(xiàn)的立體視覺(jué)資源即為全高清立體視覺(jué)資源。
4.4超高清立體視覺(jué)資源
超高清(Ultra High-Definition,簡(jiǎn)稱(chēng)Ultra HD)由國(guó)際電信聯(lián)盟(International Telecommunication Union)界定,將屏幕的物理分辨率達(dá)到3 840×2 160(4K×2K)及以上的顯示稱(chēng)為超高清,是普通Full HD(1 920×1 080)寬高的兩倍,顯示設(shè)備總像素?cái)?shù)量達(dá)到800萬(wàn)以上。常見(jiàn)的超高清有“4K分辨率(3 840×2 160 像素)”和“8K分辨率(7 680×4 320像素)”兩種形式。以超高清分辨率標(biāo)準(zhǔn)表示和呈現(xiàn)的立體視覺(jué)資源即為超高清立體視覺(jué)資源。
5基于結(jié)構(gòu)格式的立體視覺(jué)資源分類(lèi)
基于結(jié)構(gòu)格式的立體視覺(jué)資源主要針對(duì)立體視覺(jué)圖像和視頻,本分類(lèi)方法以常見(jiàn)的雙目立體視頻為例闡述不同類(lèi)別結(jié)構(gòu)格式的立體視覺(jué)資源形式[1213]。
5.1左右分離立體視覺(jué)資源
左右分離是指兩路獨(dú)立的視頻格式,和正常的左右合成格式基本相似,其視頻分辨率不發(fā)生變化,在編碼、存儲(chǔ)、傳輸?shù)认嚓P(guān)處理中可獨(dú)立操作,一般數(shù)據(jù)量較大。左右分離是目前較好的偏光立體視頻格式。
5.2左右合成立體視覺(jué)資源
包括正常左右合成格式和變形左右合成格式。正常左右合成是把左右兩路視頻合成一個(gè)視頻的偏振格式,左右視頻寬度、高度均不變,直接合成后一般是較寬的非標(biāo)準(zhǔn)格式。變形左右合成也稱(chēng)為標(biāo)準(zhǔn)的左右格式,這種格式的立體視頻是一種常見(jiàn)的結(jié)構(gòu)形式,長(zhǎng)寬比通常是標(biāo)準(zhǔn)形式,一般為1 080P、720P、576P、480P的標(biāo)準(zhǔn)視頻。合成時(shí)分別將寬度除以2,高度不變,通過(guò)立體視頻播放器播放和顯示。
5.3上下合成立體視覺(jué)資源
主要包括正常上下合成、變形上下合成、隔離變形上下合成等格式的立體視覺(jué)資源。正常上下格式和左右格式基本一樣,也是非標(biāo)準(zhǔn)寬高比的視頻格式,是將兩路視頻以上下方式排放,寬度、高度均不變。變形上下格式也稱(chēng)為標(biāo)準(zhǔn)的上下格式,具有標(biāo)準(zhǔn)的寬高比,合成時(shí)圖像左右伸拉變形,上下視頻分辨率分別在縱向上除以2,橫向不變。隔離變形上下格式是一種間隔變形上下格式的立體視頻形式,合成時(shí)同變形上下格式幾乎相同,只是中間有一條黑色間隔,在分辨率上保持寬度不變,高度分別除以2。
5.4交錯(cuò)格式立體視覺(jué)資源
包括逐行掃描交錯(cuò)格式和隔行掃描交錯(cuò)格式立體視覺(jué)資源。逐行掃描交錯(cuò)是兩重影的交錯(cuò)格式,是一種比較科學(xué)但較為復(fù)雜的偏振立體格式,運(yùn)用了反交錯(cuò)技術(shù)。隔行掃描交錯(cuò)是垂直方向隔行掃描的條形交錯(cuò)格式,以交錯(cuò)場(chǎng)直接顯示一幅立體幀。
5.5互補(bǔ)色格式立體視覺(jué)資源
互補(bǔ)色立體視覺(jué)資源是利用不同色光混合后能得到白光的原理,將以互補(bǔ)色表示的對(duì)象或場(chǎng)景進(jìn)行影像重疊而產(chǎn)生視差,從而形成立體感[14]。包括綠紅格式、紅青、紅藍(lán)格式、紅綠格式、紅藍(lán)格式、棕藍(lán)格式、黃藍(lán)格式、黑白紅青格式等立體視覺(jué)資源。
6基于視差類(lèi)型的立體視覺(jué)資源分類(lèi)
雙目立體視覺(jué)系統(tǒng)中,立體效果的呈現(xiàn)關(guān)鍵在于雙目視差,而視差是由雙目成像的左右視覺(jué)差異產(chǎn)生的,在顯示中以雙目圖像對(duì)方式呈現(xiàn)。視差具有垂直視差和水平視差之分,水平視差相對(duì)于垂直視差能夠達(dá)到更理想的立體視覺(jué)效果,且能較好地實(shí)現(xiàn)視覺(jué)舒適度[15]。在相關(guān)研究和成像實(shí)踐中通常針對(duì)水平視差,水平視差包括正視差、負(fù)視差、零視差[16]。
6.1正視差立體視覺(jué)資源
雙目立體視覺(jué)正視差又稱(chēng)入屏,指觀察者所觀測(cè)到的左右視覺(jué)成像點(diǎn)在成像面后,即被觀察到的影像或?qū)ο笤谄聊缓?,遠(yuǎn)離觀察者?;谡暡钤淼囊曈X(jué)資源(如立體視頻鏡頭、片段等)即為正視差立體視覺(jué)資源。一般常用于需要表達(dá)視野開(kāi)闊、場(chǎng)面宏大的視頻鏡頭或片段中。
6.2負(fù)視差立體視覺(jué)資源
雙目立體視覺(jué)負(fù)視差又稱(chēng)出屏,指觀察者所觀測(cè)到的左右視覺(jué)成像點(diǎn)在成像面前,即被觀察到的影像或?qū)ο笤谄聊磺埃拷^察者,通常會(huì)有“飛”出屏幕的感覺(jué)?;谪?fù)視差原理的視覺(jué)資源(如立體視頻鏡頭、片段等)即為負(fù)視差立體視覺(jué)資源,常用于表達(dá)驚悚、刺激、夸張的視頻鏡頭或片段中。
6.3零視差立體視覺(jué)資源
雙目立體視覺(jué)零視差,指觀察者觀測(cè)到的左右視覺(jué)成像點(diǎn)在成像面上,即被觀察到的影像或?qū)ο笤谄聊簧?。在正視差和?fù)視差情況下畫(huà)面對(duì)像呈現(xiàn)具有明顯深度,相應(yīng)的視覺(jué)顯示呈立體感。零視差則沒(méi)有深度信息,相應(yīng)的立體感也不明顯,但通常在立體視頻視覺(jué)顯示時(shí)用作正視差和負(fù)視差之間的過(guò)渡,以使視差和深度變換過(guò)程具有漸進(jìn)性,緩解和減少觀察者的視覺(jué)疲勞。
7基于內(nèi)容類(lèi)型的立體視覺(jué)資源分類(lèi)
基于內(nèi)容類(lèi)型的立體視覺(jué)資源主要根據(jù)常用的《廣播電視節(jié)目資料分類(lèi)法》對(duì)其進(jìn)行分類(lèi)[17],分為政治類(lèi)、法律類(lèi)、軍事類(lèi)、經(jīng)濟(jì)類(lèi)、文學(xué)藝術(shù)類(lèi)、體育類(lèi)、歷史地理類(lèi)、科學(xué)技術(shù)類(lèi)、醫(yī)藥衛(wèi)生類(lèi)、社會(huì)生活與社會(huì)問(wèn)題類(lèi)、娛樂(lè)休閑類(lèi)、文化類(lèi)、教育類(lèi)、哲學(xué)宗教類(lèi)、城鄉(xiāng)建設(shè)與環(huán)境類(lèi)等立體視覺(jué)資源,根據(jù)需要可對(duì)各類(lèi)資源進(jìn)行二級(jí)、三級(jí)等深層次分類(lèi)。
參考文獻(xiàn)參考文獻(xiàn):
[1]塞利斯基.計(jì)算機(jī)視覺(jué):算法與應(yīng)用[M].艾海舟,興軍亮,譯.北京:清華大學(xué)出版社,2012.
[2]董全武,周同,郭宗明,等.立體視頻鏡頭誤差檢測(cè)和質(zhì)量分析[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版,2014,50(6):9981006.
[3]李彥生,尚奕彤,袁艷萍,等.3D 打印技術(shù)中的數(shù)據(jù)文件格式[J].北京工業(yè)大學(xué)學(xué)報(bào),2016,42(7):10091016.
[4]VETRO A,WIEGAND T,SULLIVAN G J.Overview of the stereo and multiview video coding extensions of the H.264/MPEG4 AVC standard[J].Proceedings of the IEEE,2011,99(4):626642.
[5]趙慧敏,姜秀華.基于視頻加深度格式的立體視頻技術(shù)分析[J].電視技術(shù),2014,38(1):25.
[6]TSINGALIS I,TEFAS A,NIKOLAIDIS N,et al.Shot type characterization in 2D and 3D video content[C].2014 IEEE 16th International Workshop on Multimedia Signal Processing (MMSP),2014:15.
[7]潘文平,沈春林,蔡亮,等.交互式動(dòng)態(tài)體三維顯示關(guān)鍵技術(shù)[J].科技導(dǎo)報(bào),2011,29(1):4451.
[8]余文濤,張漢樂(lè),鄧歡,等.基于全息光學(xué)元件的增強(qiáng)現(xiàn)實(shí)3D顯示系統(tǒng)[J].中國(guó)激光,2016,43(10):202208.
[9]趙陽(yáng).三維全景圖像生成的若干關(guān)鍵技術(shù)研究[D].沈陽(yáng):沈陽(yáng)理工大學(xué),2015.
[10]秦曉軍,黃秋儒.面向網(wǎng)絡(luò)視頻的三維全景展示技術(shù)[J].電視技術(shù),2014,38(19):120122.
[11]崔建.從模擬到數(shù)字、從標(biāo)清到高清——視頻記錄存儲(chǔ)設(shè)備的歷史回顧和發(fā)展(下)[J].現(xiàn)代電視技術(shù),2016,(2):8891.
[12]邱麗娜.2D+深度格式的3D視頻重建技術(shù)研究[D].武漢:華中科技大學(xué),2013.
[13]李響.立體影片格式有多少種[EB/OL].天極網(wǎng),http://news.yesky.com/4/33946004.shtml,20121031.
[14]劉妍秀.3D顯示技術(shù)的原理及應(yīng)用[J].長(zhǎng)春大學(xué)學(xué)報(bào),2011,21(12):5254.
[15]蔡輝躍.虛擬場(chǎng)景的立體顯示技術(shù)研究[D].南京:南京郵電大學(xué),2013.
[16]段峰峰,王永濱,楊麗芳,等.一種時(shí)間一致性立體視頻深度圖序列估計(jì)算法[J].計(jì)算機(jī)應(yīng)用研究,2015(10):31423146.
[17]全國(guó)廣播電視標(biāo)準(zhǔn)化技術(shù)委員會(huì).GY/Z 199-2004.廣播電視節(jié)目資料分類(lèi)法[S].北京:國(guó)家廣播電影電視總局,2004.
責(zé)任編輯(責(zé)任編輯:杜能鋼)