余斐斐 米楠
摘要:對于AR研究而言,視線追蹤是其技術的關鍵,我們在移動設備上整合計算機畫面與現(xiàn)實景象的能力正在發(fā)展之中,這種開發(fā)功能前景無限,它能拓展人類與周圍環(huán)境互動,從環(huán)境中學習以及娛樂的能力。
關鍵詞:增強現(xiàn)實;視線追蹤;應用
增強現(xiàn)實(Augmented Reality簡稱AR)技術是近年來的一個研究熱點,有著廣泛的應用前景。它是對現(xiàn)實世界的補充,使得虛擬物體從感官上成為周圍真實環(huán)境的組成部分。與傳統(tǒng)的虛擬現(xiàn)實(Virtual Reality簡稱VR)不同,增強現(xiàn)實只是實現(xiàn)對現(xiàn)實環(huán)境的增強,加深了對現(xiàn)實環(huán)境的感受。在實際的AR體驗中,因為人的觀察視線會不斷地變化,AR系統(tǒng)需要實時的根據(jù)用戶的視場重新建立位置坐標系,進行追蹤。而視線追蹤技術就是實時地跟蹤用戶頭部的位置和視線方向,根據(jù)這些信息來確定虛擬物體在真實空間坐標中的位置,并將它實時地顯示在顯示器中的正確位置。
一、視線追蹤技術及其特點
(一)視線追蹤技術概述。
視線追蹤也稱為眼動追蹤,它被認為是研究視覺信息加工的有效手段。利用專用設備來記錄學習者的眼球運動(Eve-Movement,簡稱眼動)情況,可以作為分析學習者內部心理活動情況的依據(jù)。關于視線追蹤技術的研究己有較長歷史,目前它己在多個領域得到廣泛應用。例如用于圖片廣告研究(網(wǎng)頁評估、設計評估等)、動態(tài)分析(航空航天、體育運動、汽車、飛機駕駛等)、產(chǎn)品測試(可用性測試)、場景研究(商場購物、店鋪裝演、家居環(huán)境等)和人機交互等多個領域。此外,視線追蹤在智能計算機、智能家電、虛擬現(xiàn)實和數(shù)字游戲等領域也有很好的應用前景。
在眼動實驗研究中,當被試對視覺信息進行提取時,其注視時間、注視次數(shù)、注視點序列、眼跳距離、回視次數(shù)、瞳孔直徑等通常被視為思維和心理加工的重要參數(shù)。因此,通過對被試在學習過程中的實時眼動信息進行觀測,可用于分析和引導其學習的依據(jù)。眼動模式一般分為三種:注視(fixation)、眼跳(saccade)和追隨運動(pursuit movement)。其中,持續(xù)一段時間、相對穩(wěn)定的眼球運動稱為注視;眼球快速運動時導致視覺區(qū)域的聚焦點產(chǎn)生變化,這種行為稱為眼跳;眼睛緩慢、平滑地追蹤某個緩慢運動的目標,則稱為追隨運動。通過分析眼動模式和相關參數(shù),可以獲得很多重要的信息。例如,眼跳速度會隨著疲倦程度的增加而降低,而隨著學習任務難度的增加而增加;眨眼速度和眼睛睜開程度的降低則可能意味著疲倦的加重。因此,可以據(jù)此來確定學習者的學習精神狀態(tài),或對其學習過程進行分析,從而采取相應的學習策略或干預措施。
(二)視線追蹤系統(tǒng)的類型及其特點。
人眼的注視點主要由頭的方位和眼睛視線決定。頭的方位決定了人眼可能注視的范圍,眼睛的視線決定了注視點的精確位置。國內外將視覺跟蹤技術按照借助的媒介分為硬件和軟件兩種。以硬件為基礎的視線跟蹤的基本工作原理是利用圖像處理技術,通過攝像機攝入瞳孔反射的紅外線記錄視線變化,達到視線追蹤的目的。視線跟蹤裝置目前有穿戴式與非穿戴式,接觸式與非接觸式,如帶上專用頭盔、眼鏡或者頭部固定支架,置于頭部上的攝像機,這種情形用戶使用較不舒適。通過軟件實現(xiàn)的視線跟蹤方法,對用戶沒有干擾,首先利用攝像機獲取頭部、臉部或眼睛圖像,再經(jīng)過軟件分析對視線定位與跟蹤。由于不需要佩戴任何裝置,用戶的自由度舒適度較好。
人與計算機交互是研究人與計算機之間溝通的技術,將視線跟蹤、語音識別、手勢輸入、感覺反饋等引入人機交互,提高了交互的自然性和高效性。視線追蹤技術同樣引發(fā)了人機交互系統(tǒng)的改革,鼠標、觸控板的消失,及通過追蹤人眼視線,用眼神來操作電腦、輸入文字、玩游戲。
二、視線追蹤技術在AR增強現(xiàn)實研究中的應用
(一)顯示技術。
AR的簡單定義就是將計算機生成的虛擬數(shù)字信息疊加到現(xiàn)實的生活場景中。這個“疊加”是需要通過顯示設備作為中介來實現(xiàn)。
增強現(xiàn)實系統(tǒng)中的顯示器可以分為頭盔顯示器(HMD)和非頭盔顯示設備。目前,一般的增強現(xiàn)實系統(tǒng)主要使用透視式頭盔顯示器。透視式頭盔顯示器主要由三個基本環(huán)節(jié)構成:虛擬信息顯示通道、真實環(huán)境顯示通道、圖像融合及顯示通道。其中,虛擬信息的顯示原理與虛擬現(xiàn)實系統(tǒng)所用的浸沒式頭盔顯示器基本相同;圖像融合與顯示通道是與用戶交互的最終接口,根據(jù)其中真實環(huán)境的表現(xiàn)方式,可分為基于CCD攝像原理的視頻透視式頭盔顯示器和基于光學原理的光學透視式頭盔顯示器兩類。
光學透視技術是通過安裝在設備眼前的光學透鏡來呈現(xiàn)出真實和虛擬世界。首先計算機生成的虛擬信息經(jīng)過光學系統(tǒng)放大后反射后進入視野,透過透鏡又能直接看到現(xiàn)實場景,兩部分的信息匯聚到人眼的視網(wǎng)膜上實現(xiàn)AR的效果。視頻透視技術是借助安裝在頭顯上的攝像頭來捕捉獲取外部真實環(huán)境,計算機將數(shù)字模擬信息疊加到攝像機的視頻信號上,再將真實場景和虛擬場景進行融合。相比較光學透視技術,它的視角場更大,而且不受外界的強光干擾。不過一旦攝像機與用戶的視點不能保持完全重合,會產(chǎn)生一些偏差。
(二)跟蹤注冊技術。
基于計算機視覺的注冊技術主要是指利用計算機視覺獲取真實場景的信息后,經(jīng)過圖像處理方面的知識來識別和跟蹤定位真實場景。細分可以劃為基于傳統(tǒng)標志的注冊算法和基于自然特征點無標志注冊算法。基于計算機視覺的注冊技術的精度較高,但是對計算量非常大,而且算法復雜,對系統(tǒng)的要求非常高。
為了取長補短,得到更加精確的注冊結果,現(xiàn)在有結合兩種技術的混合注冊方法。通常是先由跟蹤傳感器大概估計位置姿態(tài),再通過視覺法進一步精確調整定位。一般采用的復合法有視覺與電磁跟蹤結合、視覺與慣導跟蹤結合、視覺與GPS跟蹤結合等。
三、結論
在國外,增強現(xiàn)實早已在醫(yī)學、遙操作、制造與維修、可視化與教育培訓、娛樂、軍事訓練等領域取得了成功應用。在國內,不少單位和個人對增強現(xiàn)實中的關鍵技術和算法進行了研究,并且以牙科醫(yī)學、設備維修等許多背景得到了初步應用研究。但國內的研究目前仍多限于實驗階段,與國外的應用水平還有一定距離。
目前,隨著增強現(xiàn)實的快速發(fā)展,出現(xiàn)了許多新的研究方向,如新的顯示方式、照片真實感圖形繪制、調節(jié)現(xiàn)實、基于網(wǎng)絡的增強現(xiàn)實和針對戶外隨身增強現(xiàn)實系統(tǒng)的技術等等。其中涉及到的技術包括基于圖像的繪制(IBMR)、多通道信息融合、普適計算技術、顯示設備和跟蹤設備的隨身便攜化等。隨著系統(tǒng)性能的提高、操作過程的簡化和設備成本的降低,增強現(xiàn)實會在越來越多的領域得到廣泛應用。
參考文獻:
[1]奚惠寧等.視線追蹤應用技術的專利分析[J].電視技術,2013(S2)。
[2]黃志方等.視線追蹤技術在網(wǎng)絡信息檢索中的應用研究綜述[J].信息資源管理學報,2011(2)。
[3]鐘慧娟,劉肖琳,吳曉莉.增強現(xiàn)實系統(tǒng)及其關鍵技術研究[J].計算機仿真,2008(1)。