孫有恒,薛志剛,王傳寶,鄒永紅
(1.廣州地鐵集團有限公司,廣東廣州 510220;2.北京九碧木信息技術(shù)有限公司,北京 102200;3.中鐵建華南建設(shè)有限公司,廣東廣州 511458)
在地鐵建設(shè)過程中,視頻監(jiān)控系統(tǒng)與新技術(shù)的融合應(yīng)用,使施工現(xiàn)場的安全管控水平顯著提高。比如在施工現(xiàn)場安裝相應(yīng)的人員定位基站,給施工人員佩戴定位卡,可查看施工區(qū)域人員的實時坐標位置和歷史軌跡[1]。但同時也伴隨著更多的資金投入,所以減少現(xiàn)場設(shè)備的安裝投入,利用軟件技術(shù)充分挖掘已有設(shè)備的應(yīng)用價值也成為智慧工地技術(shù)的一個研究方向。
該文結(jié)合廣州市軌道交通十八和二十二號線建設(shè)工程綜合監(jiān)控系統(tǒng)的開發(fā)工作,研究并實現(xiàn)了一種基于視頻圖像分析及單目視覺技術(shù)的工地人員定位方法,可有效解決上述問題。
廣州市軌道交通十八和二十二號線建設(shè)工程綜合監(jiān)控系統(tǒng)已經(jīng)在GIS 地圖上精確標記出了每個視頻監(jiān)控攝像頭的坐標位置;通過集成接口獲取到每個攝像頭的實時方位、攝像機參數(shù)、視頻監(jiān)控畫面;并通過視頻圖像分析技術(shù)識別出視頻圖像中的人體?;谝曨l圖像分析及單目視覺技術(shù)的工地人員定位方法即是基于單目視覺原理建立單張視頻圖像相片中人體與視頻監(jiān)控攝像頭的相對位置關(guān)系,并通過GIS 地圖中的視頻監(jiān)控攝像頭的地理坐標,解算方位參數(shù)后再推算目標人體的坐標。再通過GIS地圖技術(shù)展示出每個人體的實時坐標位置。
近些年來,不斷發(fā)展起來一種視覺定位的方法,主要是通過攝像機獲得周圍景物的圖像,利用景物中的一些自然或人為的特征,通過圖像的方法得到周圍環(huán)境模型來實現(xiàn)自身位置的確定的方法[2-4]。單目視覺的室內(nèi)多行人目標連續(xù)定位方法[5]提出基于單目視覺檢測方法,構(gòu)建像素坐標系到世界坐標系的坐標轉(zhuǎn)換模型,實現(xiàn)對多行人目標的連續(xù)定位與跟蹤。單目視覺三維運動位姿測量方法研究[6]提出基于點特征的單目視覺位姿測量,通過特征點約束和正交迭代解算法完成目標物體的位姿測量。
基于視覺原理的空間定位方法中,單目視覺具有顯著的優(yōu)點:結(jié)構(gòu)簡單、標定步驟少,避免了立體視覺中視場小和匹配難的缺點。常見的單目視覺方法[7-9]包括結(jié)構(gòu)光法[10-12]、幾何光學(xué)法[13-14]、輔助測量棒法、激光輔助測距法、幾何形狀約束法等。
該文所介紹的方法,是利用單目視覺技術(shù)建立單張視頻圖像相片中人體與相機的相對位置關(guān)系,然后通過GIS 地圖獲取攝像機鏡頭的實際坐標(經(jīng)緯度或投影坐標),解算方位參數(shù)后再推算人體的坐標。
相片上的任意一個像點與對應(yīng)地面點都可以由一條通過光心的直線連接起來,即所謂的中心投影,通過這條直線再輔以輔助坐標系,就可以建立起像點與地面點之間的關(guān)系。
常用的輔助坐標系包括1)像素坐標系;2)圖像坐標系;3)光心坐標系;4)世界坐標系。通過這四個輔助坐標系之間的相互變換,建立攝像機成像幾何模型,各坐標系關(guān)系及內(nèi)外方位元素,如圖1 所示。坐標系變換主要分為三個過程,如下:
圖1 各坐標系關(guān)系及內(nèi)外方位元素
1)根據(jù)像素坐標計算圖像坐標系;
未來一周,江南大部、華南西部、西南地區(qū)東部等地累計降水量有10毫米-30毫米,部分地區(qū)有40毫米-60毫米,云南南部局地有80毫米-110毫米;此外,新疆西部、內(nèi)蒙古東北部、東北地區(qū)等地降水量有8毫米-20毫米,部分地區(qū)30毫米-50毫米。上述地區(qū)累計降水量較常年同期偏多3-6成,內(nèi)蒙古東北部、東北部分地區(qū)偏多1倍以上。
2)根據(jù)圖像坐標系建立光心坐標系;
3)建立光心坐標系和世界坐標系之間的關(guān)系[15-16]。
圖像坐標系與光心坐標系之間通過主點、焦距等內(nèi)方位元素決定;光心坐標系與世界坐標系之間通過投影中心地面坐標和攝像機成像時的姿態(tài)參數(shù)建立聯(lián)系。
假設(shè)空間一點P,世界坐標為[Pcx,Pcy,Pcz]T,對應(yīng)的像素坐標為[pu,pv]T,建立攝像機的成像幾何模型如式(1)所示:
其中,Zc是點P在光心坐標系中的Z值;ax=f/dx,ay=f/dy,f為焦距,dx、dy是圖像坐標系原點在像素坐標系中的坐標;M是4 階投影矩陣,N是與攝像機內(nèi)方位元素有關(guān)的3 階矩陣(通常由設(shè)備廠商提供)。相機成像原理如圖2 所示。
圖2 相機成像原理
在內(nèi)方位元素已知的情況下,根據(jù)攝像機成像幾何模型,像素坐標系到世界坐標系的變換包含六個轉(zhuǎn)換參數(shù)(三個平移參數(shù)和三個旋轉(zhuǎn)參數(shù))。通過GIS 地圖和攝像機圖像相片中已知坐標的同名點對求解這六個參數(shù)。將式(1)進行整理,得到式(2):
將上式代入式(2),展開整理得到如下三個方程:
將第三個方程中的Zc代入上面兩個方程,整理得到式(7):
根據(jù)式(7)每一個同名點對可以建立兩個方程,n個同名點對可以建立2n個方程。為了獲得最佳的結(jié)果,使2n>11(n為同名點對個數(shù)),即可采用最小二乘法進行參數(shù)求解。如果內(nèi)方位元素也未知,只需要增加同名點對或其他約束條件即可一并進行解算。
解算出方位元素后,即可得到該攝像機成像幾何模型的全部參數(shù)。對于相片中的人體可以通過圖像分析得到的像素坐標,直接計算出對應(yīng)地面點的世界坐標,進一步可計算出在該點垂直于地面或平行于地面的邊長。
通常而言,每個攝像機的視點位置是相同的,視頻監(jiān)控圖像相片的成像幾何模型只需要計算一次即可。
基于廣州市軌道交通十八和二十二號線建設(shè)工程綜合監(jiān)控系統(tǒng)的GIS 地圖技術(shù)和視頻圖像分析技術(shù),開發(fā)了一套工地人員定位軟件,并作為綜合監(jiān)控系統(tǒng)的一個應(yīng)用模塊。該定位軟件的數(shù)據(jù)組織如表1 所示。
表1 數(shù)據(jù)組織方案
該定位軟件的主要功能包括:
1)GIS 地圖及攝像機配置展示功能。此功能是基于GIS 地圖添加攝像機的配置信息,包括攝像機的名稱、IP 地址、訪問用戶名、訪問密碼、初始安裝方位、視角范圍、視角半徑等配置參數(shù)。并在GIS 地圖上標記出攝像機安裝的精確位置,完成的攝像機配置功能和展示功能。攝像機在地圖上的位置展示如圖3 所示。
圖3 攝像機在地圖上的位置展示
2)視頻監(jiān)控攝像機的方位姿態(tài)展示。配置完成攝像機后,軟件根據(jù)配置的初始安裝方位角以及通過訪問攝像機獲取的旋轉(zhuǎn)角度,可計算出當(dāng)前的方位角(槍機是固定方位角),再根據(jù)配置的攝像機角度范圍和視角半徑數(shù)據(jù),在GIS 地圖上實時動態(tài)繪制攝像機的有效監(jiān)控區(qū)域。攝像機動態(tài)視角范圍展示如圖4 所示。
圖4 攝像機動態(tài)視角范圍展示
3)視頻監(jiān)控實時畫面獲取和人體識別。軟件集成了視頻圖像人工智能(Artificial Intelligence,AI)分析算法,通過已配置的攝像機訪問參數(shù),可實時讀取視頻監(jiān)控畫面。再通過配置的人體目標識別參數(shù),即可識別分析視頻畫面中的人體目標,當(dāng)識別到視頻畫面中的人體時,軟件會自動保存畫面,記錄當(dāng)前攝像機的人體頭部或腳部的像素坐標、攝像機成像姿態(tài)參數(shù)、人體識別可信度數(shù)據(jù),此時軟件就采集到了用于單目視覺技術(shù)計算人體坐標的所有輸入?yún)?shù)。視頻監(jiān)控圖像中人體識別圖片如圖5 所示。
圖5 視頻監(jiān)控圖像中人體識別圖片
4)人體定位坐標的計算和基于GIS 地圖的定位展示。把視頻圖像AI 分析算法輸出的圖像(含人體的像素坐標)、攝像機成像姿態(tài)參數(shù)、攝像機位置坐標、攝像機方位角等輸入條件,通過上文中的單目視學(xué)技術(shù)相關(guān)算法(攝像機成像幾何模型算法、坐標計算或邊長量測算法)即可計算出人本的定位坐標,然后再疊加到GIS 地圖上定位展示。通過設(shè)置合理的軟件執(zhí)行頻率、并過慮掉人體可信度較低的輸入數(shù)據(jù),即可實現(xiàn)較好的人員定位效果。人體坐標計算及基于GIS 地圖展示如圖6 所示。
圖6 人體坐標計算及基于GIS地圖展示
利用該文方法和實現(xiàn)的軟件,在廣州市軌道交通十八和二十二號線建設(shè)工程的兩個工點進行了應(yīng)用,結(jié)果表明,1)經(jīng)對照無人機航拍正射影像地圖和特征點交會測量坐標可知,誤差控制在2 m 以內(nèi),滿足施工區(qū)域人員定位的管理要求。2)該方法可廣泛應(yīng)用于已安裝視頻監(jiān)控設(shè)備的建筑施工區(qū)域以及其他視野相對開闊的工業(yè)園區(qū)的人員定位。3)該方法充分利用工地現(xiàn)場已安裝的視頻監(jiān)控設(shè)備,深化應(yīng)用視頻圖像分析技術(shù)、GIS 地圖技術(shù),在不增加安裝人員定位設(shè)備的前提下,可有效實現(xiàn)地鐵施工人員定位技術(shù)。