張正普
ZHANG Zheng-pu
(中國(guó)鐵道科學(xué)研究院 電子計(jì)算技術(shù)研究所,北京 100081)
(Institute of Computing Technology, China Academy of Railway Sciences, Beijing 100081, China)
我國(guó)鐵路客運(yùn)實(shí)名制驗(yàn)票識(shí)別技術(shù)的探討
張正普
ZHANG Zheng-pu
(中國(guó)鐵道科學(xué)研究院 電子計(jì)算技術(shù)研究所,北京 100081)
(Institute of Computing Technology, China Academy of Railway Sciences, Beijing 100081, China)
通過(guò)闡述自動(dòng)識(shí)別技術(shù)在鐵路客運(yùn)實(shí)名制驗(yàn)票的應(yīng)用需求,對(duì)指紋識(shí)別技術(shù)和人臉圖像識(shí)別技術(shù)及其優(yōu)缺點(diǎn)進(jìn)行分析,確定選擇基于人臉圖像識(shí)別技術(shù)的驗(yàn)票方式,并采用基于概率潛在語(yǔ)義分析模型的人臉身份認(rèn)證算法,構(gòu)建人臉詞包模型及人臉圖像差特征空間,提取人臉標(biāo)識(shí)特征,結(jié)合人臉圖像標(biāo)識(shí)特征的出現(xiàn)頻率,采用支持向量機(jī)分類(lèi)器完成人臉身份認(rèn)證驗(yàn)票。
實(shí)名制驗(yàn)票;自動(dòng)識(shí)別;人臉認(rèn)證
鐵路推出“實(shí)名制”購(gòu)票以來(lái),票面信息除包括起始站點(diǎn)、票價(jià)等信息外,還增加了身份證件信息,從真正意義上建立起旅客與鐵路運(yùn)輸之間的契約制度,不僅為查詢(xún)旅客信息提供了便利,而且能夠在沒(méi)有增加鐵路營(yíng)運(yùn)里程的情況下,增加席位復(fù)用率、提高鐵路運(yùn)能[1]。目前鐵路客運(yùn)站普遍在車(chē)站的咽喉位置設(shè)置卡控崗位,采用人工肉眼檢驗(yàn)的方式進(jìn)行人、票、證一致性檢驗(yàn),識(shí)別誤差率較高,易引起分歧,造成旅客在檢票口的滯留,影響鐵路檢票的效率。因此,采用自動(dòng)識(shí)別技術(shù)完成實(shí)名制驗(yàn)票,實(shí)現(xiàn)對(duì)持票人的自動(dòng)身份核實(shí)勢(shì)在必行。
采用自動(dòng)識(shí)別技術(shù)進(jìn)行實(shí)名制驗(yàn)票,首先需要選擇一項(xiàng)對(duì)旅客方便、可操作性好的生物識(shí)別技術(shù)。生物識(shí)別技術(shù)是以指紋、瞳孔、面像、虹膜、語(yǔ)音等人體具有惟一性的生物特征作為分析基礎(chǔ),實(shí)現(xiàn)對(duì)個(gè)體進(jìn)行識(shí)別驗(yàn)證的自動(dòng)化手段[2]。目前,成熟度高而且應(yīng)用廣泛的生物識(shí)別技術(shù)有指紋識(shí)別技術(shù)、人臉圖像識(shí)別技術(shù)等。
1.1 指紋識(shí)別技術(shù)
指紋識(shí)別技術(shù)是應(yīng)用最廣泛的生物識(shí)別技術(shù),目前已經(jīng)成熟應(yīng)用于公安、門(mén)禁、考勤等系統(tǒng)。在鐵路客運(yùn)實(shí)名制驗(yàn)票中,主要可以通過(guò)采取不同方式的指紋識(shí)別鑒別旅客的不同身份。
(1)身份證件指紋存儲(chǔ)。我國(guó)已經(jīng)開(kāi)始在居民身份證包含的信息里補(bǔ)充指紋數(shù)據(jù)。身份證里存儲(chǔ)有指紋數(shù)據(jù),可以使旅客在驗(yàn)票時(shí)通過(guò)指紋信息直接關(guān)聯(lián)到本身的票面信息,做到人、證、票合一。指紋的錄入對(duì)信息安全要求很高,每一次使用指紋時(shí)都會(huì)在指紋采集設(shè)備窗口上留下用戶(hù)的指紋印痕,因而存在復(fù)制指紋的可能性。另外,由于國(guó)家在居民身份證中錄入指紋信息采取自愿原則,導(dǎo)致指紋身份證在目前及未來(lái)的應(yīng)用并不會(huì)十分普及。
(2)票面指紋存儲(chǔ)。如果鐵路部門(mén)自行把指紋信息儲(chǔ)存在車(chē)票里,在旅客每次購(gòu)票時(shí),均采集其指紋,將大大延長(zhǎng)購(gòu)票時(shí)間,給自動(dòng)售票設(shè)備帶來(lái)操作瓶頸。由于紙質(zhì)票和磁質(zhì)票內(nèi)存儲(chǔ)量有限,目前的信息已經(jīng)趨于飽和,無(wú)法加入更多數(shù)據(jù),而且電子標(biāo)簽 (Radio Frequency Identification,RFID) 票面成本昂貴,難以推廣。
(3)自主數(shù)據(jù)庫(kù)指紋存儲(chǔ)。鐵路部門(mén)把指紋信息存儲(chǔ)在自主信息數(shù)據(jù)庫(kù)中,旅客在第一次購(gòu)買(mǎi)車(chē)票時(shí)進(jìn)行指紋錄入,相關(guān)信息以身份證號(hào)為主鍵存儲(chǔ)在數(shù)據(jù)庫(kù)中,在驗(yàn)票或下次購(gòu)票時(shí),通過(guò)身份證關(guān)聯(lián)指紋信息。這種情況本質(zhì)上是在鐵路內(nèi)部補(bǔ)充指紋身份證的功能,不僅與公安系統(tǒng)功能性重疊浪費(fèi),而且同樣存在指紋信息安全問(wèn)題。
1.2 人臉圖像識(shí)別技術(shù)
人臉圖像識(shí)別技術(shù)是基于單獨(dú)個(gè)體獨(dú)特的臉部特征進(jìn)行身份識(shí)別,采用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,利用特定的算法對(duì)其中的數(shù)據(jù)信息進(jìn)行分析,進(jìn)而對(duì)個(gè)體進(jìn)行辨別。
(1)人臉圖像存儲(chǔ)介質(zhì)。與指紋識(shí)別技術(shù)一樣,鐵路部門(mén)將旅客面部圖像嵌入到車(chē)票票面中,或存儲(chǔ)在自主信息數(shù)據(jù)庫(kù)中,均會(huì)導(dǎo)致客運(yùn)成本的提高,降低該方法推廣的可能性。目前我國(guó)二代身份證已經(jīng)普及,每個(gè)二代身份證都含有本人的頭像信息,客運(yùn)站可以配置旅客身份驗(yàn)證系統(tǒng),采集旅客當(dāng)前的人臉圖像,并提取二代身份證照片上的頭像信息,對(duì)二者進(jìn)行比對(duì),從而實(shí)現(xiàn)票、證、人的一致性認(rèn)證。
(2)身份認(rèn)證系統(tǒng)?;谌四槇D像識(shí)別技術(shù)的客運(yùn)站旅客身份驗(yàn)證系統(tǒng)由人臉圖像采集設(shè)備、身份證讀取設(shè)備、人臉圖像識(shí)別后臺(tái)服務(wù)器、前臺(tái)顯示終端組成。利用身份證讀取設(shè)備獲得旅客身份證中的圖像信息,人臉圖像采集設(shè)備用來(lái)采集實(shí)時(shí)旅客面部信息,編碼后傳輸至人臉圖像識(shí)別后臺(tái)服務(wù)器,由其按照特定的算法進(jìn)行圖像信息與實(shí)時(shí)面部信息的人臉特征提取、比對(duì)識(shí)別,并將最終結(jié)果反饋給前臺(tái)顯示終端,通過(guò)前臺(tái)顯示終端進(jìn)行結(jié)果顯示[3]。
1.3 自動(dòng)識(shí)別技術(shù)選擇
1.3.1 指紋識(shí)別技術(shù)優(yōu)缺點(diǎn)分析
作為人體重要的生物特征,指紋具有惟一性,并且隨著年齡的增長(zhǎng)不會(huì)改變,識(shí)別操作簡(jiǎn)捷方便。但手指皮膚過(guò)干、過(guò)濕、皺紋多、紋路結(jié)構(gòu)不清晰、污染都會(huì)導(dǎo)致采集的圖像難以辨認(rèn),采集設(shè)備的窗口上采集殘留的痕跡也往往造成干擾,給指紋識(shí)別帶來(lái)誤差。由于采集設(shè)備窗口留下的用戶(hù)指紋印痕存在被用來(lái)復(fù)制指紋的可能性,因而指紋識(shí)別技術(shù)因其安全性、普遍性等方面原因,難以在鐵路實(shí)名制驗(yàn)票中廣泛應(yīng)用。
1.3.2 人臉圖像識(shí)別技術(shù)優(yōu)缺點(diǎn)分析
采用人臉圖像識(shí)別技術(shù),利用旅客二代身份證中的人臉圖像,可以以極小的改造成本完成實(shí)名制驗(yàn)票,是提高實(shí)名制檢票效率的有效途徑之一。然而,現(xiàn)場(chǎng)采集到的旅客人臉圖像與其二代身份證人臉圖像相比,由于隨著旅客年齡的增長(zhǎng)而帶來(lái)很大的不一致性,造成識(shí)別匹配上的誤差,人臉老化成為影響旅客身份認(rèn)證的最大因素[4]。目前已經(jīng)有眾多研究機(jī)構(gòu)致力于年齡估計(jì)和年齡建模的相關(guān)問(wèn)題研究,但其統(tǒng)計(jì)模型的獲取易受到生活環(huán)境和生活方式的影響。
1.3.3 自動(dòng)識(shí)別技術(shù)選擇
指紋識(shí)別技術(shù)和人臉圖像識(shí)別技術(shù)在應(yīng)用層面的各項(xiàng)指標(biāo)比較如表1 所示。
表1 指紋識(shí)別技術(shù)和人臉圖像識(shí)別技術(shù)指標(biāo)比較
相對(duì)指紋識(shí)別技術(shù)而言,人臉圖像識(shí)別技術(shù)具有可采集性高、易于全面推廣、不易被復(fù)制、安全性能高的特點(diǎn),在操作方面,被采集對(duì)象不需要直接接觸采集窗口,而且沒(méi)有其他附加動(dòng)作,執(zhí)行更加方便快捷。人臉圖像識(shí)別技術(shù)在永久性和區(qū)分能力方面存在的不足,可以通過(guò)技術(shù)手段進(jìn)行彌補(bǔ),達(dá)到一個(gè)較為理想的效果。
為了使人臉圖像識(shí)別技術(shù)更好地應(yīng)用于我國(guó)鐵路客運(yùn)實(shí)名制驗(yàn)票,提高其準(zhǔn)確性、高效性,可以采用一種基于概率潛在語(yǔ)義分析模型 (probabilistic Latent Semantic Analysis,pLSA) 的人臉身份認(rèn)證算法:首先,提取人臉圖像區(qū)域的尺度不變特征變換 (Scale Invariant Feature Transform,SIFT) 描述子[5],并采用詞包模型表征人臉面部特征[6];其次,對(duì)當(dāng)前所采集到的旅客人臉圖像構(gòu)建人臉圖像視覺(jué)差空間,并利用 pLSA 挖掘人臉圖像中魯棒年齡變化的標(biāo)識(shí)特征;最后,采用向量機(jī) (Support Vector Machine,SVM) 分類(lèi)器對(duì)該特征的直方圖進(jìn)行分類(lèi)完成身份認(rèn)證。
2.1 人臉的詞包模型表示
算法采用詞包模型表征人臉特征,首先提取人臉圖像的尺度不變特征變換描述子:①對(duì)圖像進(jìn)行稠密采樣,即以 8 像素為間隔重疊分割圖像;②將每個(gè)網(wǎng)格采樣點(diǎn)的中心位置作為關(guān)鍵點(diǎn),計(jì)算示例圖像區(qū)域關(guān)鍵點(diǎn)的方向特征;③將圖像標(biāo)準(zhǔn)坐標(biāo)軸圍繞原點(diǎn)做圓周運(yùn)動(dòng),可知很多圖像特征是固定不變的,將這個(gè)固定不變的特征提取出來(lái);④以該關(guān)鍵點(diǎn)為核心,在其周?chē)鷧^(qū)域提取 128 維特征,如圖1 所示,梯度方向和梯度模值由每個(gè)小格中的箭頭方向和長(zhǎng)度分別表示,越靠近關(guān)鍵點(diǎn)的像素,梯度方向的高斯加權(quán)值越大,這樣將圖1 左圖中 4 個(gè)塊的特征分別表示為共 128 維的 SIFT 特征向量[7]。然后對(duì)其進(jìn)行 K 均值 (K-means) 聚類(lèi),生成聚類(lèi)中心,并將圖像集中的圖像區(qū)域根據(jù)最近鄰準(zhǔn)則量化到聚類(lèi)中心上,將每個(gè)聚類(lèi)中心定義為一個(gè)視覺(jué)單詞 wi,1≤i≤N,聚類(lèi)中心集合即為視覺(jué)詞匯每副圖像表征為 N-bins視覺(jué)詞匯的直方圖其中,h 為直方圖,N 代表維數(shù),R 為實(shí)數(shù)集。
圖1 128 維 SIFT 算子的形成過(guò)程
2.2 人臉圖像差特征空間
I11,I12,I21,I22,…,Ik1,Ik2為 k 對(duì)人臉圖像,其對(duì)應(yīng)的詞包模型為 h11,h12,h21,h22,…,hk1,hk2。對(duì)同一人和不同人進(jìn)行特征分析,通過(guò) hi1-h(huán)i2(其中,1≤i≤k) 的方式構(gòu)建 Intra Pesonal和 Extra Personal 2 種人臉圖像差特征空間 (以下簡(jiǎn)稱(chēng)為“I 空間”和“E 空間”)。
I 空間用來(lái)表示同一人的人臉圖像差空間。由于采用詞包模型作為人臉圖像的表示特征,因而 I空間由同一人不同年齡的人臉圖像視覺(jué)單詞直方圖差表示,公式為
E 空間表示不同人的人臉圖像差空間,構(gòu)造方式與 I 空間相似,用表示,公式為
2.3 人臉標(biāo)識(shí)特征
研究表明,人的面部存在一些年齡魯棒的特征,正是這些身份標(biāo)識(shí)特征有利于提升人臉身份認(rèn)證性能。通過(guò)采用 pLSA,可以挖掘出人臉面部與年齡變化不敏感的標(biāo)識(shí)特征,同時(shí)有效地挖掘出隱藏在視覺(jué)單詞背后的涵義,這與人臉圖像的身份標(biāo)識(shí)特征隱藏于視覺(jué)特征之后的情況基本一致。因此,建立視覺(jué)單詞、人臉標(biāo)識(shí)特征及圖像差之間的概率映射關(guān)系,以生成方式對(duì)視覺(jué)單詞、場(chǎng)景主題和圖像之間的概率關(guān)系進(jìn)行建模,從而得到圖像中場(chǎng)景主題的分布概率[8]。
用 p (< Ij1-Ii2>,w ) 表示“圖像差空間< Ij1- Ii2>和視覺(jué)單詞 w”的聯(lián)合概率,為視覺(jué)單詞在年齡魯棒特征上的概率,為圖像差對(duì)于年齡魯棒特征的概率,構(gòu)建 pLSA 模型的結(jié)構(gòu)圖如圖2 所示。
圖2 pLSA 模型的結(jié)構(gòu)圖
基于 pLSA 模型的結(jié)構(gòu)圖,“圖像差空間< Ij1-Ii2>和視覺(jué)單詞 w”的聯(lián)合概率為
采用 EM 算法迭代 E 步驟和 M 步驟直至收斂:①在E步驟中,根據(jù)現(xiàn)有的參數(shù)計(jì)算人臉標(biāo)識(shí)特征 z 的后驗(yàn)概率②在 M 步驟中,最大化 E 步中的參數(shù)估計(jì)期望值,得到參數(shù)的更新值。
E 步驟:
M 步驟:
2.4 人臉身份認(rèn)證
采用 SVM 分類(lèi)器進(jìn)行人臉身份認(rèn)證,通過(guò)一對(duì)一的方式構(gòu)造 2 類(lèi)分類(lèi)器,即基于人臉圖像的標(biāo)識(shí)特征詞包模型 P (zt| Ij1-Ii2),分別針對(duì) I 空間和 E 空間訓(xùn)練 2 類(lèi) SVM 分類(lèi)器。隨后根據(jù)訓(xùn)練得到的 SVM 分類(lèi)器,學(xué)習(xí)測(cè)試圖像 I1-I2所屬類(lèi)別 (即同一人,不同人),根據(jù) FGne 人臉數(shù)據(jù)庫(kù)[9]得出基于 pLSA 的人臉身份認(rèn)證性能如表2 所示。人臉身份認(rèn)證算法流程如圖3 所示。
表2 基于 pLSA 的人臉身份認(rèn)證性能表
該表顯示對(duì)同一人和不同人的認(rèn)證準(zhǔn)確率,縱向類(lèi)別表示采用基于 pLSA 的人臉身份認(rèn)證算法對(duì)圖像對(duì)進(jìn)行人臉認(rèn)證生成的類(lèi)別,橫向類(lèi)別表示其真實(shí)類(lèi)別。通過(guò)表2 對(duì)角線上的數(shù)值考察算法的人臉認(rèn)證性能,正確預(yù)測(cè)的圖像對(duì)屬性類(lèi)別用主對(duì)角線的數(shù)值體現(xiàn),而錯(cuò)誤的認(rèn)證比例則由非主對(duì)角線數(shù)值體現(xiàn)[10]。由此可見(jiàn),利用 pLSA 抽取年齡魯棒的人臉標(biāo)識(shí)特征,平均認(rèn)證準(zhǔn)確率可達(dá) 91.4%,能較好地完成身份認(rèn)證任務(wù)。科學(xué)院研究生院,2014.
圖3 人臉身份認(rèn)證算法流程
基于 pLSA 的人臉身份認(rèn)證算法,可以很好地挖掘出基于年齡魯棒的人臉標(biāo)識(shí)特征,使被采集對(duì)象的永久性和區(qū)分能力得到提高,有效彌補(bǔ)人臉圖像識(shí)別技術(shù)的短板,為鐵路客運(yùn)站自動(dòng)實(shí)名制驗(yàn)票提供可能。人臉圖像識(shí)別技術(shù)作為鐵路客運(yùn)站自動(dòng)實(shí)名制驗(yàn)票的首選方案,具有廣闊的應(yīng)用前景。然而,該算法對(duì)部分遮擋等角度特殊的人臉圖像仍然不能取得很好的認(rèn)證效果,基于視覺(jué)認(rèn)知的人臉面部特征識(shí)別成為人臉身份認(rèn)證驗(yàn)票的一個(gè)更深層次的問(wèn)題。
[1] 嚴(yán)光銀. 城際客運(yùn)專(zhuān)線收費(fèi)系統(tǒng)[D]. 成都:西南交通大學(xué),2008.
[2] 盧 佩. 基于類(lèi)生物視覺(jué)特性的目標(biāo)識(shí)別[D]. 北京:中國(guó)
[3] 昝 蕊,呂曉軍,劉衛(wèi)平. 基于人臉識(shí)別的客運(yùn)站旅客身份驗(yàn)證系統(tǒng)研究[C]//第九屆中國(guó)智能交通年會(huì)學(xué)術(shù)委員. 第九屆中國(guó)智能交通年會(huì)大會(huì)論文集. 北京:電子工業(yè)出版社,2014:995-1000.
[4] Lanitis A,Taylor C J,Cootes T F. Toward Automatic Simulation of Aging Effects on Face Images[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(4):442-455.
[5] Lowe D. Distinctive Image Features from Scale-invariant Key Points[J]. International Journal of Computer Vision,2004,60(2):91-110.
[6] Nowak E,Jurie F,Triggs B. Sampling Strategies for Bag-of-features Image Classification[C]//Europeon Conference on Computer Vision. Austria:Springer-Verlag,2006:490-503.
[7] 孫首群,王曉東,王 冰,等. 基于旅客面部特征的實(shí)名制鐵路車(chē)票檢票身份認(rèn)證算法[J]. 中國(guó)鐵道科學(xué),2013,34(2):133-139. SUN Shou-qun,WANG Xiao-dong,WANG Bing,et al. Identity Authentication Algorithm for Railway Real-Name Ticket Checking System based on the Facial Features of Passengers[J]. China Railway Science,2013,34(2):133-139.
[8] Bosch A,Zisserman A. Scene Classification Using a Hybrid Generative/Discriminative Approach[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(4):712-727.
[9] Face and Gesture Recognition Working Group[EB/OL]. (2002-08-25)[2016-03-30]. http://www-prima.inrialpes.fr/ FGnet/.
[10] 陸 麗. 基于人臉圖像的性別識(shí)別與年齡估計(jì)研究[D]. 上海:上海交通大學(xué),2010.
責(zé)任編輯:王 靜
Discussion on Real-name Ticket Checking and Identification Technologies of Railway Passenger Transportation in China
Through expounding the application demand of automatic identification technology on real-name ticket checking of railway passenger transportation, this paper analyzes the advantages and disadvantages of the fingerprint identification technology and the face image recognition technology. Based on above, the ticket checking method based on face image recognition technology was determined and selected, and by using the face verification algorithm based on probabilistic latent semantic analysis (pLSA) model, the face model using bag of visual words and the face feature space based on image subtraction were established, and the face identification features were extracted, and combining with the occurrence frequency of the face image identification features, the ticket checking based on face verification was completed by using support vector machine classifier.
Real-name Ticket Checking; Automatic Identification; Face Verification
1003-1421(2016)05-0064-05
U293.22
B
10.16668/j.cnki.issn.1003-1421.2016.05.14
2016-04-05
中國(guó)鐵道科學(xué)研究院科研項(xiàng)目 (2012YJ031)