姚胤米
由于人工智能的介入,四川、廣東等地,先后有8名被拐多年的兒童被重新找到。
這意味著,我們可能站在一個(gè)時(shí)間的分水嶺上:一種犯罪類(lèi)型正在被技術(shù)逐步瓦解。
人工智能破案的事不是在未來(lái)發(fā)生的,這件事就發(fā)生在6月18日。2019年1月25日,一個(gè)星期五,四川省公安廳8層的DNA實(shí)驗(yàn)室里,近300份DNA樣本被錄進(jìn)檢驗(yàn)系統(tǒng)中。下午兩點(diǎn)多,所有信息都收錄完畢,接下來(lái)是等待結(jié)果。打拐處處長(zhǎng)蔣曉玲在辦公室里坐不住,她叫上搭檔胡麗,兩人一塊上樓,直接坐在DNA檢驗(yàn)系統(tǒng)旁。
機(jī)器運(yùn)轉(zhuǎn)得很慢。那個(gè)DNA庫(kù)“比較老”,蔣曉玲的手一直放在儀器旁邊的電腦鼠標(biāo)上,“一會(huì)兒刷新一下,一會(huì)兒刷新一下”。她很急,想要馬上知道結(jié)果。
人工智能出現(xiàn)了
過(guò)去幾年,四川打拐的警察們都在跟一個(gè)案子纏斗。最初,只是2014年4月一個(gè)四川遂寧的兒童被拐,經(jīng)過(guò)了兩個(gè)多月的偵查,同年發(fā)生在巴中、南充的兩個(gè)拐賣(mài)案被串并到一起。四川省公安廳調(diào)度幾個(gè)市轄的警察成立專(zhuān)案組,稱(chēng)為“4·26案”。這些案子手法一致、嫌疑人體貌特征接近。
線索都指向了王×文。
他走路有點(diǎn)拖,“但也不是瘸”。2014年7月31日,在四川省達(dá)州市渠縣老家,王×文被抓了,這次行動(dòng)有3名男孩被解救。經(jīng)過(guò)進(jìn)一步審訊,一個(gè)驚人的進(jìn)展出現(xiàn)了:從2008年起,發(fā)生在四川多市縣總共13起兒童拐賣(mài)案,都跟王×文有關(guān)。很快,這個(gè)系列拐賣(mài)案被公安部列為部督案件,但這只是個(gè)開(kāi)始。
干了多年警察,蔣曉玲偶爾會(huì)遇到這樣的案子。這些案子的線索就像一根斷線的風(fēng)箏,會(huì)在某個(gè)環(huán)節(jié)突然斷掉。警察們用盡一切辦法,不放過(guò)任何機(jī)會(huì),但所有的努力都卡在一個(gè)關(guān)節(jié)處,成為積案。
王×文就是這樣一個(gè)關(guān)節(jié)——他不斷翻供,拒絕提供中間人的信息。越來(lái)越清楚,指望從他這里打開(kāi)局面并不現(xiàn)實(shí)。
青少年是兒童成長(zhǎng)最迅速的時(shí)期,孩子的臉一年一個(gè)樣子。時(shí)間每多一天,找到的概率就少了一些。最長(zhǎng)的一起拐賣(mài)案,有的警察跟了10年,沮喪感一度籠罩著他們。DNA比對(duì)已經(jīng)進(jìn)行過(guò)一次,無(wú)功而返。那一次,警察們完全依賴(lài)人的經(jīng)驗(yàn),從一個(gè)人口數(shù)據(jù)庫(kù)中,篩出一批兒童,但沒(méi)有一個(gè)中的?!词故亲钣H密的父母,對(duì)于失蹤了多年的孩子,肉眼和記憶也并不可靠。
直到人工智能出現(xiàn)了。
2018年11月,上海漕河涇開(kāi)發(fā)區(qū)軟件園的優(yōu)圖實(shí)驗(yàn)室里,一臺(tái)擁有4塊GPU的組裝電腦開(kāi)始高速運(yùn)轉(zhuǎn)。顯示屏的編程軟件終端界面上,一串串超級(jí)長(zhǎng)的字符自動(dòng)生成,動(dòng)態(tài)移動(dòng),像一道向上流動(dòng)的瀑布。
這些字符,代表著一個(gè)龐大數(shù)據(jù)庫(kù)中,與10位在10年前被拐兒童的相似程度。兩個(gè)小時(shí)后,研究員曉程的電腦上生成了10個(gè)文件夾壓縮包。核實(shí)無(wú)誤后,文件夾壓縮包最終被轉(zhuǎn)交到蔣曉玲的手上。
每個(gè)文件夾里有101張照片。第一張照片是被拐兒童,看著有年頭了。像素很低,很模糊,是個(gè)只有兩三歲的小男孩。
剩下的100張照片,是100個(gè)13歲左右的兒童,他們以滿(mǎn)分100分制降序排列。一張照片下寫(xiě)著分?jǐn)?shù):98.3。這意味著照片里的人與被拐兒童有98.3%的概率是同一個(gè)人。
提交給四川警方的說(shuō)明文檔中,優(yōu)圖團(tuán)隊(duì)的湯海鵬做了解釋?zhuān)?5分是萬(wàn)分之一閾值,80分是十萬(wàn)分之一閾值,85分是百萬(wàn)分之一閾值。以75分為例,如果兩個(gè)人臉比對(duì)分?jǐn)?shù)超過(guò)75,則這兩個(gè)人臉是“萬(wàn)里挑一的像”。
這是跨年齡人臉識(shí)別技術(shù)的第一次應(yīng)用。人工智能是否可以幫警方解決一個(gè)多年的難題,沒(méi)有人知道答案。在四川省公安廳,參與打拐的警察們都充滿(mǎn)期待。有人很樂(lè)觀,猜測(cè)可能會(huì)比對(duì)上幾個(gè),一個(gè)干了多年警察的老刑偵比較保守,猜兩個(gè)。
多年以來(lái),這個(gè)案子成了他們最大的心結(jié)。蔣曉玲說(shuō),要是這條路走不通,“我們可能現(xiàn)在又換另外一條路走,反正一直得往前走,走下去,不能停止,一直得走。”
那天,他們一直在DNA實(shí)驗(yàn)室里等了8個(gè)小時(shí),晚上10點(diǎn)多,仍然沒(méi)有結(jié)果出來(lái),他們只好先回家。下個(gè)周一,一到公安廳,蔣曉玲就直奔八樓。她還是不停地刷,沒(méi)有,然后再刷,上午9點(diǎn)多,“一刷新,刷,出來(lái)了四個(gè)人?!?/p>
盯了一會(huì)兒這個(gè)數(shù)字,她趕緊回過(guò)神來(lái)。“一下子從八樓跑到六樓”,她找到胡麗,語(yǔ)氣特別興奮和激動(dòng)地說(shuō):“比上了4個(gè)!”
案子拖了快10年了。兩個(gè)女警察在公安廳六樓的走廊里情不自禁地“跳圈圈”,一直在轉(zhuǎn)。“搞得整層樓別的科室的人都跑出來(lái)看,說(shuō)打拐處的怎么回事?!被貞浧疬@個(gè)細(xì)節(jié)時(shí),蔣曉玲抑制不住情緒,眼淚要掉下來(lái)。
“4·26案”是一個(gè)系統(tǒng)工程
王×文是一個(gè)記憶力極其出色的人。在描述拐賣(mài)現(xiàn)場(chǎng)時(shí),他能記住幾乎所有的細(xì)節(jié)。但一旦談起孩子的下落,王×文要么翻供,要么就“不記得了”。
即使掌握著越來(lái)越多的刑事偵查手段,但面對(duì)這樣的拐賣(mài)案,也沒(méi)有立刻奏效的辦法?!e(cuò)過(guò)找回失蹤兒童的黃金時(shí)間,就只能從市縣一級(jí)適齡人口中進(jìn)行搜索,這意味著至少數(shù)十萬(wàn)級(jí)別的檢索規(guī)模。如果進(jìn)一步擴(kuò)大搜索范圍至省一級(jí),檢索規(guī)模將急劇擴(kuò)大到千萬(wàn)以上,堪稱(chēng)“大海撈針”。
負(fù)責(zé)打拐的警察們付出了大量努力,他們的名字很難被一一記下。比如,四川省很多老刑偵都記掛著這個(gè)案子。其中一個(gè)老警察,2018年被公安部評(píng)為百佳刑警,已經(jīng)50多歲了。一直參與案件,工作做得很細(xì)。
公安廳刑偵局局長(zhǎng)王宏偉回憶,他到省廳工作,接起這個(gè)案件,“當(dāng)時(shí)還沒(méi)有打拐處的時(shí)候,這一塊工作就抓得很緊。”
“4·26案”是一個(gè)系統(tǒng)工程。“就像我們猜謎語(yǔ),你首先要揭曉謎底,這個(gè)我們有一個(gè)艱苦復(fù)雜的偵破過(guò)程?!蓖鹾陚フf(shuō)。
但越到后面,案子變得越棘手。因?yàn)橥酢廖木懿还┦鲞@些被拐兒童的下落,全國(guó)打拐DNA信息庫(kù)比對(duì)也沒(méi)有結(jié)果,案件的偵破工作陷入僵局。
對(duì)于那些丟失孩子的父母來(lái)說(shuō),10年里,他們只是在嘗試各種徒勞的辦法。桂宏正聽(tīng)說(shuō)深圳有個(gè)父親“通過(guò)不斷地在電腦上發(fā)發(fā)發(fā)”,找回了孩子。他就也買(mǎi)了一臺(tái)電腦,在天涯論壇、百度貼吧里發(fā)帖。他加了三十幾個(gè)尋子微信群,每天收到成千上萬(wàn)條消息。
孩子被拐前唯一清晰的單人照,被印在各種形式的尋人啟事上。包括:張貼在電線桿、建筑物外墻上的普通A4紙;可以用一根繩子連接起來(lái),掛在脖子上雙手托舉的泡沫板;可以被掛在汽車(chē)上幾個(gè)月不掉色的彩色噴繪布;還有尋人公益組織為了某次活動(dòng)而印制分發(fā)的撲克牌。以及,鄭州一家私人手機(jī)店的墻面上——手機(jī)店的老板也是被拐孩子的父親,他的店鋪墻面上全是丟失孩子的照片。他讓來(lái)店里買(mǎi)手機(jī)的人都看一眼,這樣找到的希望就多一些。
但這只是其中的一個(gè)故事?,F(xiàn)實(shí)比期待殘忍多了。
每天泡在數(shù)學(xué)題里
線索匱乏,專(zhuān)案組的警察們各種辦法都試過(guò)了。
其中的一些辦法,蔣曉玲現(xiàn)在看來(lái),會(huì)覺(jué)得“很幼稚”。一次,專(zhuān)案組到廣東,借了一間辦公室。警察曹軍和十余名同事每人對(duì)著一臺(tái)電腦,一條條看別人的“家譜”?!粋€(gè)家庭里有幾個(gè)小孩?最后一個(gè)是不是男孩?和姐姐相差多大?和父母的年齡相差多大?
他們每天泡在數(shù)學(xué)題里,“看瞎了,幾乎家家戶(hù)戶(hù)都好多人啊,比我們那里人多多了?!笔畮兹f(wàn)條數(shù)據(jù),專(zhuān)案組的警察用肉眼一個(gè)個(gè)篩查,最終顆粒無(wú)收。
2014年底,他們?cè)?jīng)冒著極大的風(fēng)險(xiǎn)把王×文從看守所提出來(lái),押到廣東去指認(rèn)現(xiàn)場(chǎng)。 專(zhuān)案組十余名警察集體行動(dòng),曹軍也去了。他是武勝縣的警察,那起農(nóng)貿(mào)市場(chǎng)的案子串并后,他被領(lǐng)導(dǎo)指派加入了專(zhuān)案組。為此,他到廣東出了數(shù)不清多少次的差。走訪得多了,他對(duì)當(dāng)?shù)氐拿耧L(fēng)也有了解,“他們那里,家里沒(méi)有男孩是沒(méi)有地位的。”
曹軍非常符合人們想象中的基層警察,長(zhǎng)得高大,身材很壯,能吃苦,看起來(lái)沒(méi)有架子,說(shuō)話很生動(dòng)。押解期間,專(zhuān)案組的民警們和王×文吃在一起,住在一起,24小時(shí)輪流看守,又要防止他生病,還要提防他自殘或自殺。
出發(fā)前,王×文說(shuō):“應(yīng)該能找到?!笨梢坏侥康牡?,他就改口說(shuō):“路都變了,認(rèn)不出。”
車(chē)在市內(nèi)剛開(kāi)了沒(méi)多遠(yuǎn),王×文說(shuō):“車(chē)開(kāi)得太快了,我看不清。”曹軍他們只好押著他下來(lái)走路。走了一會(huì)兒,實(shí)在太慢,他們便找了幾輛“火三輪”,那是11月,三輪車(chē)沒(méi)有棚頂,露天,風(fēng)大,“慢慢開(kāi),又冷,吹得頭發(fā)全是立起來(lái)的?!?/p>
他們終于在當(dāng)?shù)匾粋€(gè)縣找到了王×文供述的“一所小學(xué)”。一下車(chē),所有人都傻眼了——“修的房子都是一模一樣的?!辈苘娬f(shuō),不僅如此,村子里大部分人家連姓氏都是一樣的。
一群四川人到廣東找小孩,語(yǔ)言都是不通的。他們?cè)囘^(guò)挨家挨戶(hù)走訪,沒(méi)有效果。他們問(wèn)了一圈兒,什么都問(wèn)不出,最后只能押著王×文回去。
2015年,專(zhuān)案組聯(lián)系了沈陽(yáng)著名刑事相貌專(zhuān)家、中國(guó)刑警學(xué)院的趙成文教授畫(huà)像,根據(jù)孩子們的童年照片,畫(huà)出他們十幾歲的樣子。
模擬畫(huà)像是刑事偵查中的一項(xiàng)重要技術(shù),它曾幫助中國(guó)警方破獲了相當(dāng)多的案件。這一次,專(zhuān)案組帶著這些畫(huà)像再到廣東,提取適齡兒童照片,“用肉眼找出覺(jué)得和這個(gè)像的”。
看了10天,找到176張照片帶回四川,組織家長(zhǎng)辨認(rèn)。南充市公安局刑偵支隊(duì)的賈副支隊(duì)長(zhǎng)回憶,在辨認(rèn)現(xiàn)場(chǎng),一開(kāi)始,孩子的父母覺(jué)得“都不像”,看著看著,一個(gè)覺(jué)得這個(gè)像,一個(gè)覺(jué)得不像,夫妻之間有時(shí)會(huì)陷入爭(zhēng)吵。
“你才帶了幾天,你知道像不像?”
“要不是你,孩子能丟嗎?”
一份資料里顯示:這樣的家庭,“70%夫妻關(guān)系破裂,分居或離婚”。最后,他們篩出來(lái)100多個(gè)“疑似對(duì)象”,做DNA比對(duì),一個(gè)都沒(méi)中。
局面困在了這里。
跨年齡人臉識(shí)別
挫折接連不斷。在警方嘗試各種新辦法時(shí),2015年,具有更大運(yùn)算力和儲(chǔ)存空間的GPU的應(yīng)用,把人工智能的熱度推向巔峰?!狦PU是圖形處理器的簡(jiǎn)稱(chēng),比傳統(tǒng)中央處理器計(jì)算速度快10至100倍。
深度學(xué)習(xí)算法使得訓(xùn)練出一個(gè)“更聰明”的AI成為可能。人類(lèi)“不可靠”的部分——人工智能總有辦法規(guī)避掉。
2017年12月,公安部刑偵局副局長(zhǎng)陳士渠到專(zhuān)家組調(diào)研。專(zhuān)家李博士和他交流時(shí),提到人工智能和跨年齡人臉識(shí)別技術(shù)。陳士渠很感興趣,他想起了“4·26系列”拐賣(mài)案——近10年來(lái),公安部打拐辦和四川公安從未放棄過(guò)努力和偵查,他曾多次前往四川督辦此案。他希望找到突破口,便要求四川專(zhuān)案組和騰訊團(tuán)隊(duì)對(duì)接,“希望利用新技術(shù)查找被拐兒童下落。”
需求被轉(zhuǎn)達(dá)給人臉識(shí)別團(tuán)隊(duì)——優(yōu)圖實(shí)驗(yàn)室時(shí),沒(méi)有人感到樂(lè)觀。這是一個(gè)“全博士”團(tuán)隊(duì),都畢業(yè)于名校,技術(shù)水平很高。但得到這個(gè)消息時(shí),優(yōu)圖實(shí)驗(yàn)室總經(jīng)理Kyle的第一反應(yīng)是:“難度還是挺大的?!?跨年齡比對(duì)是人臉識(shí)別領(lǐng)域一個(gè)公認(rèn)的難點(diǎn),特別是青少年階段,人臉特征變化最大。優(yōu)圖當(dāng)時(shí)的算法模型,并沒(méi)有進(jìn)行過(guò)大規(guī)模的跨年齡比對(duì),準(zhǔn)確率在80%左右,這遠(yuǎn)不是一個(gè)能夠應(yīng)用到安防打拐領(lǐng)域的算法。
之后的十幾天,守護(hù)者計(jì)劃團(tuán)隊(duì)和優(yōu)圖實(shí)驗(yàn)室的同事開(kāi)了很多次會(huì)。2018年1月的一個(gè)深夜,12點(diǎn)左右,已經(jīng)入睡的優(yōu)圖實(shí)驗(yàn)室總監(jiān)Allen電話突然響起,是守護(hù)者計(jì)劃安全團(tuán)隊(duì)的同事,Allen當(dāng)時(shí)“并不明確公安部要做什么事情”,他的第一反應(yīng)是“這件事情肯定很重要,不然不會(huì)這么晚緊急找過(guò)來(lái)”。
第二天上午10點(diǎn),Allen就接到通知,要用優(yōu)圖的技術(shù)幫助尋找這起拐賣(mài)大案中的失蹤兒童。
Allen心里沒(méi)底??缍?0年的案件難度,超過(guò)他們的想象,世界上也沒(méi)有成功的案例。但他決心要全力以赴。
執(zhí)行工作由優(yōu)圖人臉識(shí)別團(tuán)隊(duì)的李博士牽頭。最重要的是“學(xué)習(xí)材料”。他們通過(guò)各種數(shù)學(xué)約束條件,教導(dǎo)AI——“這是同一個(gè)人”“這是這個(gè)人1歲的樣子,5歲的樣子,10歲的樣子,30歲的樣子”“這個(gè)大人的照片,跟其他小孩子都是不像的” 。
“它會(huì)學(xué)到一個(gè)人的面部隨年齡演變時(shí),不變的那些量是什么。”研究員曉程說(shuō),這些面部特征,“可能對(duì)應(yīng)著一些語(yǔ)義描述”。
曉程總是會(huì)冒出這種又準(zhǔn)確又干脆的詞——“比如,一個(gè)人的耳垂長(zhǎng)得很特別,或者他的眉峰、眉骨走向不一樣。”他說(shuō),AI是無(wú)法用這樣的語(yǔ)言去定義的,研究員們把它“轉(zhuǎn)化成一些數(shù)學(xué)語(yǔ)言”。
最終的結(jié)果是,機(jī)器學(xué)習(xí)總結(jié)出了“不隨時(shí)間變化的人臉特征”——在研究員的電腦上,是由長(zhǎng)度為512維的特征向量呈現(xiàn)出來(lái)的。很多個(gè)夜晚,研究員們消耗在這些事情上。他們加了數(shù)不清的班,提交了5個(gè)版本算法模型,其中大大小小的修改多達(dá)上千次。
中間,有一次測(cè)試的機(jī)會(huì)。2018年年初,公司年會(huì)。他們收集了一些同事小時(shí)候的照片,在年會(huì)上讓機(jī)器和人一起競(jìng)猜,“人機(jī)大戰(zhàn)”?!耙?yàn)槎际潜容^熟的人,”李博士覺(jué)得,“這肯定能認(rèn)出來(lái)吧?!庇螒蜻M(jìn)行了幾輪,最終的結(jié)果是,人最多猜對(duì)了4個(gè),而算法比對(duì)了7個(gè)。 這終于讓他放心了——“這個(gè)事情雖然難度大,但算法肯定是比人強(qiáng)的?!?/p>
比中4個(gè)孩子
2019年1月28日,比中4個(gè)孩子的結(jié)果,陸續(xù)向整個(gè)項(xiàng)目的參與者傳遞。李博士是在飛機(jī)上得到消息的,四川省公安廳打拐處前副處長(zhǎng)唐中琦給他打來(lái)電話,叫他猜,比中了幾個(gè)。
李博士沒(méi)敢多猜,他說(shuō):“一個(gè)?!碧铺幷f(shuō):“不對(duì),再猜?!崩钚虏拢骸皟蓚€(gè)。”唐處揭曉答案:“4個(gè)。”
李博士聽(tīng)完,幾乎尖叫出來(lái)。湯海鵬也很激動(dòng),他已經(jīng)記不清當(dāng)時(shí)在哪兒,但非常清楚地記得,聽(tīng)到結(jié)果時(shí),他真的哭了。 當(dāng)結(jié)果傳到上海優(yōu)圖辦公室時(shí),幾名研究員正在如常地對(duì)著電腦寫(xiě)代碼,看到比對(duì)上4個(gè),李博士、曉程、Allen幾個(gè)人“小聲地yeah了一下”。
那天是周一,Allen說(shuō),“覺(jué)得不可思議,就是一下子從凳子上坐起來(lái),很驚奇,很驚喜。”他的預(yù)期是能找到一個(gè)就不錯(cuò)了。
打拐的警察們付出了幾個(gè)月的努力:人工智能可以幫助警方把海量的數(shù)據(jù)縮小到100個(gè),但拿到數(shù)據(jù),并不意味著工作就結(jié)束了。蔣曉玲組織警員,先用4個(gè)多月的時(shí)間,進(jìn)行了基礎(chǔ)的刑偵工作。2019年2月11日,四川省公安廳刑偵局副局長(zhǎng)宋月齊率12名專(zhuān)案組人員趕到廣東,對(duì)比中的4個(gè)孩子的情況進(jìn)行落地偵查。剩下的就是最后一步——驗(yàn)證結(jié)果。
春節(jié)假期剛過(guò),警方提出進(jìn)行第二次比對(duì)。研究員們又對(duì)算法進(jìn)行了優(yōu)化。這一次,他們擴(kuò)大了比對(duì)范圍?!械霓k法受“學(xué)習(xí)材料”的影響很大,因?yàn)槿狈ψ銐虻目缒挲g圖像數(shù)據(jù),這個(gè)AI并不能做到像是針對(duì)成年人的人臉識(shí)別AI那樣好。
李博士用“祖母細(xì)胞”打比方。“它假設(shè)人,比如說(shuō)腦子里面有一個(gè)祖母細(xì)胞,只有在看到祖母的時(shí)候它才會(huì)響應(yīng)?!?/p>
人類(lèi)的智力不可能這樣思考。但在優(yōu)圖內(nèi)部,他們把所有的人臉識(shí)別模型都按照“祖母1、2、3、4”這樣推下來(lái),它對(duì)熟悉的東西“學(xué)得特別好”,對(duì)不熟的東西“學(xué)得就不好”。
關(guān)鍵時(shí)刻,曉程開(kāi)發(fā)了一套損失函數(shù),把識(shí)別成年人時(shí)表現(xiàn)得“很聰明”的AI作為老師,將跨年齡識(shí)別“不夠聰明”的AI作為學(xué)生,讓學(xué)生給出的判斷結(jié)果盡可能靠近老師?,F(xiàn)實(shí)條件中,照片的質(zhì)量、人臉的角度、遮擋、光線都有可能對(duì)AI的判斷帶來(lái)影響?!拔覀?nèi)ソ踢@個(gè)老師,盡量克服其他因素的影響,去獲得人臉特征?!?/p>
對(duì)于教導(dǎo)和開(kāi)發(fā)AI的研究員來(lái)說(shuō),與AI的關(guān)系是很特別的。他們雖然是AI的設(shè)計(jì)師,但AI經(jīng)過(guò)自我學(xué)習(xí)后,又變成一個(gè)強(qiáng)于人類(lèi)智力組織的存在。
曉程說(shuō),“我們教導(dǎo)AI,通過(guò)精簡(jiǎn)后的一些學(xué)習(xí)準(zhǔn)則,行為設(shè)計(jì)的標(biāo)準(zhǔn),把它生產(chǎn)出來(lái),最終,它就會(huì)達(dá)到人類(lèi)都無(wú)法達(dá)到的高度?!?/p>
AI的識(shí)別精度最終提升到接近96%。它還在不斷進(jìn)化。2019年2月,第二次比對(duì),又找到1人。2019年3月,第三次比對(duì),又找到2人。至此,這起部督拐賣(mài)專(zhuān)案的13名被拐兒童,只有3人尚未被確認(rèn)身份。
解釋不了一切
2019年4月,釀酒商人桂宏正和妻子終于等到了人生里最渴望的那個(gè)消息——被拐10年的兒子找到了。他們的心情和他們的狀態(tài)一樣慌亂。從警察手里接過(guò)兩張照片:那是他們的孩子,變樣了,有點(diǎn)陌生。他們仔細(xì)看,才看得出孩子兩三歲時(shí)的樣子。10年過(guò)去了,即使是親生父母,也不能在人群中一下認(rèn)出他。
桂宏正夫婦曾經(jīng)歷過(guò)一場(chǎng)空歡喜,那種心情“比悲傷更要悲傷”。2012年,有志愿者聯(lián)系桂宏正,說(shuō)疑似在西寧看到了孩子。志愿者發(fā)過(guò)來(lái)一張照片,男孩的眼角也是垂下來(lái)的,兩頰紅紅的。桂宏正幾乎確認(rèn)那就是他兒子。幾天之后,志愿者確認(rèn)那個(gè)孩子不是他的。
“那次我真的就太傷心了?!惫鸷暾统鍪謾C(jī),打開(kāi)相冊(cè)刷了幾秒鐘,點(diǎn)開(kāi)那個(gè)小孩的照片,拿給我看:“你看像不像?”
不等我回答,他說(shuō):“整個(gè)都像。” 出現(xiàn)這樣的“錯(cuò)誤”并不奇怪。生物學(xué)統(tǒng)計(jì),女性懷雙胞胎的自然概率是八十分之一。人群中,兩個(gè)相似度極高的人出現(xiàn)的概率更高,人類(lèi)肉眼分辨人臉相似度沒(méi)有那么可靠。
他們唯一能掌握的不太會(huì)被時(shí)間改變的細(xì)節(jié),是孩子右腳小腿上的一處疤痕。那是男孩小時(shí)候在酒坊玩耍,不當(dāng)心被滾燙的水燙的。4月12日,在廣東一處民宅與兒子相認(rèn)時(shí),這對(duì)父母做的第一件事情是:一把掀開(kāi)孩子的褲腳,看看小腿上是不是有一條疤。
技術(shù)帶來(lái)的結(jié)果令人欣喜,6月19日,最新的一個(gè)消息:今年四五月,優(yōu)圖的人臉識(shí)別技術(shù)又幫助深圳警方找回一個(gè)失聯(lián)多年的兒童。那是2000年,深圳羅湖發(fā)生一起綁架兒童案,綁匪索要贖金20萬(wàn)元。奇怪的是,小孩和綁匪隨后卻消失了。多年來(lái),警察沒(méi)有放棄尋找,也曾找畫(huà)像專(zhuān)家進(jìn)行跨年齡模擬畫(huà)像,都沒(méi)有獲得有價(jià)值的線索。孩子失聯(lián)時(shí)只有3歲,19年過(guò)去了,他被找到時(shí)在深圳一家餐廳當(dāng)廚師。
陳士渠說(shuō),這些兒童被找回,“充分證明人工智能對(duì)于查找被拐多年兒童能夠發(fā)揮重要作用?!倍壳埃扇”I竊、搶奪、拐騙等方式拐賣(mài)兒童的案件,“全國(guó)年發(fā)案只有幾十起”,基本可以快偵快破。
這意味著,我們可能站在一個(gè)時(shí)間的分水嶺上:一種犯罪類(lèi)型正在被技術(shù)逐步瓦解。
蔣曉玲對(duì)未來(lái)充滿(mǎn)期待,“我們今年準(zhǔn)備看能不能把剩下幾個(gè)解決掉,要是這幾個(gè)也找到的話,我們的案子就比較完美了。”
四川的案子中,還有3個(gè)孩子沒(méi)有確認(rèn)。這3人中,有個(gè)男孩的比對(duì)結(jié)果很特殊。3次比對(duì),排在相似度第一位的始終是同一個(gè)人。即便以肉眼看,這個(gè)男孩與被拐兒童的面部特征都很相似——甚至耳朵上一處非常特殊的標(biāo)志。但奇怪的是,幾次DNA比對(duì)都不成功。
頭兩次,機(jī)器判斷:97、98分,第三次——100分。
警察們對(duì)這個(gè)結(jié)果感到困惑。他們調(diào)查過(guò)孩子親生父母生產(chǎn)時(shí)的狀況,那對(duì)夫妻是在鎮(zhèn)上一家診所生下的男孩,診所并不正規(guī),“都沒(méi)有留下出生記錄”。
研究員們的看法各不相同。“機(jī)器也有bad case?!崩畈┦空f(shuō),“所有的人工智能都不是百分之百正確,比如說(shuō)它的識(shí)別能力就是95%,在一個(gè)千萬(wàn)的集合里,有一兩個(gè)找不到,我覺(jué)得是在算法誤差內(nèi),很正常?!?/p>
曉程則相信機(jī)器比人坦誠(chéng),也比人可靠。從2009年開(kāi)始從事人臉識(shí)別,過(guò)去10年的工作給他帶來(lái)的一個(gè)啟發(fā)是——“它的錯(cuò)肯定是有理由的?!?/p>
這個(gè)世界上有太多巧合和錯(cuò)亂的事情了,再?gòu)?qiáng)大的AI也解釋不了一切。