廖紅陽(yáng)
1988年出生的印奇,帶領(lǐng)曠視科技有限公司,僅用6年時(shí)間,憑借先進(jìn)的人臉識(shí)別技術(shù)和商業(yè)布局,就發(fā)展成為中國(guó)人工智能領(lǐng)域的“獨(dú)角獸”公司。在去年底完成1億美元的C輪融資后,曠視科技已達(dá)到20億美元的估值。
緊盯前沿
85后創(chuàng)業(yè)者印奇是一位高材生,畢業(yè)于清華大學(xué)“姚班”——一個(gè)由圖靈獎(jiǎng)得主姚期智主導(dǎo)創(chuàng)立的計(jì)算機(jī)精英班。和印奇一樣,在曠視科技的團(tuán)隊(duì)中,超過80%的員工來自清華園,可謂高手如云。其中80%以上是工程師,30多人至少獲得過一項(xiàng)世界級(jí)編程比賽獎(jiǎng)項(xiàng),獲得國(guó)際奧林匹克競(jìng)賽金牌的有7人,他們大多數(shù)有海外留學(xué)和專業(yè)機(jī)構(gòu)工作背景。這個(gè)由高素質(zhì)人才組成的智囊團(tuán)隊(duì),為曠視科技提供了強(qiáng)有力的智力保障。
說起創(chuàng)業(yè)緣由,不得不提印奇在MSRA(微軟亞洲研究院)的工作經(jīng)歷。從大學(xué)二年級(jí)開始,印奇就在MSRA學(xué)習(xí),參與人臉識(shí)別引擎的研發(fā),出于對(duì)該項(xiàng)技術(shù)的熱愛,畢業(yè)后印奇又在MSRA全職一年。正是在此基礎(chǔ)上,印奇決定成立以人臉識(shí)別技術(shù)為核心的科技公司。很快,他找到同班同學(xué)唐文斌,向他提出自己的創(chuàng)業(yè)想法。印奇和小唐都是理科出身,一個(gè)擅長(zhǎng)科研,一個(gè)更偏于工程化,能夠優(yōu)勢(shì)互補(bǔ),兩人一拍即合,并將學(xué)弟楊沫也拉攏到他們的創(chuàng)業(yè)隊(duì)伍中來。
2011年10月,曠視科技有限公司正式成立,團(tuán)隊(duì)成員最初的想法是從人工智能技術(shù)出發(fā),研制出“機(jī)器之眼”,并用它讀懂世界,這是大膽的設(shè)想,更是一次零起點(diǎn)的創(chuàng)業(yè)。由于在創(chuàng)業(yè)大賽中的出色表現(xiàn),公司在短短兩個(gè)月內(nèi)便獲得聯(lián)想之星幾百萬的天使投資。
但此時(shí),印奇又有了新的想法。人工智能技術(shù)包括硬件和軟件兩方面,軟件背景出身的印奇希望能夠補(bǔ)全硬件方面的知識(shí)。沒過多久,印奇就踏上哥倫比亞大學(xué)的求學(xué)之旅。他一邊在校攻讀3D相機(jī)方向的博士,一邊還要處理遠(yuǎn)在大洋彼岸的公司事務(wù)。盡管明確了視覺識(shí)別的方向,但如何讓技術(shù)落地還有待探討,在留學(xué)期間,印奇一直與團(tuán)隊(duì)保持遠(yuǎn)程視頻和通話。
最初他們開發(fā)了一款基于iOS移動(dòng)體感的名為“烏鴉來了”的小游戲,在游戲中,玩家通過搖晃頭部,操縱游戲中的稻草人,從而攔截從天而降偷食的烏鴉。背后的技術(shù)原理是,用攝像頭拍攝玩家的身體活動(dòng),通過人臉識(shí)別和人臉追蹤等視覺識(shí)別算法判斷人物的運(yùn)動(dòng)姿勢(shì),從而操縱游戲角色。這款游戲獲得了清華大學(xué)第三十屆“挑戰(zhàn)杯”特等獎(jiǎng),一度位居中國(guó)區(qū)APP Store排行榜前五位。但這一成績(jī)并未給印奇團(tuán)隊(duì)帶來多少實(shí)質(zhì)性收益,僅僅幾千元的盈利收入讓他們意識(shí)到,以技術(shù)起家、不了解游戲市場(chǎng)的他們并不適合做一家游戲公司。此外,F(xiàn)acebook收購(gòu)以色列人臉識(shí)別技術(shù)公司face.com這一事件也給三人提了個(gè)醒:他們所掌握的人臉識(shí)別技術(shù)有著巨大的市場(chǎng)空白,市場(chǎng)潛力不容小覷。因此三人重新回歸“技術(shù)”本位,悉心鉆研這一前沿科技。
由于相隔萬里,團(tuán)隊(duì)交流和公司管理極為不便,2013年,在完成兩年的博士學(xué)習(xí)并達(dá)到預(yù)期目標(biāo)后,印奇毅然決定結(jié)束學(xué)業(yè),回國(guó)全職創(chuàng)業(yè)。
技術(shù)至上
技術(shù)理想變?yōu)樯虡I(yè)現(xiàn)實(shí)的創(chuàng)業(yè)之途并不平坦,雖然懷揣著人臉識(shí)別這一高端技術(shù),但由于人工智能的行業(yè)應(yīng)用市場(chǎng)還未得到充分開發(fā),創(chuàng)業(yè)團(tuán)隊(duì)又缺乏實(shí)戰(zhàn)經(jīng)驗(yàn),如何使公司商業(yè)化運(yùn)作成為擺在印奇他們面前的一道難題。一開始,他們走娛樂化路線,利用人臉識(shí)別技術(shù)滿足女性對(duì)美顏的剛需,使美圖秀秀成為公司最初的種子客戶,此外,阿里、360、陌陌、Camera360、魔漫相機(jī)、世紀(jì)佳緣、聯(lián)想等一批大型圖片、社交、設(shè)備類企業(yè)也相繼匯聚到曠視科技的生態(tài)進(jìn)化鏈條中。
2014年,團(tuán)隊(duì)發(fā)現(xiàn)人工智能為傳統(tǒng)行業(yè)賦能的商機(jī),采用了to B(對(duì)企業(yè))的商業(yè)模式,在互聯(lián)網(wǎng)、金融、安防、智能零售等領(lǐng)域拓展業(yè)務(wù)。只要一部智能手機(jī),無論何時(shí)何地都可以“刷臉”開戶,這樣的“開戶神器”為券商在競(jìng)爭(zhēng)中贏得砝碼。隨之,平安銀行、中信銀行、江蘇銀行等紛紛與曠視科技簽訂合作協(xié)議。在完成B輪4700萬美元的融資后,曠視科技又聚焦到金融行業(yè)的人臉認(rèn)證、智能監(jiān)控、智能家居等應(yīng)用領(lǐng)域。兩三年間,數(shù)十億次外部信息的接收,不斷優(yōu)化曠視科技的人臉識(shí)別算法,使它的性能和用戶量都達(dá)到國(guó)際領(lǐng)先地位。
被人臉識(shí)別技術(shù)廣闊的發(fā)展前景所吸引,曠視科技被馬云選擇并合作。作為阿里的戰(zhàn)略合作伙伴,曠視科技負(fù)責(zé)為支付寶開發(fā)人臉識(shí)別模塊。2015年3月16日,在德國(guó)漢諾威IT博覽會(huì)上,馬云親自為德國(guó)總理默克爾和中國(guó)副總理馬凱兩位貴賓,演示了螞蟻金服的Smile to Pay掃臉技術(shù),并當(dāng)場(chǎng)刷自己的臉在淘寶網(wǎng)上購(gòu)買了一枚1948年的漢諾威紀(jì)念郵票。這套由螞蟻金服與曠視科技合作研發(fā)的“刷臉”系統(tǒng),在購(gòu)物后的支付認(rèn)證階段通過掃臉取代傳統(tǒng)的密碼輸入,其識(shí)別率超過99%。
原創(chuàng)“刷臉”
在印奇眼里,過去六年,曠視科技只做了“刷臉”一件事,在人臉識(shí)別技術(shù)的商業(yè)化中,曠視科技完成了從技術(shù)研發(fā)到產(chǎn)品化再到商業(yè)化的過程,目前平臺(tái)在全球已擁有2.1億實(shí)名認(rèn)證客戶。
要使人臉識(shí)別技術(shù)順利實(shí)現(xiàn)商業(yè)化,技術(shù)研發(fā)是基礎(chǔ)。帶有濃厚極客氛圍的曠視科技將技術(shù)視為核心競(jìng)爭(zhēng)力,在內(nèi)部設(shè)有專門負(fù)責(zé)基礎(chǔ)研發(fā)的研究機(jī)構(gòu)。人臉識(shí)別功能的背后技術(shù)是深度學(xué)習(xí),本質(zhì)是標(biāo)準(zhǔn)化,因此技術(shù)壁壘的堆高需要遵守快的準(zhǔn)則。除了與同行競(jìng)爭(zhēng)發(fā)展速度,與黑色產(chǎn)業(yè)的賽跑也在所難免。在金融業(yè),犯罪分子通過偽造身份信息或盜取他人身份信息進(jìn)行詐騙,作為金融業(yè)人臉對(duì)比和活體檢驗(yàn)技術(shù)的提供者,曠視科技必須與黑色產(chǎn)業(yè)進(jìn)行正面較量。其市場(chǎng)總監(jiān)謝憶楠提到,公司員工會(huì)潛伏在黑色產(chǎn)業(yè)群中,只要群里有人兜售破除人臉識(shí)別系統(tǒng)的技術(shù),謝憶楠的同事就會(huì)主動(dòng)買下,以便更好地研究黑色產(chǎn)業(yè)所使用的破解技術(shù),有針對(duì)性地補(bǔ)上漏洞。
過去,3D假體面具、播放人臉視頻等冒充手段或許可以騙過人臉識(shí)別系統(tǒng),但隨著技術(shù)的精密化處理,這些陰謀現(xiàn)在已經(jīng)無法得逞了。曠視科技開始做人臉識(shí)別簽到機(jī)時(shí),使用五點(diǎn)來識(shí)別身份,分別是兩個(gè)瞳孔、鼻尖和兩個(gè)嘴角。因?yàn)樽R(shí)別點(diǎn)少,系統(tǒng)識(shí)別靈敏度不高,如果識(shí)別對(duì)象換個(gè)發(fā)型、戴個(gè)鏡框眼鏡,就可能識(shí)別失敗。但現(xiàn)在,根據(jù)人臉識(shí)別系統(tǒng)的算法,曠視科技識(shí)別用戶面部的特征點(diǎn)已經(jīng)達(dá)到83個(gè),甚至不需要用戶配合看鏡頭,這就為人臉識(shí)別技術(shù)開拓了另一個(gè)可能的應(yīng)用領(lǐng)域:安防。
印奇認(rèn)為,一個(gè)人工智能創(chuàng)業(yè)公司除了掌握技術(shù)外,還要走商業(yè)化道路,技術(shù)平臺(tái)、商業(yè)落地的方向兩者缺一不可,唯有如此,才能最終快速實(shí)現(xiàn)數(shù)據(jù)循環(huán)。只有在商業(yè)模式、數(shù)據(jù)模式上形成網(wǎng)絡(luò)協(xié)同效應(yīng),公司才有可能形成行業(yè)壁壘,避免同行的技術(shù)趕超。
曠視科技涉及上億人的刷臉,通過云端平臺(tái)FaceID.com,曠視科技打通了Smart ID的線上和線下。無論是線上的賬號(hào),還是線下的一張卡,一把鑰匙,或者一個(gè)智能門禁,都可能成為虛擬化的入口。曠視科技比較有代表性的客戶包括支付寶、Uber、萬科等,萬科是曠視科技在線下化的體驗(yàn),未來會(huì)實(shí)現(xiàn)一個(gè)智能園區(qū)。此外,曠視科技覆蓋了幾乎全部的移動(dòng)出行領(lǐng)域,用來幫助平臺(tái)對(duì)司機(jī)身份進(jìn)行審核。不難預(yù)料,未來在快遞、物流行業(yè)等越來越多的現(xiàn)實(shí)場(chǎng)景中,也需要這樣一個(gè)刷臉平臺(tái),把互聯(lián)網(wǎng)用戶變成高附加值的商業(yè)互聯(lián)網(wǎng)用戶。
至于線下刷臉,在我國(guó)地鐵、飛機(jī)場(chǎng)、火車站等人流量較密集的場(chǎng)所,都分布有曠視科技提供的人臉識(shí)別系統(tǒng),可用于交通綜合治理或者追捕逃犯等。在安防領(lǐng)域,刷臉技術(shù)有更多應(yīng)用的空間。曠視的“天眼”系統(tǒng)和公安部門合作,搭建了“三逃”人員的身份證圖片庫(kù),通過公共場(chǎng)所的監(jiān)控?cái)z像頭,進(jìn)行實(shí)時(shí)比對(duì)。除了確認(rèn)面部特征外,刷臉系統(tǒng)還會(huì)根據(jù)身高、體重、步態(tài)、穿著等進(jìn)行綜合判斷。一旦攝像頭中的人臉與數(shù)據(jù)庫(kù)相匹配,系統(tǒng)就會(huì)瞬間報(bào)警,公安部門則會(huì)立即響應(yīng),進(jìn)一步確認(rèn)。不僅是抓捕逃犯,在人臉識(shí)別系統(tǒng)的幫助下,安防體系還會(huì)逐漸向事前、事中推進(jìn)。比如,如果一個(gè)人在車站的出現(xiàn)頻率超乎正常旅客的范圍,又非車站工作人員,就要考慮是扒手的可能性。人臉識(shí)別技術(shù)和遍布的智能化監(jiān)控?cái)z像頭相結(jié)合,使得一個(gè)“7×24”小時(shí)監(jiān)控的龐大系統(tǒng)成為可能。
綜合線上和線下的場(chǎng)景,曠視科技所做的就是用刷臉的方式來結(jié)構(gòu)化物理世界,提取所有商業(yè)場(chǎng)景中由人產(chǎn)生的身份和行為等信息,以打通線上線下商業(yè)數(shù)據(jù)、傳遞商業(yè)價(jià)值。
事實(shí)上,在現(xiàn)階段,任何一家人工智能公司都不太可能覆蓋多個(gè)行業(yè)。這里涉及到“+AI”和“AI+”兩個(gè)概念,“+AI”是指人工智能公司實(shí)際上并沒有深入到任何行業(yè),而只是給一些行業(yè)應(yīng)用者提供了深度學(xué)習(xí)的能力或者作為某一項(xiàng)技術(shù)的外包方而存在;“AI+”是指人工智能公司能夠與行業(yè)深度結(jié)合,并使其成為由AI驅(qū)動(dòng)的新行業(yè),比如新金融、新安防。印奇認(rèn)為,在過去一年時(shí)間里,第一批人工智能公司都在完成自己的商業(yè)化嘗試,但至少到2018年底,這些商業(yè)化嘗試的效果才能凸顯出來。
曠視三步
自2011年成立至今,曠視科技已由3人的初創(chuàng)團(tuán)隊(duì)發(fā)展到一個(gè)有著70多人團(tuán)隊(duì)的“獨(dú)角獸”公司,規(guī)模稱不上大,卻面臨著很多競(jìng)爭(zhēng)對(duì)手。在曠視科技獲得1億美元融資之后,2017年7月,同以人臉識(shí)別為主營(yíng)業(yè)務(wù)的商湯科技宣布完成4.1億美元融資。
在印奇看來,激烈的競(jìng)爭(zhēng)并非是壞事,有競(jìng)爭(zhēng),才有進(jìn)步。他將競(jìng)爭(zhēng)對(duì)手分為三類:一類是近幾年在人工智能資本泡沫催生下的新公司,其中不乏在人臉識(shí)別垂直領(lǐng)域做得較好的公司,但在短期內(nèi)不會(huì)對(duì)曠視科技構(gòu)成威脅;一類是人工智能技術(shù)排在前列的外國(guó)公司:谷歌、Facebook、亞馬遜;一類是行業(yè)內(nèi)的競(jìng)爭(zhēng)對(duì)手,例如安防行業(yè)。印奇表示曠視科技現(xiàn)在規(guī)模還比較小,切入點(diǎn)也與那些大公司不同,因此還需要一段時(shí)間的沉淀。
除了應(yīng)對(duì)外部激烈的競(jìng)爭(zhēng),曠視科技還面臨科學(xué)技術(shù)與倫理道德相互博弈的挑戰(zhàn)。近年來,隨著技術(shù)的不斷進(jìn)步,人工智能領(lǐng)域已經(jīng)引發(fā)了人們對(duì)于個(gè)人隱私泄露的擔(dān)憂。在一些國(guó)家,在十字路口抓拍違規(guī)行為都被視為侵犯隱私。
作為人臉識(shí)別技術(shù)的研發(fā)者,印奇始終堅(jiān)持主流的“技術(shù)中性論”,他認(rèn)為技術(shù)本身沒有對(duì)錯(cuò),關(guān)鍵是如何進(jìn)行使用,法律法規(guī)和社會(huì)價(jià)值觀都可以引導(dǎo)人們正確地使用原本中性的技術(shù)。此外,他還相信,技術(shù)本身的發(fā)展也可以打消人們對(duì)于隱私泄露的顧慮。比如,一切私人場(chǎng)所的個(gè)人數(shù)據(jù)都需要被當(dāng)事人授權(quán)后,才能被采集和使用。個(gè)人數(shù)據(jù)需要經(jīng)過脫敏處理才能入庫(kù),一張有姓名的照片會(huì)被隱去名字,以內(nèi)部ID號(hào)儲(chǔ)存,公開數(shù)據(jù)則依賴于系統(tǒng)自身的訓(xùn)練和提升。印奇認(rèn)為,與技術(shù)本身相比,真正掌握技術(shù)的人所選擇的方向更為重要。
曠視科技將未來戰(zhàn)略分為三步:識(shí)人、識(shí)圖和機(jī)器大腦。識(shí)人即人臉識(shí)別。識(shí)圖即萬物識(shí)別,包括人臉、車輛、行人、文字等,這些信息是圖像中最有價(jià)值的部分。如果能夠?qū)崿F(xiàn)對(duì)車輛、行人和交通標(biāo)志牌的識(shí)別與計(jì)算,無人駕駛汽車就會(huì)呼之欲出。將視覺推而廣之,實(shí)現(xiàn)更廣義的機(jī)器思考,就是機(jī)器大腦。
提及未來的技術(shù)時(shí),印奇預(yù)測(cè),未來20年內(nèi),人工智能將是最重要的技術(shù),很多科幻片里的場(chǎng)景都可能成為現(xiàn)實(shí)。感知型技術(shù)也就是語(yǔ)音和視覺技術(shù),成為目前亟待攻克的AI技術(shù),包括視覺的感知與理解、語(yǔ)音交互和自然語(yǔ)言理解,因?yàn)檫@關(guān)系著機(jī)器能否看懂世界并與人進(jìn)行交互的重大命題。解決了這兩個(gè)問題,其他問題都可以迎刃而解。