文/本刊記者 張斯絮
“機(jī)器之眼”,站在大數(shù)據(jù)時(shí)代的下一個(gè)風(fēng)口
文/本刊記者張斯絮
當(dāng)你做到了無(wú)人能及,想淘金還難嗎?
最近,“外星人”馬云有了一個(gè)新昵稱(chēng)“刷臉帝”。今年3月,在德國(guó)漢諾威IT博覽會(huì)開(kāi)幕式上,他當(dāng)場(chǎng)從淘寶網(wǎng)上“拍”得一枚1948年的漢諾威紀(jì)念郵票作為贈(zèng)禮。令世界為之驚艷的是,到了付款階段,他沒(méi)有采用傳統(tǒng)的密碼輸入認(rèn)證,而是對(duì)著手機(jī)攝像頭微微一笑,通過(guò)“掃臉”完成了支付。
在炫酷的“刷臉付”背后,一家年輕的創(chuàng)業(yè)企業(yè)——北京曠視科技有限公司浮出水面。三位來(lái)自清華的85后計(jì)算機(jī)“學(xué)霸”,經(jīng)過(guò)四年的摸爬滾打發(fā)展出近60人的團(tuán)隊(duì),自信已經(jīng)成長(zhǎng)為目前世界最大的人臉識(shí)別技術(shù)平臺(tái),并于2014年9月完成了4700萬(wàn)美元的B輪融資。站在C輪融資的門(mén)檻上,曠視科技的市場(chǎng)與品牌部負(fù)責(zé)人謝憶楠首次披露了公司的戰(zhàn)略思維:“刷臉不過(guò)是個(gè)起點(diǎn)。我們要實(shí)現(xiàn)的是看懂世界的機(jī)器之眼。”
“我們真講不出那些含血含淚的故事,只有一群技術(shù)咖一步一個(gè)腳印地專(zhuān)注和執(zhí)著”,謝憶楠上來(lái)便給記者打了預(yù)防針。
他們是三位標(biāo)準(zhǔn)的“極客”——印奇、唐文斌、楊沐,一同出自旨在培養(yǎng)計(jì)算機(jī)精英的清華大學(xué)姚期智實(shí)驗(yàn)班。唐文斌,從初中起就參加信息學(xué)編程比賽,在各類(lèi)編程比賽中榜上有名,并擔(dān)任國(guó)家信息學(xué)競(jìng)賽總教練7年之久;楊沐,曾獲國(guó)際信息編程奧林匹克比賽金牌;印奇,自大二起就在微軟亞洲研究院實(shí)習(xí),參與研發(fā)的人臉識(shí)別引擎后來(lái)被廣泛應(yīng)用于X-box和Bing等微軟產(chǎn)品中。
2011年,三個(gè)小伙伴窩在宿舍里初試身手,研發(fā)了國(guó)內(nèi)首款基于iOS的移動(dòng)體感游戲。在《烏鴉來(lái)了》中,玩家通過(guò)搖晃頭部控制游戲里的稻草人,攔截從天而降偷食莊稼的烏鴉。這款小游戲,讓他們?cè)诙唐趦?nèi)累積了40萬(wàn)用戶(hù),一度沖上APPStore排行榜的前5名,贏得了清華大學(xué)第三十屆“挑戰(zhàn)杯”特等獎(jiǎng),也拿到了聯(lián)想之星提供的幾百萬(wàn)元天使投資。最激動(dòng)人心的,還有投資人的認(rèn)定與預(yù)言:“過(guò)不了幾年,人臉登陸、人臉?biāo)阉鞫紝⒊蔀楝F(xiàn)實(shí),有著廣闊的應(yīng)用場(chǎng)景”。
曠視科技于當(dāng)年順理成章地成立,很快即在2012年推出Face++平臺(tái),面向不同領(lǐng)域的開(kāi)發(fā)者、企業(yè)以及個(gè)人提供免費(fèi)的人臉識(shí)別技術(shù)服務(wù)。事實(shí)上,彼時(shí)已有Google、Facebook、百度等互聯(lián)網(wǎng)巨頭正在布局人臉識(shí)別領(lǐng)域,然而“曠視”打出了一種差異化策略。唐文斌說(shuō):“第一,我們要比他們做得好,跑得快;第二,大公司不可能把技術(shù)開(kāi)放,而我們開(kāi)放?!?/p>
在公司的創(chuàng)立階段,有一位大咖的思想對(duì)其影響至深,他是李開(kāi)復(fù)。李開(kāi)復(fù)不僅攜創(chuàng)新工場(chǎng)分別在2013年、2014年的兩輪融資中給予了“曠視”強(qiáng)有力的支持,而且親自在這家小企業(yè)中擔(dān)任董事。在他生病前的一年里,每?jī)芍芏紩?huì)和團(tuán)隊(duì)核心成員見(jiàn)面聊一次,甚至?xí)蝗唤ㄗh開(kāi)發(fā)一個(gè)APP,以快速獲取用戶(hù)數(shù)據(jù)。
李開(kāi)復(fù)強(qiáng)調(diào):“如果有兩個(gè)客戶(hù),一個(gè)客戶(hù)可以給你一年100萬(wàn)元的錢(qián),另一個(gè)可以給你一年貢獻(xiàn)1000萬(wàn)的數(shù)據(jù),那么一定要選擇后者?!边@句話讓印奇至今難忘。他說(shuō)人臉識(shí)別所用到的深度學(xué)習(xí)算法,是一套模擬人腦的神經(jīng)網(wǎng)絡(luò)算法,如果打一個(gè)比方,印奇喜歡稱(chēng)之為“嬰兒智力的黑盒”,因?yàn)椤叭腴T(mén)容易,精深很難”。深度學(xué)習(xí)高度依賴(lài)于數(shù)據(jù),為了持續(xù)優(yōu)化算法,又必須不斷給它喂海量數(shù)據(jù)。
四年來(lái),免費(fèi)而開(kāi)放的“好用”模式已經(jīng)形成巨大的集群效應(yīng)。如今,F(xiàn)ace++平臺(tái)的圖庫(kù)數(shù)量已經(jīng)超越10億級(jí),包括阿里、聯(lián)想、世紀(jì)佳緣、美圖秀秀等一大批國(guó)內(nèi)外IT企業(yè)都在與之合作,移動(dòng)端幾乎所有與人臉識(shí)別相關(guān)的APP都在享用“曠視”的服務(wù)。
“Face++這個(gè)云服務(wù)平臺(tái)的調(diào)用量已經(jīng)累計(jì)超過(guò)了62億次,證明我們的算法已經(jīng)經(jīng)過(guò)了62億次的訓(xùn)練”,謝憶楠介紹,“這足以支撐我們成為世界上最大的人臉識(shí)別技術(shù)平臺(tái)?!睘槭裁础皶缫暱萍肌蹦茉?014年連續(xù)摘得FDDB(人臉檢測(cè))、300-W(人臉關(guān)鍵點(diǎn)檢測(cè))、LFW(互聯(lián)網(wǎng)圖片人臉識(shí)別)三項(xiàng)國(guó)際評(píng)測(cè)的桂冠?這就是重要的秘笈之一。
人人都知道,互聯(lián)網(wǎng)經(jīng)濟(jì)進(jìn)入一個(gè)免費(fèi)時(shí)代??勺鳛槠髽I(yè),不盈利如何形成造血機(jī)制?
2014年以來(lái),這也是曠視科技CEO印奇常常思考的問(wèn)題。他認(rèn)為到了相對(duì)成熟的階段,泛泛收集數(shù)據(jù)已經(jīng)沒(méi)有太大意義,只有讓技術(shù)落地,形成一個(gè)又一個(gè)可供商業(yè)化的產(chǎn)品,才能證明整個(gè)公司的模式可以走通。
也許你能想到“曠視”與美圖秀秀、美顏相機(jī)的合作方式:通過(guò)“人臉檢測(cè)、追蹤”快速捕捉到人臉區(qū)域,精確定位面部的關(guān)鍵點(diǎn),包括眉、眼、口、鼻,以及整體輪廓等,從而進(jìn)行美化處理;
但是你能想到它是如何服務(wù)于互聯(lián)網(wǎng)“紅娘”世紀(jì)佳緣的嗎?如果你有中意的人臉照片,那么通過(guò)“大規(guī)模人臉?biāo)阉鳌保現(xiàn)ace++便能從海量的數(shù)據(jù)庫(kù)中發(fā)現(xiàn)匹配度最高、相貌最相似的那個(gè)TA;
估計(jì)你更想不出一個(gè)傳統(tǒng)的餐飲企業(yè)——海底撈火鍋是如何用到Face++的!謝憶楠告訴記者,其實(shí)在“刷臉付”之前,“曠視”早有一款落地產(chǎn)品投入商用。它是一個(gè)可以進(jìn)行動(dòng)態(tài)人臉識(shí)別的“智能迎賓機(jī)器人”。放在公司門(mén)口,它可能是一個(gè)操控門(mén)的智能門(mén)禁;放在會(huì)場(chǎng),它可能是一套嘉賓簽到系統(tǒng)……而對(duì)于“海底撈”,它是一套VIP識(shí)別服務(wù)。不需要出示身份,還沒(méi)等貴賓進(jìn)門(mén),系統(tǒng)已經(jīng)通過(guò)“1:1人臉驗(yàn)證”把他的姓名推送到了前臺(tái)。
而當(dāng)互聯(lián)網(wǎng)金融的大潮涌來(lái),“曠視”看到了更大的市場(chǎng)前景。幾乎所有的銀行、金融以及交通業(yè)務(wù)都要實(shí)現(xiàn)“實(shí)名制”線上面簽。那么如何證明“你是你”,“你媽是你媽”這樣看似荒謬而又客觀存在的問(wèn)題?最靠譜的驗(yàn)證渠道就是生物特征,而在中國(guó),你的身份證上只有一種生物信息——人臉?!皶缫暋蹦軌驇椭髽I(yè)做到的是:只要用戶(hù)面對(duì)電腦或手機(jī)的前置攝像頭,根據(jù)頁(yè)面指令做出幾個(gè)簡(jiǎn)單動(dòng)作,例如搖搖頭、眨眨眼,動(dòng)動(dòng)嘴巴,數(shù)據(jù)便被發(fā)送到云端后與公安部的備份照片進(jìn)行比對(duì)。也許就是坐在家中的短短幾分鐘,銀行開(kāi)戶(hù)這件麻煩事就能輕松搞掂了!
至于免費(fèi)和商業(yè)是否矛盾,印奇認(rèn)為,對(duì)于用戶(hù)“曠視”將繼續(xù)保持免費(fèi)模式,而對(duì)于企業(yè),只有提供定向化的商業(yè)產(chǎn)品,才有可能進(jìn)一步獲取垂直領(lǐng)域更有價(jià)值的數(shù)據(jù)。也只有試過(guò)才知道,其實(shí)“商用”和“數(shù)據(jù)”一定是一對(duì)相輔相成的作用力。
這應(yīng)該是幾種不難想象的模式:
通過(guò)北京二環(huán)路上的一部攝像頭,解析每天過(guò)橋的車(chē)流量有多少,哪些時(shí)段最容易發(fā)生擁堵,哪些時(shí)段又發(fā)生了碰撞,碰撞的車(chē)輛分別是什么顏色、什么品牌的;通過(guò)一段比賽的視頻,分析每支球隊(duì)的得分情況、違規(guī)次數(shù),以及球員的臨場(chǎng)表現(xiàn);通過(guò)一張海邊的照片,來(lái)計(jì)算當(dāng)?shù)氐臐穸?,每天太?yáng)升起的時(shí)間和高度角,作為氣象學(xué)判斷的依據(jù)……
“很多人都以為我們只是做人臉識(shí)別的”,謝憶楠笑笑。其實(shí)一直以來(lái),“曠視”都有一個(gè)更宏偉的目標(biāo)——“重新定義圖片和視頻的價(jià)值”。
如果兩年前大家還習(xí)慣于把互聯(lián)網(wǎng)生態(tài)稱(chēng)之為“信息時(shí)代”,那么當(dāng)下更恰當(dāng)?shù)恼f(shuō)法應(yīng)該是“數(shù)據(jù)時(shí)代”。可是數(shù)據(jù)從何而來(lái)?除了電子交易的方式,“曠視”希望用一種算法的革命讓所有的攝像頭都成為數(shù)據(jù)采集的來(lái)源。
那么,如何實(shí)現(xiàn)看懂世界的“機(jī)器之眼”?一方面,“曠視”要去做攝像頭等硬件設(shè)備的更新?lián)Q代;另一方面,去研究如何提取圖片和視頻中的可用信息,這是“曠視”的另一個(gè)平臺(tái)Image++目前正在做的事:從文字、車(chē)輛、行人、場(chǎng)景等入手,按照物品信息價(jià)值的優(yōu)先級(jí),一步一步去強(qiáng)化機(jī)器識(shí)別“萬(wàn)物”的能力。
從刷“臉”,到刷“萬(wàn)物”,這就是“曠視”面向C輪融資的戰(zhàn)略規(guī)劃。不會(huì)玩噱頭,也沒(méi)必要搞小動(dòng)作,一切都將是水到渠成的事。當(dāng)記者問(wèn)及“會(huì)不會(huì)預(yù)想到一些困難”的時(shí)候,被謝憶楠反問(wèn):“當(dāng)你做到了無(wú)人能及,想淘金還難嗎?”