張鑫
我們公司的名字叫曠視科技,F(xiàn)ace++是曠視科技的第一條產(chǎn)品線。由于在開發(fā)者的生態(tài)里面,大家對于Face++的了解程度更高,它逐步成為公司的代名詞。
今天既然我們的主題是講數(shù)據(jù),就一起看大數(shù)據(jù)和AI的一些案例。中國是一個人口大國,長得非常像的人也多,經(jīng)常會認錯。我們做過一個測試,專業(yè)間諜人員在看完100多人的圖像之后進行比對,比對精準性就會直線下降,原因是通過人的認知去判定都會產(chǎn)生一種腦補的情節(jié),但機器就可以解決這個問題。我們通過化妝或者一些PS手段,可能會展現(xiàn)出一個不一樣的自己,再通過人臉識別去辨認,如何辨認到位?如何分清楚到底是否為同一個人?還是很具有挑戰(zhàn)性的。機器通過學習以后可以有效辨別人的化妝變化,如何保證比對精準度呢?機器在去做比對的時候,它的依據(jù)是人臉上的特征,不是通過人眼所認知到的比較外在的一些理解方式。
從技術(shù)角度出發(fā),如果不能有效辨別數(shù)據(jù)的真假性,會對我們的認證結(jié)果帶來非常大的擾動。我們看到,人臉識別這件事說到底是一個實驗室產(chǎn)物,但還是可以應(yīng)用在實際的商業(yè)環(huán)境中。馬云在德國漢諾威通過刷臉支付送給德國總理默克爾一套郵票,這個事件可以作為一個里程碑事件,標志著人臉識別技術(shù)已經(jīng)能夠滿足金融級的需求。恰恰是這樣的技術(shù)推動,使大家逐步了解到作為算法提供商,曠視科技一直致力于提供商業(yè)化的優(yōu)秀算法。
我們看一下中美在這十年間AI的發(fā)展情況,美國對于基礎(chǔ)研究的重視程度遠遠高于中國,其實在競爭過程中,我們的最大優(yōu)勢集中表現(xiàn)在,中國有非常好的數(shù)據(jù)資源和非常好的商業(yè)實踐環(huán)境,我們能夠把算法和場景有機地結(jié)合起來,使AI能夠得到發(fā)展。這得益于幾個關(guān)鍵點:第一個叫算法,第二個叫算力,還有一個是數(shù)據(jù),這是原來的三大元素。但是我們認為還有一項非常重要,就是場景,脫離了場景,脫離了來源于生產(chǎn)的環(huán)境數(shù)據(jù),我們做的所有訓(xùn)練,只能是實驗室的產(chǎn)物,無法解決現(xiàn)實問題。
在發(fā)展過程中,曠視對于AI成長有自己的觀察。從算法的不斷迭代到軟件的封裝,延伸到解決方案,這些應(yīng)用方案又能產(chǎn)生更多的數(shù)據(jù),這些數(shù)據(jù)能更好地解決行業(yè)問題,這本身就是一個比較好的商業(yè)閉環(huán)。在這個過程中,我們可以解決技術(shù)從0到1、從1到N以及如何產(chǎn)業(yè)化的問題。在技術(shù)環(huán)節(jié),我們非常關(guān)注在整個數(shù)據(jù)訓(xùn)練的這個閉環(huán)中如何提升效率。
從0到1,核心是要有一個完整的商業(yè)閉環(huán),完成整個商業(yè)閉環(huán),就意味著我們可以利用行業(yè)數(shù)據(jù)去提升算法的性能,在算法的性能提升之后,在應(yīng)用中會產(chǎn)生更多的數(shù)據(jù),這些數(shù)據(jù)就像滾雪球一樣發(fā)展,不斷地提升行業(yè)中AI應(yīng)用實現(xiàn)的可能性。從1到N,如何高效地將這樣一種商業(yè)模式推廣下去?我們來看一下在推廣過程中的幾個環(huán)節(jié),我們知道信息系統(tǒng)有一個生態(tài),包含基礎(chǔ)設(shè)施、商業(yè)核心以及行業(yè)加速?;A(chǔ)設(shè)施是通過物理層幫助我們在前端去收集數(shù)據(jù)或者產(chǎn)生數(shù)據(jù),拆開來看,芯片、服務(wù)、傳感器這些都是我們獲取數(shù)據(jù)的方式。在商業(yè)核心這個環(huán)節(jié),曠視本身的業(yè)務(wù)更加關(guān)注算法、產(chǎn)品和數(shù)據(jù),核心問題是我們要解決行業(yè)中存在的問題,通過AI的方式去賦能,建立基礎(chǔ)信息庫,并且不斷完善。行業(yè)加速需要資本的力量去推動,并不斷復(fù)制好的商業(yè)模式。在整個生態(tài)中,曠視對自己的定位是一個解決方案提供商,我們希望能夠在某些垂直領(lǐng)域解決一系列的問題,這些問題恰恰可以為行業(yè)用戶提升應(yīng)用價值。在曠視的發(fā)展過程中,我們非常關(guān)注與投資方的合作,不單看重資本的融資力量,我們更加關(guān)注的是如何將這種技術(shù)落地到不同的應(yīng)用場景中。所以,曠視在選擇投資方的時候非常注重,能否利用投資方的資源更好地實現(xiàn)從0到1的突破。
另外,如何去實現(xiàn)AI的平臺化?如果每一個行業(yè)我們都要建立一個閉環(huán)的話,從1到100的加速時間是一個公司無法做到的。在這個過程中,AI平臺化非常必要。要促進產(chǎn)業(yè)升級,使AI賦能產(chǎn)業(yè)化,離不開三點:在線化、數(shù)據(jù)化、智能化。在很多傳統(tǒng)行業(yè)里,獲取數(shù)據(jù)的成本非常高,有很多數(shù)據(jù)不宜獲取,數(shù)據(jù)價值決定了在線化是未來的方向。實現(xiàn)了在線化之后,我們可以提前定義哪些數(shù)據(jù)可以有效利用起來,在線化發(fā)展是未來的一個必然趨勢。智能化所解決的問題決定了數(shù)據(jù)化的維度,到底哪些數(shù)據(jù)是必要的,哪些數(shù)據(jù)是有用的,如果我們想清楚了這些問題,數(shù)據(jù)化的維度自然也是可以被定義出來的。
我們認為,剛需比較明確的行業(yè)像金融、安防、媒體等,都是我們目前覆蓋的行業(yè)。三年之內(nèi),我們認為在零售、物流、手機、保險、制造業(yè)等,通過數(shù)據(jù)積累和產(chǎn)品定義可以拓展行業(yè)爆發(fā)空間。五年左右的時間,我們認為在醫(yī)療、AR、自動駕駛、機器人等這些行業(yè)里,產(chǎn)品會達到一個真正的爆發(fā)期。所有有攝像頭的地方,小到手機,大到城市安防監(jiān)控,有攝像頭的地方都是視覺解決方案和算法提供商所關(guān)注的價值點。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)