賈宇航
作為與“新基建”有著強(qiáng)關(guān)聯(lián)性的AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè),將迎來(lái)潛力較大的市場(chǎng)空間。據(jù)統(tǒng)計(jì),2018年中國(guó)AI基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模為25.86億元,其中數(shù)據(jù)資源定制服務(wù)占比86%,預(yù)計(jì)2025年市場(chǎng)規(guī)模將突破113億元。隨著算法需求越來(lái)越旺盛,依賴人工標(biāo)注不能滿足市場(chǎng)需求,因此增強(qiáng)數(shù)據(jù)處理平臺(tái)持續(xù)學(xué)習(xí)能力,由機(jī)器持續(xù)學(xué)習(xí)人工標(biāo)注,提升預(yù)標(biāo)注和自動(dòng)標(biāo)注能力對(duì)人工的替代率將成趨勢(shì)。
從5G、人工智能、工業(yè)互聯(lián)網(wǎng)、大數(shù)據(jù)、新能源、城際高鐵、特高壓等新基建涉及的領(lǐng)域來(lái)看,我們能夠發(fā)現(xiàn),新型基礎(chǔ)建設(shè)的這些領(lǐng)域有個(gè)共同的特點(diǎn),它們都具有“管道”的特性。如何去理解“管道”這一特性,例如5G的基建,它是一種信息的傳遞;工業(yè)互聯(lián)網(wǎng)的基建,它是從物品等原材料變成成品的一個(gè)過(guò)程;特高壓的基建,它是為了能源的傳遞。而人工智能,實(shí)際上也扮演了“管道”作用,現(xiàn)實(shí)世界和虛擬世界通過(guò)互聯(lián)網(wǎng)技術(shù)、人工智能技術(shù),逐漸把現(xiàn)實(shí)世界轉(zhuǎn)化成為虛擬場(chǎng)景,同樣通過(guò)技術(shù)手段也可以將很多虛擬數(shù)據(jù)轉(zhuǎn)化成為現(xiàn)實(shí)對(duì)應(yīng)的具像化的實(shí)景。
圖1 2017-2025年全球人工智能市場(chǎng)規(guī)模
來(lái)源:德勤
從人工智能的發(fā)展過(guò)程來(lái)看,人工智能目前正處于落地的階段,對(duì)應(yīng)的AR、VR、智慧城市、無(wú)人零售、自動(dòng)駕駛、智能制造、智能家電等,這些細(xì)分領(lǐng)域的人工智能是在各行各業(yè)都有一些對(duì)應(yīng)的落地場(chǎng)景。反之這些領(lǐng)域?qū)?yīng)的人工智能,其背后有三個(gè)要素基礎(chǔ)——算法、數(shù)據(jù)、算力。其中“算法”是人類對(duì)應(yīng)機(jī)器學(xué)習(xí)的一種工作模式,例如人臉識(shí)別算法,就是它對(duì)應(yīng)的人臉識(shí)別的相關(guān)方法。而“數(shù)據(jù)”,則是人們?yōu)榱私虝?huì)人工智能學(xué)習(xí)方法所需要的訓(xùn)練數(shù)據(jù)?!八懔Α?,則是機(jī)器在運(yùn)行、學(xué)習(xí)、訓(xùn)練過(guò)程中消耗的運(yùn)算資源。
在真正的應(yīng)用過(guò)程中我們會(huì)發(fā)現(xiàn),算法、數(shù)據(jù)、算力這三個(gè)要素是既相輔相成又相互制約的存在。算法其軌跡向深度神經(jīng)網(wǎng)絡(luò)的突破,這就導(dǎo)致很多應(yīng)用場(chǎng)景落地,進(jìn)而有更多數(shù)據(jù)得以用于訓(xùn)練,算力也會(huì)因?yàn)樗牧慨a(chǎn)而更加便宜,以上這些過(guò)程也會(huì)同時(shí)再促進(jìn)算法提升。反觀之,一些行業(yè)也可能因?yàn)檫t遲沒有可以用于訓(xùn)練的數(shù)據(jù)產(chǎn)生,導(dǎo)致算法和算力在該領(lǐng)域的落地處于停滯狀態(tài),這就是人工智能中對(duì)應(yīng)出現(xiàn)的既相互促進(jìn)又相互制約的方式。
人工智能是一個(gè)較為寬泛的概念,機(jī)器學(xué)習(xí)是其中最重要的學(xué)科,神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)的一種方式,而深度神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)的加強(qiáng)版。人工智能的發(fā)展對(duì)應(yīng)著深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,實(shí)際上這只是算法層面的相互突破。從數(shù)據(jù)層面來(lái)說(shuō),數(shù)據(jù)上的突破在于,手機(jī)、電腦、照相機(jī)、打印機(jī)、掃描儀等大量的AIoT設(shè)備,它們可以將很多對(duì)應(yīng)的現(xiàn)實(shí)場(chǎng)景轉(zhuǎn)化成為虛擬化的數(shù)字資產(chǎn),并且通過(guò)互聯(lián)網(wǎng)分享、積累的形式讓這些內(nèi)容得以傳播,再配合算力資源的迭代、相關(guān)算法的提升,最終積累到一些人工智能產(chǎn)品的落地。
圖2 AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)發(fā)展歷程及展望
來(lái)源:艾媒咨詢
隨著人工智能發(fā)展到下一個(gè)階段,我們會(huì)發(fā)現(xiàn),已有通用的數(shù)碼產(chǎn)品所積累的數(shù)據(jù)已經(jīng)不足以對(duì)相關(guān)行業(yè)、產(chǎn)業(yè)進(jìn)行促進(jìn)和提升了,因此定制化的采集設(shè)備,像激光雷達(dá)、毫米波雷達(dá)、陣列麥克風(fēng)以及熱紅外傳感器,它們的使用能夠促進(jìn)多維度的數(shù)據(jù)收集,進(jìn)而轉(zhuǎn)化成為數(shù)據(jù),用于人工智能的訓(xùn)練,進(jìn)一步提升人工智能。從配合來(lái)說(shuō),由于這些數(shù)據(jù)還屬于被量產(chǎn)化的,或者說(shuō)普及度還不高,導(dǎo)致這些數(shù)據(jù)需要有特定場(chǎng)景的訓(xùn)練數(shù)據(jù),去彌補(bǔ)從互聯(lián)網(wǎng)得不到數(shù)據(jù)的缺失,以完成相對(duì)應(yīng)的人工智能相關(guān)算法的開發(fā)。
人工智能繼續(xù)發(fā)展,將進(jìn)入產(chǎn)品及AIoT設(shè)備的成熟階段,在這一階段中,產(chǎn)能提升導(dǎo)致產(chǎn)品及設(shè)備更加量產(chǎn)化、平民化,讓更多的用戶去使用,在這基礎(chǔ)上用戶使用過(guò)程中所產(chǎn)生的數(shù)據(jù)會(huì)進(jìn)一步改變下一代人機(jī)交互模式,以及改變?nèi)伺c人之間交互的模式。目前,很多人工智能對(duì)應(yīng)的場(chǎng)景處于即將落地的狀態(tài),或者說(shuō)一些對(duì)應(yīng)的行業(yè)正處于初級(jí)階段,在這一階段他們需要的就是定制化設(shè)備和場(chǎng)景訓(xùn)練數(shù)據(jù)。
為滿足產(chǎn)品的商業(yè)落地, 運(yùn)用的數(shù)據(jù)也有對(duì)應(yīng)不同的發(fā)展趨勢(shì),一是場(chǎng)景的多元化,二是樣本的多樣化,三是內(nèi)容的專業(yè)化。
具體來(lái)說(shuō), 場(chǎng)景的多元化是指由于深度神經(jīng)網(wǎng)絡(luò)的特點(diǎn),它是深度結(jié)合所對(duì)應(yīng)的場(chǎng)景。例如人臉識(shí)別在獲取數(shù)據(jù)時(shí)需要室內(nèi)的場(chǎng)景或是需要獲取某種特定角度的數(shù)據(jù),甚至人們?cè)趯?shí)際生活中應(yīng)用場(chǎng)景會(huì)更為復(fù)雜,或是它的長(zhǎng)尾場(chǎng)景非常多,那就要求我們?cè)趯?shí)際設(shè)計(jì)對(duì)應(yīng)場(chǎng)景過(guò)程中,以確保真正有標(biāo)的數(shù)據(jù)去用于機(jī)器訓(xùn)練。因此如果想要使得產(chǎn)品在某些特定場(chǎng)景中有更好的應(yīng)用,這就需要產(chǎn)品應(yīng)用能夠覆蓋更多元的場(chǎng)景。
樣本的多樣化是指要求AI需要具備普惠性。對(duì)于一款產(chǎn)品來(lái)說(shuō),不光是年輕人在使用它,同時(shí)老年人和兒童也在使用它。對(duì)于智能音箱這類智能交互設(shè)備來(lái)說(shuō),不光是中國(guó)人在使用它,還會(huì)有一部分海外用戶在使用它,智能音箱會(huì)接收到不同國(guó)家的語(yǔ)言以及同種語(yǔ)言的不同方言,在這個(gè)過(guò)程中AI就需要多樣化的樣本、多樣化的數(shù)據(jù),比如從年齡層面、方言層面、人種層面等確保AI產(chǎn)品具有普惠性作用。
內(nèi)容專業(yè)化是指隨著新基建的推進(jìn),物聯(lián)網(wǎng)擁抱人工智能的進(jìn)程也將加速,產(chǎn)業(yè)應(yīng)用領(lǐng)域也將不斷深入,有越來(lái)越多的具體問題需要引入行業(yè)專家。只有具備相應(yīng)的行業(yè)知識(shí)積累,才能更好服務(wù)于AIoT落地,進(jìn)行高質(zhì)量、專業(yè)化的數(shù)據(jù)產(chǎn)出。
云測(cè)數(shù)據(jù)作為AI數(shù)據(jù)行業(yè)的服務(wù)商,依托于高質(zhì)量AI數(shù)據(jù)交付、高效作業(yè)效率、數(shù)據(jù)隱私安全把控和技術(shù)平臺(tái)實(shí)力等優(yōu)勢(shì),除了AIoT領(lǐng)域,也為智能安防、智能駕駛、智慧金融、智慧城市、新零售、文娛等眾多領(lǐng)域提供AI數(shù)據(jù)服務(wù),和眾多企業(yè)建立了良好持久的合作關(guān)系。
受政策利好、物聯(lián)網(wǎng)發(fā)展迅猛、場(chǎng)景需求劇增的影響,AI數(shù)據(jù)服務(wù)行業(yè)發(fā)展利好。隨著AI與傳統(tǒng)行業(yè)的融合不斷加深,數(shù)據(jù)的量級(jí)以及復(fù)雜程度也將會(huì)大幅提升。聚焦在AIoT領(lǐng)域,作為AIoT場(chǎng)景落地的基礎(chǔ),高質(zhì)量的AI數(shù)據(jù)將持續(xù)發(fā)揮“基建”的作用,最大程度上提升人工智能、物聯(lián)網(wǎng)產(chǎn)業(yè)落地的效率和穩(wěn)定性。