一畝地
數(shù)據(jù)標(biāo)注是AI(人工智能)實(shí)現(xiàn)的基石,特別是ChatGPT的橫空出世,把AI的熱度推向了一個(gè)新的巔峰,那么作為整個(gè)AI產(chǎn)業(yè)鏈的基礎(chǔ)層支撐之一,數(shù)據(jù)標(biāo)注自然也不能被忽視。
行業(yè)現(xiàn)狀
2020年,人工智能訓(xùn)練師被正式納入國家職業(yè)分類目錄。一般來說,人工智能訓(xùn)練師主要分為數(shù)據(jù)標(biāo)注員和人工智能算法測試員。數(shù)據(jù)標(biāo)注從業(yè)人員在業(yè)內(nèi)有“AI民工”的稱號,由此不難看出數(shù)據(jù)標(biāo)注屬于勞動密集型產(chǎn)業(yè),具有機(jī)械性、重復(fù)性的特點(diǎn),而此類工作正是AI要取代的方向。如此看來,數(shù)據(jù)標(biāo)注行業(yè)似乎有種“舍身飼虎”的感覺。
其實(shí)不然,目前主流的機(jī)器學(xué)習(xí)方式以有監(jiān)督的深度學(xué)習(xí)方式為主,對于標(biāo)注數(shù)據(jù)有著強(qiáng)依賴性需求。且不說當(dāng)前AI的火熱會帶動數(shù)據(jù)標(biāo)注需求短時(shí)間內(nèi)增長,從長久來看,人類社會的發(fā)展是一個(gè)動態(tài)的過程,世界更是千變?nèi)f化,從中采集的數(shù)據(jù)自然也不會是一成不變的,而AI要進(jìn)化,就需要不斷地識別和學(xué)習(xí)經(jīng)過清洗、處理而成的結(jié)構(gòu)化數(shù)據(jù)。所以,只要AI存在一天,數(shù)據(jù)標(biāo)注就不會消亡。
好馬喂好料
如果把AI當(dāng)作一匹馬,隨著越來越多的AI應(yīng)用落地,現(xiàn)在的AI市場儼然一幅萬馬奔騰的畫面,要想在AI市場脫穎而出,唯有升級為“千里馬”。俗話說“好馬喂好料”,縱有算法千般好,沒有好的數(shù)據(jù)供其訓(xùn)練也只能“才美不外見”,這就對數(shù)據(jù)標(biāo)注行業(yè)提出了更高的要求。相比以往的低門檻,今后的數(shù)據(jù)標(biāo)注從業(yè)人員需要具備更加專業(yè)的知識。如發(fā)展醫(yī)療、法律、金融、工業(yè)等專業(yè)化水平較高的AI技術(shù),就需要具備一定專業(yè)知識的人進(jìn)行數(shù)據(jù)標(biāo)注工作。在這方面,大型的工廠式數(shù)據(jù)標(biāo)注公司在技術(shù)儲備、人員培訓(xùn)方面的優(yōu)勢就得以顯現(xiàn),會進(jìn)一步擠壓中小型工作室的生存空間。
有多少人工就有多少智能
AI行業(yè)有一句話“有多少人工就有多少智能”,在ChatGPT獨(dú)領(lǐng)風(fēng)騷、AI概念高熱不退的當(dāng)下,仍有成千上萬的AI訓(xùn)練師做著枯燥的流水線式標(biāo)注工作。他們多就職于三四線城市的中小型工作室(人數(shù)由幾十人到幾百人不等),收入較低,難以獲得福利保障。他們多數(shù)學(xué)歷較低、就業(yè)競爭優(yōu)勢不大,其中不乏殘障人士等無法從事正常工作的特殊群體,而且他們又極有可能是AI在數(shù)據(jù)標(biāo)注行業(yè)最先取代的人。
與大型公司相比,工作室能接到的項(xiàng)目資源通常不穩(wěn)定,且經(jīng)過層層轉(zhuǎn)包,到了最后一層,自然沒有多少利潤,也導(dǎo)致了從業(yè)人員的薪資普遍較低。究其原因,是數(shù)據(jù)標(biāo)注行業(yè)發(fā)展粗放、缺乏規(guī)范。今后數(shù)據(jù)標(biāo)注的標(biāo)準(zhǔn)會更高,競爭也會愈發(fā)激烈,數(shù)據(jù)標(biāo)注公司需要去思考怎樣提高效率、培訓(xùn)員工、規(guī)范行業(yè),以及承擔(dān)更多的社會責(zé)任。
結(jié)語
發(fā)展科學(xué)技術(shù)的根本目的是解放生產(chǎn)力,把人類從繁重的體力勞動中解放出來。數(shù)據(jù)標(biāo)注和算法研究一樣為AI行業(yè)發(fā)光發(fā)熱,為人類美好的明天做出貢獻(xiàn)。