南之瑉
當(dāng)人工智能取代你的工作時,你可能不會失業(yè),但你的工作可能會變得更加陌生、孤立和枯燥,就像那數(shù)以百萬計的數(shù)據(jù)標(biāo)注員一樣。
從東非肯尼亞內(nèi)羅畢一所大學(xué)畢業(yè)幾個月后,30歲的喬找到了一份數(shù)據(jù)標(biāo)注的工作,主要是處理用于訓(xùn)練人工智能的原始數(shù)據(jù)。人工智能可以借助大量數(shù)據(jù)學(xué)習(xí)模式和規(guī)律,但首先,這些數(shù)據(jù)必須由人類進行分類和標(biāo)注。這些標(biāo)注員數(shù)量龐大,常常隱藏在機器之后,不為人知。喬的任務(wù)是為自動駕駛汽車標(biāo)注圖像數(shù)據(jù),逐幀識別所有攝像機角度下的車輛、行人、騎自行車的人以及司機需要注意的其他細(xì)節(jié)。這是一項繁瑣而重復(fù)的工作,一段幾秒鐘的視頻片段可能需要標(biāo)注8個小時,而且,喬僅僅為此獲得約10美元的報酬。
好在2019年,出現(xiàn)了一個新機會:喬替一家急需標(biāo)注員的新公司開展標(biāo)注訓(xùn)練,收入是之前的4倍。每兩周就有50名新學(xué)員在內(nèi)羅畢的一棟辦公樓開始學(xué)徒期。他們給對鏡自拍照中的衣服分類,通過掃地機器人的眼睛定位其所在的房間,并在摩托車的激光雷達掃描圖上畫框。一般情況下,會有超半數(shù)的學(xué)員未完成訓(xùn)練就選擇放棄。“有些人從來不懂什么叫堅持。”喬輕描淡寫地解釋道。同時,他也承認(rèn),這份工作確實單調(diào)乏味。
對于雇傭他們的公司,大多數(shù)人只知道它叫“雷默任務(wù)”。它運營著一個面向所有英語流利者的求職網(wǎng)站。喬并不知道“雷默任務(wù)”其實是硅谷數(shù)據(jù)供應(yīng)商“規(guī)模人工智能”下屬的子公司。規(guī)模人工智能估值數(shù)十億美元,其客戶包括開放人工智能公司和美國軍方。
對于開放人工智能公司的聊天生成式預(yù)訓(xùn)練轉(zhuǎn)換器(ChatGPT)等語言模型,公眾最為關(guān)注的往往是它們似乎準(zhǔn)備自動化所有工作。然而,即使是最卓越的人工智能系統(tǒng),背后也是人,是大量標(biāo)注數(shù)據(jù)來訓(xùn)練它并在數(shù)據(jù)混亂時整理數(shù)據(jù)的人。只有買得起數(shù)據(jù)的公司才能參與競爭,而這些公司也極有動力對數(shù)據(jù)保密。
當(dāng)前的人工智能熱潮——幾乎能以假亂真的聊天機器人、僅憑簡單提示就能生成藝術(shù)作品的智能工具以及這些技術(shù)背后的估值數(shù)十億美元的公司——基于一項前所未有的單調(diào)而重復(fù)的勞動。
公司能以盡可能低的成本收集大量的標(biāo)注數(shù)據(jù)用于訓(xùn)練模型。如果模型運作有效,至少從理論上來講,就不再需要數(shù)據(jù)標(biāo)注員了。然而實際上,數(shù)據(jù)標(biāo)注的工作從未真正停止過。正如研究者所言,機器學(xué)習(xí)系統(tǒng)非常脆弱,極易受到那些所謂“邊緣案例”的影響而出現(xiàn)問題,甚至導(dǎo)致災(zāi)難性后果。2018年,優(yōu)步一輛自動駕駛測試車就因未能正確處理“行人騎自行車穿越馬路”的情境,導(dǎo)致一名49歲的女性被撞死。隨著越來越多的人工智能系統(tǒng)被用來提供法律咨詢與醫(yī)療救助,可能產(chǎn)生的極端情況也就越多。這就需要更多的人來對數(shù)據(jù)進行分類和整理。這一現(xiàn)象催生了一個全球性的行業(yè),像喬這樣的人正利用他們獨特的人類能力來支持機器的發(fā)展。
很多數(shù)據(jù)標(biāo)注員都在訓(xùn)練最前沿的聊天機器人,他們實際做的工作卻大多瑣碎且重復(fù),旨在維持人工智能系統(tǒng)的正常運行。
這些工作包括分類抖音視頻的情感內(nèi)容、甄別垃圾郵件的新類型以及評估在線廣告的內(nèi)容是否恰當(dāng)?shù)鹊取S械臉?biāo)注員則分析信用卡交易與購物行為的關(guān)聯(lián),或檢查電商平臺推薦的效果,以判斷購買特定襯衫的顧客是否會對推薦的另一件襯衫感興趣。
數(shù)據(jù)標(biāo)注員的日常工作還包括糾正客服聊天機器人的回復(fù)、處理亞馬遜智能助理的請求,以及對視頻通話中的情緒進行分類。此外,他們在標(biāo)注食品時需要足夠細(xì)致,以防智能冰箱在遇到新包裝時判斷失誤,還要在安防攝像頭發(fā)出警報前進行校驗,甚至幫助困惑的無人駕駛拖拉機識別玉米。
人工智能合作組織的項目和研究負(fù)責(zé)人索南·金達爾說:“數(shù)據(jù)標(biāo)注是人工智能的基礎(chǔ)設(shè)施,人類智能是人工智能的基礎(chǔ)。我們必須認(rèn)識到,數(shù)據(jù)標(biāo)注是人工智能經(jīng)濟中的一項真實工作,它將在一段時間內(nèi)長期存在?!?/p>
標(biāo)注已成為一門大生意。
2022年底,喬開始注意到他的學(xué)生們常常抱怨無事可做。不久后,一封電子郵件告知他肯尼亞的培訓(xùn)營即將被關(guān)閉。他還可以繼續(xù)在線上訓(xùn)練數(shù)據(jù)標(biāo)注員,但他開始擔(dān)憂自己的職業(yè)未來。他聽說標(biāo)注業(yè)務(wù)正遷離肯尼亞,轉(zhuǎn)移至尼泊爾、印度和菲律賓。
與手機和汽車制造業(yè)不同,人工智能行業(yè)有著極大的流動性。這項工作可以輕易而迅速地得以重新配置,轉(zhuǎn)移到勞動力技能、帶寬條件和工資水平都更理想的任何地點。
2023年5月,規(guī)模人工智能公司在自己的網(wǎng)站上列出數(shù)據(jù)標(biāo)注職位,招募人工智能有志于征服的幾乎每個領(lǐng)域的優(yōu)秀人才。這些人工智能培訓(xùn)師具備的專業(yè)知識涵蓋健康指導(dǎo)、人力資源、金融、經(jīng)濟、法律、文化等多個領(lǐng)域。你可以每小時賺45美元教機器人法律,或者每小時賺25美元教機器人詩歌。還有人專門協(xié)助訓(xùn)練軍事人工智能。規(guī)模型人工智能公司正在測試一款名為多諾萬的大語言模型,該模型被稱為“人工智能戰(zhàn)爭中的彈藥”,并已獲得美國機器人戰(zhàn)車項目的合同。
(摘自《經(jīng)濟日報》)