人形機(jī)器人即將能夠從事體力勞動(dòng)?近日,一則消息讓人“浮想聯(lián)翩”。
5月31日,車企東風(fēng)柳汽與優(yōu)必選科技(以下簡(jiǎn)稱:優(yōu)必選)簽署應(yīng)用戰(zhàn)略合作協(xié)議。優(yōu)必選工業(yè)版人形機(jī)器人Walker S將進(jìn)入東風(fēng)工廠,在更為復(fù)雜的檢測(cè)、裝配、物流現(xiàn)場(chǎng)提供解決方案,把人從重復(fù)、價(jià)值低的工作中解放出來(lái)。
機(jī)器人進(jìn)工廠不是件新鮮事,罕見的是,進(jìn)工廠的Walker S有著類人的雙足形態(tài)。它的身高1米7,身上有41個(gè)關(guān)節(jié)。在過(guò)去,因技術(shù)和落地難度過(guò)高,類似Walker S的人形機(jī)器人,被稱為“機(jī)器人皇冠上的明珠”。
這顆“明珠”正因?yàn)?023年AI大模型熱,進(jìn)入迅猛發(fā)展的積極周期。有數(shù)據(jù)統(tǒng)計(jì),2023年我國(guó)人形機(jī)器人相關(guān)投融資事件達(dá)12起,金額占過(guò)去十年行業(yè)總投資的1/4。
而Walker S背后的公司—優(yōu)必選成立于2012年,是國(guó)內(nèi)最資深的人形機(jī)器人公司,有人形機(jī)器人領(lǐng)域全球第一的有效技術(shù)專利。2023年12月,優(yōu)必選在港交所上市,成為我國(guó)“人形機(jī)器人”第一股,備受市場(chǎng)關(guān)注。
另一面是,優(yōu)必選招股書和財(cái)報(bào)揭露,2020年至2023年,優(yōu)必選的營(yíng)收分別為7.40億元、8.17億元、10.08億元和10.55億元,每年平均研發(fā)投入超過(guò)年?duì)I收50%。經(jīng)調(diào)整后的凈虧損分別為6.43億元、7.61億元、7.82億元和5.15億元。“燒錢”的前沿科技,亟需商業(yè)化的拐點(diǎn)。
6月,南風(fēng)窗記者與優(yōu)必選副總裁、研究院副院長(zhǎng)龐建新見面,聊了聊人形機(jī)器人的進(jìn)展與挑戰(zhàn)。他保持著創(chuàng)業(yè)者的樂(lè)觀,認(rèn)為AI大模型讓機(jī)器人擁有了“大腦”,資金與人才因此接連涌入,“現(xiàn)在是一個(gè)重要拐點(diǎn)”。
但在落地角度方面,這位技術(shù)派的副總裁始終十分冷靜。機(jī)器人需要面臨遠(yuǎn)比數(shù)字世界復(fù)雜繁多的問(wèn)題:穩(wěn)定性、安全性、性價(jià)比……這也是當(dāng)下的AI暫時(shí)無(wú)法取代體力勞動(dòng),而是率先威脅白領(lǐng)部分工作的原因。
而龐建新相信,“經(jīng)過(guò)2—3年技術(shù)沉淀”,人形機(jī)器人領(lǐng)域落地的產(chǎn)品,也將真正影響千家萬(wàn)戶。全面電動(dòng)化、智能化的人形機(jī)器人,或?qū)⒊蔀榈谒拇喂I(yè)革命載體。
機(jī)器人之夢(mèng),馬上要實(shí)現(xiàn)了?
過(guò)去兩年,龐建新經(jīng)常感到興奮。新進(jìn)展層出不窮,他比過(guò)往更關(guān)注機(jī)器人學(xué)術(shù)界的發(fā)現(xiàn),花了很多時(shí)間在閱讀論文上。
他的公司坐落在深圳南山區(qū)的山地之間,馬路對(duì)面是南方科技大學(xué),再遠(yuǎn)些是北京大學(xué)深圳研究院、哈爾濱工業(yè)大學(xué)深圳校區(qū)等高校。知情人士透露,在人形機(jī)器人行業(yè),全國(guó)的公司基本集聚在三地,分別是:北京,上海、杭州等長(zhǎng)三角城市,深圳等珠三角城市。
如此的分布反映了人形機(jī)器人行業(yè)特點(diǎn):門檻極高。一位人形機(jī)器人創(chuàng)業(yè)者曾告訴南風(fēng)窗,人形雙足的機(jī)器人難度最高,首先是因?yàn)槠鋼碛斜纫话銠C(jī)器人更多的關(guān)節(jié)與硬件,“一個(gè)人形機(jī)器人光是零部件就有7000多個(gè)”。再加上入局者少,上下游供應(yīng)鏈不成熟,還處在“非標(biāo)準(zhǔn)化生產(chǎn)”的階段,成本也高。
更令投身這一賽道的創(chuàng)新者苦惱的是,這是一個(gè)過(guò)去不被多數(shù)人看好的“冷門賽道”。
龐建新2015年從中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院離職,加入優(yōu)必選,便是被創(chuàng)始人周劍發(fā)展“人形機(jī)器人”的夢(mèng)想打動(dòng)。但他對(duì)南風(fēng)窗坦言,過(guò)去多年,國(guó)內(nèi)只有寥寥幾家做人形機(jī)器人的公司,“很多人都質(zhì)疑我們,會(huì)不會(huì)太早了?會(huì)不會(huì)技術(shù)還沒(méi)發(fā)展到這個(gè)地步?”
這些質(zhì)疑聲,隨著ChatGPT在2022年引發(fā)的AI大模型熱,一并退卻了。馬斯克也在這起到帶動(dòng)作用,他在特斯拉AI Day 2022給了眾人驚喜—特斯拉首款人形機(jī)器人“擎天柱”(Optimus)正式登場(chǎng)。馬斯克還宣布,特斯拉的這類機(jī)器人,今后售價(jià)將低于2萬(wàn)美元。
從此,人形機(jī)器人賽道仿佛被按了加速鍵,成為市場(chǎng)的“香餑餑”。公開資料顯示,2023年12月底,優(yōu)必選在港股上市,發(fā)行價(jià)為90港元。僅三個(gè)多月后,優(yōu)必選股價(jià)已較發(fā)行價(jià)漲逾一倍,市值最高一度達(dá)到千億港元。
龐建新說(shuō),許多機(jī)器人或人工智能從業(yè)者都因?yàn)锳I大模型的出現(xiàn),轉(zhuǎn)變了發(fā)展思路,投入人形機(jī)器人研發(fā)的大潮。這是因?yàn)?,將大模型融入機(jī)器人,會(huì)使人形機(jī)器人具備更多的智能,泛化性有了很大提高。
更具體而言,人形機(jī)器人分為感知、決策、執(zhí)行三個(gè)系統(tǒng),分別對(duì)應(yīng)人類的感官、大腦、小腦。大模型出現(xiàn)前,每個(gè)系統(tǒng)都是獨(dú)立存在的。
他舉例,在過(guò)去,人形機(jī)器人會(huì)通過(guò)視覺(jué)感知、激光雷達(dá)等部件感知外界,每種維度信號(hào)再分別給出一個(gè)結(jié)論,交給決策系統(tǒng),“各個(gè)部分相對(duì)獨(dú)立”。如此一來(lái),“(人形機(jī)器人)會(huì)丟失很多有價(jià)值的內(nèi)容,例如信息的完整性,信息上下文相關(guān)性”。
也就是說(shuō),以前的人形機(jī)器人很難準(zhǔn)確認(rèn)知環(huán)境,而且魯棒性(即適配性)差。
有了AI大模型后,機(jī)器人的大腦會(huì)變得“聰明”。龐建新解釋,在過(guò)去,研發(fā)人員一直在找尋各種辦法,讓人形機(jī)器人理解人類物理世界的常識(shí)。這些常識(shí)由人類在生活中自然習(xí)得,對(duì)人類而言非常簡(jiǎn)單,但機(jī)器人理解它們常常十分困難。
比如,人們夏天需要喝冰水、冬天愛喝熱水,小孩需要喝更溫點(diǎn)的水……人類世界太多的“理所當(dāng)然”,要想機(jī)器人知悉,需要提前用專家數(shù)據(jù)庫(kù)設(shè)定。而這容易導(dǎo)致一個(gè)“死結(jié)”:如果機(jī)器人周邊環(huán)境發(fā)生變化或者換個(gè)任務(wù),就有可能因?yàn)槿狈?shù)據(jù)“宕機(jī)”。
而有了大模型以后,人形機(jī)器人可以在擁有海量的知識(shí)時(shí)接入更多常識(shí)。于是,當(dāng)它遇到?jīng)]見過(guò)的場(chǎng)景或者任務(wù)時(shí),不再像過(guò)去一樣傻愣著,而是擁有自行推理、重新決策的能力。
“大模型給我們帶來(lái)太多想象空間,”龐建新感慨,“我們第一次看到,通過(guò)多模態(tài)大模型,人形機(jī)器人能表現(xiàn)出對(duì)物理世界強(qiáng)大的理解和推理能力,這是我們以前從沒(méi)有看到過(guò)的?!?/p>
人形機(jī)器人風(fēng)光無(wú)限時(shí),不少人都在急切呼喚著人形機(jī)器人的落地與應(yīng)用。在人們的想象里,人形機(jī)器人應(yīng)該像奧斯卡獲獎(jiǎng)電影《機(jī)器人之夢(mèng)》演的一樣,成為人類伙伴,幫助人們處理家務(wù)、陪伴養(yǎng)老。
AI大模型毫無(wú)疑問(wèn)讓“夢(mèng)想”的實(shí)現(xiàn)加速了。龐建新透露,此前行業(yè)內(nèi)部判斷,人形機(jī)器人離落地需要5—10年時(shí)間,而現(xiàn)在時(shí)間被大大縮短?!拔乙恢痹诟緝?nèi)部講,這兩三年是技術(shù)更迭的兩三年,我們這些企業(yè)要大力投入,一定會(huì)有新的技術(shù)出現(xiàn)?!?/p>
2024年4月,優(yōu)必選官宣與百度文心大模型合作。接入百度文心大模型后,優(yōu)必選的人形機(jī)器人進(jìn)行了任務(wù)調(diào)度應(yīng)用開發(fā),提升了任務(wù)理解與規(guī)劃的能力。在官方透露的視頻里,接入文心大模型的Walker S能聽懂人的指令,幫人疊衣服,并能與人類實(shí)時(shí)語(yǔ)言互動(dòng),完成分揀等復(fù)雜的任務(wù)。
龐建新坦言,制造出人形機(jī)器人demo(小樣)對(duì)企業(yè)的難度并不算高,難的是在后續(xù)的落地中,保持性能穩(wěn)定、質(zhì)量可靠、減少出錯(cuò)率。這是目前困擾各家人形機(jī)器人企業(yè)的問(wèn)題。
相較于讓與人類進(jìn)行交互的人形機(jī)器人落地,優(yōu)必選有一條走得更快的路線—讓人形機(jī)器人進(jìn)工廠。兩年前,優(yōu)必選創(chuàng)始人周劍就開始讓團(tuán)隊(duì)探索這一應(yīng)用場(chǎng)景。這也是馬斯克率先押注的應(yīng)用場(chǎng)景。
6月15日,馬斯克還在年度股東大會(huì)上宣布,位于加州的特斯拉工廠已經(jīng)有兩個(gè)擎天柱機(jī)器人在使用,“從明年開始將有超過(guò)1000個(gè),甚至可能有幾千個(gè)擎天柱在工作”。他預(yù)計(jì),未來(lái)人形機(jī)器人和人類的比例可能是2比1或者1比1,光這一項(xiàng)就能給特斯拉帶來(lái)20萬(wàn)億美元的市值。
龐建新告訴南風(fēng)窗,工廠的場(chǎng)景較能符合現(xiàn)在人形機(jī)器人的技術(shù)發(fā)展程度,即在結(jié)構(gòu)化或半結(jié)構(gòu)化場(chǎng)景下,完成特定的有限任務(wù)。
“只要能解決幾個(gè)工位,對(duì)于一個(gè)產(chǎn)業(yè)來(lái)講都是極其巨大的市場(chǎng)。這個(gè)市場(chǎng)的確太大了。”他說(shuō)。據(jù)透露,目前有多家新能源汽車、3C行業(yè)客戶正在與優(yōu)必選洽談合作,需求樂(lè)觀。
今年年初,Walker S進(jìn)入蔚來(lái)第二先進(jìn)制造基地總裝車間實(shí)地“培訓(xùn)”,成為全球首例進(jìn)廠與人類協(xié)作完成汽車裝配及質(zhì)量檢查作業(yè)的人形機(jī)器人。在4月的業(yè)績(jī)會(huì)上,優(yōu)必選透露,2024年通過(guò)在工廠端進(jìn)行大量的實(shí)測(cè),為2025年或2026年人形機(jī)器人在工廠端的放量做好準(zhǔn)備。
龐建新解釋,人形機(jī)器人進(jìn)工廠背后實(shí)際有非常復(fù)雜的問(wèn)題。首先,每家工廠都有自己一套生產(chǎn)流程,“我們首先要解決的事情是機(jī)器人到底能干什么,解決哪類問(wèn)題?需要(為它)新增工位還是保持原有工位?”哪怕是同一類工廠,不同公司需求差異也很大。
接著,團(tuán)隊(duì)要根據(jù)實(shí)際需求,在實(shí)驗(yàn)室搭建類似場(chǎng)景,對(duì)機(jī)器人進(jìn)行訓(xùn)練和迭代,接著才能進(jìn)工廠實(shí)訓(xùn)。
實(shí)訓(xùn)得到真實(shí)數(shù)據(jù)后,“再反饋、再訓(xùn)練、再迭代”。最后,“讓人形機(jī)器人正式進(jìn)入工廠的系統(tǒng),與工廠工作流進(jìn)行配合,完成落地”。
龐建新告訴南風(fēng)窗,Walker S進(jìn)蔚來(lái)工廠的任務(wù)主要是門鎖質(zhì)檢、車燈蓋板檢測(cè)、安全帶檢測(cè)、貼車標(biāo)等,完成部分產(chǎn)業(yè)工人的工作。
“如果只是代替單一工種,這與過(guò)去只完成垂直任務(wù)的機(jī)器人有什么區(qū)別?”南風(fēng)窗記者問(wèn)他。
“人形機(jī)器人從來(lái)不能只干一件活,它要解決的是通用任務(wù)—一種機(jī)器人能完成多個(gè)任務(wù)。例如,在工業(yè)制造場(chǎng)景里,有大量不同工作同時(shí)存在,我不能為了每個(gè)工作都去設(shè)計(jì)一個(gè)專用機(jī)器人……”
而這,便是人形機(jī)器人的“魅力”所在—通用性為王。
技術(shù)路線已經(jīng)初見名目。
龐建新告訴南風(fēng)窗,當(dāng)下,實(shí)現(xiàn)人形機(jī)器人的路徑和邏輯基本清晰,目前亟待解決的是工程化的問(wèn)題。
“工業(yè)場(chǎng)景對(duì)人形機(jī)器人提出三方面要求,包括數(shù)據(jù)安全性、操作穩(wěn)定性、底層控制可靠性等。還有售后、日常支持和維護(hù),一大堆的(工程)問(wèn)題需要解決?!彼硎尽?/p>
優(yōu)必選副總裁、研究院執(zhí)行院長(zhǎng)焦繼超也在近日告訴媒體,量產(chǎn)人形機(jī)器人是區(qū)別于產(chǎn)品研發(fā)的另一個(gè)重要階段。
“如果是產(chǎn)品研發(fā),實(shí)驗(yàn)室有一兩臺(tái)人形機(jī)器人搭建成功就可以對(duì)外發(fā)布,而如果是量產(chǎn),則對(duì)人形機(jī)器人的穩(wěn)定性、可靠性,以及人形機(jī)器人的生產(chǎn)制造工藝有著很高的要求,即便是1%的誤差,都會(huì)造成很大影響。”
一位人形機(jī)器人的投資人曾告訴南風(fēng)窗,她在選擇投資的公司時(shí),會(huì)著重看公司對(duì)細(xì)節(jié)的交付能力。因?yàn)橛布惖腁I容錯(cuò)率很低,對(duì)安全性要求很高,“這大概就是硬件AI與軟件AI最大的區(qū)別”。
而技術(shù)出身的龐建新也始終十分冷靜。他認(rèn)為,當(dāng)下,大模型雖然給機(jī)器人注入了“大腦”,讓機(jī)器人有了更多智能,但這并非一勞永逸的解法。業(yè)界仍在探索大腦與小腦、肢體之間的銜接。
也就是說(shuō),現(xiàn)在讓機(jī)器人看懂、理解一句話并不難,難的是機(jī)器人如何在聽懂人類語(yǔ)言,或看到人的動(dòng)作后,主動(dòng)來(lái)驅(qū)動(dòng)自己的全身,做出接下來(lái)的動(dòng)作。
龐建新舉例:“即使是端水這個(gè)簡(jiǎn)單任務(wù),目前大多數(shù)人形機(jī)器人要成功完成還相當(dāng)困難。這個(gè)任務(wù)雖然聽起來(lái)簡(jiǎn)單,但其實(shí)質(zhì)涉及從感知到?jīng)Q策,再到控制,一旦環(huán)境變化,就是一個(gè)非常復(fù)雜的挑戰(zhàn)。”
一位人形機(jī)器人行業(yè)人士告訴南風(fēng)窗,人形機(jī)器人近年非?;馃?,吸納大量的資金和人才。但太熱的賽道有時(shí)會(huì)帶來(lái)過(guò)高的期待,“公眾可能以為人形機(jī)器人什么都能做,實(shí)際上技術(shù)還沒(méi)完全到這一階段”。
阻礙技術(shù)落地的另一座“大山”在于,這是一個(gè)研發(fā)周期長(zhǎng)、投入巨大的“燒錢”賽道。
華福證券曾在研報(bào)中提到,人形機(jī)器人目前對(duì)標(biāo)電動(dòng)汽車發(fā)展初期,降本成為行業(yè)的首要問(wèn)題。
而從1960年代早稻田大學(xué)推出的WABOT人形機(jī)器人開始,到千禧年代的本田ASIMO機(jī)器人、波士頓動(dòng)力ATLAS機(jī)器人,數(shù)代人形機(jī)器人的發(fā)展都困于高成本和居高不下的售價(jià)。
優(yōu)必選的方案是,“兩條腿”走路。
2017年以來(lái),優(yōu)必選在多個(gè)場(chǎng)景進(jìn)行了商業(yè)化落地。招股書顯示,人工智能教育機(jī)器人及解決方案是優(yōu)必選的營(yíng)收主力,2020—2022年分別實(shí)現(xiàn)營(yíng)業(yè)收入6.12億元、4.62億元、5.17億元,占比為82.7%、56.5%、51.2%。2023年,智慧物流機(jī)器人及解決方案成為優(yōu)必選主營(yíng)業(yè)務(wù),實(shí)現(xiàn)營(yíng)收3.897億元人民幣,同比提升47%。
與此同時(shí),優(yōu)必選2012年開始研發(fā)小型人形機(jī)器人Alpha,從2015年開始研發(fā)大型人形機(jī)器人Walker。這帶來(lái)了大量的研發(fā)支出,數(shù)據(jù)顯示,2023年,優(yōu)必選研發(fā)投入達(dá)4.9億元。
但毫無(wú)疑問(wèn),AI大模型的火熱讓這群創(chuàng)新者更加堅(jiān)信,這條入局已久的賽道,即將迎來(lái)改變千家萬(wàn)戶的拐點(diǎn)。
龐建新告訴南風(fēng)窗,目前許多工廠都對(duì)人形機(jī)器人有需求,原因是中國(guó)人口老齡化帶來(lái)了勞動(dòng)力短缺的問(wèn)題。而且,許多年輕人都不愿意進(jìn)工廠從事簡(jiǎn)單、枯燥、重復(fù)的工作。
其次,隨著中國(guó)企業(yè)的出海,海外擴(kuò)張的企業(yè)在當(dāng)?shù)睾茈y招到員工,培育和管理人的成本很高,亟需機(jī)器人。
他也相信,盡管目前成本仍較高,但中國(guó)人形機(jī)器人已具備較強(qiáng)實(shí)力。只要堅(jiān)持技術(shù)投入,中國(guó)相比美國(guó)具有智能制造的供應(yīng)鏈優(yōu)勢(shì),今后會(huì)在制造成本上體現(xiàn)出競(jìng)爭(zhēng)力。
優(yōu)必選董事會(huì)主席、執(zhí)行董事兼行政總裁周劍則判斷,現(xiàn)在全球頂尖科技公司對(duì)人形機(jī)器人的投入非常大。當(dāng)前,國(guó)內(nèi)科技企業(yè)和機(jī)構(gòu)開始重視人形機(jī)器人賽道,但還需要耐心的資本長(zhǎng)期持續(xù)地投入。
“現(xiàn)在人形機(jī)器人行業(yè)談?dòng)€為時(shí)尚早,我們要保持投入,探索商業(yè)化路徑,迎接產(chǎn)業(yè)蓬勃發(fā)展時(shí)刻的到來(lái)?!敝軇φf(shuō)。