極客公園
2月底,Way m o首席科學(xué)家D rag o Anguelov在MIT(麻省理工學(xué)院)首次開(kāi)講,他分享的內(nèi)容主題為“解決自動(dòng)駕駛中的長(zhǎng)尾問(wèn)題”(Taming The Long Tail of Autonomous Driving Challenges),這應(yīng)該是外界對(duì)Waymo自動(dòng)駕駛研發(fā)目前能夠了解到的最深度、最詳細(xì)的內(nèi)容了。
近些年,使用大量標(biāo)注過(guò)的數(shù)據(jù)對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行監(jiān)督訓(xùn)練,使得物體感知和行為預(yù)測(cè)能力有了大幅提升,這些技術(shù)在Waymo自動(dòng)駕駛開(kāi)發(fā)過(guò)程中得到了大規(guī)模應(yīng)用。我們也從 Drago Anguelov口中第一次知道了Waymo在使用“模仿學(xué)習(xí)(imitation learning)”,這里先“科普”一下。
模仿學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的一種,它的神經(jīng)網(wǎng)絡(luò)能夠通過(guò)“觀察”人類(lèi)的行為將某些特定的動(dòng)作和場(chǎng)景進(jìn)行匹配。如果使用不同類(lèi)型的“人類(lèi)行為”作為數(shù)據(jù)源來(lái)訓(xùn)練,最終神經(jīng)網(wǎng)絡(luò)就能夠根據(jù)感知的結(jié)果輸出相對(duì)應(yīng)的決策動(dòng)作。例如,“如果你看到停車(chē)標(biāo)志,馬上停車(chē)”以及“如果前方有輛停著的車(chē)擋路了,繞開(kāi)它”等。
隨著商業(yè)化試運(yùn)營(yíng)的推進(jìn),谷歌(Waymo為谷歌旗下的子公司)能夠采集數(shù)據(jù)的場(chǎng)景更多了,模仿學(xué)習(xí)算法也就有了更頻繁的用處。但Drago Anguelov也指出,人類(lèi)駕駛行為存在著很多不確定性,一些罕見(jiàn)的場(chǎng)景(所謂的“長(zhǎng)尾”問(wèn)題),Waymo的數(shù)據(jù)集中并沒(méi)有足夠的案例來(lái)訓(xùn)練算法應(yīng)對(duì)。出現(xiàn)這種情況就只能依靠開(kāi)發(fā)人員手動(dòng)編寫(xiě)算法。Drago Anguelov認(rèn)為這種“折中”的做法遲早是會(huì)被機(jī)器學(xué)習(xí)代替的。
根據(jù)Waymo官方披露的數(shù)據(jù)顯示,Waymo目前已經(jīng)累積了約1 500萬(wàn)英里的行駛里程。按照平均每3 000萬(wàn)英里才會(huì)出現(xiàn)一起事故的概率來(lái)計(jì)算的話,Waymo可能到現(xiàn)在都沒(méi)有得到一個(gè)特定的“長(zhǎng)尾”案例。假設(shè)行駛每100萬(wàn)英里會(huì)發(fā)生一起事故,Waymo也不過(guò)積累了15個(gè)數(shù)據(jù)而已。按照普通機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)需要的數(shù)據(jù)量(每個(gè)圖像分類(lèi)需要至少1 000個(gè)樣本)的標(biāo)準(zhǔn)來(lái)看,Waymo似乎還差得有些遠(yuǎn)。
盡管Drago Anguelov表示希望通過(guò)采集盡可能多的人類(lèi)駕駛行為(包括“長(zhǎng)尾”案例)來(lái)進(jìn)行模仿學(xué)習(xí),但“數(shù)據(jù)量的缺失”是個(gè)很大的問(wèn)題。
而為了彌補(bǔ)這方面的缺陷,Waymo已經(jīng)構(gòu)建出了一套仿真模型,仿真出盡可能多的場(chǎng)景來(lái)進(jìn)行測(cè)試。因?yàn)橛袝r(shí)會(huì)得出截然相反的結(jié)果,所以要加強(qiáng)系統(tǒng)的魯棒性,做出足夠多的仿真模型,確保系統(tǒng)的準(zhǔn)確性。
不過(guò)仿真模型的建立依然需要真實(shí)世界數(shù)據(jù)的支持,解決“長(zhǎng)尾”問(wèn)題也需要對(duì)人類(lèi)駕駛行為進(jìn)行大量的模仿學(xué)習(xí)。所以這就又回到了問(wèn)題的原點(diǎn),Waymo還需要更大量級(jí)“數(shù)據(jù)”的支持。
對(duì)比之下,似乎“差生”特斯拉在“數(shù)據(jù)”問(wèn)題上還真是不發(fā)愁。
特斯拉目前預(yù)計(jì)有超過(guò)40萬(wàn)輛搭載了Autopilot系統(tǒng)的車(chē)輛在道路上行駛,單日行駛里程超過(guò)了1 300萬(wàn)英里。如果未來(lái)這個(gè)車(chē)隊(duì)的規(guī)模增加至超過(guò)100萬(wàn)輛,那么每月產(chǎn)生的有效行駛里程將到達(dá)10億英里的量級(jí)。對(duì)一家已經(jīng)有成熟產(chǎn)品落地的車(chē)企而言,這種真實(shí)世界產(chǎn)生的“數(shù)據(jù)”根本不是問(wèn)題。
至于特斯拉在自動(dòng)駕駛研發(fā)上的獨(dú)特性,根據(jù)外媒The Information曾經(jīng)透露的信息,特斯拉同樣在利用“里程累積”上的優(yōu)勢(shì)進(jìn)行模仿學(xué)習(xí)。據(jù)熟悉特斯拉這套系統(tǒng)的知情人士爆料稱(chēng),特斯拉的車(chē)輛在行駛過(guò)程中會(huì)將攝像頭及其他傳感器的數(shù)據(jù)搜集起來(lái),Autopilot是否運(yùn)行并沒(méi)有關(guān)系。之后工程師可以將這些數(shù)據(jù)中人類(lèi)的駕駛行為與不同的場(chǎng)景進(jìn)行匹配,此后遇到類(lèi)似的場(chǎng)景機(jī)器就可以模仿人類(lèi)去執(zhí)行—比如怎樣拐彎或躲避障礙物等。
當(dāng)然這種被叫做“行為克隆”的方法也有局限性,但特斯拉的工程師認(rèn)為只要有足夠的數(shù)據(jù)支撐,神經(jīng)網(wǎng)絡(luò)就能夠給出正確的決策結(jié)果,例如在絕大多數(shù)場(chǎng)景中如何轉(zhuǎn)向、剎車(chē)以及加速。在特斯拉看來(lái),未來(lái)不再需要人類(lèi)手動(dòng)編程控制無(wú)人車(chē)應(yīng)對(duì)特定場(chǎng)景。
事實(shí)上,特斯拉的軟件工程師提到的“行為克隆”和Waymo的“模仿學(xué)習(xí)”是一個(gè)意思,等同于大家都在講的“端到端學(xué)習(xí)”的方案,即使用一個(gè)巨大的神經(jīng)網(wǎng)絡(luò),輸入傳感器數(shù)據(jù)后得到關(guān)于轉(zhuǎn)向、加速和剎車(chē)的整體執(zhí)行策略。
假設(shè)特斯拉采用的是“端到端學(xué)習(xí)”方案,那它肯定是不需要對(duì)圖像進(jìn)行標(biāo)記的。唯一需要“標(biāo)記”的是人類(lèi)駕駛員的行為,比如轉(zhuǎn)向角是多少、加減速的力度等。將整個(gè)傳感器數(shù)據(jù)輸入到一個(gè)巨大的神經(jīng)網(wǎng)絡(luò)后,系統(tǒng)會(huì)學(xué)習(xí)如何將傳感器數(shù)據(jù)與人類(lèi)駕駛員的行為進(jìn)行匹配。但我們知道特斯拉是在做圖片標(biāo)記的,所以從這一點(diǎn)出發(fā)考慮,它采用的就不大可能是和Waymo一樣的“端到端學(xué)習(xí)”的策略。
針對(duì)自動(dòng)駕駛感知的算法差異,Mobileye創(chuàng)始人Amnon Shashua曾經(jīng)對(duì)“端到端學(xué)習(xí) (End-to-End Learning)”和“語(yǔ)義抽象(Semantic Abstraction)”這兩個(gè)概念做過(guò)詳細(xì)的講解。
而根據(jù)外媒The Information報(bào)道的內(nèi)容來(lái)推斷,特斯拉可能是在開(kāi)發(fā)一套用于路徑規(guī)劃或執(zhí)行控制的神經(jīng)網(wǎng)絡(luò)。而用來(lái)訓(xùn)練這套神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)并非來(lái)自傳感器,而是由感知神經(jīng)網(wǎng)絡(luò)輸出的元數(shù)據(jù)。這樣人類(lèi)駕駛員的直接行為—轉(zhuǎn)向、加速和剎車(chē)可以對(duì)元數(shù)據(jù)進(jìn)行“標(biāo)記”,類(lèi)似端到端學(xué)習(xí)中,駕駛行為與傳感器數(shù)據(jù)的匹配。
這種將感知層和執(zhí)行層神經(jīng)網(wǎng)絡(luò)分開(kāi)的做法能夠規(guī)避Amnon Shashua教授提到的端到端學(xué)習(xí)可能產(chǎn)生的一系列問(wèn)題:如“不常見(jiàn)場(chǎng)景”出現(xiàn)的幾率會(huì)大幅下降;對(duì)先備知識(shí)(Prior Knowledge)的要求提高,深度神經(jīng)網(wǎng)絡(luò)在解決一些簡(jiǎn)單問(wèn)題上可能會(huì)“慘敗”。
假設(shè)特斯拉用于訓(xùn)練的數(shù)據(jù)來(lái)自特斯拉車(chē)主,通過(guò)人工的方式將一些“壞的”行為去掉,這樣可以避開(kāi)人工編碼算法的局限和模擬測(cè)試的不真實(shí)。當(dāng)然特斯拉還可以使用強(qiáng)化學(xué)習(xí)或監(jiān)督學(xué)習(xí)來(lái)進(jìn)一步優(yōu)化??梢园崖窂揭?guī)劃或執(zhí)行控制的神經(jīng)網(wǎng)絡(luò)放在運(yùn)行Autopilot或其他駕駛輔助功能的車(chē)輛上,一旦出現(xiàn)系統(tǒng)脫離、失效或碰撞等情況,工程師就可以通過(guò)BUG報(bào)告來(lái)定位原因。這些“錯(cuò)誤”之后還可以用來(lái)訓(xùn)練新的神經(jīng)網(wǎng)絡(luò)。
如果上面猜測(cè)正確的話,這種方法可以用相當(dāng)快的速度來(lái)解決路徑規(guī)劃和執(zhí)行控制方面的問(wèn)題。考慮到目前搭載硬件2.0版本的特斯拉車(chē)型每個(gè)月可以獲得近10億英里的行駛里程,獲得的數(shù)據(jù)量之大是Waymo無(wú)法企及的。之后硬件3.0版本上線后,搭載了AI芯片的這套系統(tǒng)會(huì)更有利于特斯拉算法的迭代。
盡管Waymo深受“數(shù)據(jù)”的困擾,但光憑對(duì)這個(gè)維度的考量自然是沒(méi)辦法斷言什么的。只不過(guò)Waymo要解決自動(dòng)駕駛中的“長(zhǎng)尾”問(wèn)題,自然需要更多的數(shù)據(jù)支持。Waymo近日宣布將在亞利桑那州的梅薩市開(kāi)設(shè)新的技術(shù)服務(wù)中心,進(jìn)一步擴(kuò)大無(wú)人車(chē)出行服務(wù)的規(guī)模。顯然Waymo是奔著搜集更多“數(shù)據(jù)”的目的來(lái)的。
也有人認(rèn)為,Waymo可以效仿特斯拉開(kāi)發(fā)一套類(lèi)似Autopilot的駕駛輔助系統(tǒng),僅使用成本低廉可量產(chǎn)的傳感器。一旦在市場(chǎng)鋪開(kāi)后,搜集真實(shí)場(chǎng)景的駕駛數(shù)據(jù)也就不是什么難事了。當(dāng)然,Waymo自己要完成這件事比較困難,肯定需要來(lái)自主機(jī)廠領(lǐng)域的合作伙伴。
不久前有消息稱(chēng),“Waymo正在尋求外部投資人”,這其實(shí)是意料之中的計(jì)劃。如果有車(chē)企成為Waymo的股東,要獲得海量的駕駛數(shù)據(jù)自然容易得多。而且Waymo作為自動(dòng)駕駛解決方案的供應(yīng)商,始終只有借助OEM的平臺(tái)才能最終獲得商業(yè)化成功。不管是手中的全棧自動(dòng)駕駛技術(shù),還是正在進(jìn)行的移動(dòng)出行業(yè)務(wù),Waymo對(duì)很多車(chē)企而言,都是有十足吸引力的合作伙伴。Cruise和通用、福特與Argo.AI,這些都是比較成功的先例。
對(duì)特斯拉而言,之前因?yàn)镸odel 3陷入“量產(chǎn)地獄”,Autopilot的研發(fā)進(jìn)程似乎出現(xiàn)了停滯,硬件3.0也遲遲沒(méi)有發(fā)布。盡管在“數(shù)據(jù)”容量上有先天優(yōu)勢(shì),但率先量產(chǎn)以及頻發(fā)的幾次事故使其屢陷輿論風(fēng)波。所以,特斯拉在自動(dòng)駕駛上到底能有怎樣的成就,還在還很難說(shuō)。
不過(guò)筆者個(gè)人倒是蠻欣賞之前馬斯克說(shuō)過(guò)的一段話。他說(shuō),“我不認(rèn)為哪家企業(yè)能在特斯拉之前打造出一套綜合性的自動(dòng)駕駛解決方案。除非它們保密工作做得太好了,到時(shí)候要拿出驚人的成果來(lái)。我覺(jué)得這種可能性不大,對(duì)特斯拉而言,任何車(chē)企都不是我們的競(jìng)爭(zhēng)對(duì)手”。
希望這種“目中無(wú)人”的狂妄自大,可以給特斯拉帶來(lái)點(diǎn)好運(yùn)氣。
寫(xiě)在最后
預(yù)計(jì)到2030年自動(dòng)駕駛市場(chǎng)規(guī)模將達(dá)到8 000億美元,自動(dòng)駕駛行業(yè)的競(jìng)爭(zhēng)也會(huì)越來(lái)越激烈。如果將自動(dòng)駕駛比作一顆樹(shù),算法算力就是它的種子,決定了它成長(zhǎng)潛質(zhì);數(shù)據(jù)就是它的土壤養(yǎng)分,決定了它成長(zhǎng)速度。特斯拉和Waymo在數(shù)據(jù)量以及算法算力的競(jìng)爭(zhēng)就是未來(lái)整個(gè)自動(dòng)駕駛行業(yè)的縮影。