金鐘
飛機(jī)即將落地,腳下是寬闊的俄亥俄河河口,森林與山地環(huán)抱之中,匹茲堡的輪廓出現(xiàn)了。這座城市,曾因鋼鐵繁榮了百年之久,又在上世紀(jì)70年代迅速衰落,與底特律、克利夫蘭、芝加哥并稱為美國的“工業(yè)銹帶”。如今,它因為在人工智能領(lǐng)域的領(lǐng)先地位,有了新的聲名。
出了機(jī)場,5位來自中國的旅客直奔位于匹茲堡郊區(qū)的卡內(nèi)基梅隆大學(xué)。這是一所在全美計算機(jī)科學(xué)排行榜上名列第一的大學(xué),12位圖靈獎得主和20位諾貝爾獎得主在這里度過了他們的大學(xué)時代。
6月的校園,草木茂盛,參觀計算機(jī)科學(xué)學(xué)院時,這5位中國旅客深受震撼。來自語言技術(shù)研究所的女教授Rita Singh向他們展示了自己研發(fā)的音頻分析算法,她可以通過一段電話錄音,推算說話者的性別、身高、體重甚至面容,推斷通話發(fā)生的地點是否有窗戶、墻體的材質(zhì),并根據(jù)當(dāng)?shù)仉娋W(wǎng)的電壓波動,推算通話發(fā)生的物理位置及通話時間。這個算法Rita Singh研究了20年,如今已被美國的政府使用。
這是2017年夏天,中國手機(jī)廠商vivo核心技術(shù)團(tuán)隊的美國之旅。vivo CEO沈煒,帶著核心團(tuán)隊在美國東、西海岸拜訪了兩周之久。
“雖然我們一直在做這方面的研究,但科研機(jī)構(gòu)在AI技能、算法方面的成果,還是讓我們重新認(rèn)識了這個行業(yè)。”一起赴美的vivo人工智能負(fù)責(zé)人周圍發(fā)現(xiàn),很多前沿的研究,像聲音、機(jī)器視覺、語義理解,在這些優(yōu)秀的科研機(jī)構(gòu)里面已經(jīng)沉淀有10年的時間了?!叭斯ぶ悄軙r代到了?!?/p>
赴美前,中國棋手柯潔和人工智能機(jī)器人AlphaGo剛剛在烏鎮(zhèn)對戰(zhàn)。在這場比賽里,排名世界第一的年輕棋手,曾在中途躲在宣傳板后失聲痛哭,直到20分鐘后裁判長找到他。這場頂尖級比賽的意義太復(fù)雜,它不僅關(guān)于圍棋,還關(guān)于全體人類對科技、對未來、對自我認(rèn)知的拆毀與重塑。更是一種宣告—人工智能時代真的到來了。
對一直站在科技最前沿的手機(jī)行業(yè),這個結(jié)論同樣成立。這也是為什么在回國后,沈煒做了兩件事:一、讓技術(shù)人員再去美國拜訪;二、重新規(guī)劃擴(kuò)建自己的人工智能團(tuán)隊。沈煒認(rèn)為,因為有了人工智能,手機(jī)完成新的代際更替,從原來的Smartphone,變成了真正具備智慧的產(chǎn)品。
vivo的管理層曾一起觀看過斯派克·瓊斯導(dǎo)演的電影《Her》。那是一個愛情故事,孤獨的男主角愛上了他的操作系統(tǒng)Samantha。在片中那樣一個危機(jī)四伏的后現(xiàn)代社會里,這個溫暖又悵惘的故事,給了觀眾痛和甜的體驗。
但不僅于此,它還如此真切地描繪了一個激動人心的圖景,在未來,人工智能助手將陪你一起生活。它體貼溫柔、善于溝通,它了解你,感動你,撫慰你,與你建立超越肉身的親密關(guān)系,它是你最好的伴侶,同時也學(xué)習(xí)你,是你更完美的一個自我。
vivo的管理層不是唯一被Samantha打動的人。早在8年前,蘋果創(chuàng)始人喬布斯就已看到了浪潮。那一年,蘋果花2億美金買下Siri的創(chuàng)始公司。在Siri創(chuàng)始人之一Dag Kittlaus的客廳里,他們聊了3個小時關(guān)于未來的超現(xiàn)實主義話題, 喬布斯認(rèn)為,Siri絕不是一個搜索工具,而是一個人工智能助手。而他們對這個助手的想象,就是Samantha。
那時所有人都堅信,“Siri最終會在宇宙中留下自己的痕跡。”
2018年3月19日,距離美國之旅已經(jīng)過去了9個月時間。那幾位當(dāng)時被AI趨勢打動的中國旅客,交出了自己的答卷。
在這一天烏鎮(zhèn)的發(fā)布會上,vivo推出了新手機(jī)X21,手機(jī)里已經(jīng)有了一個名為Jovi的智能助手,這就是他們的Samantha。
單看新手機(jī)的外表,已經(jīng)很炫目了。這兩年大熱的全面屏、屏幕指紋解鎖、面部識別,它都完成得很漂亮。用指紋解鎖的瞬間,你可以看到電路板上有閃亮的電流流過。新的廣告片里,是時下最受關(guān)注的年輕明星鹿晗、周冬雨和彭于晏。發(fā)布會上,穿著襯衣、年輕俊朗的產(chǎn)品經(jīng)理侃侃而談。
但這些都沒有Jovi來得意義深遠(yuǎn),Jovi生活在X21中,這是它的第一個版本,可以在13個具體的場景之下給用戶幫助:你定了車票、機(jī)票,它會提醒你時間、目的地天氣和機(jī)場路況;你要上班,起床了它就會告訴你路況和路線,這是根據(jù)你長久以來的出行習(xí)慣;如果你喜歡看球賽,它會幫你跟蹤歐冠和NBA賽事;它能在你出行前,為你安排行程。
智能機(jī)時代,人們已經(jīng)習(xí)慣了打開一個個孤島般的App,Jovi的工作就是打破這些孤島,整合這些數(shù)據(jù),了解你,模擬你,它的終極目標(biāo)是成為第二個你,甚至比你更了解你自己。
vivo品牌戰(zhàn)略總監(jiān)黃善一,是Jovi整個品牌設(shè)計的負(fù)責(zé)人。在接到任務(wù)的第一刻,他就在想AI品牌如何和vivo形成一個有機(jī)整體。
“Joy?magic?vivo的人工智能應(yīng)該是什么樣的?”黃善一拿這個問題,反復(fù)地問自己、問團(tuán)隊,也不斷地“拷問”人工智能團(tuán)隊。這個過去一直在寶馬汽車從事品牌戰(zhàn)略的韓國歐巴,在2017年進(jìn)行了一次人生職業(yè)規(guī)劃的轉(zhuǎn)身。從汽車到手機(jī),產(chǎn)品形態(tài)發(fā)生了變化,但黃善一堅信用戶的需求不變。
“Join,enjoy”,Jovi一呼即出,這就是vivo人工智能想給消費者帶來的感受,“快來加入我們吧,join這個年輕時尚的圈子,enjoy貼心的提醒以及拍照和游戲的伙伴,這就是我們vivo的人工智能—Jovi。”黃善一說。
最初,Jovi是不夠聰明的,它需要人去訓(xùn)練,需要長久的陪伴。你使用的時間越長,操作的次數(shù)越多,它對你的畫像越精準(zhǔn),操作越合你心意。這后面的本質(zhì)是算法,是vivo超過10000臺服務(wù)器的日夜計算。還有語音的識別、語義的分析、機(jī)器的自主學(xué)習(xí)。
這也是國內(nèi)首個手機(jī)內(nèi)置的人工智能助手。它的操盤手周圍,是vivo公司13年的老員工,曾經(jīng)的程序員、軟件工程師,如今vivo人工智能總負(fù)責(zé)人。他是個安靜的人,一張圓臉,戴一副眼鏡,說話很輕。
在創(chuàng)造Jovi的9個月里,很難想象他經(jīng)歷了什么。
每一步都走得很難。人工智能的關(guān)鍵在于算法,偉大的頭腦寫就他們。周圍知道,許多優(yōu)秀算法都是在大學(xué)的實驗室里孕育的。他們按照一個個榜單,如機(jī)器視覺、語義理解,去拜訪國內(nèi)前10名的大學(xué)。哈工大的語義實驗室,是全球范圍內(nèi)的第一名,負(fù)責(zé)的劉挺教授到珠海開會,周圍就帶著人在酒店苦等。
算法有了,實現(xiàn)它的功能,需要器件。芯片、麥克風(fēng)、攝像頭、屏幕,都來處不同。他們一家一家去談,挑的都是最頂尖的產(chǎn)品。除此之外,還要兼顧消費者需求、組織、數(shù)據(jù)……
許多大公司喜歡建造一個封閉的體系,這是一個安全的選擇。但vivo的想法不同,在周圍看來,人工智能時代,不是企業(yè)做一個芯片、做一個算法或者做幾個產(chǎn)品,就能把這件事情做好,手機(jī)廠商的本質(zhì)是平臺,“匯集這個行業(yè)里面最優(yōu)秀的器件、最優(yōu)秀的算法、最優(yōu)秀的垂直類能力和服務(wù)給消費者?!?/p>
最艱難的抉擇還不在這里,而在于打破他們原有的贏利模式—手機(jī)預(yù)裝軟件是手機(jī)廠商重要的收入之一,如果Jovi得到大規(guī)模使用,手機(jī)App將會不再那么重要,手機(jī)廠家現(xiàn)有的應(yīng)用分發(fā)的贏利模式也將被改變,但服務(wù)與應(yīng)用將會直達(dá),用戶將會因此得到更好的生活體驗。
vivo的管理層有自己的考慮。
他們都是一群手機(jī)行業(yè)的老人了。周圍工作18年,做手機(jī)13年,而管理層的其他成員在行業(yè)里甚至超過了20年。這個行業(yè)繁花似錦,競爭與迭代的速度遠(yuǎn)超往日。他們知道,即使剝皮見骨,人工智能,也是不得不打的一仗。
我們聊起創(chuàng)業(yè)史,那是整場談話中周圍最興致勃勃的時刻。問他是否還記得當(dāng)年vivo的辦公地址,他飛快背出“深圳科技園南區(qū)R2-B樓”,怎么能忘記,那是一群年輕人付出的上千個日夜。
2005年,功能機(jī)的時代,周圍到vivo做的第一款手機(jī),第一次有了MP4,那個年代,彩鈴和MP3是最流行的技術(shù),MP4是完全領(lǐng)先的功能,那是行業(yè)里了不得的進(jìn)步。但你能感覺到世界在慢慢變化。2006年,CEO沈煒已經(jīng)看到智能機(jī)的未來不遠(yuǎn),讓周圍拉著9個剛畢業(yè)的工程師,開始做實驗。
在那三四年,做出一個有操作系統(tǒng)的Linux手機(jī),是這群工程師唯一的職業(yè)理想。Linux,是一套免費使用和自由傳播的操作系統(tǒng),在由它發(fā)展而來的手機(jī)操作系統(tǒng) Android出現(xiàn)之前,它是無數(shù)軟件工程師的方向。
坐享成熟的Android和IOS系統(tǒng)的這一代年輕人無法想象,在當(dāng)時,做一臺智能手機(jī)有多難——就像上帝創(chuàng)造世界,你要從無到有創(chuàng)造它,還要試圖讓它正常運轉(zhuǎn)。
他們花了2年時間,移植linux到嵌入式CPU上,自己編寫系統(tǒng)通信總線,編寫窗口管理器,編寫一整套的用戶界面。幾百個日夜,終于完成了樣機(jī),但是CPU很慢,C++完成的系統(tǒng)效率也不高,樣機(jī)看起來體驗很不好。把寶貝一樣的成品拿過去給CTO施玉堅看,施戳了一下,隔了400毫秒,撥號界面出來了,他說了一句,“嗯,有點慢?!?/p>
“那句話,對我打擊很大,很大很大,我跟施總做了13年以上的同事,那是他說得最重的一句話,當(dāng)時我眼淚都要下來了。我認(rèn)為是行業(yè)里面優(yōu)化得最好的手機(jī),400毫秒能出一個撥號界面,我覺得已經(jīng)很厲害了?!敝車f來,語氣激動,仍為當(dāng)年那個年輕的程序員感到委屈。
不過,改變很快就來了。2007年,谷歌推出了Android,這是一個開源系統(tǒng),他們飛速迭代,很快把Linux系統(tǒng)甩在了身后。vivo用了Android,周圍說自己是一個“懂得感恩的程序員”,他成立了谷歌在深圳的開發(fā)者社區(qū),還幫谷歌在中國推廣Android。在社區(qū)論壇里,現(xiàn)在都可以看到他當(dāng)年的ID:Wei Zhou。
同年6月,初代蘋果手機(jī)也來了。它被人們視為真正推開了智能手機(jī)時代的大門。全球手機(jī)市場的競爭,進(jìn)入了新的階段。
2014年夏天,vivo剛?cè)肼毜漠a(chǎn)品經(jīng)理洪杰鴻被派到了鄭州的二七廣場,在正式工作之前,他需要去手機(jī)賣場呆一段時間,了解行業(yè)與用戶的狀態(tài)。那一年多,正是各大手機(jī)廠家酣戰(zhàn)與轉(zhuǎn)型的關(guān)鍵時刻。在這個典型的二線城市商場,他看到了變化的發(fā)生。
最初,廠商們在硬件上比拼,比如屏幕大、續(xù)航好、像素高,這會成為用戶購買手機(jī)的關(guān)鍵。漸漸的,這些要求每一家廠商都有能力去滿足了,體驗和軟件成了線下廝殺的關(guān)鍵。用戶關(guān)心什么功能,他們就去更多地實現(xiàn)它,比如拍照,可以逆光,可以美顏,還可以雙攝。但很快,這些功能也做到了極致??v觀整個智能手機(jī)領(lǐng)域,大家的差距已經(jīng)越來越小。
那下一步的競爭在哪里?在2017年5月的谷歌開發(fā)者大會上,谷歌直接把公司未來戰(zhàn)略定在了人工智能上,“機(jī)器學(xué)習(xí)”是他們提到最多的詞語。
事實上,在此時,vivo公司的整個供應(yīng)鏈條、所有的廠商,甚至是整個中國,所有的資本與熱錢,都已同樣進(jìn)入人工智能的浪潮之中。
時間到了。這家在業(yè)內(nèi)以低調(diào)、謹(jǐn)慎甚至保守出名的公司,在長時間的觀望之后,也做出了入局的決定——看明白了,用人工智能技術(shù)去整合硬件、軟件與服務(wù),可能是未來10年他們能抓住的最大機(jī)會。
他們要做的不是一個功能,而是一個系統(tǒng),“哪怕費力一點也要做,因為你繞不開。語音交互是最自然的一個交互方式。為什么要取一個名字叫Jovi?你必須把它形象化。用戶是需要養(yǎng)的,要讓更多的用戶慢慢去用它,習(xí)慣去用這個東西。”
讓更多人接納人工智能,并不容易。從1950年曼徹斯特大學(xué)校園里的艾倫·圖靈提出“機(jī)器能思考嗎”這個問題至今,人類從未停止懷疑,人與機(jī)器之間,具有靈性的血肉之軀與程序鍛造的鋼鐵之間,能互相理解嗎?
沒人能給出一個確定的結(jié)論。但已知的是,vivo在預(yù)測你是否會拋棄正在使用的手機(jī)時,準(zhǔn)確率已經(jīng)達(dá)到了86%。究竟是什么原因,或者是什么原因的疊加,會使你拋棄它?我們不知道,但機(jī)器知道—“人操心的事情只有幾個維度,但可能500個維度都會影響你,你操心不過來,但你可以讓一個小型機(jī)把這500個參數(shù)全部運算一遍,通過機(jī)器學(xué)習(xí),它就會給你答案?!?/p>
如果要從技術(shù)層面來解釋人工智能,其實并不難??▋?nèi)基梅隆大學(xué)計算機(jī)科學(xué)系的教授邢波在去年的一次演講中描述了人工智能研發(fā)的過程—首先是取得數(shù)據(jù),第二是明確你要做的功能,比如做圖像識別、下棋或者機(jī)器人。再往下就是算法,它用來解決這個題目。再就是計算設(shè)備,去實現(xiàn)軟件。再往下是一套程序,對接硬件和軟件。
對中國的手機(jī)廠商來說,取得數(shù)據(jù)容易,但問題的關(guān)鍵在于他們怎么去知道人們對人工智能的需求。更深遠(yuǎn)一些,這個問題指向的是,人如何理解人,又如何使用機(jī)器理解人。正如臺灣金馬獎獲獎電影《大佛普拉斯》里的旁白:現(xiàn)在已經(jīng)是太空時代了,人們可以登上月球,卻永遠(yuǎn)無法探索人們內(nèi)心的宇宙。
產(chǎn)品經(jīng)理洪杰鴻,負(fù)責(zé)的就是消費者調(diào)研。他每個月有三分之一的時間都是在與消費者訪談,接觸到的是這個時代人們熱騰騰的生活。時間久了,他總結(jié)出來一些東西,比如:“很多城市的這種消費者喜歡健身時拍照,是因為健康嗎?不是。是因為想發(fā)朋友圈?!?/p>
他還發(fā)現(xiàn),國家的政策也會對消費者需求產(chǎn)生影響,比如二胎政策放開之后,給孩子拍好照片成了他們的需求。孩子不好拍,他們會動,會變,用戶想記錄孩子的狀態(tài),想分享給別人,還不能暴露太多信息。
這些需求因人而異,很難總結(jié),很難量化,一次調(diào)研往往要花3個月以上的時間。在研發(fā)Jovi時,周圍因為上線時間而焦慮,忍不住和洪杰鴻發(fā)了幾次火,問他:“你到底什么時候才能把需求給我?”但洪杰鴻覺得不行,直到調(diào)研完成,才提交結(jié)論——在現(xiàn)階段,拍照和游戲是用戶比較看中的功能。
需求之后,就是算法。這是這個行業(yè)的核心,也是競爭最激烈、最殘酷的領(lǐng)域。如果沒有大量的數(shù)據(jù)去訓(xùn)練,算法也無法發(fā)揮效果。正因為擁有巨大的數(shù)據(jù)入口,vivo接觸了中國人工智能產(chǎn)業(yè)大量的獨角獸公司、最杰出的年輕人。
洪杰鴻也發(fā)現(xiàn)了這群人的改變。最初他們更理想主義,或者說更geek,一個商務(wù)帶一個技術(shù)去找他談,談的都是參數(shù)、測試?,F(xiàn)在往往會加一個產(chǎn)品經(jīng)理,開始談需求,談這個算法如何真正落到現(xiàn)實生活中。
算法、器件與數(shù)據(jù)的組合,能夠迸發(fā)出多大的力量?樂觀者有之,唱衰者亦有之。
關(guān)于此事最著名的爭論出現(xiàn)在硅谷大佬扎克伯格和伊隆·馬斯克之間。馬斯克很早就對人類使用人工智能的方式擔(dān)憂,扎克伯格在去年的一次直播中隔空回應(yīng):對AI鼓吹末日論的人是不負(fù)責(zé)任。馬斯克當(dāng)仁不讓,在Twitter上回?fù)簦骸拔液驮瞬裼懻摿舜耸拢麑@事懂得太少?!?/p>
就在采訪周圍的前一天,在美國亞利桑那州,49歲的伊蓮·赫茲伯格在過馬路時,被一輛Uber無人駕駛的汽車撞倒并最終死亡,警方要求Uber停止無人駕駛汽車項目。
所以,人工智能的前程,也成為我們這場訪談躲不開的話題。
但事實上,Jovi的“父母們”都是務(wù)實主義者。在他們看來,現(xiàn)在手機(jī)應(yīng)用的人工智能,包括Jovi,都才剛剛起步,離真正的“通用人工智能”還距離很遠(yuǎn)。
這也是為什么在3月的發(fā)布會上,Jovi只是被短暫提及——因為它還沒有足夠成熟,還需要時間去訓(xùn)練。半年后、一年后,它將會是嶄新的面貌。
但身處這個行業(yè)的人們,已經(jīng)看到了更遠(yuǎn)的未來。
比如前段時間,周圍的一位家人因病暈倒。這讓他開始思考新的問題:如今我們的攝像頭,可以是紅外,也可以做超聲波,只要設(shè)計一個算法,它便可以在你看屏幕時感知和分析你的心跳、心率?!岸伎吹侥愕男穆?、心跳不正常了,其實完全可以建議你提前就醫(yī),對不對?”麥克風(fēng)也是一個道理,如果你愿意,它可以聽到你咳嗽的聲音、打呼嚕的聲音,也可以給你很多建議。
這不是空談。這些設(shè)想全都基于現(xiàn)在已經(jīng)可以量產(chǎn)的攝像頭和麥克風(fēng),和已經(jīng)可以實現(xiàn)的算法。
回到位于中國東莞的vivo廠區(qū),他們要做的事情,是4個字,確保交付。如果確定要做監(jiān)測心跳的功能,那么第一步,去定制攝像頭,第二步,掃描全球的算法,安排好時間表,直到它按時上市。一個一個功能,去把Jovi血肉豐滿,直到接近你的自我。
采訪的末尾,我提到一個場景。人工智能發(fā)展到未來,假如某天我即將乘飛機(jī)出差,但是我收到短信,告訴我家人生了重病。人工智能通過分析我所有的通話記錄、照片等信息,得知我是一個很看重家庭的人,同時也是一個工作狂,那么它是給我推送去機(jī)場的路況,還是去醫(yī)院的路況?人工智能作為另一個自我,它能超越簡單的服務(wù)功能,而擁有真正的共情能力嗎?
周圍的回復(fù)很簡單。在這整件事情里,人工智能可以切中幾個點來做。一是給用戶畫像,只要用戶隱私授權(quán),機(jī)器會為人的經(jīng)濟(jì)能力、社會屬性、性格特征、對家庭的看重程度打分,這已經(jīng)在逐漸實現(xiàn)。
再就是分析權(quán)重。如果這兩件事要同時做,無非就是這兩個屬性的權(quán)重和參數(shù)的博弈。如果親情權(quán)重大,那就去醫(yī)院,中斷你的出差,它會給你推送退改機(jī)票的鏈接,幫助你一鍵退票。
“對機(jī)器來說,對智能來說,它是很簡單的一個邏輯?!钡圃烊斯ぶ悄艿娜藗兪冀K明白,內(nèi)心里的切磋琢磨,關(guān)心和愛,不可量化,不可模擬,機(jī)器永遠(yuǎn)無法替代。