沈凌莉
在討論Siri遇到的問題時(shí),我們首先要理解Siri究竟是什么?,F(xiàn)在對它最大的誤解可能就是,認(rèn)為 Siri這類語音智能助手產(chǎn)品是由前端的語音識別、語義解析技術(shù)和后端的搜索組成的。事實(shí)上并不全是這樣。
簡單地說,智能助手產(chǎn)品是由三部分組成:前端的交互方式,也就是信息輸入和輸出的方式,比如語音是其中一種;中間的智能分析,相當(dāng)于人的大腦;后面是數(shù)據(jù)庫或者是獲取方式,包括自有的數(shù)據(jù)庫、第三方的數(shù)據(jù)庫,以及搜索引擎等。
蘋果的Siri目前是把語音作為前端的交互方式,這是和Nuance等合作來實(shí)現(xiàn)的。而蘋果收購的Siri公司更核心的能力是在后端的智能分析上。
這確實(shí)是件很復(fù)雜的事,所以當(dāng)最初投資 Siri項(xiàng)目之一的風(fēng)險(xiǎn)投資公司摩根塔勒合伙人Gary Morgenthaler說,“Siri的創(chuàng)始團(tuán)隊(duì)看到了未來、定義了未來并且順利地邁開了通往未來技術(shù)的第一步,但被收購之后(蘋果)Siri緩慢的商業(yè)化進(jìn)程讓我們這些創(chuàng)始團(tuán)隊(duì)感到非常失望”時(shí),我不禁要問:這真的僅僅是個(gè)商業(yè)化的問題嗎?
“對于人工智能來說,現(xiàn)在談商業(yè)化還為時(shí)尚早,”小i機(jī)器人的創(chuàng)始人袁輝這樣認(rèn)為。他下這個(gè)判斷是因?yàn)樗?0年前就在人工智能領(lǐng)域做過了艱難的商業(yè)化嘗試。
小i機(jī)器人是國內(nèi)最早的智能機(jī)器人平臺運(yùn)營商,成立于2001年。據(jù)其官方發(fā)布的數(shù)據(jù),2004年到2007年倚靠微軟MSN平臺,小i的用戶超過1億,交互量達(dá)到100億次以上,覆蓋100多個(gè)國家。2007年小i機(jī)器人獲得了包括英特爾投資、IDG在內(nèi)的5家風(fēng)險(xiǎn)投資機(jī)構(gòu)的千萬美元投資。但是大量的用戶并沒有給公司帶來太多收入。
有用戶沒收入,袁輝在很長一段時(shí)間內(nèi)一直把原因歸結(jié)為“小i沒找到好的盈利模式”。后來發(fā)現(xiàn),用戶的快速增長實(shí)際上掩蓋了小i最根本的問題——究竟?jié)M足了用戶的什么需求?
袁輝說,“小i當(dāng)時(shí)的目標(biāo)和如今的 Siri一樣,希望做成一個(gè)無所不知、無所不能的變形金剛。但這幾乎是很難實(shí)現(xiàn)的”。首先,語音識別不是完全靠算法能解決的,無論是Nuance還是科大訊飛都花了很多年去研發(fā)。而后邊的智能分析和數(shù)據(jù)庫密切相關(guān),二者的匹配和系統(tǒng)構(gòu)建是非常核心的,既包括開發(fā)互聯(lián)網(wǎng)的信息還包括機(jī)器學(xué)習(xí),這需要大量的整合和多年的積累。“時(shí)間是智能機(jī)器人最大的壁壘,而這不是靠開放平臺、靠人多、錢多就能解決的,必須先知道要怎么做才行”。2009年,小i機(jī)器人全面轉(zhuǎn)型到公司(B2B)業(yè)務(wù)上。
或許,這樣一款產(chǎn)品,真的不能等在實(shí)驗(yàn)室里進(jìn)行完各種微調(diào)和全面測試再推向市場,起碼第一步它必須接觸到從音質(zhì)到自然語言解讀的盡可能多的變化。
敗給Google Now?談勝負(fù)還早了點(diǎn)
但既然推向了市場,總免不了比較。Google推出語音數(shù)字助理Google Now,用戶發(fā)現(xiàn),暫且不提人工智能,僅從語音搜索來看,Google Now的準(zhǔn)確率比Siri更高。于是,問題來了——誰能代表移動(dòng)搜索的未來? 在這一點(diǎn)上,面對PC端搜索的老大,且Google有多年積累的知識圖譜做后盾,確實(shí)讓人為Siri捏一把汗。但移動(dòng)搜索和PC搜索能一樣嗎?
“移動(dòng)搜索有很強(qiáng)的場景性,不像桌面搜索是用關(guān)鍵詞搜索大量資料,然后慢慢看。所以并不需要很深的知識圖譜,反而對非結(jié)構(gòu)化的、實(shí)時(shí)產(chǎn)生的數(shù)據(jù)有更大的需求?!敝菃杽?chuàng)始人朱勝這樣總結(jié)移動(dòng)搜索的特征。
為了建立非結(jié)構(gòu)化數(shù)據(jù)庫,國內(nèi)另一家語音助手類產(chǎn)品“蟲洞語音助手”除了通過網(wǎng)絡(luò)抓取、第三方合作,還開設(shè)了社區(qū)。蟲洞的聯(lián)合創(chuàng)始人郭家的總結(jié)是,“作為助手類的產(chǎn)品,長尾信息的組織是一大關(guān)鍵,它很難通過通用型搜索產(chǎn)品獲得?!?/p>
顯然,在非結(jié)構(gòu)化數(shù)據(jù)上,蘋果 Siri和Google Now都在以不同的方式發(fā)力。Siri與很多不同的服務(wù)集成在一起提供搜索結(jié)果,包括Yelp、OpenTable、Wolfram Alpha、Yahoo,以及Twitter和微軟推出的搜索引擎Bing;Google Now也做出了重大革新,用戶不再需要主動(dòng)去搜索信息,谷歌會(huì)在適當(dāng)?shù)臅r(shí)候把信息提供給用戶。這相當(dāng)于搜索引擎在幫助人們做出決策。
從這一點(diǎn)來看,Google Now和Siri的目標(biāo)都不僅僅囿于移動(dòng)搜索,而是智能交互,搜索只是其中的一部分表現(xiàn)形式。最終,二者將殊途同歸——整合數(shù)據(jù)庫,提高智能分析能力,讓機(jī)器主動(dòng)學(xué)習(xí)理解人、服務(wù)人——只是他們依托各自現(xiàn)有的優(yōu)勢從不同角度在往前做。在這個(gè)目標(biāo)下,目前二者都發(fā)展得比較初級,談勝負(fù)還為時(shí)過早。
千萬別把Siri僅僅當(dāng)成一個(gè)語音助手
其實(shí),Google Now也有難題,就是落地難。對于Google來說,谷歌的手機(jī)廠商和運(yùn)營商總是很難及時(shí)向用戶提供Android系統(tǒng)更新。而對于蘋果這樣一個(gè)軟硬件結(jié)合的公司,并擁有封閉的生態(tài)系統(tǒng),將Siri的能力落地并推向消費(fèi)市場正是其優(yōu)勢所在。
“千萬不要把Siri僅僅當(dāng)成一個(gè)語音助手,它是蘋果整個(gè)產(chǎn)品線包括操作系統(tǒng)演進(jìn)的方向。”正如朱勝所說,蘋果在逐漸把 Siri整合到iOS操作系統(tǒng)和硬件產(chǎn)品中去。2012年6月,蘋果公司發(fā)布了iOS6,這一操作系統(tǒng)對汽車行業(yè)最大的意義在于將地圖、車輛控制和 Siri語音功能相集合。蘋果為Siri 打造的 Eyes Free駕車系統(tǒng)也已經(jīng)日趨完善,目前已經(jīng)有多家知名汽車廠商加入 Eyes Free陣營。
可見,蘋果一定會(huì)充分發(fā)揮其硬件的優(yōu)勢。相信不久以后,Siri會(huì)橫跨蘋果整個(gè)產(chǎn)品線。以Siri和iCloud為依托打穿不同的設(shè)備間的連接,與App Store一起組成蘋果的生態(tài)系統(tǒng)。
同時(shí),蘋果會(huì)發(fā)揮渠道和入口的作用。Siri將不僅僅是一款應(yīng)用程序,它同時(shí)也是一款自然用戶界面系統(tǒng),占據(jù)用戶與數(shù)字設(shè)備和互聯(lián)網(wǎng)的第一觸點(diǎn),它使得服務(wù)器端可以整合大量開放API的數(shù)據(jù)。而這些數(shù)據(jù)是無法通過網(wǎng)絡(luò)抓取的方式獲得的。被整合進(jìn)蘋果操作系統(tǒng)中的Siri,可以方便被第三方調(diào)用。
對于蘋果來說,最重要的是通過 Siri把人工智能帶進(jìn)了現(xiàn)實(shí)生活中。蘋果更可能走的一條路徑是,打造智能交互的底層架構(gòu),由它來提供人工智能助手通用層面的支持。在此之上,將產(chǎn)生更細(xì)分、垂直的智能化應(yīng)用和服務(wù),將人工智能助手滲透進(jìn)生活的方方面面,而這將是中小創(chuàng)業(yè)者的機(jī)會(huì)所在。而基于Siri的智能大腦和數(shù)據(jù)庫,智能服務(wù)前端的交互方式也會(huì)變得更加多樣,除了聲音,比如圖像、視頻、腦波等都可能成為信息采集和輸出的方式。