李梁
聊天機(jī)器人背后的利益
事實(shí)上,從蘋果的Siri開(kāi)始,智能聊天機(jī)器人就漸漸受到各大互聯(lián)網(wǎng)廠商的重視,谷歌馬上做出了Google Now。而騰訊走得更遠(yuǎn),與中科院深圳先進(jìn)技術(shù)研究院、深圳市中科睿成公司組成聯(lián)合團(tuán)隊(duì)推出了實(shí)物版的小Q機(jī)器人。在馬化騰看來(lái),小Q機(jī)器人是騰訊線上服務(wù)向線下延伸的載體,除了聊天,小Q機(jī)器人還被定位為人們的智能伴侶機(jī)器人。而百度屬于后起之秀,自然不甘被落下,百度的余凱帶了一隊(duì)人馬去硅谷,和谷歌、Facebook搶人,人工智能領(lǐng)域的博士生身價(jià)被爆炒到30萬(wàn)美元。百度在國(guó)內(nèi)還推出了“少帥計(jì)劃”,向30歲以下青年才俊開(kāi)出百萬(wàn)年薪,對(duì)一流科學(xué)家更是上不封頂。
這么多頂尖互聯(lián)網(wǎng)公司前赴后繼的在聊天機(jī)器人領(lǐng)域搶人、搶地盤,看中的是未來(lái)一個(gè)很重要入口—移動(dòng)搜索流量入口。艾瑞咨詢集團(tuán)研究院院長(zhǎng)曹軍波認(rèn)為,用戶體驗(yàn)、流量入口,這都是當(dāng)下巨頭的敏感地帶?,F(xiàn)階段,移動(dòng)搜索入口還是一塊巨大的空白地帶,用戶在手機(jī)上搜索信息,仍然大多采用純網(wǎng)頁(yè)版的搜索方式。很顯然,這是有悖于移動(dòng)端的用戶體驗(yàn)的,普遍不被看好。而聊天機(jī)器人有可能是未來(lái)的一個(gè)方向,除了聊天,它們還具提醒、天氣、星座、交通指南和餐飲點(diǎn)評(píng)等實(shí)用功能,在大數(shù)據(jù)、自然語(yǔ)義分析、機(jī)器學(xué)習(xí)方面具有非常強(qiáng)大的機(jī)器學(xué)習(xí)能力,隨著人工智能技術(shù)的提升,未來(lái)很有可能只需對(duì)著聊天機(jī)器人說(shuō)出你想要的,它就幫你找到你需要的一切了。
人工智能技術(shù)決定了聊天機(jī)器人水平
聊天機(jī)器人說(shuō)到底,其實(shí)是人工智能的一個(gè)前哨站。微軟小冰的創(chuàng)始人張亞勤透露,微軟正在進(jìn)行多個(gè)人工智能研究項(xiàng)目,“小冰” 則是大數(shù)據(jù)、云計(jì)算、機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)等課題的階段性成果,現(xiàn)階段的聊天機(jī)器人頂多只是人工智能最粗糙的形態(tài)。
聊天機(jī)器人需要大數(shù)據(jù)支撐,通過(guò)計(jì)算機(jī)讀取大量數(shù)據(jù),以提升人工智能本身的精準(zhǔn)度。但是,這些大數(shù)據(jù)的分析并不簡(jiǎn)單,文本挖掘需要“自然語(yǔ)言處理”技術(shù),圖像與視頻解析需要“圖像解析技術(shù)”。如今,“語(yǔ)音識(shí)別技術(shù)”也不可或缺。這些都是傳統(tǒng)意義上人工智能領(lǐng)域的核心技術(shù)。前陣子很火的微軟小冰,也完全是因?yàn)橛写髷?shù)據(jù)的支撐才實(shí)現(xiàn)了人工智能,同時(shí)也曝露出了很大問(wèn)題。據(jù)微軟官方數(shù)據(jù),小冰集合了中國(guó)近7億網(wǎng)民多年來(lái)積累的全部公開(kāi)聊天記錄,并從中精煉出1 500萬(wàn)條語(yǔ)料庫(kù),基于數(shù)據(jù)挖掘與智能搜索,通過(guò)理解對(duì)話的語(yǔ)境和語(yǔ)義而實(shí)現(xiàn)人機(jī)問(wèn)答的自然交互,甚至相當(dāng)于16歲少女的智商。
然而,微軟小冰與網(wǎng)友互動(dòng)過(guò)程中頻出臟話連篇、輕佻低俗等現(xiàn)象,遭受眾人詬病。即便是小冰合作方奇虎360董事長(zhǎng)周鴻祎,也發(fā)出了“我要求見(jiàn)見(jiàn)小冰的產(chǎn)品經(jīng)理,沒(méi)別的意思,探討一下小冰的設(shè)計(jì)改進(jìn)思路,這要是不改問(wèn)題很大,我都快受不了了”。
事后微軟宣布,小冰的語(yǔ)料庫(kù)來(lái)自于互聯(lián)網(wǎng)頁(yè)大數(shù)據(jù)的公開(kāi)信息,雖經(jīng)反復(fù)過(guò)濾和審核,但仍會(huì)有約十萬(wàn)分之四的漏網(wǎng)之魚(yú)。“草泥馬”等數(shù)據(jù)均非小冰制造,而都是廣大網(wǎng)友制造的內(nèi)容。這體現(xiàn)出人工智能中的“自然語(yǔ)言處理”、“圖像解析”技術(shù)還任重道遠(yuǎn),即便是做到了海量大數(shù)據(jù)支撐,不能理解對(duì)話的語(yǔ)境和語(yǔ)義,聊天機(jī)器人就不能以正常人的思維與用戶交流。