正月
人工智能等技術(shù)都在背后加快著計(jì)算機(jī)的“聽(tīng)說(shuō)”功能。
對(duì)著谷歌 Home智能音箱,“偷偷”告訴它你想買(mǎi)買(mǎi)買(mǎi)的東西。英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、印度語(yǔ)……語(yǔ)言沒(méi)有阻礙你的手機(jī)會(huì)瞬間知曉這個(gè)“秘密”,并且還能顯示搜索結(jié)果。
當(dāng)然,除了懂得多國(guó)語(yǔ)言,谷歌 Home的語(yǔ)音配對(duì)(Voice Match)功能,可以讓最多六個(gè)用戶連接到同一臺(tái)音箱。據(jù)說(shuō)它是首個(gè)具備此功能的智能音箱,也因此顯得與其它智能音箱更加不同。
現(xiàn)在,語(yǔ)音助手已然成為智能手機(jī)們的標(biāo)配,有“個(gè)性”就成為差異化的要素。比如蘋(píng)果的Siri是個(gè)段子手、三星的Bixby成了消除孤獨(dú)寂寞冷的高手……
去年10月推出的谷歌 Pixel手機(jī)在今年升級(jí)后會(huì)展現(xiàn)什么樣的個(gè)性呢?這可能要取決于 “谷歌 Assistant”的發(fā)揮。
這個(gè)工具能夠整合日歷和事件功能,可以根據(jù)用戶當(dāng)前的位置、活動(dòng)項(xiàng)目整合服務(wù),而不再是單一的網(wǎng)絡(luò)搜索功能?!霸诓煌O(shè)備之間通用的谷歌 Assistant,通過(guò)機(jī)器學(xué)習(xí),會(huì)隨著時(shí)間的推移而變得越發(fā)強(qiáng)大。”谷歌 Assistant 工程總監(jiān)Pravir Gupta說(shuō)。
這是谷歌正在探索的軟件硬件結(jié)合的模式。人工智能等技術(shù)都在背后加快著計(jì)算機(jī)的“聽(tīng)說(shuō)”功能。比如深度神經(jīng)網(wǎng)絡(luò)技術(shù)提高了語(yǔ)音搜索中語(yǔ)音識(shí)別的準(zhǔn)確性,這使得用戶在嘈雜的環(huán)境中也可以與手機(jī)自由對(duì)話。在機(jī)器學(xué)習(xí)的幫助下,自然語(yǔ)言處理系統(tǒng)能夠更好地理解人們想說(shuō)的話。
現(xiàn)在谷歌語(yǔ)音搜索支持 119 種語(yǔ)言,其中包括 11 種印度語(yǔ)言和 3 種印度尼西亞語(yǔ)言。Pixel Buds是一種能實(shí)時(shí)將你周?chē)鷦e人說(shuō)的話翻譯成你的母語(yǔ)的耳機(jī),運(yùn)用了語(yǔ)音識(shí)別和翻譯技術(shù)。有了它你就能在陌生的語(yǔ)言環(huán)境中漫游,幾秒鐘后便能翻譯成你的母語(yǔ)。這項(xiàng)技術(shù)的翻譯效果也將隨著時(shí)間的推移得到顯著的提升。
另一方面,機(jī)器學(xué)習(xí)正在實(shí)現(xiàn)文本向語(yǔ)音轉(zhuǎn)換,通過(guò)轉(zhuǎn)換引擎,手機(jī)可以用語(yǔ)料并不豐富的語(yǔ)種,比如孟加拉語(yǔ)、高棉語(yǔ)和爪哇語(yǔ)與人們對(duì)話。機(jī)器學(xué)習(xí)模型有助于減少構(gòu)建文本到語(yǔ)音模型所需的數(shù)據(jù)量。
人工智能等技術(shù)也反過(guò)來(lái)被應(yīng)用到最新一代的Pixel手機(jī)中。機(jī)器學(xué)習(xí)和計(jì)算攝影技術(shù)的結(jié)合使新款Pixel 手機(jī)具備了人像模式功能。這個(gè)功能能夠在拍攝人像時(shí)柔和虛化背景,讓Pixel在拍照功能上能夠和IPHONE 7 Plus之后的手機(jī)媲美。
語(yǔ)音的新戰(zhàn)場(chǎng)
好的醫(yī)療文檔有助于醫(yī)療團(tuán)隊(duì)成員更好的照顧病患?,F(xiàn)在醫(yī)生們經(jīng)常要在工作日中花6~11小時(shí)在電子病歷上,醫(yī)生們嘗試使用工具來(lái)創(chuàng)建醫(yī)患對(duì)話的日志。而語(yǔ)音技術(shù)在“翻譯”醫(yī)患對(duì)話上找到了新的戰(zhàn)場(chǎng)。
谷歌 Brain團(tuán)隊(duì)嘗試使用谷歌 Assistant、谷歌 Home以及谷歌 Translate來(lái)紀(jì)錄醫(yī)患對(duì)話,并總結(jié)記錄。在“醫(yī)療對(duì)話中的語(yǔ)音識(shí)別”項(xiàng)目中,這個(gè)團(tuán)隊(duì)展示了使用自動(dòng)語(yǔ)音識(shí)別模型紀(jì)錄醫(yī)療對(duì)話的可能。大部分現(xiàn)有的醫(yī)療自動(dòng)語(yǔ)音識(shí)別解決方案,主要是識(shí)別醫(yī)生醫(yī)囑,也就是說(shuō)識(shí)別一個(gè)人的專用醫(yī)療術(shù)語(yǔ)。而這個(gè)項(xiàng)目是建立能夠識(shí)別多人對(duì)話,并且內(nèi)容涵蓋從天氣到醫(yī)療判斷的語(yǔ)音模型。
谷歌的這個(gè)團(tuán)隊(duì)與斯坦福大學(xué)的醫(yī)生和研究者一起開(kāi)展工作。實(shí)際上,斯坦福大學(xué)已經(jīng)在使用技術(shù)提升醫(yī)生滿意度上做了廣泛研究,理解類(lèi)似自動(dòng)語(yǔ)音識(shí)別技術(shù)如何抓取醫(yī)生的記錄。
在一項(xiàng)研究中,團(tuán)隊(duì)研究了何種類(lèi)型的醫(yī)療相關(guān)信息能夠被從醫(yī)療對(duì)話中抽取出來(lái),從而降低醫(yī)生不斷打開(kāi)電子病例的頻率。這項(xiàng)研究獲得了病人的授權(quán),并且為了保護(hù)個(gè)人隱私而模糊了病患身份。谷歌團(tuán)隊(duì)希望這項(xiàng)研究不僅能降低醫(yī)生的日常工作負(fù)載,還能幫助病患得到更好的醫(yī)療照顧。
掘金大部隊(duì)
除了谷歌之外,微軟、亞馬遜等公司都是語(yǔ)音識(shí)別市場(chǎng)上的主要玩家。為推動(dòng)AI語(yǔ)音技術(shù)發(fā)展、同時(shí)阻擊蘋(píng)果和谷歌等競(jìng)爭(zhēng)對(duì)手,微軟和亞馬遜還選擇“抱團(tuán)”策略,雙方在9月就AI語(yǔ)音助手合作達(dá)成了共識(shí),將雙方各自的智能語(yǔ)音助理Cortana和Alexa進(jìn)行整合。
通過(guò)此次合作,雙方的語(yǔ)音助手將能夠互相激活。亞馬遜Alexa的用戶可以訪問(wèn)微軟Cortana的一些特有功能,如工作日歷,閱讀工作郵件。而Cortana的用戶可以通過(guò)Alexa在亞馬遜網(wǎng)站上購(gòu)物,也可以控制家中的智能設(shè)備。不過(guò),評(píng)論認(rèn)為有一個(gè)現(xiàn)實(shí)壁壘擺在微軟和亞馬遜面前,這兩家公司都沒(méi)有自己的智能手機(jī)。
微軟旗下的智能語(yǔ)音助手Cortana與亞馬遜旗下的Alexa、谷歌旗下的谷歌 assistant和蘋(píng)果旗下的Siri正在智能家居領(lǐng)域鋪開(kāi)全面競(jìng)爭(zhēng),這幾家IT巨頭都在試圖將旗下的智能語(yǔ)音服務(wù)滲透到人們生活的各個(gè)場(chǎng)景中爭(zhēng)奪入口。
三星除了自有的Bixbay外,還奉行開(kāi)放策略。三星電子旗下音箱和汽車(chē)零部件企業(yè)哈曼國(guó)際公司所推出的音箱分別支持谷歌Assistant、亞馬遜 Alexa 以及微軟 Cortana。哈曼旗下?lián)碛蠮BL等多個(gè)知名品牌。語(yǔ)音操控系統(tǒng)與硬件的結(jié)合,成為巨頭公司圈地之戰(zhàn)。
不過(guò),作為人類(lèi)延長(zhǎng)器官而存在的智能手機(jī)決定了這才是語(yǔ)音識(shí)別技術(shù)的最大戰(zhàn)場(chǎng)。一項(xiàng)調(diào)查顯示,語(yǔ)音識(shí)別市場(chǎng)在2023年將價(jià)值183億美元,年復(fù)合增長(zhǎng)率將達(dá)到19.8%。