• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      未來,聲音將控制一切

      2015-04-20 19:15:50倪偉杰
      支點(diǎn) 2015年4期
      關(guān)鍵詞:助手語義語音

      倪偉杰

      核心提示:隨著移動(dòng)互聯(lián)網(wǎng)和人工智能的發(fā)展,人機(jī)交互方式將向智能語音交互方式發(fā)展。在未來,我們將用聲音控制一切。

      電影《她》中,主人公西奧多的工作是寫信,坐在電腦前,對(duì)著電腦口述信件內(nèi)容,屏幕上就會(huì)即時(shí)顯示文字內(nèi)容。下班后,西奧多通過向手機(jī)發(fā)布語音指令來聽音樂、讀電子郵件和瀏覽新聞。

      西奧多最近才離了婚,他的寂寞是手機(jī)無法理解的,直到他遇上世界上首個(gè)人工智能操作系統(tǒng)OS1。OS1給自己取了個(gè)名字叫薩曼莎。西奧多在與薩曼莎的聊天中,找到了快樂,也成就了一段奇異的人機(jī)情緣。

      以前,我們與機(jī)器的交互,典型如操作手機(jī),從最初的按鍵盤按鈕到現(xiàn)在觸摸手機(jī)屏幕,主要靠動(dòng)手實(shí)現(xiàn)。隨著我們使用手機(jī)場景的不斷豐富,與電影中所展示的一樣,我們與手機(jī)通過語音交互的方式正在逐步流行。

      電影《她》被歸為科幻片。如果說西奧多通過語音控制手機(jī)播放音樂、瀏覽新聞多多少少有現(xiàn)實(shí)的影子的話,那么人工智能薩曼莎則是科幻。但是技術(shù)又不甘心只讓我們生活在幻想中。技術(shù)的創(chuàng)新力量就在于將科幻變?yōu)楝F(xiàn)實(shí)。得益于技術(shù)進(jìn)步,在萬物互聯(lián)的未來,我們與機(jī)器打交道,很可能是“動(dòng)口”不“動(dòng)手”。我們將用聲音控制一切。

      “耳”與“腦”

      要讓機(jī)器聽懂我們說的話并能與我們說話交流,這就需要給機(jī)器裝上“耳朵”、“大腦”和“嘴巴”。

      機(jī)器的“耳朵”作為語音傳輸?shù)耐ǖ?,能夠識(shí)別我們說話的聲音、語種和內(nèi)容,并將它們翻譯為文本,這里主要涉及到語音識(shí)別技術(shù)。

      “耳朵”聽到文本內(nèi)容后,機(jī)器“大腦”開始發(fā)揮作用,對(duì)文本的文法、背景知識(shí)和語義進(jìn)行邏輯分析,使機(jī)器真正理解我們說的究竟是什么意思。在這里,語義分析技術(shù)大顯神威。

      理解了我們所說的內(nèi)容,機(jī)器就要用“嘴巴”說話,對(duì)我們的訴求進(jìn)行反饋,將任意的文字轉(zhuǎn)化為自然流暢的語音。這就是語音合成技術(shù)。

      未來確保我們能用聲音控制一切的智能語音技術(shù),主要就包括上述三種子技術(shù)。

      在北京光年無限科技有限公司CEO俞志晨看來,語音識(shí)別和語義分析是最重要的智能語音技術(shù)。俞志晨和他的創(chuàng)業(yè)團(tuán)隊(duì)于2013年推出的“蟲洞語音助手”,就專長于語義分析。不要覺著“蟲洞”這個(gè)名字很科幻,就以為語音助手提供的都是些玄而又玄的服務(wù),其實(shí)它專注于為我們的日常生活服務(wù),問天氣、找飯館,信手拈來,很接地氣。

      《支點(diǎn)》記者曾經(jīng)與中國智能機(jī)器人第一品牌——小i機(jī)器人有過一次交流,其中有一段對(duì)話如下:

      記者:你覺得人工智能會(huì)毀滅人類嗎?

      小i機(jī)器人:我會(huì)的東西可多了,沒必要一一闡述了吧。

      在記者看來,小i機(jī)器人并沒有理解這個(gè)問題,許多智能語音產(chǎn)品在語義分析方面普遍做得不好。

      俞志晨解釋說:“這個(gè)問題對(duì)小i機(jī)器人來說太冷門了。就好像一個(gè)科學(xué)家向一個(gè)普通人問一個(gè)高深的科學(xué)問題,而普通人無法理解一樣?!辈贿^小i機(jī)器人在通信、金融等細(xì)分行業(yè)領(lǐng)域有著較為完備的知識(shí)庫,理解能力會(huì)較好。

      “說到底,語義分析主要基于算法和知識(shí)庫,優(yōu)化算法和知識(shí)庫建設(shè)將會(huì)提高語義分析能力?!庇嶂境繉?duì)《支點(diǎn)》記者說。

      對(duì)機(jī)器來說,除了有冷門問題的語義挑戰(zhàn),還有方言和環(huán)境噪音的困擾。中國各地的方言很多,如果使用環(huán)境比較嘈雜,都會(huì)影響到語音識(shí)別的準(zhǔn)確度?!霸诹己玫沫h(huán)境下,用普通話與機(jī)器對(duì)話,許多語音產(chǎn)品的識(shí)別率能在90%以上。而在噪音和方言環(huán)境中,識(shí)別準(zhǔn)確率只能達(dá)到60%-70%?!庇嶂境繉?shí)話實(shí)說。

      另外,電影《她》中普通手機(jī)與人工智能薩曼莎,在智能層次上有一定差距。薩曼莎可主動(dòng)與西奧多進(jìn)行對(duì)話交流,而普通手機(jī)必須在西奧多發(fā)出語音指令以后才會(huì)進(jìn)行交互。在交互方式上,現(xiàn)在的很多智能語音產(chǎn)品還無法像薩曼莎一樣主動(dòng)與用戶交互。

      聲控時(shí)代即將來臨

      盡管智能語音技術(shù)門檻很高,但隨著Siri的出現(xiàn),智能語音市場呈現(xiàn)出一番熱火朝天的景象,互聯(lián)網(wǎng)科技巨頭和創(chuàng)業(yè)公司紛紛入局智能語音。

      目前語音識(shí)別市場相對(duì)成熟,這得益于傳統(tǒng)老牌語音識(shí)別企業(yè)多年來的技術(shù)積累。比如為Siri提供語音技術(shù)支持的美國Nuance公司,占據(jù)著全球語音識(shí)別市場80%的份額。Nuance的語音識(shí)別引擎能識(shí)別大約60種語言和方言,可合成39種語言。全球上億部智能手機(jī)、車載導(dǎo)航系統(tǒng)以及呼叫中心,都使用了Nuance的語音技術(shù)。

      如果說Nuance是國際上的語音識(shí)別大佬,那么科大訊飛則在國內(nèi)語音識(shí)別市場上占據(jù)了頭把交椅。成立于1999年的科大訊飛,十幾年來一直專注于語音識(shí)別技術(shù)研發(fā)。據(jù)其官網(wǎng)稱,其在國內(nèi)電信、金融、能源、交通等行業(yè)內(nèi)的份額占到了80%以上。比如已經(jīng)合并的滴滴和快的所使用的語音技術(shù),就是由科大訊飛提供的。目前在國內(nèi)還有云知聲、中科信利和盛大等公司提供語音識(shí)別技術(shù)。

      與智能語音中的“耳”相比,“腦”還有很大的發(fā)展?jié)摿ΑV悄苷Z音的“腦”產(chǎn)品主要是像Siri一樣的人工智能,它們像私人助手一般,能夠聽懂我們說的話,從而為我們的生活提供便利。在國外私人語音助手市場上,蘋果的Siri、微軟的Cortana和谷歌的Google Now,形成三足鼎立的局面。

      Siri剛推出的時(shí)候,并沒有中文語音服務(wù),這就給了中國企業(yè)入局的機(jī)會(huì),各種中國版Siri紛至沓來。百度、搜狗和科大訊飛分別推出了自己的語音助手產(chǎn)品,也有像蟲洞語音助手、出門問問、小i機(jī)器人和智能360這樣的創(chuàng)業(yè)型公司推出的語音產(chǎn)品。

      智能語音的熱潮,是跟移動(dòng)互聯(lián)網(wǎng)的發(fā)展相適應(yīng)的。在移動(dòng)互聯(lián)網(wǎng)時(shí)代,新出現(xiàn)的各種場景化應(yīng)用讓以前的人機(jī)交互方式變得有些落伍,而語音作為最為自然的交互方式,則恰好滿足了新的場景化應(yīng)用需求。

      如今我們使用最多的移動(dòng)終端是智能手機(jī),與PC相比,手機(jī)屏幕較小,用手輸入較為不便,而語音輸入則更為便捷和自然。比如,駕駛汽車時(shí),用手來操作手機(jī)既不方便又很危險(xiǎn),而語音操作則顯得方便而又安全。

      中興通訊的終端事業(yè)部CEO曾學(xué)忠就認(rèn)為,移動(dòng)終端的下一個(gè)革命就是聲控革命。他說:“三年前我們還很難想象人們拿著手機(jī)對(duì)著微信吼,而現(xiàn)在的手機(jī)語音與三年前的微信語音一樣,在未來也會(huì)成為隨處可見的場景,聲控時(shí)代即將來臨。”

      語音或是移動(dòng)搜索的最好形式

      當(dāng)Siri剛開始出現(xiàn)的時(shí)候,許多人都是抱著娛樂的態(tài)度使用Siri,時(shí)不時(shí)會(huì)調(diào)戲Siri一番,比如對(duì)Siri說:“我愛你!”Siri也很狡猾:“希望你不要對(duì)其他手機(jī)也這么說。”

      但如果只把Siri當(dāng)作無聊時(shí)的陪聊工具,那就太掉價(jià)了,畢竟Siri是響當(dāng)當(dāng)?shù)娜斯ぶ悄?。正是得益于人工智能的發(fā)展,智能語音技術(shù)已經(jīng)應(yīng)用于我們生活中的各種場景,為我們服務(wù)。蟲洞語音助手正朝著這個(gè)方向發(fā)展。

      2012年3月,俞志晨和他的團(tuán)隊(duì)發(fā)布了蟲洞語音助手,他的愿景就是讓它成為用戶的私人助手,滿足生活的各種需求,查詢天氣、票務(wù)等各種有用信息。最初,蟲洞語音助手以手機(jī)應(yīng)用的形式出現(xiàn),使手機(jī)變身為智能機(jī)器人。隨后,蟲洞語音助手向車載系統(tǒng)、智能家居和可穿戴設(shè)備等方向遷移,使它的應(yīng)用范圍更加廣泛。

      “蟲洞語音助手主要專注于為用戶的生活服務(wù),現(xiàn)在也已應(yīng)用到了車載系統(tǒng)和智能家居上,比如我們跟海爾的智能家居就有合作?!庇嶂境繉?duì)《支點(diǎn)》記者說。

      因?yàn)樵谌藱C(jī)交互的語義分析領(lǐng)域深耕,俞志晨和他的團(tuán)隊(duì)在去年又推出了人機(jī)交互引擎服務(wù)平臺(tái)——圖靈機(jī)器人,其他的開發(fā)者可在圖靈機(jī)器人的基礎(chǔ)上做二次開發(fā)。開發(fā)者基于圖靈機(jī)器人,在微博、微信、客服、智能硬件等領(lǐng)域搭建個(gè)性化的智能機(jī)器人。目前有超過30000名開發(fā)者入駐圖靈機(jī)器人,形成了人工智能的良好生態(tài)。

      出門問問CEO李志飛和他的團(tuán)隊(duì),正在向著智能語音搜索方向發(fā)力。這位專注于機(jī)器翻譯的前谷歌科學(xué)家,繼承了谷歌的創(chuàng)新基因,回國后打造了中國版的Google Now——出門問問。在出門問問的微信公眾號(hào)上,用戶可以與它語音交流。比如問:“附近的咖啡館在哪里?”出門問問就會(huì)給用戶一個(gè)咖啡館列表。跟Siri不一樣,出門問問專注于為用戶提供生活服務(wù)信息搜索,而不會(huì)跟用戶閑聊。

      李志飛認(rèn)為智能語音搜索代表著移動(dòng)互聯(lián)網(wǎng)的發(fā)展方向。在PC時(shí)代,用戶習(xí)慣了對(duì)著鍵盤和屏幕文字搜索關(guān)鍵詞尋找需要的信息,地點(diǎn)是固定的,搜索內(nèi)容傾向于緊急性需求(工作、學(xué)習(xí)、醫(yī)療)和消遣性需求(影視、音樂、小說);而在移動(dòng)互聯(lián)網(wǎng)時(shí)代,用戶通常會(huì)在不同地點(diǎn)對(duì)著方寸之間的小屏幕進(jìn)行搜索,更傾向于搜索美食、地標(biāo)、旅游等LBS資源信息。

      “移動(dòng)設(shè)備的小型、移動(dòng)、便攜和功能性,以及更偏重生活和娛樂的需求,讓用戶傾向于更加直接、快速、簡潔的搜索方式,文字搜索已經(jīng)無法滿足用戶的需求,語音交互作為一種非常方便、自然的表達(dá),是移動(dòng)搜索的最好形式?!崩钪撅w在給《支點(diǎn)》記者的書面回復(fù)中強(qiáng)調(diào)。

      人工智能能否超越人類

      盡管智能語音市場潛力無限,各種語音技術(shù)產(chǎn)品和服務(wù)琳瑯滿目,但我們使用這些服務(wù)時(shí),總覺得它們還沒有像薩曼莎一樣聰明。福布斯資深記者Elise Ackerman就生活中的一些需求向Siri和Google Now尋求幫助時(shí)發(fā)現(xiàn),這些智能語音在實(shí)際生活當(dāng)中的表現(xiàn)差強(qiáng)人意。當(dāng)她向語音助手詢問最近的加油站時(shí),Siri為她介紹了很遠(yuǎn)的加油站,而Google Now則為她介紹了其他一個(gè)州的加油站,它們誰都不知道在Elise Ackerman家的拐角處就有一家加油站。

      智能語音技術(shù)作為人工智能的一部分,目前仍具有很大的技術(shù)發(fā)展空間。我們之所以覺得現(xiàn)在的語音產(chǎn)品不夠聰明,也許是因?yàn)槿斯ぶ悄艿摹捌纥c(diǎn)”還沒有到來。未來學(xué)家雷·庫茲韋爾有關(guān)人工智能的“奇點(diǎn)理論”,無疑給人工智能界注入了一劑強(qiáng)心劑。按照庫茲韋爾的理論,到2045年,“奇點(diǎn)”來臨,人工智能將超越人類智能水平。

      面對(duì)來勢洶洶的人工智能,埃隆·馬斯克、斯蒂芬·霍金和比爾·蓋茨等紛紛發(fā)出了警告,讓我們警惕人工智能這一人類的終結(jié)者。馬斯克曾經(jīng)這樣“黑”人工智能:“我們需要萬分警惕人工智能,它們比核武器更加危險(xiǎn)。”

      在俞志晨看來,馬斯克對(duì)人工智能的言論太過悲觀,而人工智能的所謂“奇點(diǎn)”在短期內(nèi)是不會(huì)來臨的,現(xiàn)階段讓人工智能像人類智能一樣仍舊很困難。對(duì)此,李志飛更直截了當(dāng)?shù)卣f:“奇點(diǎn)不會(huì)降臨,人類不會(huì)滅絕?!?/p>

      我們所說的人工智能也是分等級(jí)的。簡單的智能包括聽覺、視覺、觸覺等感知能力,高級(jí)的智能包括思考、情感、創(chuàng)造性等等。目前的人工智能技術(shù)還停留在初級(jí)階段。

      未來人工智能技術(shù)會(huì)獲得長足進(jìn)步,但離真正意義上的人類智能還有很大差距,沒有必要過于擔(dān)憂。計(jì)算機(jī)的優(yōu)勢在于強(qiáng)大的存儲(chǔ)和高速的運(yùn)算能力。在某些特定任務(wù)上,人工智能已經(jīng)超越人類,但在大多數(shù)方面,尤其是需要?jiǎng)?chuàng)造性的工作方面,計(jì)算機(jī)遠(yuǎn)不及人類。(支點(diǎn)雜志2015年4月刊)

      猜你喜歡
      助手語義語音
      語言與語義
      魔力語音
      基于MATLAB的語音信號(hào)處理
      電子制作(2019年14期)2019-08-20 05:43:38
      基于MQ3與MP3的價(jià)廉物美的酒駕語音提醒器
      電子制作(2019年9期)2019-05-30 09:42:10
      對(duì)方正在輸入……
      小說界(2018年5期)2018-11-26 12:43:42
      “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
      小助手
      靈感助手表彰大會(huì)(二)
      靈感助手表彰大會(huì)(一)
      認(rèn)知范疇模糊與語義模糊
      海林市| 万全县| 芦山县| 鹿邑县| 常州市| 建宁县| 汽车| 盱眙县| 正蓝旗| 乌审旗| 孟州市| 柏乡县| 荣昌县| 红河县| 鹤山市| 罗江县| 济南市| 乌什县| 韶关市| 大埔县| 六盘水市| 军事| 苍山县| 六盘水市| 霞浦县| 丁青县| 秀山| 边坝县| 桦甸市| 鄄城县| 兴国县| 阳信县| 北川| 成武县| 晴隆县| 甘德县| 康定县| 新邵县| 咸阳市| 伽师县| 三明市|