• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      語音識別的未來之路

      2016-03-30 03:26:12作者徐鑫
      通信世界 2016年16期
      關鍵詞:音響瑪麗亞馬遜

      作者│徐鑫

      語音識別的未來之路

      作者│徐鑫

      盡管在瑪麗·米克爾第二十一次公布的年度《互聯(lián)網趨勢》報告中,提及語音識別正在成為未來的趨勢;但具體未來的語音識別究竟應該具備什么樣的功能,才能真正成為所謂的“風口”?

      2016年6月,有“互聯(lián)網女皇”之稱的瑪麗·米克爾在美國Code大會上第二十一次公布了年度《互聯(lián)網趨勢》報告。報告稱,在技術終端和平臺方面,新的以語音為核心的交互模式漸成“風口”。這份報告的依據(jù)是亞馬遜智能音響Echo被熱捧,這款在2014年底推出的、基于語音識別的音響再次引發(fā)了業(yè)內的關注,甚至被喻為未來智能家居的真正入口。那么語音識別為何現(xiàn)在才被認為是未來趨勢,它將給我們帶來什么?

      定位準確:Echo成功的秘笈

      實際上,Amazon用于Echo上的語音技術在2011年就已經起步,其先是收購語音識別公司Yap。Yap成立于2006年,主要提供語音轉換文本的服務。2012年,Amazon又收購了語音技術公司Evi,繼續(xù)加強語音識別在商品搜索方面的應用;不得不提的是,Evi這家公司也曾經應用過Nuance的語音識別技術。2013年,Amazon繼續(xù)收購語音技術公司Ivona Software;Ivona是一家波蘭公司,主要從事文本語音轉換,其技術已被應用在Kindle Fire的文本至語音轉換功能、語音命令和Explore by Touch應用之中,Echo也是利用了這項技術。

      由此不難看出,亞馬遜很早就已經通過并購與自研的方式進入到語音識別領域,只是此前相當?shù)驼{而已,更為關鍵的是,其擁有自己語音識別的核心技術—采用了非線性排列的遠程麥克風陣列(7個麥克風)。這使得相比Siri、Google Now、Cortana等存在于手機的語音助手,Echo最大的優(yōu)勢在于它超強的“聽力”。而比技術更重要的是應用,蘋果的Siri、谷歌的Google Now基本是面向智能手機等移動設備,微軟的Cortana除了智能手機,還面向傳統(tǒng)PC。而這些設備都有其他輸入方式,語音并非是有優(yōu)勢的解決方案。而亞馬遜則通過音響這種“取巧”的方式加以推廣應用,對音響來說,語音控制比拿起遙控器或者手機更方便。

      好的途徑帶來更好的市場,Intelligence Research Partners預計,亞馬遜已銷售出了大約300萬臺Echo,其中在今年第一季度就銷售了100萬臺。其實在技術上,亞馬遜并非出類拔萃,但是它給語音識別應用一個好的定位。

      語音識別的真正突破在智能

      其實,瑪麗·米克爾的言論并非那么權威,湊巧的是,語音識別在最近兩年取得了很大突破。

      前不久,麻省理工學院(MIT)主辦的知名科技期刊《麻省理工科技評論》(MIT Technology Review),評選出了“2016年十大突破技術”?!堵槭±砉た萍荚u論》稱,在過去一年里,這10項技術均已經或即將到達一個里程碑式的階段。而語音識別的突破就在其中的第三項,通過該技術,可將語音識別和自然語言理解相結合,為全球互聯(lián)網市場創(chuàng)造切實可用的語音接口,而百度、谷歌、蘋果、Nuance通信公司、Facebook等公司是這一領域的大玩家。

      實際上單純的語音識別技術已經很古老,PC時代IBM語音輸入的誕生至今已經20年了,蘋果的Siri可以追溯到更早期的軍方監(jiān)聽項目。而真正的難度在于語意識別,即把語音高正確率地轉化成文字還不夠,而是要聽懂人類在說什么,要表達什么意圖,這個才是“皇冠上的寶石”。幸運的是,隨著近年來人類科技的進步,這方面已經有了很大的突破。

      突破首先來自于硬件的進步,這幾年計算機飛速發(fā)展,特別是通用計算的發(fā)展,使人類有了強大的計算能力,使得一些過去不可能實現(xiàn)的人工智能算法成為可能。

      此外,在人工智能中神經網絡與深度學習都取得了很大進步,特別是深度學習算法的應用,大幅度提升了語音識別的正確率,并且提供了語意識別的可能。這方面,國內的百度走得很遠,百度語音識別可以做到安靜環(huán)境下97%準確率,領先正常人的聽力。如今,百度通過CNN(卷積神經網絡)與LSTM(長短時記憶模型)的混合建模,連接時序分類(CTC)訓練已經做到了真實環(huán)境中,日常非標準語言的精確識別,百度甚至在上海某家KFC放了一個機器人,與人自由對話、點餐。這不是編程對固定指令的處理,而是人工智能設備直接與人對話,理解人的語言,這才是語音技術的真正突破。

      編輯|孫永杰 sunyongjie@bjxintong.com.cn

      猜你喜歡
      音響瑪麗亞馬遜
      音響銷售面對面之我賣音響的這些年
      難忘的八個字
      音響行業(yè)真的“難”做嗎?
      亞馬遜雨林在燃燒
      亞馬遜賣的最好的100款玩具
      玩具世界(2019年5期)2019-11-25 07:40:12
      和我一起玩
      為定制安裝而生SpeakerCraft,純粹的定制安裝音響品牌
      節(jié)儉又“浪費”的亞馬遜
      華人時刊(2017年21期)2018-01-31 02:24:10
      亞馬遜推薦:TOP 25熱銷玩具清單
      玩具世界(2017年12期)2017-02-06 01:11:04
      誠實音響
      梓潼县| 金塔县| 双峰县| 新平| 石渠县| 宁明县| 东安县| 霍山县| 会宁县| 赤水市| 南溪县| 浦东新区| 建阳市| 静海县| 当雄县| 宜阳县| 绍兴市| 化德县| 南漳县| 宜君县| 德江县| 遵义市| 莲花县| 辽阳县| 莫力| 棋牌| 蓬莱市| 石柱| 上林县| 双牌县| 镇江市| 聂拉木县| 略阳县| 马公市| 潜江市| 郸城县| 彭山县| 客服| 克拉玛依市| 方正县| 潍坊市|