• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中文語音識(shí)別領(lǐng)域的激戰(zhàn)

      2017-05-30 20:07:19徐坤
      關(guān)鍵詞:搜狗巨頭阿里

      徐坤

      早前,業(yè)界普遍認(rèn)為語音識(shí)別領(lǐng)域?qū)?huì)催生出巨頭公司。在英語領(lǐng)域,作為搜索巨頭的Google逐漸占據(jù)了行業(yè)的主導(dǎo)權(quán)。而在中文領(lǐng)域,語音識(shí)別行業(yè)正面臨新一輪的洗牌,科大訊飛、搜狗和百度等紛紛將目光瞄準(zhǔn)了語音識(shí)別技術(shù)。重兵布局的各方誰會(huì)成為中國語音識(shí)別領(lǐng)域標(biāo)準(zhǔn)的制定者,并占據(jù)行業(yè)主導(dǎo)權(quán)呢?

      技術(shù)為王。百度與微軟雙雄鼎立

      去年10月中旬,微軟人工智能與研究部門的一個(gè)研究者和工程師團(tuán)隊(duì)報(bào)告出他們的語音識(shí)別系統(tǒng)實(shí)現(xiàn)了和專業(yè)速錄員相同甚至更低的誤字率(word error rate,簡稱WER),降到了5.9%,而一個(gè)月前這一數(shù)字還是6.3%。微軟首席語音工程師黃學(xué)東表示,“我們已經(jīng)達(dá)到了人類水平,這是一項(xiàng)歷史性的成就?!?img alt="" src="https://cimg.fx361.com/images/2023/07/16/qkimagesjsswjssw201701jssw20170130-1-l.jpg"/>

      有意思的是,百度首席科學(xué)家吳恩達(dá)(Andrew Ng)立即在Twitter上表示祝賀,并毫不掩飾地?cái)[出了百度的戰(zhàn)績,“在2015年我們就超越了人類水平的漢語識(shí)別;很高興看到微軟在不到一年之后讓英語也達(dá)到了這一步?!睍r(shí)隔一年,百度和微軟兩大人工智能科技巨頭先后分別在漢語和英語語音識(shí)別研究方面取得了超越人類的成果,轟動(dòng)業(yè)界。

      近年來,隨著數(shù)據(jù)量的豐富和計(jì)算能力的提升,語音識(shí)別行業(yè)迅速崛起。據(jù)統(tǒng)計(jì),僅美國至少就有26家公司在開發(fā)語音識(shí)別技術(shù)。

      2015年之前,Nuance是當(dāng)之無愧的全球語音領(lǐng)域老大。隨著Google、微軟和蘋果都選擇自己建立團(tuán)隊(duì)開發(fā)語音業(yè)務(wù),在此之后,Nuance的市場份額節(jié)節(jié)下跌,2014年還高達(dá)60%的市場份額,一年過去只剩下31.1%。相比之下,Google語音識(shí)別的市場份額增長明顯,逐漸占據(jù)了英語領(lǐng)域的主導(dǎo)權(quán)。

      盡管Google、微軟和蘋果這些巨頭在語音識(shí)別技術(shù)上的技術(shù)積累和先發(fā)優(yōu)勢讓后來者似乎難望其項(xiàng)背,但因?yàn)橐恍┱吆褪袌龇矫娴脑颍@些巨頭的語音識(shí)別主要偏向于英語,這給中國互聯(lián)網(wǎng)企業(yè)在中文領(lǐng)域崛起提供了機(jī)會(huì),百度就是其中的佼佼者。百度收集了大量中文(尤其是普通話)的音頻數(shù)據(jù),這給其Deep Speech 2技術(shù)成果提供了基本的數(shù)據(jù)優(yōu)勢。

      事實(shí)上,在當(dāng)前的發(fā)展脈絡(luò)下,語音識(shí)別的準(zhǔn)確率和通用性的本質(zhì)就在于三個(gè)方面:數(shù)據(jù)量的多少、算法的優(yōu)劣和計(jì)算能力的水平。在這三個(gè)方面的比拼中,互聯(lián)網(wǎng)巨頭擁有很大的優(yōu)勢,因?yàn)樗鼈儞碛凶疃嗟臄?shù)據(jù),最頂級(jí)的人才以及最強(qiáng)大的計(jì)算能力水平。所以當(dāng)Google開放語音識(shí)別API后,在英語語音識(shí)別的市場中,Google比Nuance有更大的優(yōu)勢。而在中文市場中,百度也扮演著和Google在英語市場相似的角色,甚至更為出色。

      2015年12月,在Deep Speech 2首次發(fā)布時(shí),吳恩達(dá)稱其識(shí)別精度已經(jīng)超越了Google Speech API、wit.ai、微軟的Bing Speech以及蘋果的Dictation至少10個(gè)百分點(diǎn)。2016年2月,百度表示Deep Speech 2的短語識(shí)別誤字率已經(jīng)降到了3.7%。

      群雄逐鹿,中文領(lǐng)域的生死戰(zhàn)

      毫無疑問,微軟和百度的語音識(shí)別技術(shù)水平都很驚人,但一項(xiàng)技術(shù)終究要變成產(chǎn)品和服務(wù)才能實(shí)現(xiàn)價(jià)值,所以在英語語音識(shí)別市場占據(jù)主導(dǎo)地位的是Google而非微軟。在中文語音識(shí)別市場,這方面做得最好的公司莫過于科大訊飛。

      Google是最早在全球范圍內(nèi)大規(guī)模使用深度神經(jīng)網(wǎng)絡(luò)的公司,而科大訊飛是中國第一個(gè)在商用系統(tǒng)里使用深度神經(jīng)網(wǎng)絡(luò)的公司。2010年,科大訊飛率先將語音輸入功能引入到了手機(jī)當(dāng)中,截至2016年6月,《訊飛輸入法》已經(jīng)擁有3.6億用戶,活躍用戶更是超過1億人,其中,語音用戶滲透率高達(dá)59%。在國內(nèi)語音行業(yè),科大訊飛已是不折不扣的龍頭企業(yè)。而不久之前,《訊飛輸入法》還因在錘子手機(jī)發(fā)布會(huì)上的驚艷表現(xiàn)備受關(guān)注。

      在2016年10月18日晚上的錘子手機(jī)發(fā)布會(huì)上,羅永浩現(xiàn)場展示了科大訊飛97%正確率的語音輸入。一夜之間,科大訊飛幾乎成了所有科技媒體人所討論的話題和關(guān)注的焦點(diǎn)。其實(shí),除了錘子手機(jī)的Smartisan OS之外,華為、小米和魅族等廠商的語音服務(wù)或者輸入法都在使用或曾經(jīng)使用過科大訊飛的技術(shù)。據(jù)悉,在未來的三年中,科技巨頭英特爾也將與科大訊飛合作,一起研究機(jī)器學(xué)習(xí)和深度學(xué)習(xí)項(xiàng)目。

      除了科大訊飛,國內(nèi)在語音識(shí)別領(lǐng)域有所建樹的大公司還有不少。在2016年4月中旬舉行的“云棲大會(huì)南京峰會(huì)”上,阿里云總裁胡曉明率先進(jìn)行演講,阿里云的“小Ai”機(jī)器人全程對(duì)胡曉明的語音進(jìn)行了實(shí)時(shí)翻譯文字,這也是阿里巴巴第一次對(duì)外公布阿里云人工智能的能力。其實(shí),這并非“小Ai”首次展示自己的速記能力。在阿里云2016年年會(huì)上,“小Ai”曾打敗了世界中文速記大賽亞軍。阿里云人工智能技術(shù)專家陳一寧透露,“在阿里云大數(shù)據(jù)平臺(tái)數(shù)加上,智能語音交互產(chǎn)品就是采用的“小Ai”的技術(shù)。目前,阿里云還在探討同各類直播平臺(tái)的合作,以后所有的直播都能具備實(shí)時(shí)加字幕功能。

      除了阿里云,搜狗也是國內(nèi)語音識(shí)別領(lǐng)域不容忽略的一方諸侯。在去年11月中旬舉行的第三屆世界互聯(lián)網(wǎng)大會(huì)上,搜狗CEO王小川首秀搜狗“黑科技”——機(jī)器同傳,展示了實(shí)時(shí)機(jī)器翻譯技術(shù),將演講嘉賓的中文講話實(shí)時(shí)語音識(shí)別并同步翻譯為英文上屏顯示,引起轟動(dòng)。這是全球首次基于神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)機(jī)器翻譯技術(shù)在大型活動(dòng)上的展示,效果可靠、準(zhǔn)確率已接近人類同傳翻譯結(jié)果。而在近期人工評(píng)測中,搜狗機(jī)器翻譯在演講、旅游、閑聊和日常口語等領(lǐng)域,采用5分制人工評(píng)分能達(dá)到4.4分,走向?qū)嵱没?。目前,搜狗語音識(shí)別準(zhǔn)確率已超過97%,識(shí)別速度達(dá)到了400字每分鐘。

      除了科大訊飛、阿里云和搜狗等互聯(lián)網(wǎng)大佬,國內(nèi)還有不少專注自然語言處理技術(shù)的創(chuàng)業(yè)公司,如云知聲和思必馳等。云知聲CEO黃偉表示,云知聲的識(shí)別準(zhǔn)確率已經(jīng)能達(dá)到97%,屬于業(yè)內(nèi)一流水平。相比之下,思必馳做的是語音對(duì)話交互技術(shù)的整體解決方案,而不是單純的語音識(shí)別解決方案。因此在場景應(yīng)用中,思必馳的系統(tǒng)和科大訊飛的系統(tǒng)多有比較,可相互媲美。

      毫無疑問,面對(duì)擁有領(lǐng)先優(yōu)勢的科大訊飛,以及阿里云和搜狗等實(shí)力雄厚的互聯(lián)網(wǎng)大佬,還有云知聲和思必馳這類不容小覷的創(chuàng)業(yè)公司,百度雖然擁有做人的技術(shù)和財(cái)力,但想在中文語音識(shí)別領(lǐng)域獨(dú)霸江湖仍有不小的難度。未來難測,深挖場景是必經(jīng)路

      未來5年,語音市場將顯著增長,到2020年,全球語音市場規(guī)模預(yù)計(jì)將達(dá)到191.7億美元。語音識(shí)別之所以潛力巨大,很大程度上源于它是最便捷的人機(jī)交互方式,也是人工智能的重要入口。近年來,國內(nèi)外互聯(lián)網(wǎng)巨頭們都在發(fā)力人工智能,雖然各自的側(cè)重點(diǎn)不同,但都極為倚靠語音識(shí)別技術(shù)。畢竟,語音輸入本身只是一個(gè)途徑,它最終仍然要和實(shí)際操作相結(jié)合。

      語音識(shí)別技術(shù)要在現(xiàn)實(shí)生活中落地,必須與場景結(jié)合,這需要吸納來自各種場景的數(shù)據(jù)去訓(xùn)練語音技術(shù),讓其更加智能化。這也是為什么“微軟小冰”每周都要上線新功能,努力刺激用戶貢獻(xiàn)更多聊天數(shù)據(jù),而科大訊飛則不斷擴(kuò)大包括長虹等智能電視在內(nèi)的合作名單,吸納來自入口級(jí)硬件的數(shù)據(jù)。數(shù)據(jù)顯示,與訊飛人工智能連接的應(yīng)用,日均訪問量為30億次。

      與科大訊飛相比,百度在海量用戶數(shù)據(jù)和人工智能技術(shù)上的優(yōu)勢,能讓他們迅速發(fā)展出優(yōu)秀的語音智能。從這個(gè)角度來說,百度的發(fā)展道路比科大訊飛更寬。在百度生態(tài)內(nèi)部,目前語音技術(shù)的落地滲透在《百度地圖》、《手機(jī)百度》和《百度輸入法》等產(chǎn)品中。而在外部,截至2016年年中,使用百度語音技術(shù)的APP數(shù)量超過8萬款,大型合作廠商包括中興、魅族和聯(lián)想等。百度語音如今能獲取的數(shù)據(jù)規(guī)模非常龐大,據(jù)吳恩達(dá)透露,在線識(shí)別請(qǐng)求量2016年每天達(dá)到1.4億次,在線語音合成請(qǐng)求量則達(dá)到2億次。

      除依靠產(chǎn)品收集用戶數(shù)據(jù)之外,各大廠商還在積極與數(shù)據(jù)資源商合作,以更快捷地獲得龐大的數(shù)據(jù)支撐。隨著這些數(shù)據(jù)的輸入,每分每秒,人工智能的模型會(huì)迅速迭代和升級(jí),就像Google的AlphaGo在每一場棋局的每一步對(duì)決中都在學(xué)習(xí)。

      作為底層技術(shù),語音識(shí)別未來的發(fā)揮空間極大,將廣泛出現(xiàn)在手機(jī)、智能家居、醫(yī)療、教育和司法等各種場景。當(dāng)然,這還有很長的一段路要走,想要在這條路上脫穎而出的公司,—方面要面對(duì)同行的生死競爭,另—方面還需努力解決語音識(shí)別技術(shù)仍然存在的一些瓶頸。

      小編觀點(diǎn)

      目前,國內(nèi)語音識(shí)別領(lǐng)域仍然是群雄混戰(zhàn)的局面,短期來說,科大訊飛仍有著明顯領(lǐng)先優(yōu)勢。然而,隨著人工智能的進(jìn)步,語音識(shí)別技術(shù)逐漸往大規(guī)模產(chǎn)業(yè)化發(fā)展時(shí),公司的技術(shù)生態(tài)會(huì)非常重要,百度這類互聯(lián)網(wǎng)巨頭將迎來快速發(fā)展期。在核心技術(shù)和能力的比拼下,語音識(shí)別也將進(jìn)入巨頭崛起,傳統(tǒng)語音公司稍顯沒落的時(shí)代。

      猜你喜歡
      搜狗巨頭阿里
      海里的巨頭蝌蚪
      豬價(jià)再降下去 巨頭也挺不住了?
      云上阿里
      炎黃地理(2021年1期)2021-06-08 00:27:03
      騰訊擬147億元全資收購搜狗
      辰辰帶你游阿里
      石化巨頭35年成長記
      能源(2018年7期)2018-09-21 07:56:28
      搜狗三季度營收同比增長
      CHIP新電腦(2016年11期)2016-12-03 14:26:58
      阿里戰(zhàn)略
      阿里是個(gè)好榜樣
      搜狗分號(hào)工具箱 輸入更便捷
      驻马店市| 南京市| 保康县| 嫩江县| 墨竹工卡县| 手机| 白水县| 南宫市| 泰宁县| 德庆县| 土默特左旗| 贞丰县| 清涧县| 米易县| 隆子县| 化隆| 威信县| 南川市| 那曲县| 黔江区| 澄江县| 南岸区| 浏阳市| 镇康县| 正阳县| 无棣县| 永兴县| 揭东县| 建水县| 定兴县| 亚东县| 临邑县| 砀山县| 昌图县| 贺兰县| 齐河县| 邵武市| 葵青区| 宿州市| 昌宁县| 独山县|