朱天健
摘? 要:人工智能的快速發(fā)展,與此同時帶來了語音輸入的發(fā)展,隨著兩者的互相推動下,人工智能出現(xiàn)了增長緩慢的態(tài)勢。同時,近年來,中國的人工智能和語音輸入快速發(fā)展,已處在了世界領(lǐng)先的地位。但是,隨之而來的是大量的不得不面對的困境。為此,我選擇了通過分析國內(nèi)人工智能和語音輸入領(lǐng)導(dǎo)者,科大訊飛。以尋找解決問題的可行方案,以及未來的發(fā)展方向。
關(guān)鍵詞:人工智能? 語音輸入? 科大訊飛
中圖分類號:TP183 ? ?文獻標識碼:A 文章編號:1672-3791(2019)09(b)-0016-02
隨著時代的發(fā)展,人工智能已經(jīng)進入了我們的生活。在不知不覺中,人們的生活方式開始發(fā)生了轉(zhuǎn)變,QQ、微信、支付寶等已經(jīng)成為了我們生活中不可或缺的一部分。然而,在使用種種軟件時,我們都不可避免的會用到輸入法。但是又一個問題隨之到來,我國有超過五千萬的老人在使用這些軟件,他們可能不會拼音,甚至不識字,那怎樣才能幫助老年人輸入自己所想的信息呢?語音輸入,成為了必不可少的軟件。由此可見,語音交互在未來必然與人們的生活息息相關(guān)。
1? 語音輸入的到來
當人工智能發(fā)展的如火如荼之時,相較之下,語音輸入更加顯得默默無聞。甚至可以說是,極少出現(xiàn)在人們的視野中。就目前來說,哪怕是最火爆,受眾面最廣的輸入軟件,其語音輸入的使用率甚至不足一半。但是,不用打字,不需要會拼音,也不需要會五筆,在如此優(yōu)越的條件下,使用語音輸入的人依舊是寥寥無幾。作為一個新事物,想發(fā)展就必須要找出自身的不足之處,并將其彌補。那么,語音輸入想要擁有更高的使用率就必須去探尋原因。對此,我做出了自己的以下幾點假設(shè)。
首先,當我們使用語音錄入的時候,我們需要周邊環(huán)境的安靜,但即使在這樣的條件下依然很難保證輸入內(nèi)容的準確性。
其次,我們利用語音輸入的內(nèi)容在出現(xiàn)明顯錯誤時,你很難中途停下來對其進行改正。
最后,也是我個人認為最重要的一點,就是語音輸入的私密性難以保證。當你在人群之中時,你的輸入內(nèi)容就會被大眾所知,難以保證個人的隱私。
2? 優(yōu)勢——以科大訊飛為例
在面對種種困難時,讓我們來看看行業(yè)的領(lǐng)軍者——科大訊飛又是如何去做的呢?在國內(nèi),以科大訊飛為首的語音公司投入大量的人力,物力,來尋找解決問題的方法。比如說科大訊飛就是國內(nèi)目前為止,也是唯一一家投入的科研資金超過總收入的25%的公司。面對著行業(yè)內(nèi)外的重重危機,科大訊飛既沒有像谷歌一樣大肆收購或并購頂尖公司,以此保證自身走在行業(yè)的領(lǐng)軍水平;也沒有像百度等其他的大公司一樣與國外的科研機構(gòu)展開合作,成立各式各樣的實驗室、研究所。相反,科大訊飛始終堅信自己的力量,成立了獨屬于自己的科大訊飛實驗室。同時,科大訊飛集中所有力量,研發(fā)構(gòu)建訊飛超腦,希望讓機器可以從能聽會說,逐步轉(zhuǎn)變?yōu)槟芾斫鈺伎?,以此來研發(fā)基于神經(jīng)網(wǎng)絡(luò)的認知智能系統(tǒng)??拼笥嶏w也同樣注重中國文化,組織大量的專家將各地的方言納入了語音輸入的范圍之內(nèi)。這樣,不僅更好的保存了中國傳統(tǒng)文化,推動其不斷發(fā)展的同時,也大大加強了語音輸入的受眾面,為期開拓了更為廣闊的市場。
同樣,精益求精也是開拓新興領(lǐng)域的一個必不可少的品質(zhì)。舉個例子,在科大訊飛中一直都流傳著這么一個段子。如果一個人在交流群里說,今天我拿下了一個億的訂單。下面可能是無人問津。但如果有一個人說,我今天將語音輸入的準確度提高了1%,這個群可能會立即火熱了起來,展開激烈的討論。雖然這只是一個段子,但從中不難發(fā)現(xiàn),他反映了科大訊飛中有著極為良好的科研氛圍。
從上面兩個例子中,我們不難看出正是因為在科大訊飛擁有著精益求精的良好品質(zhì),以及眾人一心,專注于科研的良好氛圍,才有了今日科大訊飛破千億市值,與BAT三大巨頭平起平坐的不朽神話。
但是,科大訊飛的前景并非一片光明,同樣存在著大量的缺陷等待改進。首先,在人工智能領(lǐng)域,為了推動其的快速發(fā)展,人工智能的算法始終處于開源狀態(tài),同時還有著為數(shù)不少的芯片公司專門推出了適合算法運行的計算機芯片。這意味著,企業(yè)只需要招募少量的人才,利用算法或者使用芯片,就可以直接對本行業(yè)的數(shù)據(jù)進行應(yīng)用。而訊飛在耗費巨資研發(fā)的技術(shù),也隨著算法的開源,開始貶值。
在種情況下,科大訊飛所處的語音輸入的賽道上,越來越多的強有力的對手加入了進來,目前百度的語音市場份額已經(jīng)上升到了第二位。同時,騰訊、搜狗、阿里先后與2010年開始通過成立自主的研發(fā)團隊或者收購其他公司的方式進入了語音輸入的團隊。但是在此之前,他們都曾經(jīng)是科大訊飛的客戶。人工智能越來越熱,錢卻反而難賺。
面對著重重阻礙,語音輸入的收入也一度降至最低點。多領(lǐng)域投入成為了解決問題的必然選擇。如今,科大訊飛已經(jīng)在教育、醫(yī)療、司法等多個行業(yè)開始布局。
同時,AI建模的有效性需要有著大量的實驗數(shù)據(jù)來支持,那么如果以某一系統(tǒng)作為了底層而搭建起的操作系統(tǒng),在未來就很有可能成為行業(yè)的標準。那么開放自身的核心數(shù)據(jù),構(gòu)建起自身的生態(tài)圈,競爭成為行業(yè)的標準也是勢在必行。
最后,把握住自身區(qū)別于BAT的最大優(yōu)勢,就是科大訊飛作為人工智能領(lǐng)域最受關(guān)注的公司,可以依靠人工智能的風向,在多個領(lǐng)域上獲得政府的支持,使其在多個領(lǐng)域中掌握先機。
3? 自然語言理解行之將至
就像人工智能會被分為弱人工智能,強人工智能,超人工智能一樣,語音輸入也被分為了語音合成、語音識別、自然語言理解的三大層次。不過,相較于人工智能,語音輸入的層次感反而沒有那么強了,尤其是,當我們的語音輸入正在一步一步走向巔峰的時候,與之息息相關(guān)的人工智能反而成為了其的桎梏。同時,人工智能的深度學習需要大量的數(shù)據(jù)訓練模型,也導(dǎo)致了其發(fā)展遇到瓶頸?;蛟S有的人會疑惑如今的人工智能,已經(jīng)可以輕輕松松擊敗圍棋界頂尖高手,尤其是現(xiàn)在最新的人工智能,Alphago更是擊敗了最強高手李世石。如此水平,又怎會出現(xiàn)智力問題呢?然而科研人員給出的目標是,希望人工智能盡快達到六齡兒童的水平。舉個例子,“爸爸沒法舉起他的兒子,因為他很重。”那么請問“誰重?”答:“兒子”
“爸爸沒法舉起他的兒子,因為他很虛弱?!蹦敲凑垎枴罢l虛弱?”答:“爸爸”對于這兩句話中對“他”的理解就相當于六齡兒童的認知水平,也是我們目前的研究目標。可以想見,只有當人工智能對語音的理解水平,即語音識別的準確度,得到了提高,語音輸入才能得到新的突破。
4? 結(jié)語
人工智能或許比我們想象中的要來的更快。當我們還懵懵懂懂之時,語音輸入已經(jīng)進入了我們的生活,打字即將成為過去時了。那么,在未來,更加便利便捷的語音輸入方式,更為廣闊的應(yīng)用環(huán)境,隨心所欲的輸入語種,一切的一切都將成為可能。
參考文獻
[1] 錢麗娜,游叢瑞.劉慶峰的焦慮:科大訊飛危局[J].商學院,2018(12):13-20.
[2] 衛(wèi)萌,淦凌云.科大訊飛的人工智能之路[J].互聯(lián)網(wǎng)經(jīng)濟,2016(Z2):56-61.
[3] 錢麗娜.探秘科大訊飛:人工智能比你想象的來得更快[J].商學院,2017(7):89-90.
[4] 胡郁.人工智能與語音識別技術(shù)[J].電子產(chǎn)品世界,2016,23(4):23-25,27.
[5] 梅新蕾,李偉.科大訊飛:探尋人工智能的實現(xiàn)路徑[J].清華管理評論,2018(12):11-19.
[6] 陳平.科大訊飛:“讓世界聆聽中國的聲音”[J].中國商界,2018(Z1):86-91.
[7] 卜文娟.科大訊飛 要有坐好十年冷板凳的韌性[J].中國戰(zhàn)略新興產(chǎn)業(yè),2018(5):88-89.