張婷
在經(jīng)濟(jì)學(xué)上語(yǔ)言信息服務(wù)能力已成為國(guó)家參與全球化事務(wù)的戰(zhàn)略資源。作為語(yǔ)言信息處理的一個(gè)典型應(yīng)用,“智能輸入法”此前曾被評(píng)選最成功的人工智能產(chǎn)品,從側(cè)面印證了語(yǔ)言信息處理技術(shù)是人工智能走進(jìn)人類(lèi)生活的先鋒軍。中國(guó)工程院院士、新疆大學(xué)教授吾守爾·斯拉木指出,人工智能要想真正落地,融入人類(lèi)日常生活,語(yǔ)言是最重要的接口,也是最重要的發(fā)力點(diǎn)。
吾守爾自1984年開(kāi)始從事維吾爾、哈薩克、柯?tīng)柨俗危ㄒ韵潞?jiǎn)稱(chēng)“維哈柯”)等多語(yǔ)種智能信息處理、標(biāo)準(zhǔn)規(guī)范制定、操作系統(tǒng)、辦公套件、排版印刷、電子政務(wù)等方面的技術(shù)研發(fā)和應(yīng)用工作,創(chuàng)建了維哈柯文信息處理的理論、方法、技術(shù)體系,開(kāi)辟了中國(guó)少數(shù)民族文字信息處理的新領(lǐng)域,使它不斷發(fā)展,進(jìn)入智能化、網(wǎng)絡(luò)化、數(shù)字化的新階段,相關(guān)技術(shù)成果在疆內(nèi)外廣泛應(yīng)用。他是第一位也是目前唯一的維吾爾族院士,讓新疆少數(shù)民族語(yǔ)言與漢語(yǔ)同時(shí)進(jìn)入信息化時(shí)代。
近年來(lái),吾守爾團(tuán)隊(duì)努力攻關(guān)多語(yǔ)種多模態(tài)智能信息處理技術(shù),他們開(kāi)發(fā)的應(yīng)用工具能讓計(jì)算機(jī)、手機(jī)終端識(shí)別維哈柯語(yǔ)言文字、聽(tīng)“懂”維哈柯語(yǔ)等民族語(yǔ)言,助力國(guó)際和國(guó)內(nèi)文化交流、交往、交融,并不斷以更高層次、更具人工智能色彩的技術(shù)建設(shè)“數(shù)字絲綢之路”,為國(guó)家“一帶一路”倡議提供技術(shù)支撐。
維哈柯信息化與漢語(yǔ)同步
顧名思義,多語(yǔ)種智能信息處理技術(shù)就是提供跨語(yǔ)言的信息服務(wù),是一種普惠的人工智能服務(wù)。
吾守爾表示:“人工智能的核心目標(biāo)是服務(wù)人的需求,人類(lèi)90%的信息溝通由語(yǔ)言承載,因而語(yǔ)言信息的處理,在人工智能各領(lǐng)域扮演至關(guān)重要的角色?!?/p>
20世紀(jì)80年代,計(jì)算機(jī)、互聯(lián)網(wǎng)開(kāi)始出現(xiàn)在人們的視野。新疆大學(xué)緊跟時(shí)代步伐,開(kāi)設(shè)計(jì)算機(jī)相關(guān)課程,當(dāng)時(shí)教授無(wú)線電電子專(zhuān)業(yè)課程的吾守爾被選中,先后到北京工業(yè)大學(xué)、上海交通大學(xué)進(jìn)修計(jì)算機(jī)相關(guān)知識(shí),從此進(jìn)入計(jì)算機(jī)領(lǐng)域。
新疆是一個(gè)多民族、多語(yǔ)言的地區(qū)。當(dāng)時(shí)中文信息處理技術(shù)剛剛起步,維哈柯等少數(shù)民族同步信息化像一個(gè)不可企及的夢(mèng),但吾守爾做到了。
他先學(xué)習(xí)漢語(yǔ),再學(xué)習(xí)英語(yǔ);從無(wú)線電技術(shù)入門(mén),到計(jì)算機(jī)應(yīng)用基礎(chǔ)知識(shí),再到更深層次的理論學(xué)習(xí)、實(shí)踐鍛煉……吾守爾邊學(xué)邊干,艱苦摸索,每一步都走得很辛苦。
1986年4月,吾守爾團(tuán)隊(duì)開(kāi)發(fā)的多語(yǔ)種綜合信息系統(tǒng)軟件在新疆人大會(huì)議上應(yīng)用,實(shí)現(xiàn)了會(huì)議管理、會(huì)議資料和參會(huì)代表資料的維哈柯文錄入、排版、打印。這一成果轟動(dòng)了新疆乃至中西亞各界。
20世紀(jì)90年代,針對(duì)維哈柯文語(yǔ)言特性導(dǎo)致的“前后端不一致”的輸入問(wèn)題,吾守爾團(tuán)隊(duì)自主研發(fā)出民文信息處理系統(tǒng)使用的點(diǎn)陣字體和矢量字體,在Trutype字體基礎(chǔ)上編制出16×16、16×8全角、半角點(diǎn)陣維吾爾字庫(kù)和矢量字庫(kù),制定了符合國(guó)家G18030標(biāo)準(zhǔn)的信息交換維、哈、柯文信息技術(shù)三項(xiàng)國(guó)家標(biāo)準(zhǔn),后來(lái)又研制了4種與此對(duì)應(yīng)的OpenType字體……
吾守爾團(tuán)隊(duì)開(kāi)拓了新疆民文信息處理新領(lǐng)域,并始終致力于攻克和突破多語(yǔ)種信息處理智能化、網(wǎng)絡(luò)化、數(shù)字化領(lǐng)域的關(guān)鍵理論及核心技術(shù)。在科學(xué)技術(shù)研發(fā)應(yīng)用方面,吾守爾先后主持承擔(dān)國(guó)家863計(jì)劃項(xiàng)目7項(xiàng),973項(xiàng)目1項(xiàng),國(guó)家自然科學(xué)基金項(xiàng)目5項(xiàng)、重點(diǎn)項(xiàng)目2項(xiàng),工程院咨詢(xún)研究項(xiàng)目2項(xiàng)、省部級(jí)項(xiàng)目30多項(xiàng),14項(xiàng)成果達(dá)到國(guó)際先進(jìn)水平;主持制定國(guó)際標(biāo)準(zhǔn)5項(xiàng)、國(guó)家標(biāo)準(zhǔn)22項(xiàng);榮獲國(guó)家科技進(jìn)步獎(jiǎng)3項(xiàng)、省部級(jí)以上獎(jiǎng)勵(lì)13項(xiàng);發(fā)表論文170余篇,出版教材9部;培養(yǎng)了20多名科研骨干、150多名博士碩士研究生。
作為新疆大學(xué)211工程、自治區(qū)高峰學(xué)科“計(jì)算機(jī)科學(xué)與技術(shù)”重點(diǎn)學(xué)科帶頭人之一,吾守爾開(kāi)拓了多語(yǔ)種信息技術(shù)產(chǎn)品市場(chǎng),與北大方正、中電通信、科大訊飛等多個(gè)企業(yè)合作,打造出集多語(yǔ)種信息技術(shù)研發(fā)、生產(chǎn)、經(jīng)營(yíng)、服務(wù)為一體的產(chǎn)學(xué)研基地。
截至當(dāng)前,吾守爾團(tuán)隊(duì)研發(fā)具有自主知識(shí)產(chǎn)權(quán)的DOS系列、Windows系列、Linux系列操作系統(tǒng)的維哈柯文版本,維哈柯文多語(yǔ)種的尋呼機(jī)及發(fā)布臺(tái)站、編輯排版系統(tǒng)、互聯(lián)網(wǎng)信息發(fā)布平臺(tái)及應(yīng)用軟件、電子政務(wù)系統(tǒng)、廣播電視文稿系統(tǒng)、衛(wèi)星圖文傳輸系統(tǒng),智能輸入法、語(yǔ)音識(shí)別、語(yǔ)音合成、機(jī)器翻譯軟件平臺(tái)等共計(jì)30余種多語(yǔ)種新系統(tǒng)、新平臺(tái)、新軟件,在多語(yǔ)言、多模態(tài)智能信息處理、國(guó)產(chǎn)多語(yǔ)種操作系統(tǒng)研發(fā)、音視頻圖像處理、圖文識(shí)別、大數(shù)據(jù)智能分析、網(wǎng)絡(luò)內(nèi)容安全及智能檢測(cè)監(jiān)控等方面創(chuàng)建了諸多關(guān)鍵技術(shù)和處理機(jī)制,從科技文化教育、信息通訊,到新聞出版、廣播電視,再到電子政務(wù)和商務(wù)、信息數(shù)字化,疆內(nèi)外的各族同胞都能享受到信息化的成果。
這些技術(shù)和產(chǎn)品得到廣泛應(yīng)用并成功實(shí)現(xiàn)標(biāo)準(zhǔn)化示范和產(chǎn)業(yè)化,開(kāi)辟了中國(guó)民文信息處理新領(lǐng)域,并不斷與時(shí)俱進(jìn),為推動(dòng)中國(guó)少數(shù)民族進(jìn)入數(shù)字化辦公新時(shí)代作出杰出貢獻(xiàn),促進(jìn)了中亞西亞多語(yǔ)種軟件服務(wù)外包國(guó)家戰(zhàn)略的實(shí)施。
多語(yǔ)種信息“絲綢之路”
自2013年我國(guó)提出“一帶一路”倡議以來(lái),中國(guó)走出去的步伐進(jìn)一步加快,非通用語(yǔ)言、小語(yǔ)種的服務(wù)需求急劇上升。在“一帶一路”沿線60多個(gè)國(guó)家中,有200多種語(yǔ)言都是非通用語(yǔ)言。
新疆是“一帶一路”的橋頭堡,新疆大學(xué)則是新疆信息化建設(shè)的排頭兵。吾守爾指出,實(shí)現(xiàn)語(yǔ)言互通是實(shí)現(xiàn)“一帶一路”倡議中“五通”(政策溝通、設(shè)施聯(lián)通、貿(mào)易暢通、資金融通和民心相通)的基礎(chǔ)。
“我們要堅(jiān)持的是特色中追求一流?!蔽崾貭栒J(rèn)為,各高校、各學(xué)科要打破專(zhuān)業(yè)、學(xué)科壁壘,注意培養(yǎng)學(xué)生思考和認(rèn)識(shí)世界的能力,促進(jìn)學(xué)生對(duì)中西文化的深刻理解,培養(yǎng)具有人文情懷、全球視野、創(chuàng)新精神和實(shí)踐能力的跨文化、跨國(guó)別的“多語(yǔ)種+”國(guó)際化人才。
吾守爾團(tuán)隊(duì)從理論、方法、工具、系統(tǒng)等四個(gè)方面,結(jié)合新疆的特色與優(yōu)勢(shì),展開(kāi)阿爾泰語(yǔ)系、阿拉伯語(yǔ)系、印度-伊朗語(yǔ)族的智能語(yǔ)音交互、多語(yǔ)言機(jī)器翻譯、語(yǔ)音合成等研究工作,有針對(duì)性地發(fā)展交叉學(xué)科。在人才培養(yǎng)方面,科學(xué)制訂具有不同特點(diǎn)的交叉培養(yǎng)方案,努力在人工智能發(fā)展方向和理論、方法、工具、系統(tǒng)等方面取得變革性、顛覆性突破。
吾守爾認(rèn)為,通過(guò)對(duì)我國(guó)民族語(yǔ)言的信息化建設(shè),研究復(fù)雜形態(tài)語(yǔ)言和長(zhǎng)距離語(yǔ)言模型、跨語(yǔ)言文法推導(dǎo)方法等,突破同語(yǔ)系和跨語(yǔ)系語(yǔ)言機(jī)器翻譯方法和模型、多模態(tài)多語(yǔ)種信息化智能化技術(shù),可以消除語(yǔ)言隔閡,為“一帶一路”建設(shè)提供技術(shù)支撐。
人工智能應(yīng)當(dāng)增加社會(huì)福祉
實(shí)現(xiàn)語(yǔ)言互通最便捷的方式就是利用語(yǔ)音識(shí)別、語(yǔ)音合成、機(jī)器翻譯手段實(shí)現(xiàn)多模態(tài)智能聲圖文交互,并在教育、文化、旅游、通信、經(jīng)貿(mào)、安全等領(lǐng)域推廣應(yīng)用。為此,吾守爾團(tuán)隊(duì)研究了多語(yǔ)言的詞法、句法、語(yǔ)義、篇章、情感、蘊(yùn)含、信息抽取等語(yǔ)言文字識(shí)別數(shù)據(jù)分析方法,研究復(fù)雜形態(tài)語(yǔ)言和長(zhǎng)距離語(yǔ)言模型、聲學(xué)模型、跨語(yǔ)言文法推導(dǎo)方法等,重點(diǎn)突破同語(yǔ)系和跨語(yǔ)系語(yǔ)言機(jī)器翻譯方法和訓(xùn)練模型,開(kāi)展維漢等語(yǔ)音識(shí)別、語(yǔ)音合成、文字識(shí)別、機(jī)器翻譯研究開(kāi)發(fā),研發(fā)出維漢雙向語(yǔ)音翻譯系統(tǒng)。目前,維漢互譯已經(jīng)達(dá)到實(shí)用化水平,部分語(yǔ)音識(shí)別準(zhǔn)確率已達(dá)到95%以上。
“利用現(xiàn)代化技術(shù)手段,建立大規(guī)模、跨語(yǔ)言、多模態(tài)大型語(yǔ)料知識(shí)庫(kù),對(duì)于開(kāi)展語(yǔ)言研究進(jìn)而突破同語(yǔ)系、跨語(yǔ)言互通意義深遠(yuǎn),結(jié)合教育場(chǎng)景來(lái)看,其深遠(yuǎn)意義在于夯實(shí)跨文化、跨民族教育的基礎(chǔ)?!蔽崾貭栒f(shuō)道。通過(guò)互聯(lián)網(wǎng)把語(yǔ)音云、智能識(shí)別等技術(shù)應(yīng)用到少數(shù)民族的遠(yuǎn)程教育、雙語(yǔ)教育中,擴(kuò)大優(yōu)質(zhì)資源覆蓋面,對(duì)于促進(jìn)教育發(fā)展均衡、改變偏遠(yuǎn)地區(qū)落后教育現(xiàn)狀有重要意義。
那么,人工智能會(huì)取代翻譯團(tuán)隊(duì)嗎?對(duì)于這個(gè)問(wèn)題,吾守爾有直接的體會(huì)。
“我的回答是‘不會(huì)全面替代翻譯。我們必須中正理性地看待機(jī)器翻譯和機(jī)器翻譯的使用問(wèn)題。不要被許多雜音,甚至被一些AI廠商的夸大宣傳所左右。”吾守爾認(rèn)為,在可預(yù)見(jiàn)的未來(lái),人所擅長(zhǎng)的某些方面機(jī)器很難代替,如對(duì)情感、場(chǎng)景和言外之意的捕捉與體驗(yàn),對(duì)不同語(yǔ)言文化背景下的溝通技巧的運(yùn)用等。機(jī)器擅長(zhǎng)常規(guī)的文內(nèi)之義翻譯,能夠大規(guī)模瞬時(shí)準(zhǔn)確地完成一半質(zhì)量的翻譯任務(wù),幫助翻譯團(tuán)隊(duì)進(jìn)行翻譯任務(wù)的協(xié)調(diào)與同步,提供一般性的信息服務(wù)。
事實(shí)上,也不必追求“替代”。吾守爾說(shuō),科學(xué)的人工智能觀是以人為本的人工智能觀,它指向了一個(gè)“人機(jī)共生”(或人機(jī)協(xié)作、人機(jī)耦合)的未來(lái)。
他回憶起20世紀(jì)90年代工程單位去海外投標(biāo)的經(jīng)歷,幾百頁(yè)的標(biāo)書(shū),要在一周內(nèi)快速翻譯提交,這幾乎不可能,因?yàn)榉g團(tuán)隊(duì)人少了翻不完,人多了互相之間風(fēng)格不一、術(shù)語(yǔ)不統(tǒng)一。但在機(jī)器翻譯和機(jī)輔翻譯平臺(tái)的幫助下,以前“不可譯”的任務(wù)現(xiàn)在“可譯”了。
“這是巨大的進(jìn)步。翻譯行業(yè)因?yàn)槿斯ぶ悄艿慕槿攵艿接绊?,反而因?yàn)槭袌?chǎng)的擴(kuò)大,更加繁榮。會(huì)使用技術(shù)裝備的譯者和單位獲得了更多的收益,整個(gè)市場(chǎng)變大,社會(huì)福祉也隨之增加?!蔽崾貭栒f(shuō)。