趙小兵,孫媛,李琳
1.中央民族大學(xué)信息工程學(xué)院
2.國家語言資源監(jiān)測與研究少數(shù)民族語言中心
3.青海師范大學(xué)計算機學(xué)院
4.省部共建藏語智能信息處理及應(yīng)用國家重點實驗室
多語種智能信息處理是人工智能發(fā)展的前沿方向和關(guān)鍵要點。為了更好地服務(wù)于國家“一帶一路”倡議發(fā)展規(guī)劃,中國人工智能學(xué)會成立了多語種智能信息處理專業(yè)委員會,旨在實現(xiàn)語言相通、信息相通,為“一帶一路”上各國家各民族的經(jīng)貿(mào)相通、文化相通與民心相通貢獻力量。其中,多語種數(shù)據(jù)共享與評測是多語種智能信息處理的基礎(chǔ)保障。為此,在吾守爾院士等多位權(quán)威專家的指導(dǎo)下,中國人工智能學(xué)會多語種智能信息處理專業(yè)委員會語料共享與評測工作組成立,工作組以多語言智能服務(wù)為定位,推進產(chǎn)、學(xué)、研的多領(lǐng)域、深層次融合與合作,服務(wù)于國家“一帶一路”建設(shè)目標,宗旨是“共建、共享、合作、轉(zhuǎn)化”、“以評測促進技術(shù)進步,以評測帶動技術(shù)轉(zhuǎn)化”。
為推動人工智能多語種優(yōu)質(zhì)數(shù)據(jù)資源的持續(xù)匯聚、傳播共享、評測服務(wù)、技術(shù)交流、國際合作與可持續(xù)發(fā)展,人工智能學(xué)會多語種智能信息處理專業(yè)委員會推出了多語種智能信息處理數(shù)據(jù)專題,力爭打造具有國際影響力的人工智能多語種數(shù)據(jù)集,提升我國多語種智能信息領(lǐng)域的國際影響力,共同推動多語種智能信息處理研究的進步。本??噙x了10余篇高質(zhì)量數(shù)據(jù)論文,包括多語種的詞法分析、機器翻譯、閱讀理解、日常問答、語音翻譯、文本摘要、語音識別、語音合成、翻譯校正、文本剽竊檢測等多個領(lǐng)域的數(shù)據(jù)集。每種數(shù)據(jù)集的介紹包括了數(shù)據(jù)的采集和處理方法、樣本的描述、數(shù)據(jù)質(zhì)量控制和評估以及數(shù)據(jù)的應(yīng)用方向和價值。
本次專題的順利出版得到了《中國科學(xué)數(shù)據(jù)》期刊的大力支持。特別感謝期刊編輯部、特邀執(zhí)行主編、副主編、責任編輯、審稿人、論文作者付出的諸多努力。此外,??幕I備也得到了國家基礎(chǔ)學(xué)科公共科學(xué)數(shù)據(jù)中心的鼎力支持,在此一并表示感謝。