張磊 王旗雄 毛華俊 羅詩(shī)麒 梁榮航 王發(fā)興
西北民族大學(xué)
隨著科技的進(jìn)步和社會(huì)的發(fā)展以及國(guó)家對(duì)雙語(yǔ)教育的重視,越來(lái)越多的學(xué)者和語(yǔ)言愛好者對(duì)少數(shù)民族語(yǔ)言開展了研究。苗語(yǔ)就是其中之一,苗語(yǔ)是苗族人用于日常生活學(xué)習(xí)和交流的語(yǔ)言,在中國(guó),苗語(yǔ)分三大方言:東部方言、中部方言、西部方言[1],每天都有很多的人在使用它,在學(xué)術(shù)研究方面有很多精通這門語(yǔ)言的大家,但對(duì)于日常學(xué)習(xí)使用來(lái)說,花大量時(shí)間去學(xué)習(xí)一門語(yǔ)言,但最后自己使用的很少是沒必要的。為此,我們萌生了實(shí)現(xiàn)一個(gè)苗語(yǔ)漢語(yǔ)翻譯網(wǎng)站的想法,為的是可以填補(bǔ)國(guó)內(nèi)苗語(yǔ)翻譯來(lái)自googleapi的國(guó)際苗語(yǔ)和本地的苗語(yǔ)方言無(wú)法進(jìn)行互通匹配的問題,也可以填補(bǔ)目前國(guó)內(nèi)苗語(yǔ)翻譯和查詞的一些空白。方便苗語(yǔ)愛好者查尋苗語(yǔ)詞詞語(yǔ),實(shí)時(shí)實(shí)現(xiàn)苗語(yǔ)漢語(yǔ)互譯,改善苗語(yǔ)學(xué)習(xí)體驗(yàn)。
縱觀目前市面上的翻譯類應(yīng)用,已經(jīng)有了成熟的技術(shù)與實(shí)現(xiàn)方法。本文主要使用基于詞典詞條匹配的方法實(shí)現(xiàn)苗語(yǔ)漢語(yǔ)互譯。為了實(shí)現(xiàn)快速匹配,本文實(shí)現(xiàn)了基于苗語(yǔ)詞典Tire樹快速匹配[2]的模塊,同時(shí)作為一款語(yǔ)言文字處理類軟件,分詞模塊是必不可少,苗語(yǔ)分詞模塊的實(shí)現(xiàn)有利于對(duì)無(wú)法直接匹配的句子進(jìn)行切詞處理,進(jìn)一步細(xì)化翻譯匹配。
苗語(yǔ)漢語(yǔ)互譯工具,作為一個(gè)翻譯類工具軟件系統(tǒng),其最主要的需求是實(shí)現(xiàn)苗語(yǔ)漢語(yǔ)翻譯功能,通過調(diào)查研究,得到苗語(yǔ)漢語(yǔ)翻譯工具需求如下:
1.苗語(yǔ)漢語(yǔ)互譯功能:苗語(yǔ)漢語(yǔ)互譯功能主要包括兩個(gè)方面,第一是實(shí)現(xiàn)苗語(yǔ)漢語(yǔ)的句子翻譯,其次是實(shí)現(xiàn)苗語(yǔ)漢語(yǔ)詞語(yǔ)互查。實(shí)現(xiàn)對(duì)應(yīng)的語(yǔ)言意義的對(duì)比和匹配,用戶根據(jù)自己的需要查詢對(duì)應(yīng)詞語(yǔ)的意思。
2.詞典管理功能,為方便維護(hù)者維護(hù)苗語(yǔ)漢語(yǔ)詞典,保證詞典的完整性和增加新的詞典。
3.苗語(yǔ)學(xué)習(xí)功能,包括苗語(yǔ)音頻視頻的存儲(chǔ)和播放,便于學(xué)習(xí)者學(xué)習(xí)使用。
系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)都是為方便用戶使用。本系統(tǒng)總體采用簡(jiǎn)單美觀的操作界面以及簡(jiǎn)便的操作方式,同時(shí)實(shí)現(xiàn)能滿足用戶需求的功能。
苗語(yǔ)漢語(yǔ)互譯工具,作為一個(gè)工具類軟件,其最主要的功能是實(shí)現(xiàn)苗語(yǔ)漢語(yǔ)的互譯,通過需求分析本系統(tǒng)確定了需要實(shí)現(xiàn)的功能模塊:
1.苗語(yǔ)漢語(yǔ)詞語(yǔ)互查和翻譯,實(shí)現(xiàn)實(shí)時(shí)的苗語(yǔ)漢語(yǔ)詞語(yǔ)在線互查,同時(shí)實(shí)現(xiàn)苗語(yǔ)和漢語(yǔ)句子及文本相互翻譯功能。
2.苗語(yǔ)語(yǔ)音播放功能,在查詢相應(yīng)苗語(yǔ)詞語(yǔ)之后,播放苗語(yǔ)語(yǔ)音,便于苗語(yǔ)使用者了解和學(xué)習(xí)苗語(yǔ)發(fā)音。
3.苗語(yǔ)漢語(yǔ)詞典管理功能,方便管理人員實(shí)時(shí)維護(hù)系統(tǒng)的詞典,致力于獲取最新、最全的詞語(yǔ)詞條添加到系統(tǒng)數(shù)據(jù)庫(kù)。
4其他功能:
用戶登陸實(shí)現(xiàn),在已有基礎(chǔ)功能上進(jìn)行下一步的開發(fā),用戶登陸是為了更方便管理和運(yùn)營(yíng),其一使用用戶登陸可以更好的維護(hù)詞典以及詞典的更新、擴(kuò)充;其二,實(shí)現(xiàn)用戶登陸界面,有利于進(jìn)一步功能的擴(kuò)充,留待之后的頁(yè)面升級(jí)接口使用。用戶登陸的實(shí)現(xiàn),使用的是數(shù)據(jù)驗(yàn)證方式登陸,若驗(yàn)證失敗則跳轉(zhuǎn)到登陸注冊(cè)界面,注冊(cè)后再實(shí)現(xiàn)登陸。
其他功能的實(shí)現(xiàn):苗語(yǔ)漢語(yǔ)翻譯系統(tǒng)的實(shí)現(xiàn),第一步是實(shí)現(xiàn)苗語(yǔ)漢語(yǔ)互譯的基本功能,其二是實(shí)現(xiàn)一個(gè)學(xué)習(xí)苗語(yǔ)的平臺(tái),同時(shí)兼容語(yǔ)音,視頻,以及一些基本的苗語(yǔ)學(xué)習(xí)資料提供給有興趣的人。
本系統(tǒng)采用基于B/S結(jié)構(gòu)方式實(shí)現(xiàn),為的是方便用戶隨時(shí)使用,同時(shí)不占用任何用戶的存儲(chǔ)空間,同時(shí)方便管理員維護(hù)苗語(yǔ)漢語(yǔ)詞典。選用python語(yǔ)言作為開發(fā)語(yǔ)言,使用Django框架作為技術(shù)支撐,保證項(xiàng)目的快速實(shí)現(xiàn)和健壯性,使得網(wǎng)站能夠穩(wěn)定運(yùn)行,通過實(shí)現(xiàn)苗語(yǔ)分詞和苗語(yǔ)詞典Tire樹快速匹配翻譯,改善用戶的使用體驗(yàn)。
本文通過論述苗語(yǔ)漢語(yǔ)互譯工具實(shí)現(xiàn)的過程,進(jìn)一步細(xì)化苗語(yǔ)漢語(yǔ)實(shí)現(xiàn)的細(xì)節(jié),從需求分析、開發(fā)實(shí)現(xiàn)和開發(fā)語(yǔ)言的選擇、系統(tǒng)總體功能設(shè)計(jì)和功能實(shí)現(xiàn)等始終依據(jù)軟件工程的基本思想及信息系統(tǒng)的開發(fā)流程,實(shí)現(xiàn)了預(yù)期的開發(fā)目標(biāo),滿足了用戶需求,基本上實(shí)現(xiàn)了本次論文的設(shè)計(jì)目的。但每個(gè)人的精力都是有限的,有些地方細(xì)節(jié)處理的不夠好,需要進(jìn)一步完善,本系統(tǒng)實(shí)現(xiàn)了基礎(chǔ)的苗語(yǔ)漢語(yǔ)翻譯,苗漢詞語(yǔ)互查等功能,但在詞典詞條的收集整理等方面做的還不夠完善,詞條的數(shù)據(jù)量還不夠多,這導(dǎo)致一些詞語(yǔ)無(wú)法翻譯和查詢。