劉若蘭+年梅
摘要:隨著計算機和網(wǎng)絡(luò)技術(shù)在人們生活中的廣泛應(yīng)用,攜帶不便、查閱效率低的紙質(zhì)版維吾爾語同義詞詞典已經(jīng)不能滿足人們的需求,為此該文設(shè)計并實現(xiàn)基于web的維吾爾語同義詞電子詞典,進行維吾爾語同義詞的智能管理和查詢。整個系統(tǒng)在需求分析、總體設(shè)計、詳細設(shè)計的基礎(chǔ)上,采用JSP、Servlet、JQueryEasyUI等技術(shù)以及MySQL數(shù)據(jù)庫進行開發(fā)。
關(guān)鍵詞:維吾爾語;同義詞;電子詞典;數(shù)據(jù)管理
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2017)14-0072-03
1背景
同義詞是語言中的重要現(xiàn)象,其數(shù)量決定了語言的豐富程度。各種語言中都存在同義詞,新疆地區(qū)常用的維吾爾語中也擁有豐富的同義詞,其豐富語言表達效果的同時,也增加了信息處理中語句理解的難度。此外,同義詞還是很多研究開展的基礎(chǔ)資源,如基于同義詞的詞語相似度算法等。故深入開展維吾爾語同義詞研究,并共享其成果,無論對維吾爾語語言學(xué)習者學(xué)習語言規(guī)律、進行語言運用,還是對語言研究者推動語言學(xué)的發(fā)展,以及維漢雙語的對等翻譯、對比研究,都有非常重要的意義。
信息技術(shù)和互聯(lián)網(wǎng)的飛速發(fā)展,使得各類應(yīng)用軟件走進了人們的生活、工作和學(xué)習中,大量軟件的應(yīng)用不僅方便了日常生活,也使學(xué)習變得愈加容易。目前,網(wǎng)上可供使用的各類語言學(xué)習軟件可謂種類繁多、琳瑯滿目,但主要是英語、漢語等大語種語言的學(xué)習軟件,維吾爾語學(xué)習軟件卻屈指可數(shù),而維吾爾語同義詞電子詞典資源幾乎找不到。而已出版的維吾爾語紙質(zhì)版同義詞詞典,由于其使用不便、查閱速度慢,尚無法在信息處理中直接使用。故本文進行維吾爾語同義詞電子詞典的開發(fā)。為廣大維吾爾語學(xué)習者、研究者、信息處理者提供方便,為基于維吾爾語同義詞的相關(guān)研究提供基礎(chǔ)資源。
2系統(tǒng)需求分析
2.1系統(tǒng)目標
在充分調(diào)研維吾爾語語言學(xué)習者及研究者實際需求的基礎(chǔ)上,本維吾爾語同義詞電子詞典需要達到的性能目標如下:
1)普通用戶能夠快速查詢、導(dǎo)出同義詞信息。管理員用戶能夠?qū)崿F(xiàn)同義詞的增刪改查等管理。
2)不同用戶可授予不同角色,不同角色可授予不同權(quán)限。
3)后期能夠?qū)崿F(xiàn)同義詞的維護及擴展。
4)具有友好的人機交互界面,簡單的操作方式。
2.2系統(tǒng)功能需求
維吾爾語同義詞電子詞典實現(xiàn)同義詞數(shù)據(jù)的有效管理及快速查詢,系統(tǒng)整體分為前、后臺兩大模塊。前臺供普通用戶使用,為用戶提供同義詞瀏覽、查詢以及導(dǎo)出功能。后臺為管理員提供用戶管理、角色管理以及菜單管理功能,實現(xiàn)用戶的角色設(shè)置,角色的權(quán)限設(shè)置,將大規(guī)模數(shù)據(jù)的錄入及維護分配給多個用戶共同完成。此外管理員還能實現(xiàn)同義詞的數(shù)據(jù)錄入、數(shù)據(jù)修改、數(shù)據(jù)刪除、數(shù)據(jù)導(dǎo)出、數(shù)據(jù)存儲、數(shù)據(jù)查詢以及數(shù)據(jù)瀏覽等功能。
2.3系統(tǒng)用例圖
分析系統(tǒng)功能發(fā)現(xiàn),整個系統(tǒng)涉及兩類用戶:普通用戶和管理員用戶,各用戶的功能采用UML的用例圖進行客觀描述,具體如圖1、圖2所示:
3系統(tǒng)總體設(shè)計
3.1系統(tǒng)總體功能結(jié)構(gòu)
維吾爾語同義詞電子詞典是實現(xiàn)維吾爾語同義詞信息管理的平臺,其總體功能結(jié)構(gòu)如圖3所示,整個系統(tǒng)分為前、后臺兩大模塊,其中后臺管理模塊由系統(tǒng)管理和分類管理兩個子模塊構(gòu)成。
3.2系統(tǒng)功能模塊
1)用戶管理模塊:超級管理員登錄后臺管理界面后,可以實現(xiàn)對用戶信息的管理,瀏覽所有用戶的信息,添加新用戶的信息,修改、刪除已有用戶的信息,并能夠通過用戶名進行模糊搜索,也可以通過用戶角色進行精確搜索,還可以根據(jù)需要將用戶信息導(dǎo)出到EXCEL表格中。
2)角色管理模塊:超級管理員登錄后臺主界面后,可以實現(xiàn)對角色信息的管理,查看所有角色的信息,添加新角色,修改、刪除角色信息,對角色進行角色授權(quán),即賦予角色更多的權(quán)限或取消角色已擁有的權(quán)限,并能夠根據(jù)角色名進行模糊查詢。
3)菜單管理模塊超級管理員登錄后臺界面后,可以依據(jù)《同義詞詞林》分類體系中同義詞詞群的編碼規(guī)則,通過添加、修改、刪除菜單信息完成對同義詞詞群的擴展及維護。
4)分類管理模塊:超級管理員通過后臺系統(tǒng)可以實現(xiàn)對同義詞詞匯管理,進行同義詞數(shù)據(jù)的添加、修改及刪除,也可以將同義詞數(shù)據(jù)批量導(dǎo)出到本地。
5)前臺模塊:普通用戶通過系統(tǒng)主界面能夠進行同義詞查詢及導(dǎo)出操作。
3.3數(shù)據(jù)庫設(shè)計
根據(jù)系統(tǒng)的總體功能結(jié)構(gòu),本文設(shè)計了t_auth(用戶表)、t_role(角色表)、t_user(用戶表)、t_tag(標記信息表)、t_word(詞語信息表)和t_example(同義詞數(shù)據(jù)信息表)六張數(shù)據(jù)表,這些表涉及的實體類以及類間的關(guān)系如圖4所示。
4詳細設(shè)計與實現(xiàn)
4.1系統(tǒng)詳細設(shè)計
維吾爾語同義詞電子詞典在后臺模塊中實現(xiàn)了用戶管理、角色管理、菜單管理、分類管理,在前臺模塊為用戶設(shè)置了同義詞的查詢及導(dǎo)出功能,普通用戶和管理員用戶與系統(tǒng)前后臺的交互行為用如下所示的順序圖描述。
4.2系統(tǒng)開發(fā)環(huán)境及技術(shù)
《維吾爾語同義詞電子詞典》的具體開發(fā)環(huán)境及技術(shù)如下:
1)同義詞詞典資源:新疆維吾爾自治區(qū)出版社出版的《維漢同義詞詞典》
2)操作系統(tǒng):Windows XP/Windows 7。
3)數(shù)據(jù)庫管理系統(tǒng)軟件:MYSQL。
4)前后臺開發(fā)環(huán)境:Jdk+Tomcat+MyEclipse。
5)開發(fā)技術(shù):JSP+Servlet+JQueryEasyU。
4.3系統(tǒng)實現(xiàn)
1)分類管理的界面如圖7所示:
分類管理完成對同義詞數(shù)據(jù)的增加、修改、刪除、導(dǎo)出及瀏覽。為了方便后續(xù)擴展維護同義詞資源,系統(tǒng)以維吾爾語同義詞詞群為單位實現(xiàn)對維吾爾語中同義詞的管理,在對同義詞詞群進行編碼時,以《同義詞詞林》的同義詞分類及編碼標準為基礎(chǔ),將新疆人民出版社出版的《維漢同義詞詞典》中的同義詞詞匯編碼形成700多個詞群。
2)前臺界面如圖8所示:
前臺為用戶提供了同義詞數(shù)據(jù)的查詢功能,此外用戶還能根據(jù)需要將查詢所得數(shù)據(jù)導(dǎo)出到本地,便于用戶使用。
5結(jié)束語
維吾爾語同義詞電子詞典系統(tǒng)通過前臺的數(shù)據(jù)查詢與后臺的數(shù)據(jù)動態(tài)管理,實現(xiàn)了維吾爾語同義詞數(shù)據(jù)的有效管理。這對于維吾爾語的學(xué)習者和研究者都極有益處。此外,該系統(tǒng)的開發(fā)也為后續(xù)網(wǎng)絡(luò)維吾爾語文本挖掘,網(wǎng)絡(luò)文本輿情分析以及網(wǎng)絡(luò)內(nèi)容過濾和維吾爾語網(wǎng)絡(luò)查詢擴展等提供了基礎(chǔ)資源。