劉媛媛
摘要:在海量的互聯(lián)網(wǎng)教育資源中精準(zhǔn)有效的檢索到所需要資源的是當(dāng)前在線教育建設(shè)的難點(diǎn),該文針對(duì)傳統(tǒng)網(wǎng)絡(luò)教育資源檢索的不足,提出了一種基于本體的教育資源智能檢索系統(tǒng),通過介紹系統(tǒng)的設(shè)計(jì),以及描述了教育資源本體的設(shè)計(jì)方法和構(gòu)建的具體步驟,實(shí)現(xiàn)了教育資源領(lǐng)域的語義智能檢索,結(jié)果表明,該系統(tǒng)提高了教育資源檢索的查準(zhǔn)率和查全率。
關(guān)鍵詞:本體;教育資源;信息檢索
中圖分類號(hào) G203 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào):1009-3044(2017)35-0001-02
1 概述
隨著信息技術(shù)的飛速發(fā)展,教育與互聯(lián)網(wǎng)結(jié)合的越來越緊密,網(wǎng)絡(luò)上出現(xiàn)了豐富的網(wǎng)絡(luò)教育資源。如何在海量的互聯(lián)網(wǎng)教育資源中精準(zhǔn)有效的檢索到所需要資源成為在線教育建設(shè)的難點(diǎn)。信息檢索是一條有效的途徑,但是傳統(tǒng)的信息檢索大部分都是根據(jù)關(guān)鍵詞來查詢信息,但是僅僅根據(jù)關(guān)鍵詞來檢索很難完全匹配用戶的查詢需求。這是因?yàn)殛P(guān)鍵詞無法準(zhǔn)確的表示邏輯語義,難以完全表示用戶的查詢意圖,會(huì)檢索出許多無關(guān)內(nèi)容;關(guān)鍵詞無法精準(zhǔn)的描述內(nèi)容關(guān)系,難以全面反映用戶查詢要求,會(huì)漏掉許多近似內(nèi)容。針對(duì)傳統(tǒng)檢索難以精準(zhǔn)的查詢到所需教育資源的問題,本文基于語義,提出一種智能教育資源檢索系統(tǒng),幫助用戶精準(zhǔn)有效的檢索到所需的教育資源。
2 基于本體的教育資源檢索系統(tǒng)設(shè)計(jì)
基于本體的教育資源檢索系統(tǒng)綜合應(yīng)用本體理論,語義網(wǎng)絡(luò)技術(shù)和信息檢索等相關(guān)技術(shù)?;诒倔w的檢索是通過的構(gòu)建描述某個(gè)事物及其關(guān)系的具體的本體,并且將其應(yīng)用到相應(yīng)的信息資源檢索之中。具體在教育資源檢索系統(tǒng)中,首先需要有對(duì)教育資源及其相關(guān)關(guān)系進(jìn)行定義和描述的本體,然后基于教育資源本體來進(jìn)行語義的推理和解析,實(shí)現(xiàn)精確檢索。
基于本體的教育資源檢索系統(tǒng)由用戶交換、檢索引擎模塊、教育資源本體模塊、元數(shù)據(jù)庫(kù)模塊、網(wǎng)絡(luò)采集模塊和RDF實(shí)例模塊六個(gè)部分組成。其中用戶交互模塊提供友好的用戶查詢檢索頁(yè)面;檢索引擎模塊負(fù)責(zé)根據(jù)教育資源本體信息解析用戶的查詢請(qǐng)求,并向元數(shù)據(jù)庫(kù)請(qǐng)求用戶所需數(shù)據(jù),并返回給用戶;教育資源本體模塊定義教育資源本體內(nèi)容,在查詢檢索過程中負(fù)責(zé)語義分析和推理;網(wǎng)絡(luò)采集模塊負(fù)責(zé)采集網(wǎng)絡(luò)信息;RDF實(shí)例模塊負(fù)責(zé)對(duì)所采集的信息基于教育資源本體信息進(jìn)行標(biāo)注處理,生產(chǎn)相應(yīng)的本體實(shí)例,并且形成對(duì)應(yīng)的RDF實(shí)例文件;元數(shù)據(jù)模塊負(fù)責(zé)存儲(chǔ)生成的RDF實(shí)例文件?;诒倔w的教育資源檢索系統(tǒng)的系統(tǒng)結(jié)構(gòu)如圖1所示。
3 基于本體的教育資源檢索系統(tǒng)的實(shí)現(xiàn)
3.1 系統(tǒng)的功能
基于本體的教育資源檢索系統(tǒng)的主要目標(biāo)就是能夠更加準(zhǔn)確高效的檢索教育資源信息,即提高查全率和查準(zhǔn)率,其主要功能是實(shí)現(xiàn)基于語義的查詢,使檢索上升到基于語義檢索和知識(shí)檢索的層次?;谡Z義的教育資源智能查詢主要實(shí)現(xiàn)如下功能:1)能夠通過本體,實(shí)現(xiàn)對(duì)用戶數(shù)據(jù)關(guān)鍵詞的語義解析,豐富查詢結(jié)果。2)能夠?qū)崿F(xiàn)對(duì)用戶輸入的關(guān)鍵詞及其同義詞的查詢,如用戶輸入“計(jì)算機(jī)網(wǎng)絡(luò)”,對(duì)應(yīng)的搜索結(jié)果不但有“計(jì)算機(jī)網(wǎng)絡(luò)”相關(guān)教育資源,還會(huì)有“網(wǎng)絡(luò)技術(shù)”、“網(wǎng)絡(luò)科學(xué)”、“網(wǎng)絡(luò)應(yīng)用”等同義詞的相關(guān)教育資源。3)能夠?qū)崿F(xiàn)對(duì)用戶輸入關(guān)鍵詞及其相關(guān)聯(lián)內(nèi)容的查詢,包括關(guān)鍵次的上層關(guān)系和下層關(guān)系(即父類和子類關(guān)系),如用戶輸出“程序設(shè)計(jì)”,對(duì)應(yīng)的搜索結(jié)果不但有“程序設(shè)計(jì)”相關(guān)教育資源,還會(huì)有“軟件開發(fā)”這樣的父類資源,也會(huì)有“Java語言設(shè)計(jì)”、“C語言基礎(chǔ)”等這樣的子類資源。
3.2 系統(tǒng)實(shí)現(xiàn)步驟
(1) 創(chuàng)建本體
基于本體的教育資源檢索系統(tǒng)首先需要?jiǎng)?chuàng)建教育資源本體,包含設(shè)計(jì)教育資源本體和將其應(yīng)用到檢索系統(tǒng)中。本體是一種形式化表示“知識(shí)”的工具,目前已經(jīng)廣泛應(yīng)用在語義網(wǎng)絡(luò)、信息檢索、人工智能等領(lǐng)域。本系統(tǒng)設(shè)計(jì)的本體是應(yīng)用在教育資源智能檢索中,雖然有許多理論研究者和實(shí)踐工作者將本體應(yīng)用到教育領(lǐng)域,但是當(dāng)前在網(wǎng)絡(luò)教育資源領(lǐng)域還沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)和方法,因此需要根據(jù)具體的應(yīng)用來進(jìn)行設(shè)計(jì)。本體的設(shè)計(jì)方法主要有“迭代設(shè)計(jì)法”和“至上而下設(shè)計(jì)法”兩種?!暗O(shè)計(jì)法”的步驟是首先設(shè)計(jì)一個(gè)初始本體,然后不斷的修正和完善該本體的細(xì)節(jié),使之逐步的滿足所要實(shí)現(xiàn)的目標(biāo)?!爸辽隙路ā钡牟襟E是從根目錄開始,不斷豐富其層次結(jié)構(gòu),從而達(dá)到描述目標(biāo)對(duì)象的目標(biāo)。本文采用本體編輯工具Protégé進(jìn)行本體模型構(gòu)建,包括定義本體的類、類屬性、類層次和實(shí)例,設(shè)計(jì)教育資源本體的主要步驟包含如下幾步:1)確定范圍,即確定教育資源本體的領(lǐng)域知識(shí)所包含的范圍;2)描述概念,描述教育資源本體的中的重要概念;3)確定類,定義教育資源本體中的類和類的關(guān)系;4)定義屬性,定義本體類的屬性。5)確定屬性約束;6)建立實(shí)例。
(2) 語義標(biāo)注
在基于本體的教育資源檢索系統(tǒng)中,設(shè)計(jì)好本體之后,需要基于教育資源本體信息進(jìn)行標(biāo)注處理,生產(chǎn)相應(yīng)的本體實(shí)例,并且形成對(duì)應(yīng)的RDF實(shí)例文件。語義檢索需要針對(duì)統(tǒng)一格式的文檔,一般采用基于XML語法的文檔,該文檔采用RDF三元組的方式描述信息資源。本研究采用手動(dòng)的方式對(duì)采集的信息資源進(jìn)行語義標(biāo)準(zhǔn),標(biāo)準(zhǔn)的結(jié)果存儲(chǔ)在基于XML語法的XML實(shí)例文件中。
(3) 信息檢索
根據(jù)檢索條件,基于教育資源本體,采用jena推理機(jī)進(jìn)行語義推理,最終得到檢索結(jié)果。在創(chuàng)建了教育資源領(lǐng)域信息知識(shí)本體構(gòu)和語義標(biāo)注后,使用Jena推理機(jī)將XML文件轉(zhuǎn)化為可供檢索程序應(yīng)用的格式。Jena是一款開源的,由惠普公司開發(fā)的基于Java的語義網(wǎng)工具包,是用來創(chuàng)建語義Web系統(tǒng)的框架,它提供基于本體的語義檢索相關(guān)工具API。
3.3 系統(tǒng)的運(yùn)行效果分析
該系統(tǒng)實(shí)現(xiàn)了對(duì)教育資源的語義查詢,不僅實(shí)現(xiàn)對(duì)用戶輸入的關(guān)鍵詞及其同義詞的查詢,還實(shí)現(xiàn)了對(duì)用戶輸入關(guān)鍵詞及其相關(guān)聯(lián)內(nèi)容的查詢,包括關(guān)鍵次的上層關(guān)系和下層關(guān)系。
4 結(jié)束語
本文基于教育資源本體理論,構(gòu)建了計(jì)算機(jī)網(wǎng)絡(luò)學(xué)科領(lǐng)域的知識(shí)本體,實(shí)驗(yàn)證明,基于本體的教育資源檢索在查準(zhǔn)率和查全率上都有顯著提升。與傳統(tǒng)教育資源檢索相比,基于本體的網(wǎng)絡(luò)教育資源檢索通過教育資源的本體信息在本體層來檢索教育資源,利用合理完善的教育資源本體描述,表達(dá)了教育資源概念(類)的語義含義和相互之間的內(nèi)在聯(lián)系,幫助用戶更精準(zhǔn)的檢索到所需要的教育資源信息,更好地滿足用戶需求。
參考文獻(xiàn):
[1] 杜小勇,李曼,王珊,等.本體學(xué)習(xí)研究綜述[J].軟件學(xué)報(bào),2006,17(9):1837-1847.
[2] 張祥,李星,溫韻清,等.語義網(wǎng)虛擬本體構(gòu)建[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版,2015,45(4):652-656.
[3] 楊月華,杜軍平,平源等.基于本體的智能信息檢索系統(tǒng)[J].軟件學(xué)報(bào),2015,26(7):1675-1687.
[4] 劉毅,王宇,楊德禮,等.本體進(jìn)化驅(qū)動(dòng)的個(gè)性化語義搜索研究[J].情報(bào)學(xué)報(bào),2015,34(10):1048-1055.
[5] 畢魯雁,焦宗夏,范圣韜,等.基于本體映射的設(shè)計(jì)知識(shí)庫(kù)搜索方法[J].計(jì)算機(jī)集成制造系統(tǒng),2009,15(10):1890-1899.
[6] 李春,楊明,顧婷婷,等.基于本體的信息關(guān)聯(lián)搜索[J].中國(guó)新通信,2017,19(11):25-27.
[7] 萬靜,王文聰,易軍凱,等.一種基于本體的知識(shí)庫(kù)語義擴(kuò)展搜索方法[J].計(jì)算機(jī)工程,2012,38(6):19-21,24.
[8] 劉志亮,張金隆.基于教育云的教育信息資源整合框架研究[J].情報(bào)雜志,2013,(10):164-167.DOI:10.3969.endprint