• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      教學(xué)資源概念查詢(xún)擴(kuò)展研究

      2014-02-28 10:27:22張?zhí)m芳年梅
      關(guān)鍵詞:同義計(jì)算機(jī)網(wǎng)絡(luò)關(guān)聯(lián)

      張?zhí)m芳,年梅

      新疆師范大學(xué)網(wǎng)絡(luò)信息安全與輿情分析重點(diǎn)實(shí)驗(yàn)室,烏魯木齊830054

      1 引言

      互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展促使教育教學(xué)要面向信息化、現(xiàn)代化,基于網(wǎng)絡(luò)的在線(xiàn)學(xué)習(xí)(E-Learning)成為一種新的學(xué)習(xí)方式[1],它是自主學(xué)習(xí)、終身學(xué)習(xí)的有利工具。但是隨著網(wǎng)絡(luò)資源的迅速膨脹,基于關(guān)鍵字簡(jiǎn)單匹配的搜索引擎在查找教學(xué)資源時(shí),找到的大量鏈接與學(xué)習(xí)者的查詢(xún)需求無(wú)關(guān),不能滿(mǎn)足學(xué)習(xí)者網(wǎng)上資源查詢(xún)的需要,降低了學(xué)習(xí)者在線(xiàn)學(xué)習(xí)的效率,也困擾了學(xué)習(xí)者利用網(wǎng)絡(luò)學(xué)習(xí)的創(chuàng)造性和積極性。近年來(lái),一些學(xué)者提出采用概念語(yǔ)義查詢(xún)擴(kuò)展的方法來(lái)檢索教學(xué)資源,這樣可以從語(yǔ)義層面理解學(xué)習(xí)者的需求,把握學(xué)習(xí)者檢索的真實(shí)意圖,為學(xué)習(xí)者提供語(yǔ)義相近和相關(guān)的知識(shí)內(nèi)容,以提高在線(xiàn)學(xué)習(xí)的效率。

      概念語(yǔ)義查詢(xún)擴(kuò)展是在語(yǔ)義詞典/領(lǐng)域本體的基礎(chǔ)上構(gòu)建概念語(yǔ)義空間,對(duì)原查詢(xún)進(jìn)行擴(kuò)展。該方法需要首先提取概念語(yǔ)義空間中的各種概念及其隱含的各種語(yǔ)義關(guān)聯(lián),建立一個(gè)概念語(yǔ)義網(wǎng)絡(luò)知識(shí)庫(kù);然后將查詢(xún)概念與概念語(yǔ)義網(wǎng)絡(luò)知識(shí)庫(kù)中的概念匹配,生成查詢(xún)語(yǔ)義的關(guān)聯(lián)概念樹(shù);從關(guān)聯(lián)概念樹(shù)中提取與原查詢(xún)語(yǔ)義相關(guān)的概念,通過(guò)一定閾值與規(guī)則的沒(méi)定,選出擴(kuò)展概念,實(shí)現(xiàn)基于概念的擴(kuò)展檢索[2]。概念語(yǔ)義擴(kuò)展檢索能夠?qū)崿F(xiàn)語(yǔ)義的同義擴(kuò)展、蘊(yùn)含擴(kuò)展、外延擴(kuò)展、并列擴(kuò)展和相關(guān)擴(kuò)展[3]。

      基于概念語(yǔ)義網(wǎng)絡(luò)能提高教學(xué)資源檢索的查全率和查準(zhǔn)率,并為學(xué)習(xí)者提供所查詢(xún)知識(shí)點(diǎn)相關(guān)領(lǐng)域的導(dǎo)引學(xué)習(xí),是目前教學(xué)資源查詢(xún)的主流途徑。近年來(lái)本體技術(shù)頗受學(xué)者們的青睞,成來(lái)教學(xué)領(lǐng)域概念語(yǔ)義網(wǎng)絡(luò)的研究熱點(diǎn)。他們采用本體技術(shù)構(gòu)建某一學(xué)科領(lǐng)域的知識(shí)庫(kù),從而實(shí)現(xiàn)該領(lǐng)域知識(shí)的查詢(xún)擴(kuò)展,以幫助學(xué)習(xí)者更全面、準(zhǔn)確地了解所查詢(xún)知識(shí)點(diǎn)的相關(guān)內(nèi)容。

      本文提出教學(xué)資源概念擴(kuò)展思想,以《計(jì)算機(jī)網(wǎng)絡(luò)》第五版為依據(jù),采用文獻(xiàn)[3]提出的文檔抽取方法,抽取出《計(jì)算機(jī)網(wǎng)絡(luò)》主要知識(shí)點(diǎn)中的術(shù)語(yǔ)作為《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)的概念詞和擴(kuò)展概念詞,構(gòu)建概念語(yǔ)義網(wǎng)絡(luò),設(shè)計(jì)概念語(yǔ)義查詢(xún)擴(kuò)展檢索系統(tǒng);將學(xué)習(xí)者查詢(xún)計(jì)算機(jī)網(wǎng)絡(luò)領(lǐng)域的查詢(xún)?cè)~在《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)中進(jìn)行語(yǔ)義擴(kuò)展,并向上拓展抽取完整的關(guān)聯(lián)概念樹(shù),不僅充分挖掘出每個(gè)查詢(xún)?cè)~的語(yǔ)義概念,而且通過(guò)向上拓展至各個(gè)查詢(xún)?cè)~的公共祖先節(jié)點(diǎn),將各查詢(xún)?cè)~的原始語(yǔ)義關(guān)系聯(lián)接起來(lái)。其解決了查詢(xún)?cè)~之間缺乏聯(lián)系的問(wèn)題,從而較全面地進(jìn)行答案搜索,提高學(xué)習(xí)資源的查全率和查準(zhǔn)率,為學(xué)生在線(xiàn)學(xué)習(xí)效率的提高奠定基礎(chǔ)。

      2 國(guó)內(nèi)外相關(guān)研究分析

      2.1 查詢(xún)擴(kuò)展技術(shù)研究現(xiàn)狀

      查詢(xún)擴(kuò)展是在原查詢(xún)?cè)~的基礎(chǔ)上加入與用戶(hù)用詞相關(guān)的詞或者詞組,組成新的、更準(zhǔn)確的查詢(xún)序列,使擴(kuò)展后的查詢(xún)序列能更清晰地表達(dá)用戶(hù)的查詢(xún)意愿[2]。傳統(tǒng)的查詢(xún)擴(kuò)展技術(shù)主要有全局分析、局部分析,以及基于用戶(hù)查詢(xún)?nèi)罩綶4]和基于關(guān)聯(lián)規(guī)則挖掘[5]的查詢(xún)擴(kuò)展[2]。其中局部分析中的偽相關(guān)性反饋PRF(Pseudo-Relevance Feedback)技術(shù)[6-7]是使用較多的方法。該方法主要利用查詢(xún)時(shí)返回的top-N支持文檔來(lái)擴(kuò)展原始查詢(xún)語(yǔ)句。但是這些查詢(xún)擴(kuò)展方法的效果并不穩(wěn)定。

      目前,基于概念語(yǔ)義的查詢(xún)擴(kuò)展檢索已經(jīng)成為信息檢索的發(fā)展趨勢(shì)。國(guó)外較著名的項(xiàng)目有Swoogle、KIM平臺(tái)、FINDUR系統(tǒng),其中Swoogle是由美國(guó)馬里蘭大學(xué)開(kāi)發(fā)的針對(duì)語(yǔ)義網(wǎng)的搜索引擎,其處理的數(shù)據(jù)對(duì)象是RDF元數(shù)據(jù)及本體術(shù)語(yǔ)。Swoogle借助Google等通用搜索引擎為其搜索博客、新聞種子、數(shù)字圖書(shū)館、版權(quán)元數(shù)據(jù)、軟件配置和詞典(如WordNet)等語(yǔ)義數(shù)據(jù),其目的是推動(dòng)語(yǔ)義網(wǎng)數(shù)據(jù)的獲取[1]。國(guó)內(nèi)在概念語(yǔ)義檢索方面的研究起步較晚,目前還沒(méi)有真正能得到大范圍應(yīng)用且用戶(hù)認(rèn)可的檢索系統(tǒng)或搜索引擎。中科院計(jì)算所諸葛海等[8]提出的知識(shí)網(wǎng)絡(luò)通過(guò)采用新的計(jì)算模式和新的資源組織與管理模型,能有效地輔助用戶(hù)進(jìn)行資源的查詢(xún)、獲取、共享等工作。

      2.2 概念語(yǔ)義網(wǎng)絡(luò)研究現(xiàn)狀

      國(guó)內(nèi)外在概念語(yǔ)義網(wǎng)絡(luò)方面的研究已初具成果。例如斯擔(dān)福大學(xué)的Infomap Search Engine,通過(guò)選用不同的訓(xùn)練語(yǔ)料,測(cè)試生成的概念語(yǔ)義網(wǎng)絡(luò)對(duì)查詢(xún)效果的影響,并在此基礎(chǔ)上,利用醫(yī)學(xué)相關(guān)語(yǔ)料和雙語(yǔ)詞典生成一個(gè)概念網(wǎng)絡(luò),建立醫(yī)學(xué)文檔檢索的示范應(yīng)用[9]。國(guó)內(nèi)較典型的相關(guān)研究有:中國(guó)科學(xué)院計(jì)算技術(shù)研究所用共現(xiàn)分析以及Hopfield網(wǎng)絡(luò)概念空間,從而實(shí)現(xiàn)了基于概念空間的擴(kuò)展檢索[10];北京郵電大學(xué)針對(duì)計(jì)算機(jī)及其應(yīng)用領(lǐng)域,手工創(chuàng)建了一個(gè)含有500多個(gè)概念節(jié)點(diǎn),包括一個(gè)分類(lèi)體系和近300種概念相關(guān)關(guān)系的語(yǔ)義網(wǎng)絡(luò),初步實(shí)現(xiàn)了特定領(lǐng)域的概念檢索[11];中國(guó)科學(xué)技術(shù)大學(xué)和中國(guó)科學(xué)院計(jì)算技術(shù)研究所聯(lián)合研究開(kāi)發(fā)的基于概念語(yǔ)義空間的聯(lián)想檢索系統(tǒng),通過(guò)共現(xiàn)分析建立概念語(yǔ)義空間,并借助于大型語(yǔ)義詞典《知網(wǎng)》,為用戶(hù)提供了一個(gè)智能檢索接口[12]。

      3 以《計(jì)算機(jī)網(wǎng)絡(luò)》為教學(xué)資源生成概念語(yǔ)義網(wǎng)絡(luò)

      3.1 抽取概念詞

      通過(guò)對(duì)自然語(yǔ)言網(wǎng)絡(luò)答疑語(yǔ)料庫(kù)(即問(wèn)題答案庫(kù))的分析,以《計(jì)算機(jī)網(wǎng)絡(luò)》(第五版)為依據(jù),總結(jié)出《計(jì)算機(jī)網(wǎng)絡(luò)》的關(guān)鍵知識(shí)點(diǎn),從這些關(guān)鍵知識(shí)點(diǎn)中抽取出概念詞。

      3.2 構(gòu)建概念語(yǔ)義網(wǎng)絡(luò)

      概念語(yǔ)義網(wǎng)絡(luò)是本文實(shí)現(xiàn)教學(xué)資源概念查詢(xún)擴(kuò)展的關(guān)鍵部分。含有概念詞間概念關(guān)系的概念語(yǔ)義網(wǎng)絡(luò)實(shí)際上就是一個(gè)知識(shí)庫(kù),基于該知識(shí)庫(kù)可以實(shí)現(xiàn)特定領(lǐng)域信息的智能檢索。本文基于《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò),實(shí)現(xiàn)《計(jì)算機(jī)網(wǎng)絡(luò)》教學(xué)資源領(lǐng)域Web頁(yè)面的概念檢索。

      在概念語(yǔ)義網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)表示一個(gè)概念詞,有向邊表示概念詞之間的某種關(guān)系。概念語(yǔ)義網(wǎng)絡(luò)具有縱向?qū)哟侮P(guān)系,不同層次表明概念間的抽象程度不同,層次越高其概念概括性越強(qiáng),包含的子概念越多。父概念由一組子概念組成,是子概念的抽象、概括表示,子概念是父概念的屬性、特征表示,是對(duì)父概念的細(xì)化。概念語(yǔ)義網(wǎng)絡(luò)還有橫向關(guān)系,包括同義概念關(guān)系和兄弟概念關(guān)系,這樣就可以把不同層的具有同義概念關(guān)系和兄弟概念關(guān)系的任意節(jié)點(diǎn)聯(lián)系起來(lái),構(gòu)成一個(gè)概念語(yǔ)義網(wǎng)。

      圖1 概念語(yǔ)義網(wǎng)絡(luò)構(gòu)造示意圖

      以《計(jì)算機(jī)網(wǎng)絡(luò)》第五版教材為依據(jù)構(gòu)建《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)。參考文獻(xiàn)[3]提出的概念語(yǔ)義網(wǎng)絡(luò)的自動(dòng)生成方法,抽取出概念詞的同義概念詞、子概念詞,然后對(duì)子概念關(guān)系進(jìn)行角色轉(zhuǎn)換,得到父概念詞和兄弟概念詞。這樣以各個(gè)概念詞為中心依托各種概念關(guān)系構(gòu)造出它的概念語(yǔ)義網(wǎng),各概念詞之間通過(guò)各種概念關(guān)系相互關(guān)聯(lián),從而生成一個(gè)有著各種概念關(guān)系的語(yǔ)義網(wǎng)絡(luò)。概念網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)代表一個(gè)元概念,節(jié)點(diǎn)間的連線(xiàn)表示概念間的各種語(yǔ)義關(guān)聯(lián)和繼承關(guān)系。具體構(gòu)建時(shí)采用如下的方法:

      (1)用分類(lèi)樹(shù)的方法構(gòu)建概念詞間的縱向?qū)哟侮P(guān)系。第一層是最高層,用來(lái)描述最具概括性的概念,定義為“計(jì)算機(jī)網(wǎng)絡(luò)”;第二層細(xì)化為網(wǎng)絡(luò)參考模型、網(wǎng)絡(luò)安全、無(wú)線(xiàn)網(wǎng)絡(luò)、因特網(wǎng)多媒體信息服務(wù)、下一代因特網(wǎng)五個(gè)主題領(lǐng)域;第三層對(duì)第二層的概念再進(jìn)行細(xì)化,如:第二層中網(wǎng)絡(luò)參考模型再細(xì)化分為物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、運(yùn)輸層、應(yīng)用層五個(gè)主題領(lǐng)域。在這里并非所有的概念都要進(jìn)行細(xì)化,可以根據(jù)概念詞間的關(guān)系進(jìn)行細(xì)化,這樣建成的分類(lèi)樹(shù)在深度和廣度上自由擴(kuò)展,易于操做。

      (2)在分類(lèi)樹(shù)的基礎(chǔ)上添加橫向的同義概念關(guān)系和兄弟概念關(guān)系,實(shí)現(xiàn)不同層次上同義概念詞和兄弟概念詞的聯(lián)系,構(gòu)成一個(gè)概念語(yǔ)義網(wǎng)絡(luò)。

      圖1是《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)的構(gòu)造示意圖。

      圖1中每個(gè)節(jié)點(diǎn)代表一個(gè)概念詞,括號(hào)里是它的同義概念詞,主要是英文簡(jiǎn)寫(xiě)和全稱(chēng)。單向箭頭表示所連接的兩個(gè)概念詞是父子概念關(guān)系,實(shí)曲線(xiàn)所連接的兩個(gè)概念詞是兄弟概念關(guān)系。

      3.3 描述概念語(yǔ)義網(wǎng)絡(luò)

      《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)表示為SN={N,E},其中N是概念節(jié)點(diǎn)的集合,描述了該節(jié)點(diǎn)的各種屬性值,E是聯(lián)接N中節(jié)點(diǎn)的帶標(biāo)識(shí)的有向邊的集合,描述了有向邊所代表的概念關(guān)系。定義如下的概念關(guān)系:

      概念關(guān)系::=<同義概念關(guān)系A(chǔ)>|<父概念關(guān)系F>|

      <子概念關(guān)系S>|<兄弟概念關(guān)系B>

      針對(duì)概念語(yǔ)義網(wǎng)絡(luò)的實(shí)際需求,設(shè)計(jì)如下實(shí)體和屬性:

      概念詞(概念詞編號(hào){PK},概念詞名,父概念詞編號(hào))

      同義概念詞(同義概念詞編號(hào){PK},概念詞編號(hào){FK},同義概念詞描述)

      父概念詞(父概念詞編號(hào){PK},概念詞編號(hào){FK},父概念詞描述)

      子概念詞(子概念詞編號(hào){PK},概念詞編號(hào){FK},子概念詞描述)

      兄弟概念詞(兄弟概念詞編號(hào){PK},概念詞編號(hào){FK},兄弟概念詞描述)

      4 學(xué)習(xí)者查詢(xún)語(yǔ)義的提取策略與算法

      學(xué)習(xí)者查詢(xún)語(yǔ)義的提取策略:如果學(xué)習(xí)者輸入的《計(jì)算機(jī)網(wǎng)絡(luò)》領(lǐng)域的查詢(xún)概念與《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)中的概念詞精確匹配,將提取每一個(gè)查詢(xún)概念的關(guān)聯(lián)概念。關(guān)聯(lián)概念包括同義概念詞、父概念詞、子概念詞和兄弟概念詞,這些概念詞組合在一起其實(shí)就是一棵與查詢(xún)概念關(guān)聯(lián)的概念語(yǔ)義樹(shù),稱(chēng)它為關(guān)聯(lián)概念樹(shù)。學(xué)習(xí)者查詢(xún)概念的擴(kuò)展其實(shí)就是關(guān)聯(lián)概念樹(shù)的提取過(guò)程。在提取過(guò)程中給每個(gè)概念設(shè)定相關(guān)的權(quán)重,就可以完成學(xué)習(xí)者查詢(xún)語(yǔ)義的提取。

      4.1 查詢(xún)擴(kuò)展算法

      步驟1學(xué)習(xí)者輸入查詢(xún)的概念,系統(tǒng)調(diào)用預(yù)處理模塊對(duì)其進(jìn)行處理生成查詢(xún)向量Q(q1,q2,…,qn),將初始查詢(xún)向量放入到《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)中進(jìn)行概念節(jié)點(diǎn)匹配,匹配原則是概念詞名稱(chēng)的精確匹配,如果在概念語(yǔ)義網(wǎng)絡(luò)中精確匹配到查詢(xún)向量Q,就把匹配到的概念節(jié)點(diǎn)定義為元概念節(jié)點(diǎn)O(o1,o2,…,on)。

      步驟2以元概念節(jié)點(diǎn)O(o1,o2,…,on)為基點(diǎn)提取關(guān)聯(lián)概念樹(shù)T(t1,t2,…,tn)。

      步驟3以元概念節(jié)點(diǎn)O(o1,o2,…,on)為基點(diǎn)搜索它們的共同祖先概念節(jié)點(diǎn),可能存在多個(gè)共同祖先概念節(jié)點(diǎn),把離元概念節(jié)點(diǎn)最近的共同祖先概念節(jié)點(diǎn)定義為最近祖先概念節(jié)點(diǎn)Root,它將成為關(guān)聯(lián)概念樹(shù)T(t1,t2,…,tn)根節(jié)點(diǎn)。把元概念節(jié)點(diǎn)及其下面的子概念集、最近祖先概念節(jié)點(diǎn)及其到元概念節(jié)點(diǎn)的路徑概念節(jié)點(diǎn),連同它們的樹(shù)狀結(jié)構(gòu)及元概念節(jié)點(diǎn)的同義概念節(jié)點(diǎn)、兄弟概念節(jié)點(diǎn)一起裁剪復(fù)制一份出來(lái),生成一個(gè)符合學(xué)習(xí)者查詢(xún)意愿的關(guān)聯(lián)概念樹(shù)。

      步驟4查詢(xún)語(yǔ)義的提取及擴(kuò)展詞的確定。在關(guān)聯(lián)概念樹(shù)中,查詢(xún)語(yǔ)義是以元概念節(jié)點(diǎn)為中心,向上向下延伸,離元概念節(jié)點(diǎn)越遠(yuǎn)的節(jié)點(diǎn),其概念語(yǔ)義與查詢(xún)語(yǔ)義相關(guān)程度就越小。元概念節(jié)點(diǎn)上層語(yǔ)義邊界是其最近祖先概念節(jié)點(diǎn),也就是關(guān)聯(lián)概念樹(shù)的根節(jié)點(diǎn)。以元概念節(jié)點(diǎn)為根節(jié)點(diǎn)向下延伸到子樹(shù),這里引入?yún)?shù)L定義為子樹(shù)層數(shù),確定查詢(xún)語(yǔ)義的下層語(yǔ)義邊界。關(guān)聯(lián)概念樹(shù)的語(yǔ)義范圍確定就是查詢(xún)語(yǔ)義的提取,以元概念節(jié)點(diǎn)O(o1,o2,…,on)為基點(diǎn)向上延伸至最近祖先概念節(jié)點(diǎn)Root,向下延伸至所有元概念節(jié)點(diǎn)的子概念節(jié)點(diǎn),橫向延伸至元概念節(jié)點(diǎn)的同義概念節(jié)點(diǎn)和兄弟概念節(jié)點(diǎn),除元概念節(jié)點(diǎn)外,關(guān)聯(lián)概念樹(shù)中其余的概念節(jié)點(diǎn)都將作為查詢(xún)概念的擴(kuò)展詞。

      如圖2是查詢(xún)?cè)~關(guān)聯(lián)概念樹(shù)的提取示意圖。

      圖2中實(shí)心圓點(diǎn)為元概念節(jié)點(diǎn),“查詢(xún)語(yǔ)義的關(guān)聯(lián)概念樹(shù)”中的空心圓點(diǎn)就是擴(kuò)展的概念節(jié)點(diǎn),它們將與元概念節(jié)點(diǎn)一起組成查詢(xún)序列以表示學(xué)習(xí)者的查詢(xún)意愿。

      4.2 計(jì)算權(quán)重

      在查詢(xún)?cè)~的關(guān)聯(lián)概念樹(shù)中,各概念節(jié)點(diǎn)對(duì)初始查詢(xún)的權(quán)重是不同的,元概念節(jié)點(diǎn)是初始查詢(xún)?cè)~,其權(quán)重最高,規(guī)定其權(quán)重WC=1;元概念節(jié)點(diǎn)的同義概念詞與初始查詢(xún)?cè)~語(yǔ)義相同,規(guī)定其權(quán)重WCO=1;元概念節(jié)點(diǎn)擴(kuò)展子概念節(jié)點(diǎn)的語(yǔ)義范圍屬于其父概念,它的權(quán)重應(yīng)該要小一些,規(guī)定WCS=B-L,B為常數(shù),L為子概念節(jié)點(diǎn)與其對(duì)應(yīng)的元概念節(jié)點(diǎn)的距離,即層數(shù)L=1;父概念節(jié)點(diǎn)是元概念節(jié)點(diǎn)語(yǔ)義的向上泛化,因而其權(quán)重應(yīng)該較小些,規(guī)定父概念節(jié)點(diǎn)的權(quán)重WCF=B-2L;根據(jù)分析,兄弟概念節(jié)點(diǎn)的權(quán)重應(yīng)該更小一些,規(guī)定其權(quán)重WCB=B-3L。元概念節(jié)點(diǎn)的最近祖先概念節(jié)點(diǎn)Root的權(quán)重等于與它直接相連的子節(jié)點(diǎn)的權(quán)重之和,如圖2“查詢(xún)語(yǔ)義的關(guān)聯(lián)概念樹(shù)”中最近祖先節(jié)點(diǎn)Root的權(quán)重是與它直接相連的子節(jié)點(diǎn)B1、C1、D1節(jié)點(diǎn)的權(quán)重之和,即WRoot=B-4+B-4+B-4,它表明最近祖先概念節(jié)點(diǎn)和與之相聯(lián)的所有元概念節(jié)點(diǎn)的關(guān)聯(lián)程度。圖2中的“查詢(xún)語(yǔ)義的關(guān)聯(lián)概念樹(shù)”標(biāo)出了各節(jié)點(diǎn)的權(quán)重。

      4.3 獲取查詢(xún)擴(kuò)展詞

      定義查詢(xún)?cè)~序列Qe以及閾值變量λ,遍歷查詢(xún)?cè)~的關(guān)聯(lián)概念樹(shù)的所有節(jié)點(diǎn)CI,如果W(CI)>λ,就將節(jié)點(diǎn)CI插入查詢(xún)?cè)~序列Qe,通過(guò)對(duì)閾值變量l的調(diào)整,可以控制查詢(xún)序列Qe中擴(kuò)展詞的數(shù)量。

      將查詢(xún)序列Qe中的詞送入檢索系統(tǒng)進(jìn)行檢索,實(shí)現(xiàn)概念擴(kuò)展檢索。

      5 概念查詢(xún)擴(kuò)展檢索的計(jì)算機(jī)實(shí)現(xiàn)

      本文設(shè)計(jì)的概念查詢(xún)擴(kuò)展是基于《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)的檢索系統(tǒng),這種查詢(xún)方式能夠幫助學(xué)習(xí)者快速、準(zhǔn)確地定位到所要查找的知識(shí)點(diǎn),同時(shí)還為學(xué)習(xí)者提供所要查找知識(shí)點(diǎn)的上下位概念和兄弟概念,以幫助學(xué)習(xí)者拓展延伸所要查詢(xún)的知識(shí)點(diǎn),從而極大地方便了學(xué)習(xí)者的查詢(xún)需求。

      圖2 查詢(xún)語(yǔ)義關(guān)聯(lián)樹(shù)提取示意圖

      由于本文設(shè)計(jì)的概念語(yǔ)義網(wǎng)絡(luò)是《計(jì)算機(jī)網(wǎng)絡(luò)》教學(xué)資源領(lǐng)域的,所以要求學(xué)習(xí)者限定所要查詢(xún)的領(lǐng)域。對(duì)于學(xué)習(xí)者輸入的查詢(xún),系統(tǒng)同時(shí)進(jìn)行三種處理。

      關(guān)鍵詞同義擴(kuò)展搜索:當(dāng)學(xué)習(xí)者輸入查詢(xún)?cè)~時(shí),檢索模塊從概念語(yǔ)義網(wǎng)絡(luò)中抽取出查詢(xún)?cè)~的同義概念詞,并直接把同意概念詞和原查詢(xún)?cè)~一起作為檢索條件在索引數(shù)據(jù)庫(kù)中查詢(xún),利用倒排索引,返回《計(jì)算機(jī)網(wǎng)絡(luò)》領(lǐng)域的文檔。

      學(xué)習(xí)者選擇相關(guān)概念擴(kuò)展查詢(xún),當(dāng)學(xué)習(xí)者輸入查詢(xún)?cè)~時(shí),如果所輸入的查詢(xún)?cè)~在概念語(yǔ)義網(wǎng)絡(luò)中能匹配到,系統(tǒng)在概念語(yǔ)義網(wǎng)絡(luò)中激活查詢(xún)?cè)~的關(guān)聯(lián)語(yǔ)義樹(shù),提取查詢(xún)?cè)~的擴(kuò)展查詢(xún)序列反饋給學(xué)習(xí)者,由學(xué)習(xí)者選擇相關(guān)概念詞進(jìn)行概念擴(kuò)展查詢(xún)。同時(shí),系統(tǒng)將學(xué)習(xí)者的選擇輸入和該領(lǐng)域下文檔聚類(lèi)所生成的各個(gè)類(lèi)別的文檔進(jìn)行匹配,找出和這個(gè)關(guān)鍵詞最為相關(guān)的文檔,返回給學(xué)習(xí)者。

      如果學(xué)習(xí)者在關(guān)鍵詞同義擴(kuò)展搜索方式中找到所要查詢(xún)的文檔,則查詢(xún)結(jié)束。如果用戶(hù)對(duì)“關(guān)鍵詞同義擴(kuò)展搜索”返回的文檔不滿(mǎn)意,學(xué)習(xí)者可以選擇相關(guān)概念擴(kuò)展查詢(xún),這樣系統(tǒng)只返回相應(yīng)類(lèi)別的文檔。

      學(xué)習(xí)者選擇相近概念精確查詢(xún),如果學(xué)習(xí)者在“關(guān)鍵詞同義擴(kuò)展搜索”返回的文檔集合中找不到所需的文檔,則有可能是學(xué)習(xí)者輸入的查詢(xún)?cè)~有誤,學(xué)習(xí)者可以通過(guò)系統(tǒng),利用概念語(yǔ)義網(wǎng)絡(luò)搜索返回相近概念來(lái)進(jìn)行查詢(xún)。圖3為查詢(xún)處理流程圖。

      6 實(shí)驗(yàn)分析

      教學(xué)資源概念查詢(xún)擴(kuò)展的主要目的在于通過(guò)概念語(yǔ)義的擴(kuò)展提高查詢(xún)的查全率和查準(zhǔn)率,并向?qū)W習(xí)者提供所查詢(xún)知識(shí)點(diǎn)的上、下位延伸知識(shí),方便學(xué)習(xí)者掌握所查詢(xún)的知識(shí)內(nèi)容。

      采用本系統(tǒng)查詢(xún)《計(jì)算機(jī)網(wǎng)絡(luò)》教學(xué)資源,當(dāng)學(xué)習(xí)者提交“OSPF協(xié)議”時(shí),系統(tǒng)會(huì)擴(kuò)展“OSPF協(xié)議”的同義概念詞“開(kāi)放式最短路徑優(yōu)先協(xié)議”和“Open Shortest Path First”,將其作為檢索條件查詢(xún)出更全、更準(zhǔn)的“OSPF協(xié)議”內(nèi)容;除此之外,系統(tǒng)還可以通過(guò)擴(kuò)展“OSPF協(xié)議”的父概念,檢索到“內(nèi)部網(wǎng)關(guān)協(xié)議”的內(nèi)容,擴(kuò)展子概念,檢索到“OSPFv2”和“OSPFv3”的內(nèi)容,擴(kuò)展兄弟概念,檢索到“路由信息協(xié)議”的內(nèi)容,從而增加了檢索到相關(guān)教學(xué)資源的數(shù)目,提高了學(xué)習(xí)者在線(xiàn)學(xué)習(xí)的效率。

      評(píng)價(jià)檢索系統(tǒng)的重要指標(biāo)是查全率和查準(zhǔn)率。查全率用于衡量檢索系統(tǒng)從資源中檢索出相關(guān)資源成功度的一項(xiàng)指標(biāo),即檢索出的資源和應(yīng)得到的全部相關(guān)資源的百分比。查準(zhǔn)率是用于衡量檢索系統(tǒng)的信號(hào)噪聲比的一種指標(biāo),即檢出的相關(guān)文檔與檢出的全部文檔的百分比,是衡量信息檢索系統(tǒng)檢出資源準(zhǔn)確度的尺度。

      本檢索實(shí)驗(yàn)基于Google搜索引擎,模擬學(xué)習(xí)者初始查詢(xún)請(qǐng)求和擴(kuò)展同義概念查詢(xún)請(qǐng)求提交給Google,實(shí)驗(yàn)過(guò)程不涉及搜索引擎實(shí)現(xiàn)的細(xì)節(jié)。由于涉及到具體搜索引擎的網(wǎng)頁(yè)數(shù)據(jù)庫(kù),并考慮在線(xiàn)學(xué)習(xí)者查看搜索結(jié)果的習(xí)慣,對(duì)查全率、查準(zhǔn)率的比較做了重新定義,即查全率的比較是把常規(guī)查詢(xún)查到的鏈接網(wǎng)頁(yè)數(shù)與概念擴(kuò)展查詢(xún)查到鏈接網(wǎng)頁(yè)數(shù)進(jìn)行比較;查準(zhǔn)率的比較只考慮前50條搜索結(jié)果,設(shè)學(xué)習(xí)者檢索信息為Q,針對(duì)Q檢索出的資源總數(shù)為B,其中與Q相關(guān)的資源總數(shù)為A,則檢索系統(tǒng)針對(duì)Q的查準(zhǔn)率P的計(jì)算公式是:在這里由于只對(duì)前50條鏈接做統(tǒng)計(jì),所以

      為了測(cè)試本文所構(gòu)建的《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)和檢索系統(tǒng),對(duì)《計(jì)算機(jī)網(wǎng)絡(luò)》領(lǐng)域的1 600個(gè)問(wèn)題答案進(jìn)行檢索,對(duì)隨機(jī)輸入的9個(gè)學(xué)習(xí)者提問(wèn)進(jìn)行以下兩種檢索方法的測(cè)試。

      學(xué)生測(cè)試采用如下兩種方法:

      (1)常規(guī)查詢(xún),沒(méi)有使用概念語(yǔ)義網(wǎng)絡(luò)進(jìn)行擴(kuò)展的方法;

      (2)概念擴(kuò)展查詢(xún),使用概念語(yǔ)義網(wǎng)絡(luò)進(jìn)行擴(kuò)展的查詢(xún)的方法。

      比較結(jié)果如表1所示。

      圖3 查詢(xún)處理流程圖

      表1 兩種查詢(xún)方法比較

      7 系統(tǒng)分析

      實(shí)驗(yàn)結(jié)果表明,基于《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò)的查詢(xún)擴(kuò)展檢索在智能水平上較現(xiàn)有的搜索引擎有很大的提高,其主要特色有以下方面:

      (1)實(shí)現(xiàn)了對(duì)學(xué)習(xí)者檢索請(qǐng)求的知識(shí)聯(lián)想,層次清楚地給出查詢(xún)知識(shí)點(diǎn)相關(guān)的領(lǐng)域內(nèi)概念,學(xué)習(xí)者可以根據(jù)系統(tǒng)提供的概念次層把握知識(shí)點(diǎn)的框架結(jié)構(gòu),更加全面、準(zhǔn)確地掌握計(jì)算機(jī)網(wǎng)絡(luò)領(lǐng)域內(nèi)查詢(xún)知識(shí)點(diǎn)的相關(guān)內(nèi)容。

      (2)擴(kuò)展概念詞不僅限于中文語(yǔ)種,可以在一定程度上實(shí)現(xiàn)計(jì)算機(jī)網(wǎng)絡(luò)領(lǐng)域跨語(yǔ)種檢索的功能。

      (3)概念語(yǔ)義網(wǎng)絡(luò)的概念詞、擴(kuò)展概念詞可以實(shí)現(xiàn)增量化管理,具有良好的可擴(kuò)展性。

      (4)本研究的概念語(yǔ)義網(wǎng)絡(luò)生成方法具有普適性,可以在此研究的基礎(chǔ)上生成其他學(xué)科教學(xué)資源的概念語(yǔ)義網(wǎng)絡(luò),并基于其進(jìn)行相關(guān)領(lǐng)域知識(shí)的查詢(xún)擴(kuò)展檢索。它將概念查詢(xún)擴(kuò)展引入教育資源的查詢(xún)中,為教學(xué)系統(tǒng)中自動(dòng)問(wèn)答系統(tǒng)的實(shí)現(xiàn)提供了技術(shù)前提。

      8 結(jié)束語(yǔ)

      依據(jù)《計(jì)算機(jī)網(wǎng)絡(luò)》第五版教材,建立了《計(jì)算機(jī)網(wǎng)絡(luò)》概念語(yǔ)義網(wǎng)絡(luò),描述了關(guān)聯(lián)概念樹(shù)的提取方法和概念查詢(xún)擴(kuò)展檢索計(jì)算機(jī)實(shí)現(xiàn)的流程,并分析了該系統(tǒng)的特色。今后,將結(jié)合機(jī)器學(xué)習(xí)技術(shù)不斷完善教學(xué)資源領(lǐng)域概念語(yǔ)義網(wǎng)絡(luò)的增量化管理,并在檢索結(jié)果的處理方面做更多的研究,在保證查全率的同時(shí)提高查準(zhǔn)率。本文所闡述的概念語(yǔ)義網(wǎng)絡(luò)生成算法和查詢(xún)擴(kuò)展檢索系統(tǒng)有著廣闊的應(yīng)用前景,可以為教學(xué)資源領(lǐng)域的在線(xiàn)學(xué)習(xí)提供強(qiáng)大的技術(shù)支持。

      [1]胡川洌.基于本體的教學(xué)資源語(yǔ)義檢索研究[D].重慶:重慶大學(xué),2011:1-2.

      [2]王磊,黃廣君.結(jié)合概念語(yǔ)義空間的語(yǔ)義擴(kuò)展技術(shù)研究[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(35):106-109.

      [3]鄭慶華,王朝靜,孫霞.一種基于結(jié)化語(yǔ)料庫(kù)的概念語(yǔ)義網(wǎng)絡(luò)自動(dòng)生成算法[J].計(jì)算機(jī)研究與發(fā)展,2005,42(3):478-485.

      [4]Cui Hang,Wen Jirong,Nie Jianyun,et al.Query expansion by Mining user logs[J].IEEE Transactions on Know ledge and Data Engineering,2003,15(4):829-839.

      [5]Zhang Chengqi,Qin Zhenxing,Yan Xiaow ei.Associationbased segmentation for Chinese-crossed query expansion[J].IEEE Intelligent Informatics Bulletin,2005,5(1):18-25.

      [6]Macdonald C,Ounis I.Using relevance feedback in expert search[C]//Proc of the 29th European Conference on IR Research.Berlin:Springer,2007:431-443.

      [7]陳志敏,姜藝,趙耀.基于用戶(hù)查詢(xún)擴(kuò)展的自動(dòng)摘要技術(shù)[J].計(jì)算機(jī)應(yīng)用研究,2011,28(6):2188-2190.

      [8]Zhuge H.The know ledge grid[M].New Jersey:World Scientific Publishing,2004.

      [9]Information mapping project[EB/OL].(2003)[2013-06-01].http://www-csli.stanford.edu/sem lab/infomap.htm l.

      [10]鄭毅,吳斌,史忠植.基于概念空間的文本檢索系統(tǒng)[J].計(jì)算機(jī)工程與應(yīng)用,2002,38(12):67-69.

      [11]李蕾,王楠,鐘義信.基于語(yǔ)義網(wǎng)絡(luò)的概念檢索研究與實(shí)現(xiàn)[J].情報(bào)學(xué)報(bào),2000,19(5):525-531.

      [12]李源,何清,史忠植.基于概念語(yǔ)義空間的聯(lián)想檢索[J].北京科技大學(xué)學(xué)報(bào),2001,23(6):577-580.

      [13]唐成.答疑系統(tǒng)中基于概念的搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué),2007:25-41.

      [14]黃名選,嚴(yán)小衛(wèi),張師超,等.關(guān)聯(lián)語(yǔ)義的概念查詢(xún)擴(kuò)展模型[J].情報(bào)雜志,2007(8):92-95.

      [15]李海芳,史俊冰,段利國(guó),等.一種基于含糊同義詞的查詢(xún)擴(kuò)展方法[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(12):41-43.

      [16]謝希仁.計(jì)算機(jī)網(wǎng)絡(luò)[M].北京:電子工業(yè)出版社,2008.

      猜你喜歡
      同義計(jì)算機(jī)網(wǎng)絡(luò)關(guān)聯(lián)
      Dale Carnegie
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      西夏文《同義》重復(fù)字研究
      西夏學(xué)(2019年1期)2019-02-10 06:22:08
      計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境下混合式教學(xué)模式實(shí)踐與探索
      電子制作(2018年16期)2018-09-26 03:27:08
      計(jì)算機(jī)網(wǎng)絡(luò)信息安全及防護(hù)策略
      電子制作(2018年12期)2018-08-01 00:47:58
      西夏文《同義》考釋三則
      西夏學(xué)(2018年2期)2018-05-15 11:25:30
      奇趣搭配
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的應(yīng)用探討
      計(jì)算機(jī)網(wǎng)絡(luò)維護(hù)工作的思考
      河南科技(2014年19期)2014-02-27 14:15:24
      阳泉市| 诸城市| 新化县| 定襄县| 西平县| 祁阳县| 德昌县| 新绛县| 金华市| 安福县| 曲松县| 界首市| 天气| 平阳县| 枣庄市| 晋州市| 奎屯市| 宣化县| 新竹市| 文成县| 东辽县| 昆山市| 雷山县| 岳普湖县| 札达县| 保德县| 富顺县| 防城港市| 友谊县| 精河县| 绍兴市| 承德市| 建平县| 浮梁县| 霞浦县| 洛浦县| 满洲里市| 哈密市| 武夷山市| 石景山区| 章丘市|