• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      智能答疑系統(tǒng)的設計與研究

      2014-07-25 07:45:10徐曉
      關鍵詞:字符串哈希分詞

      徐曉

      (江蘇聯(lián)合職業(yè)技術學院無錫機電分院,江蘇 無錫 214028)

      隨著Internet上遠程教學普及,遠程教學中的答疑成為人們關注的焦點之一。學習者從聽眾變成索求者,當遇到無法理解需要幫助時,及時的答疑和幫助成了必不可少的內(nèi)容。在遠程教學中建立智能答疑系統(tǒng),可以使得學生在任何時間、任何地點都可以得到解答。教師也不必一直在線回答學生問題或重復回答相似問題。答疑系統(tǒng)自動回答學生的問題,一方面提高學生學習熱情,提高解答效率,另一方面可以節(jié)約教師的時間,間接提高工作效率。

      本文通過.net建立一個簡單高效的智能答疑系統(tǒng),教師將疑難問題按一定組織方式,存放到知識和信息庫中。學生提交問題時,通過中英文分詞技術來分析并自動地匹配學生所提出的問題,自動地給予問題解答。當在知識庫中沒有搜索到信息可以采用電子郵件或是通過在線方式征求解答,有人解答后,系統(tǒng)自動將解答發(fā)給學生。

      1 開發(fā)環(huán)境

      系統(tǒng)采用C#編碼,利用VS2005+SQL2005數(shù)據(jù)庫平臺開發(fā)智能答疑系統(tǒng),使用ADO.Net實現(xiàn)對數(shù)據(jù)庫的訪問。

      2 模塊的設計

      智能答疑系統(tǒng)是一個智能適應性的知識庫系統(tǒng),在教學設計階段,教師將最常見的疑難問題按一定的組織方式,存放到知識庫中,當學生在遇到疑難問題時,對學生以自然語言形式提出的問題進行預處理,主要是采用分詞技術對問題語句進行切分處理,提取出匹配所需要的關鍵詞,根據(jù)預先建立的基于關鍵詞的索引結構,將答案快速定位,找出問題匹配度最高的答案。若在知識庫中沒有搜索到信息可以采用電子郵件或是通過在線方式征求解答,有人解答后,系統(tǒng)自動將解答發(fā)給學生??傊?,智能答疑系統(tǒng)是一種支持同步和異步答疑以及討論的系統(tǒng)。如圖1所示,該系統(tǒng)包括以下幾個模塊:

      (1)提問模塊

      學生可以使用提問模塊來尋求問題的答案,這是使用系統(tǒng)的基本手段之一。

      對于問題文本首先采用正規(guī)表達式取出中文和英文,然后采用分詞技術,主要是按照一定的策略將要分析的字串與詞典中的詞條進行匹配來分解一系列的子串。然后在系統(tǒng)的知識庫中以及討論形成的材料中搜索與問題相關的材料,并按照相關程度返回結果。

      圖1 自動答疑系統(tǒng)的模型

      (2)討論模塊

      討論模塊是學生使用智能答疑系統(tǒng)的另外一種基本手段。用戶可以參加BBS和聊天室等來進行討論。

      當學生在沒有得到系統(tǒng)滿意的問題解答時,系統(tǒng)提供了給教師發(fā)郵件模塊來請求教師解答,并且提供了給教師手機發(fā)短信模塊,以便提醒教師郵箱里有提示;還提供討論模塊,請求系統(tǒng)別的學生幫助解答;還提供了RSS閱讀器,可以在其中查看預訂的相關網(wǎng)上討論社區(qū)中的資源。

      (3)RSS 模塊

      RSS模塊可以簡單地理解為一種方便的信息獲取工具。RSS獲取信息的模式與加入郵件列表模式相似,無需登錄到各個提供信息的站點即可自動獲取。該模塊主要建立一個RSS閱讀器來訂閱知識點,一旦網(wǎng)站上的這些知識點被更新,就會自動發(fā)送到鏈接源閱讀器中。這樣就可以不斷更新和擴充知識庫中的內(nèi)容,如圖2所示。

      圖2 RSS模型

      3 關鍵技術

      3.1 正規(guī)表達式

      正規(guī)表達式允許快速有效地處理文本。被處理的文本小到一個電子郵件地址,大到一個多行的輸入框內(nèi)容。正規(guī)表達式的使用不僅允許使用一個定義模式來校驗文本,而且還允許從匹配一個給定模式的文本中提取數(shù)據(jù)。

      本系統(tǒng)使用正規(guī)表達式來取出學生問題中的中文和英文,然后執(zhí)行相應的中英文分詞技術,如圖3所示。

      圖3 正規(guī)表達式處理流程

      3.2 中文分詞技術

      中文分詞(Chinese Word Segmentation)指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程?,F(xiàn)有的分詞算法可分為三大類:基于字符串匹配的分詞方法、基于理解的分詞方法和基于統(tǒng)計的分詞方法?;谧址ヅ涞姆衷~方法又叫做機械分詞方法,它是按照一定的策略將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行配,若在詞典中找到某個字符串,則匹配成功(識別出一個詞)。按照掃描方向的不同,串匹配分詞方法可以分為正向匹配和逆向匹配;按照不同長度優(yōu)先匹配的情況,可以分為最大(最長)匹配和最?。ㄗ疃蹋┢ヅ?;《計算機基礎》課程的智能答疑系統(tǒng)采用的是機械分詞方法中的正向最大匹配算法。

      3.2.1 分詞算法

      采用基于字符串匹配的分詞方法,它是按照正向最大匹配法(由左到右的方向);將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行匹配,若在詞典中找到某個字符串,則匹配成功(識別出一個詞)。

      例如,對一個字符串S,從前到后掃描,對掃描的每個字,從詞庫中尋找最長匹配。比如假設S=“我是中華人民共和國公民”,詞庫中有 “中華人民共和國”,“中華”,“公民”,“人民”,“共和國”……等詞。當掃描到“中”字,那么從中字開始,向后分別取 1,2,3,……個字(“中”,“中華”,“中華人”,“中華人民”,“中華人民共”,“中華人民共和”,“中華人民共和國”,“中華人民共和國公”),詞庫中的最長匹配字符串是 “中華人民共和國”,那么就此切分開,掃描器推進到“公”字。

      3.2.2 數(shù)據(jù)結構

      哈希表是一種高效的數(shù)據(jù)結構。哈希表最大的優(yōu)點,就是把數(shù)據(jù)的存儲和查找消耗的時間大大降低,幾乎可以看成是常數(shù)時間;而代價僅僅是消耗比較多的內(nèi)存。然而在當前可利用內(nèi)存越來越多的情況下,用空間換時間的做法是值得的。另外,編碼比較容易也是它的特點之一。

      本系統(tǒng)采用哈希表(Hashtable)記錄詞庫。首先將詞典中的詞進行處理,對每一個詞語,如果該詞語有N個字,則將該詞語的 1,1~2,1~3,…,1~N 個字作為鍵,插入相應詞長度的哈希表中,而同一個鍵如果重復插入,則后面的值遞增,如圖4所示。

      圖4 哈希表

      該智能答疑系統(tǒng)能在一定程度上減少答案域的搜索范圍,并能獲得準確的答案。實踐證明該智能答疑系統(tǒng)是有一定的智能性、主動性和方便性等特點,提高了教學效率和教學手段。

      [1]趙成龍.一個基于Web的智能答疑系統(tǒng)的設計與實現(xiàn)[D].南京:東南大學,2004.

      [2]陳銀鳳.RSS技術的應用和發(fā)展趨勢探討[J].內(nèi)蒙古財經(jīng)學院學報,2008,6(1):98-102.

      [3]余戰(zhàn)秋.中文分詞技術及其應用初探[J].電腦知識與技術,2004,(32):81-83.

      [4] 陳挺.中文字段匹配算法[J].計算機工程,2003,29(13):118-120.

      [5]柳泉波,黃榮懷,何克抗.智能答疑系統(tǒng)的設計與實現(xiàn)[J].中國遠程教育,2000,121(8):43-45.

      猜你喜歡
      字符串哈希分詞
      結巴分詞在詞云中的應用
      智富時代(2019年6期)2019-07-24 10:33:16
      值得重視的分詞的特殊用法
      基于OpenCV與均值哈希算法的人臉相似識別系統(tǒng)
      基于維度分解的哈希多維快速流分類算法
      計算機工程(2015年8期)2015-07-03 12:20:04
      一種新的基于對稱性的字符串相似性處理算法
      基于同態(tài)哈希函數(shù)的云數(shù)據(jù)完整性驗證算法
      計算機工程(2014年6期)2014-02-28 01:25:40
      一種基于Bigram二級哈希的中文索引結構
      高考分詞作狀語考點歸納與疑難解析
      依據(jù)字符串匹配的中文分詞模型研究
      一種針對Java中字符串的內(nèi)存管理方案
      祁阳县| 吉首市| 营口市| 阿克苏市| 黄山市| 崇明县| 泸州市| 保德县| 通渭县| 兖州市| 新巴尔虎左旗| 晋江市| 南康市| 衡山县| 阳高县| 德州市| 拜城县| 牡丹江市| 资溪县| 四子王旗| 郸城县| 平塘县| 荔波县| 札达县| 榆林市| 蓝山县| 蕉岭县| 北流市| 古丈县| 通化市| 湖北省| 边坝县| 馆陶县| 临安市| 新昌县| 长丰县| 商都县| 句容市| 尚义县| 沙河市| 康保县|