董守斌
華南理工大學信息網(wǎng)絡(luò)工程研究中心副主任
分布式搜索時代
董守斌
華南理工大學信息網(wǎng)絡(luò)工程研究中心副主任
華南理工大學信息網(wǎng)絡(luò)工程研究中心副主任董守斌很早就主持華南理工大學木棉搜索引擎的開發(fā)工作。該引擎基于開源項目進行,以建立一個具有可擴展性和開放性的搜索引擎。他們立足于教育網(wǎng),力圖解決新一代搜索引擎應(yīng)用中所帶來的新問題和技術(shù)挑戰(zhàn),并與北京大學、清華大學合作形成中文分詞的標準數(shù)據(jù)集等工作。
“信息檢索是現(xiàn)代互聯(lián)網(wǎng)應(yīng)用體系結(jié)構(gòu)的重要支柱。 WWW上的搜索引擎技術(shù)隨著IPv4網(wǎng)絡(luò)信息資源的爆炸增長取得了巨大的成就,特別是中文搜索引擎的技術(shù),為互聯(lián)網(wǎng)的應(yīng)用普及作出巨大的貢獻?!倍乇笳f。目前在下一代互聯(lián)網(wǎng)CNGI項目的支持下,華南理工大學等研究單位聯(lián)合華中科技大學等共同研究和開發(fā)面向新一代網(wǎng)絡(luò)的大規(guī)模分布式搜索引擎:從搜索引擎體系結(jié)構(gòu)面臨的可擴展性問題出發(fā),結(jié)合IPv6網(wǎng)絡(luò)信息分布的構(gòu)造特點和潛在的發(fā)展趨勢,在下一代互聯(lián)網(wǎng)上建設(shè)具有一定規(guī)模的分布式搜索引擎系統(tǒng),通過資源詞典、索引數(shù)據(jù)以及檢索結(jié)果等多層面的資源共享和融合,實現(xiàn)搜索單元的有機協(xié)作和互為增強,支持對IPv4/IPv6網(wǎng)絡(luò)中的大規(guī)模的多媒體信息檢索服務(wù),并以統(tǒng)一門戶界面滿足多種終端的訪問需要。
董守斌表示,目前工作的重點在于推廣分布式搜索引擎的應(yīng)用以及單元搜索引擎的部署,致力于將教育網(wǎng)不同層次、不同專題及各具特色的搜索引擎系統(tǒng)組織起來,形成大規(guī)模、分布式的搜索引擎服務(wù)聯(lián)合體,提高教育網(wǎng)搜索引擎的服務(wù)特色和競爭力。不同耦合度的搜索引擎組織模型的對比試驗和示范研究,可以為我國發(fā)展下一代搜索引擎技術(shù)奠定扎實的基礎(chǔ),并進一步推動我國網(wǎng)上信息資源的良性發(fā)展。