余翀翀,黃麗萍
(華僑大學(xué) 信息化建設(shè)與管理處,福建 廈門 361021)
目前,高校使用的教學(xué)和科研儀器、設(shè)備的種類、型號(hào)、廠家、供應(yīng)商以及維修服務(wù)等品目繁多,會(huì)給用戶在設(shè)備的選購(gòu)、維護(hù)、更新、管理等方面帶來(lái)很大的困擾[1-4]。雖然用戶能夠從網(wǎng)上獲取信息,但是網(wǎng)上的信息存在過(guò)載和資源迷向問(wèn)題,即網(wǎng)上雖存在極其豐富的信息,但用戶卻找不到真正所需要的東西。如何從海量的信息中高效、全面地獲取最有針對(duì)性的和最新、最全的信息,使用戶能真正得到快捷、準(zhǔn)確的信息服務(wù),已成為一個(gè)重要的研究課題。例如:文獻(xiàn)[5]提出基于RSS技術(shù)的個(gè)性化信息服務(wù)系統(tǒng)的架構(gòu),該架構(gòu)在建立用戶興趣模型和信息推送中融合了RSS技術(shù);文獻(xiàn)[6]提出了基于網(wǎng)格管理的個(gè)性化信息服務(wù)電子政務(wù)平臺(tái);文獻(xiàn)[7]則提出了基于UCL的數(shù)據(jù)廣播個(gè)性化信息服務(wù)模型。
本文提出一個(gè)基于多Agent的設(shè)備信息個(gè)性化服務(wù)系統(tǒng)。該系統(tǒng)是一個(gè)多Agent體系結(jié)構(gòu),它由用戶Agent、檢索和監(jiān)視Agent、分類Agent、過(guò)濾Agent和個(gè)性化服務(wù)Agent等5個(gè)Agent和其他相關(guān)組件組成。系統(tǒng)在內(nèi)部Agent之間,以及系統(tǒng)與其他信息服務(wù)提供者之間,比如信息搜索引擎、WWW網(wǎng)站等,均具有良好的協(xié)作性。
(1)系統(tǒng)在為用戶提供設(shè)備信息服務(wù)的過(guò)程中,能學(xué)習(xí)并記錄用戶的興趣和習(xí)慣;能自動(dòng)建立用戶本地的設(shè)備信息庫(kù);能及時(shí)告知用戶本地信息庫(kù)的內(nèi)容及其變化動(dòng)態(tài)。
(2)系統(tǒng)能定期為用戶查找新的相關(guān)設(shè)備信息并主動(dòng)通知用戶,而不需用戶重復(fù)查詢;系統(tǒng)在獲得一定程度的用戶資料后,能預(yù)測(cè)用戶的行為并自主地為用戶作出設(shè)備信息選擇和決定。
(3)可以建立并維護(hù)用來(lái)存儲(chǔ)設(shè)備知識(shí)和用戶相關(guān)資料的知識(shí)庫(kù),還可以通過(guò)學(xué)習(xí),使這些知識(shí)不斷向更適合用戶的方向調(diào)整。
個(gè)性化信息服務(wù)是指系統(tǒng)能根據(jù)個(gè)人的興趣、習(xí)慣和選擇,提供不一樣的、能符合每一位用戶要求的服務(wù)[8]。因此,系統(tǒng)必須具備以下的基本能力:
(1)個(gè)性化。能夠觀察用戶的操作、接受用戶的反饋信息和用戶的直接訓(xùn)練,在不斷地與用戶的交互和反饋中學(xué)習(xí)用戶知識(shí),包括用戶的興趣、偏好、習(xí)慣、思維方式等。
(2)自主性。系統(tǒng)能定期地收集網(wǎng)上不同數(shù)據(jù)源的信息,更新本地信息,在獲得一定程度的用戶資料后,能預(yù)測(cè)用戶的行為并自主地為用戶作出信息選擇和決定,幫助用戶處理搜索結(jié)果。
(3)信息收集、分類、過(guò)濾、學(xué)習(xí),且可以協(xié)調(diào)地工作。
(4)靈活性和可擴(kuò)展性。不同的用戶對(duì)系統(tǒng)的用途可能有不同的要求,要能較好地適應(yīng)必要的動(dòng)態(tài)擴(kuò)展和調(diào)整。
圖1給出了基于多Agent個(gè)性化服務(wù)的設(shè)備信息系統(tǒng)的結(jié)構(gòu),該系統(tǒng)可提供以下的功能:
(1)根據(jù)使用者的個(gè)人資料,如興趣、偏好、習(xí)慣、思維、選擇等,提供不同的設(shè)備信息和其他服務(wù);
(2)對(duì)使用者的資料有一個(gè)自動(dòng)化的學(xué)習(xí)機(jī)制,提供個(gè)性化的學(xué)習(xí)與修正;
(3)對(duì)新的設(shè)備信息,有一分類機(jī)制將其分類和過(guò)濾,再提供給使用者。
圖1 系統(tǒng)結(jié)構(gòu)圖
系統(tǒng)利用網(wǎng)絡(luò)PROXY及Java Applet技術(shù)提供一個(gè)共同的人機(jī)界面,通過(guò)一些模塊為每一個(gè)使用者提供最適合其要求的服務(wù)。
(1)個(gè)性化服務(wù)Agent。它通過(guò)一個(gè)監(jiān)控代理,為每個(gè)用戶提供最貼切且最有效的設(shè)備信息,并且可通過(guò)它行使過(guò)濾與監(jiān)督的任務(wù)。過(guò)濾與監(jiān)督的任務(wù)是:①阻攔非法的使用者;②對(duì)合法的已登錄的使用者,它觸發(fā)相關(guān)程序,提取使用者的個(gè)人資料,并把這些資料提供給內(nèi)部系統(tǒng)作為服務(wù)的依據(jù);③自動(dòng)監(jiān)督、記錄和學(xué)習(xí)用戶的興趣與習(xí)慣的改變。
(2)用戶屬性存取。其作用和功能包括:①獲取使用者資料供個(gè)性化服務(wù)Agent和其他的程序使用,如身份確認(rèn)等;②保存監(jiān)督記錄的用戶興趣與習(xí)慣以便為個(gè)性化學(xué)習(xí)提供依據(jù)。
(3)用戶特征文件和存取規(guī)則特征文件。用戶特征文件是系統(tǒng)保留個(gè)性化資料的重要所在,登錄過(guò)的每個(gè)使用者在系統(tǒng)中都擁有自己的個(gè)性化資料特征文件。用戶存取規(guī)則特征文件用于檢查和確認(rèn)使用者的權(quán)限。
(4)調(diào)整機(jī)制。它通過(guò)學(xué)習(xí)機(jī)制動(dòng)態(tài)統(tǒng)計(jì)分析用戶行為特征和行為的變遷,并根據(jù)分析結(jié)果自動(dòng)修正用戶特征文件,從而使個(gè)性化服務(wù)可以即時(shí)反映用戶興趣和行為的變更。
(5)分類和過(guò)濾。在使用過(guò)程中,隨著時(shí)間的推移,會(huì)產(chǎn)生大量的新的相關(guān)信息,且無(wú)法得知新產(chǎn)生的信息資料與用戶的關(guān)系。分類Agent和過(guò)濾Agent用于對(duì)這些資料作預(yù)處理,以利于個(gè)性化服務(wù)時(shí)采用。
(1)用戶 Agent。用戶 Agent IA(interface agent)的主要功能是接受用戶的查詢請(qǐng)求,幫助用戶細(xì)化查詢要求,并顯示查詢結(jié)果。在這個(gè)過(guò)程中學(xué)習(xí)并記錄用戶的興趣和習(xí)慣。它還負(fù)責(zé)顯示本地設(shè)備信息庫(kù)的內(nèi)容,并在界面中反映本地信息庫(kù)的動(dòng)態(tài)變化。用戶Agent主要由用戶界面、與其他Agent的接口、分析推理機(jī)、使用記錄數(shù)據(jù)庫(kù)4個(gè)部分組成。其中,用戶界面采用通常的GUI;接口部分定義了與其他A-gent之間的通信和交互規(guī)則與方法;使用記錄數(shù)據(jù)庫(kù)用來(lái)記錄用戶的使用歷史;分析推理機(jī)用于分析推理的算法、規(guī)則和相關(guān)的知識(shí)。
(2)個(gè)性化服務(wù)Agent。個(gè)性化服務(wù)Agent用來(lái)追蹤管理信息的處理流程及監(jiān)控,與個(gè)性化服務(wù)直接相關(guān),是各個(gè)Agent的控制核心。其主要的目的是和用戶Agent通信,隨時(shí)檢查使用者的登錄與個(gè)性化的資料,并用來(lái)協(xié)調(diào)各個(gè)Agent。
(3)搜索和監(jiān)視Agent。搜索和監(jiān)視Agent由信息任務(wù)模塊(information task module,ITM)、信息搜索模塊 (information search module,ISM)和信息分析模塊 (information task module,IAM)組成。ITM 從IA處接受用戶提出的查詢請(qǐng)求,生成搜集信息的多個(gè)子目標(biāo)并提交給信息搜索模塊。ISM訪問(wèn)網(wǎng)上異構(gòu)的信息資源,完成在Internet上搜集信息的任務(wù)。信息搜索的實(shí)現(xiàn)采用2種搜索方式:一是與一些知名的信息搜索引擎和信息服務(wù)提供者合作;另一種是利用Robot技術(shù)在網(wǎng)上主動(dòng)完成實(shí)際的信息采集工作。ISM將得到的結(jié)果提交給IAM,IAM對(duì)合作的信息服務(wù)提供者返回的結(jié)果信息進(jìn)行再分析,并運(yùn)用系統(tǒng)的知識(shí)對(duì)搜索結(jié)果進(jìn)行過(guò)濾,再通過(guò)IA返回給用戶。
本系統(tǒng)建立2種特征文件來(lái)支持個(gè)性化服務(wù),分別為用戶特征文件和用戶存取規(guī)則特征文件。用戶特征文件描述用戶的物理性質(zhì)(姓名,生日,性別等)、人文背景(教育程度,主修領(lǐng)域,嗜好等)、職業(yè)背景(職業(yè)性質(zhì),職業(yè)層級(jí)等);用戶存取規(guī)則特征文件的重要作用是要針對(duì)所有的用戶表達(dá)出個(gè)人的條件限制,其資料結(jié)構(gòu)包括年齡、性別、職位、特殊關(guān)系等。
要較好地支持個(gè)性化服務(wù),特征文件必須具備很好的可理解性和彈性,以便對(duì)使用者所關(guān)注的信息和偏好等個(gè)性化需求進(jìn)行理解和自動(dòng)修正。因此,在系統(tǒng)中可采用BNF(backus-naur form)語(yǔ)言對(duì)特征文件進(jìn)行描述。之所以采用BNF,是因?yàn)锽NF具有嚴(yán)格和彈性地描述資料信息的能力,并可以借助成熟的編譯方法和自然語(yǔ)言處理技術(shù)對(duì)特征文件進(jìn)行理解、學(xué)習(xí)和自動(dòng)修正。
當(dāng)使用者的喜好有所改變時(shí),系統(tǒng)必須對(duì)特征文件進(jìn)行調(diào)整與修正,以自動(dòng)適應(yīng)用戶的需求。系統(tǒng)借助于分類Agent和事先建立的本體,采用如圖2所示的學(xué)習(xí)算法來(lái)完成本項(xiàng)工作。
圖2 個(gè)性化服務(wù)的調(diào)整機(jī)制
最重要的是要能找出用戶的個(gè)人需求與整體資料間的關(guān)系。系統(tǒng)首先依靠用戶的個(gè)性化資料和事先建立的本體,取得使用者的個(gè)性化信息,再參考這些信息在本體中的關(guān)系,通過(guò)學(xué)習(xí)機(jī)制學(xué)習(xí)和修改其特征文件。對(duì)特征文件進(jìn)行自動(dòng)調(diào)整和修正的步驟如下:
(1)假設(shè)用戶推薦資料Dj(即其所關(guān)注或喜愛的信息),Dj有m個(gè)terms屬于類別Ci,類別Ci的pattern中詞的個(gè)數(shù)有t個(gè);
(2)計(jì)算用戶特征文件中個(gè)性化服務(wù)要求的術(shù)語(yǔ)和概念的權(quán)重:
式中,Wjk是文件Dj中詞(Term)k的權(quán)重;Wik是類別Ci中詞(Term)k的權(quán)重;α是學(xué)習(xí)率;W是類別Ci中詞(Term)k的權(quán)重。
(3)通過(guò)以下公式計(jì)算用戶對(duì)每篇資料的喜好程度并進(jìn)行排序:
上式中,β={1,-1};如果Wik>W(wǎng)jk,β=1;否則β=-1。使用者特征文件中提供的個(gè)性化服務(wù)的術(shù)語(yǔ)和概念的權(quán)重,繼承自分類系統(tǒng)中相應(yīng)術(shù)語(yǔ)和概念的權(quán)重。系統(tǒng)首先將這些權(quán)重當(dāng)成是使用者的預(yù)設(shè)值。
基于多Agent個(gè)性化服務(wù)的設(shè)備信息系統(tǒng),把多Agent個(gè)性化服務(wù)和本體與分類的思想相結(jié)合,并應(yīng)用到設(shè)備信息服務(wù)中。與其他類似的系統(tǒng)相比,在實(shí)現(xiàn)方面具有以下特點(diǎn):
(1)在抽取信息特征時(shí)應(yīng)用了Tagger和 Word-Net,可以直接獲取具有代表性的特征詞項(xiàng),增強(qiáng)了分類效果;
(2)系統(tǒng)由個(gè)性化服務(wù)Agent作為控制Agent,負(fù)責(zé)協(xié)調(diào)其他Agent的工作,節(jié)省系統(tǒng)資源,并可使單個(gè)Agent的設(shè)計(jì)簡(jiǎn)化。
該系統(tǒng)用于高校實(shí)驗(yàn)室設(shè)備的咨詢、采購(gòu)、管理與維護(hù)等服務(wù),在應(yīng)用前期,通過(guò)一定的訓(xùn)練和調(diào)整,在實(shí)驗(yàn)室計(jì)劃和實(shí)際配置的各種設(shè)備資料、產(chǎn)品、技術(shù)支持、人事、供需方信息等6項(xiàng)10個(gè)類別的信息服務(wù)中,用戶獲得的幫助以及使用的方便性的總滿意度提高了約37%。在儀器設(shè)備的選型與配置、實(shí)驗(yàn)室建設(shè)規(guī)劃與論證、設(shè)備維修等方面都取得了良好的效果,較好地解決了實(shí)驗(yàn)室建設(shè)和使用中存在的實(shí)驗(yàn)室重復(fù)設(shè)置、資源配置不合理、儀器設(shè)備使用率低、資源浪費(fèi)等問(wèn)題[9-10],大大提高了實(shí)驗(yàn)設(shè)備的投資效益。
系統(tǒng)開發(fā)的后續(xù)工作是研究設(shè)備信息本身的特點(diǎn)以及如何把簡(jiǎn)單的、基于關(guān)鍵詞的分類提高到基于知識(shí)的分類,以獲得更為準(zhǔn)確的設(shè)備信息分類結(jié)果。結(jié)合這樣的分類系統(tǒng)和本體論,可以使整個(gè)系統(tǒng)具有更好的理解能力[11-12],從而能提供更好、更準(zhǔn)確的設(shè)備信息服務(wù)。
(References)
[1]王春梅,陳建云,趙躍華.基于Web的多媒體設(shè)備信息管理系統(tǒng)設(shè)計(jì)與實(shí)踐[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(13):3507-3509.
[2]姜麗偉.教學(xué)實(shí)驗(yàn)設(shè)備使用與管理的優(yōu)化[J].實(shí)驗(yàn)技術(shù)與管理,2011,28(10):206-208.
[3]周輝.物流實(shí)驗(yàn)設(shè)備的選購(gòu)和管理[J].物流工程與管理,2011,33(4):188-190.
[4]賴妙芳.高校IT資產(chǎn)設(shè)備的信息化管理初探[J].中國(guó)現(xiàn)代教育裝備,2009(7):15-17.
[5]胡晶晶,鄭志蘊(yùn).基于RSS的個(gè)性化信息服務(wù)研究[J].計(jì)算機(jī)應(yīng)用與軟件,2009,26(5):40-42.
[6]Cai Yunjuan,Tang Zhiwei,Gao Tianpeng.E-government Platform of Personalized Information Service Based on Gridding Management[C]//Proceedings of the 2009International Conference on Networking and Digital,IEEE Computer Society.2009:123-126.
[7]Liu Guihua,Ma Jianguo.Personalized Information Service Model of Data Broadcasting Based on UCL[C]//Proceedings of the 2008 Second International Symposium on Intelligent Information Technology,IEEE Computer Society.2008:323-327.
[8]王巧容,趙海燕,曹健.個(gè)性化服務(wù)中的用戶建模技術(shù)[J].小型微型計(jì)算機(jī)系統(tǒng),2011,32(1):39-46.
[9]胡小龍.高校實(shí)驗(yàn)設(shè)備投資與需求分析[J].實(shí)驗(yàn)室研究與探索,2001,20(5):117-118.
[10]董秀萍.淺談現(xiàn)代工科高校實(shí)驗(yàn)設(shè)備及人員管理[J].中國(guó)現(xiàn)代教育裝備,2010(5):8-10.
[11]王伊蕾,李濤,賀毅.基于 Multi-Agent個(gè)性化信息服務(wù)的電子政務(wù)系統(tǒng)的研究[J].計(jì)算機(jī)應(yīng)用研究,2006,23(12):28-29,32.
[12]Pan Jianguo,Zhang Bofeng,Wang Shufeng,et al.Ontology Based User Profiling in Personalized Information Service Agent[C]//Proceedings of the 7th IEEE International Conference on Computer and Information Technology,IEEE Computer Society.2007:1089-1093.