屈健民
(承德石油高等專科學(xué)校信息中心,河北承德 067000)
隨著2004、2005年博客(Blog)熱在國(guó)內(nèi)的升溫,RSS也吸引了不少國(guó)人的眼球,可以說(shuō),Blog的流行從一個(gè)側(cè)面成就了RSS的流行。RSS在內(nèi)容發(fā)布和信息集成方面的優(yōu)越性,使其迅速突破最初的新聞和博客領(lǐng)域,開(kāi)始在信息服務(wù)相關(guān)行業(yè)拓展,目前許多網(wǎng)站已加入RSS技術(shù)。因而嘗試將RSS技術(shù)引入圖書(shū)館網(wǎng)絡(luò)信息采集和網(wǎng)絡(luò)信息服務(wù)工作中,有著積極的現(xiàn)實(shí)意義。
RSS(Really Simple Syndication、Rich Site Summary或者RDF Site Summary)是一種描述和同步網(wǎng)站內(nèi)容的格式,是目前使用最廣泛的XML應(yīng)用。所有的RSS文件(RSS feeds)都必須符合由W3C發(fā)布的XML1.0規(guī)范。網(wǎng)站發(fā)布一個(gè)RSS文件后,這個(gè)RSS Feed中包含的信息就能直接被其他站點(diǎn)調(diào)用,而且由于這些數(shù)據(jù)都是標(biāo)準(zhǔn)的XML格式,所以也能在其他的終端和服務(wù)中使用。也就是說(shuō),RSS就是一種用來(lái)分發(fā)和匯集網(wǎng)頁(yè)內(nèi)容的XML格式,是站點(diǎn)用來(lái)和其他站點(diǎn)之間共享內(nèi)容的一種簡(jiǎn)易方式(也叫聚合內(nèi)容)。從用戶角度說(shuō),RSS又是一種漸漸風(fēng)行的瀏覽訪問(wèn)網(wǎng)站的方式,用戶不必登錄實(shí)際的網(wǎng)絡(luò)站點(diǎn)就可以看到要瀏覽網(wǎng)站內(nèi)容的及時(shí)更新。這種瀏覽方式需要“RSS閱讀器”軟件來(lái)閱讀用戶訂購(gòu)的內(nèi)容。
在描述方式上,RSS將網(wǎng)站看作一系列頻道(Channels)的組合,各個(gè)頻道又包含了一系列資源(I-tems),因此通過(guò)對(duì)頻道及所含資源的描述可實(shí)現(xiàn)對(duì)作為資源集合的網(wǎng)站的描述[2]。這個(gè)利用RSS元素描述的網(wǎng)站內(nèi)容匯總文件稱為一個(gè)RSS Feed,它由內(nèi)容提供者的網(wǎng)站發(fā)布,再由內(nèi)容整合者的網(wǎng)站(也稱“門(mén)戶”)或獨(dú)立的桌面工具(聚合工具)使用??梢?jiàn),RSS最基本的功能就是信息聚合和信息推送,具有如下特點(diǎn):
1)簡(jiǎn)單、標(biāo)準(zhǔn)、通用、容易自動(dòng)生成。服務(wù)器端內(nèi)容的RSS包裝在技術(shù)實(shí)現(xiàn)上極為簡(jiǎn)單,RSS Feed可人工生成,也可自動(dòng)生成,而且是一次性的工作,使長(zhǎng)期的信息發(fā)布邊際成本幾乎降為零,是傳統(tǒng)的電子郵件、衛(wèi)星傳輸、互聯(lián)網(wǎng)瀏覽等發(fā)布方式所無(wú)法比擬的[3]。
2)預(yù)防垃圾信息,便于本地管理。RSS用戶端閱讀器軟件的特點(diǎn)是完全由用戶根據(jù)自身喜好以“頻道”的形式訂閱值得信任的內(nèi)容來(lái)源,如“人民日?qǐng)?bào)中文新聞”、“中國(guó)汽車(chē)網(wǎng)學(xué)車(chē)用車(chē)”等等。RSS閱讀器軟件完全屏蔽掉用戶沒(méi)有訂閱的內(nèi)容以及彈出廣告、圖片、垃圾郵件等令人困擾的噪音內(nèi)容。此外,對(duì)下載到閱讀器軟件本地的RSS信息,用戶可以進(jìn)行離線閱讀、存檔保留、搜索排序、相關(guān)分類等多種管理操作,使閱讀器軟件不僅是一個(gè)“閱讀”器,更是一個(gè)用戶桌面的“信息資源庫(kù)”。
3)信息“聚合”,真正實(shí)現(xiàn)個(gè)性化閱讀。因?yàn)镽SS是一種被廣泛采用的內(nèi)容包裝定義格式,所以任何內(nèi)容源都可以采用這種方式來(lái)發(fā)布信息,包括專業(yè)新聞?wù)军c(diǎn)、電子商務(wù)站點(diǎn)、企業(yè)站點(diǎn)、甚至個(gè)人站點(diǎn)等。而在用戶端,RSS閱讀器軟件的作用就是使用戶可以根據(jù)需要有選擇性地加入多個(gè)定制的RSS提要將用戶感興趣的內(nèi)容來(lái)源“聚合”到該軟件的界面中,為用戶提供多來(lái)源信息的“一站式”服務(wù)[4]。
4)信息的高時(shí)效性和價(jià)值。RSS閱讀器自動(dòng)更新你定制的網(wǎng)站內(nèi)容,保持信息的及時(shí)性。RSS技術(shù)秉承“推”信息的概念,當(dāng)新內(nèi)容在服務(wù)器數(shù)據(jù)庫(kù)中出現(xiàn)時(shí),第一時(shí)間被“推”到用戶端閱讀器中,極大地提高了信息的時(shí)效性和價(jià)值[5]。
RSS搭建了信息迅速傳播的一個(gè)技術(shù)平臺(tái),使得每個(gè)人都成為潛在的信息提供者。由于RSS的開(kāi)放、靈活等眾多優(yōu)點(diǎn),使其最初在新聞聚合(NewsAggregation)、網(wǎng)站聯(lián)合、博客等領(lǐng)域中得到了廣泛的應(yīng)用。隨著越來(lái)越多的站點(diǎn)對(duì)RSS的支持,RSS已經(jīng)成為目前最成功的XML應(yīng)用。在國(guó)外RSS應(yīng)用已經(jīng)非常普遍,從個(gè)人博客(Blog)欄目、企業(yè)站點(diǎn)到世界級(jí)的門(mén)戶都提供基于RSS的服務(wù),如IBM公司站點(diǎn)的中文新聞 RSS http://www.ibm.com/news/cn/zh/index.rss,YAHOO 站點(diǎn)的 http://news.yahoo.com/rss,微軟 MSDN 站點(diǎn)的 http://msdn.microsoft.com/aboutmsdn/rss.asp 等等。
RSS的發(fā)展還可以在電子商務(wù)中發(fā)揮作用。如eBay、Amazon、SecondhandMarket等,用戶可對(duì)自己感興趣的商品進(jìn)行定制,并且隨時(shí)掌握最新標(biāo)價(jià)等更新信息,一旦完成交易這個(gè)信息也就隨之失效。早在2003年3月,在線超市亞馬遜(Amazon.com)就開(kāi)始在其站點(diǎn)上推出數(shù)百個(gè)個(gè)性化的RSS提要,以供電子商務(wù)顧客使用。
除了較為常見(jiàn)的新聞網(wǎng)站、企業(yè)網(wǎng)站之外,許多科技網(wǎng)站也提供RSS Feed來(lái)發(fā)布最新消息,如美國(guó)物理研究所(The American Institute of Physics)、加拿大UBC生物信息學(xué)中心(UBC Bioinformatics Centre)[6]等。
目前,RSS技術(shù)在圖書(shū)館的應(yīng)用也越來(lái)越廣泛。國(guó)外很多圖書(shū)館網(wǎng)站已經(jīng)提供RSS Feed功能,如休斯敦大學(xué)圖書(shū)館UH Library Updates、芝加哥圖書(shū)館Chi Lib Rocks!、喬治亞州大學(xué)圖書(shū)館Library News等。國(guó)內(nèi)某些圖書(shū)館網(wǎng)站也開(kāi)始嘗試提供RSS Feed功能,如中國(guó)科學(xué)院國(guó)家科學(xué)數(shù)字圖書(shū)館、廈門(mén)大學(xué)圖書(shū)館[7]等。
隨著現(xiàn)代化技術(shù)的運(yùn)用以及信息的多元化發(fā)展,使圖書(shū)館文獻(xiàn)采訪工作發(fā)生了巨大變化,采訪渠道越來(lái)越寬,信息類型越來(lái)越多,使采訪的難度增加了。除傳統(tǒng)的紙本文獻(xiàn)、網(wǎng)上電子圖書(shū)、電子期刊外,圖書(shū)館還要整合網(wǎng)絡(luò)資源,搜集網(wǎng)上有價(jià)值的信息,建立學(xué)科導(dǎo)航庫(kù)(或叫學(xué)科信息門(mén)戶)。RSS的信息聚合功能為我們這方面的工作帶來(lái)了巨大的便利。
3.1.1 基于RSS網(wǎng)絡(luò)信息采集的技術(shù)實(shí)現(xiàn)
在信息采集的過(guò)程中,需要支持RSS的聚合工具軟件來(lái)訂閱那些提供了RSS Feed的站點(diǎn)。RSS聚合工具可選用開(kāi)放的RSS閱讀器(也稱聚合器),目前應(yīng)用較多的如SharpReader、NewzCrawler、FeedDemon等,這些軟件對(duì)非商業(yè)應(yīng)用或個(gè)人一般是免費(fèi)的;也可以采用支持RSS的任何語(yǔ)言(如Java、PHP、Perl、ASP和C#)來(lái)編寫(xiě)簡(jiǎn)單的腳本,根據(jù)需要開(kāi)發(fā)自己的RSS信息聚合器,這方面可參考的例子很多,實(shí)現(xiàn)起來(lái)較簡(jiǎn)單,如 O'ReillyXML.com(http://www.xml.com/pub/a/2002/05/22/parsing.html?page=2)提供了一個(gè)用 Java 寫(xiě)的示例;在 Developer.com(http://www.developer.com/xml/article.php/3113931)提供了一個(gè)使用PHP、MySQL數(shù)據(jù)庫(kù)服務(wù)器和MagpieRSSparser來(lái)實(shí)現(xiàn)的示例[8]。有了信息聚合工具后,添加和設(shè)定一些RSS feed鏈接,來(lái)獲取各網(wǎng)站RSS feed并提取數(shù)據(jù),將其進(jìn)行內(nèi)容過(guò)濾、分類并存入數(shù)據(jù)庫(kù)中,然后再將數(shù)據(jù)庫(kù)中的信息根據(jù)需要組織成各種數(shù)據(jù)源提供各種形式的信息服務(wù)。
3.1.2 對(duì)某些專業(yè)性強(qiáng)的領(lǐng)域進(jìn)行知識(shí)過(guò)濾和積累
有些提供RSS服務(wù)的網(wǎng)站(包括博客、信息門(mén)戶等)的學(xué)術(shù)性比較強(qiáng),內(nèi)容一般聚焦在某個(gè)主題領(lǐng)域,它所收集的信息一般是經(jīng)過(guò)專家的過(guò)濾篩選而來(lái),因而對(duì)圖書(shū)館有很大的采集價(jià)值,使“隱性知識(shí)”真正通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)“顯性”化。如國(guó)家科學(xué)數(shù)字圖書(shū)館,它擁有比較權(quán)威的關(guān)于圖書(shū)情報(bào)學(xué)科的各類新聞、研究進(jìn)展等信息,并且在它的網(wǎng)站上提供了 RSS Feed(http:∥www.csdl.ac.cn/weblog/index.rdf),我們可以在自己圖書(shū)館的網(wǎng)站上使用這些RSS服務(wù)。如果以這種方式對(duì)高校的重點(diǎn)學(xué)科進(jìn)行信息積累,一定會(huì)深化圖書(shū)館的特色服務(wù)[9]。
3.1.3 網(wǎng)絡(luò)信息資源聚合
搜集本圖書(shū)館關(guān)注的信息,如用RSS信息聚合器定制各學(xué)科信息門(mén)戶網(wǎng)站、圖書(shū)館系統(tǒng)、文獻(xiàn)情報(bào)系統(tǒng)網(wǎng)站及其相關(guān)網(wǎng)站以獲得最新信息。
3.2.1 服務(wù)器端技術(shù)實(shí)現(xiàn)
網(wǎng)絡(luò)信息服務(wù)指基于Internet上及本網(wǎng)站的數(shù)字資源,借助計(jì)算機(jī)網(wǎng)絡(luò),針對(duì)廣大圖書(shū)館網(wǎng)上用戶的一種服務(wù)方式。圖書(shū)館需要將各種網(wǎng)絡(luò)信息資源以頻道方式在服務(wù)器端提供動(dòng)態(tài)的RSS feed供用戶訂閱。首先要制作和保存RSS feed:RSSfeed可人工生成,方法是創(chuàng)建RSS文件并保存在網(wǎng)站中的某個(gè)位置。一個(gè)RSS文件就是一段規(guī)范的XML數(shù)據(jù),該文件一般以rss、xml或者rdf作為后綴。它通常由4個(gè)主要元素構(gòu)成:<channel>,<image>,<item>和<textinput>。其中,<channel>元素是必需的,<item>元素至少要出現(xiàn)一次。<textinput>和<image>元素是可選的,是否使用要視具體情況而定。也有許多工具和網(wǎng)上服務(wù)可以根據(jù)網(wǎng)站現(xiàn)有的內(nèi)容來(lái)自動(dòng)生成RSSfeed,如由SixApart’s制作的一個(gè)功能強(qiáng)大的個(gè)性化的發(fā)布系統(tǒng)MovableType(對(duì)個(gè)人和非商業(yè)網(wǎng)站基本上是免費(fèi)的)。其次要驗(yàn)證并發(fā)布生成的RSS文件,網(wǎng)上有許多RSS驗(yàn)證工具,如OnlineRSS0.9xValidator和OnlineRSS1.0Validator可以實(shí)現(xiàn)RSS的驗(yàn)證;另外還要在網(wǎng)站上宣傳并推廣本網(wǎng)站的RSS feed,以通用的RSS圖標(biāo)提醒用戶注意和訂閱RSS feed。
3.2.2 客戶端信息的接收
對(duì)于客戶端來(lái)說(shuō),使用RSS獲取信息前,需先下載并安裝一個(gè)RSS閱讀器,然后將感興趣的提供RSS服務(wù)的網(wǎng)站加入到RSS閱讀器的頻道即可。圖書(shū)館網(wǎng)站可提供RSS閱讀器下載,并預(yù)設(shè)圖書(shū)館的部分RSS頻道。
3.2.3 基于RSS的網(wǎng)絡(luò)信息服務(wù)內(nèi)容及方式
基于RSS技術(shù)可以實(shí)現(xiàn)的網(wǎng)絡(luò)信息服務(wù)主要有:
1)新聞、消息、最新資源發(fā)布:通過(guò)RSS feeds發(fā)布圖書(shū)館的各種通知如會(huì)議、培訓(xùn)、規(guī)則及開(kāi)館時(shí)間的變更等,以及新書(shū)(期刊)通報(bào)、試用數(shù)據(jù)庫(kù)等,用戶通過(guò)RSS訂閱可以隨時(shí)獲取最新的信息。
2)信息推送:RSS誕生之初即被稱為“推”技術(shù),圖書(shū)館可以利用其實(shí)現(xiàn)信息的推送服務(wù),結(jié)合信息的更新數(shù)量、更新頻率和用戶需求,確定推送信息的內(nèi)容、推送頻道的多寡和推送方式。如專題信息、最新發(fā)布的新聞、消息、最新資源等以及用戶借閱信息如所借圖書(shū)到期提醒、催還通知等,均可作為動(dòng)態(tài)信息頻道推送給用戶,而用戶不需要時(shí)時(shí)刻刻關(guān)注圖書(shū)館網(wǎng)站的內(nèi)容更新,而只需登錄RSS閱讀器即可獲得這些信息。
3)實(shí)現(xiàn)用戶個(gè)性化信息定制及“一站式”服務(wù):在客戶端,用戶利用RSS閱讀器可以定制自己需要的、感興趣的頻道內(nèi)容,實(shí)現(xiàn)個(gè)性化閱讀;另外,在RSS對(duì)信息有效集成的基礎(chǔ)上,用戶只需通過(guò)一次訂閱即只需在第一次使用時(shí)提出訂閱請(qǐng)求,在今后的查詢中不必次次訂閱就可檢索圖書(shū)館網(wǎng)站所提供的最新相關(guān)信息,從而實(shí)現(xiàn)“一站式”服務(wù)。
4)實(shí)現(xiàn)虛擬參考咨詢等深層次服務(wù):圖書(shū)館可以構(gòu)建基于RSS技術(shù)的Blog空間,實(shí)現(xiàn)與用戶之間的實(shí)時(shí)信息交流,提供虛擬參考咨詢、課題查新、定題服務(wù)等。
圖書(shū)館引入RSS技術(shù)進(jìn)行網(wǎng)絡(luò)信息采集與服務(wù),并不是要放棄現(xiàn)有的網(wǎng)絡(luò)信息采集與服務(wù)方式,而是開(kāi)拓新的工作方法和思路,傳統(tǒng)的網(wǎng)絡(luò)服務(wù)方式如E-mail、BBS、Chat等應(yīng)視情況繼續(xù)使用,各種方式相互補(bǔ)充、取長(zhǎng)補(bǔ)短,共同實(shí)現(xiàn)我們所期望的功能。
[1]劉林.基于詞語(yǔ)權(quán)重改進(jìn)的樸素貝葉斯分類算法的研究與應(yīng)用[D].廣州:中山大學(xué),2009.
[2]黃艷娟.基于RSS的圖書(shū)館個(gè)性化信息推送服務(wù)[J].情報(bào)科學(xué),2006(7):1023-1026.
[3]宋邵輝.RSS技術(shù)在互聯(lián)網(wǎng)上的應(yīng)用[J].中國(guó)信息導(dǎo)報(bào),2006(5):48-49.
[4]伍玉偉.RSS:網(wǎng)絡(luò)信息“聚合”利器[J].現(xiàn)代情報(bào),2006(2):221 -222.
[5]張會(huì)娥.基于RSS的科技信息聚合系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(7):60-63.
[6]孫彩杰.RSS技術(shù)發(fā)展及其在圖書(shū)館中的應(yīng)用[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2006(6):83-85.
[7]吳振新.RSS元數(shù)據(jù)在門(mén)戶網(wǎng)站建設(shè)中的應(yīng)用[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2004(10):60-64.
[8]馬國(guó)棟,朱濂.RSS技術(shù)在數(shù)字圖書(shū)館建設(shè)中的應(yīng)用[J].圖書(shū)館學(xué)研究,2006(4):99-101.