陳 驍 連 鍥 黃 煜 龔德昱
上海財(cái)經(jīng)大學(xué)圖書館 上海 200433
在開放的信息社會(huì)中,圖書館面對(duì)的內(nèi)外部環(huán)境越來越復(fù)雜,圖書館管理者需要為決策耗費(fèi)大量的時(shí)間和精力。一方面圖書館需要與更多的組織和機(jī)構(gòu)發(fā)生關(guān)系(如數(shù)據(jù)庫廠商、書商、外包業(yè)務(wù)承包商等第三方機(jī)構(gòu)),圖書館管理者所面臨的決策的數(shù)量和復(fù)雜性都是前所未有的。另一方面,由于管理信息系統(tǒng)的廣泛應(yīng)用,圖書館每天都會(huì)產(chǎn)生大量的數(shù)據(jù),而這些數(shù)據(jù)往往缺少整理和分析,不僅不能給決策提供幫助,反而會(huì)給圖書館管理者帶來困擾。因此,有必要設(shè)計(jì)一個(gè)系統(tǒng),能對(duì)相關(guān)數(shù)據(jù)和信息進(jìn)行加工、處理和分析,能隨時(shí)向管理者提供決策所需的有用信息,節(jié)省管理者的時(shí)間和精力,提高決策效率。
決策支持系統(tǒng)(Decision Support System,簡稱DSS)是輔助決策者通過數(shù)據(jù)、模型和知識(shí),以人機(jī)交互方式進(jìn)行半結(jié)構(gòu)化或非結(jié)構(gòu)化決策的計(jì)算機(jī)應(yīng)用系統(tǒng)。它為決策者提供分析問題、建立模型、模擬決策過程和方案的環(huán)境,調(diào)用各種信息資源和分析工具,幫助決策者提高決策水平和質(zhì)量。現(xiàn)在決策支持系統(tǒng)應(yīng)用比較廣泛,如在組織運(yùn)營管理、工業(yè)處理、證券投資組合、軍隊(duì)管理和醫(yī)療診斷等方面都有大量應(yīng)用[1]。決策支持系統(tǒng)在圖書館中也開始有所應(yīng)用,國外主要集中在文獻(xiàn)采訪[2]、經(jīng)費(fèi)預(yù)算[3]等方面,我國圖書情報(bào)界研究較少,主要集中在圖書館管理[4]、圖書采訪[5]和科技情報(bào)[6]等方面。
在日常決策中引入決策支持系統(tǒng),能夠輔助管理者快速、準(zhǔn)確地做出決策?;跇I(yè)務(wù)數(shù)據(jù)的高校圖書館決策支持系統(tǒng)應(yīng)該包括如下功能:
圖書館決策支持系統(tǒng)需要收集、管理并隨時(shí)提供與決策問題有關(guān)的圖書館內(nèi)部信息,以便管理者能夠快速、準(zhǔn)確地知道圖書館目前的狀況。圖書館內(nèi)部信息主要包括:館藏信息、資源利用信息、服務(wù)信息和業(yè)務(wù)信息等。
圖書館決策支持系統(tǒng)需要收集、管理并提供與決策問題有關(guān)的外部信息包括:國家、教育部的政策法規(guī),本校相關(guān)規(guī)定,本校重點(diǎn)學(xué)科和專業(yè)設(shè)置,出版市場(chǎng)行情,同行動(dòng)態(tài)等。
圖書館決策支持系統(tǒng)需要收集、管理并提供各項(xiàng)決策方案執(zhí)行情況的反饋信息,為決策的及時(shí)調(diào)整或以后的決策提供參考經(jīng)驗(yàn),如訂單或合同執(zhí)行進(jìn)程、學(xué)科服務(wù)的反饋情況、圖書館新服務(wù)的反饋情況等。
圖書館決策支持系統(tǒng)應(yīng)能設(shè)置和管理與決策問題有關(guān)的各種模型,使系統(tǒng)中的數(shù)據(jù)、模型與方法能夠很容易地被修改和添加,能靈活運(yùn)用模型與方法對(duì)數(shù)據(jù)進(jìn)行加工、匯總、分析、預(yù)測(cè),得出所需的綜合信息與預(yù)測(cè)信息。
圖書館決策支持系統(tǒng)必須具有良好的人機(jī)會(huì)話功能,方便用戶輸入數(shù)據(jù)和隨機(jī)查詢,同時(shí)也需要有強(qiáng)大的圖表輸出功能,方便決策者閱讀和利用。此外,決策支持系統(tǒng)應(yīng)能提供良好的數(shù)據(jù)通信功能,以保證及時(shí)收集所需數(shù)據(jù),并將結(jié)果傳送給用戶。
圖書館決策支持系統(tǒng)包含數(shù)據(jù)源、數(shù)據(jù)存儲(chǔ)與管理、聯(lián)機(jī)分析處理(OLAP)服務(wù)、決策支持應(yīng)用4個(gè)部分。數(shù)據(jù)源是整個(gè)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)基礎(chǔ);數(shù)據(jù)存儲(chǔ)與管理是在現(xiàn)有數(shù)據(jù)源的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行抽取(Extract)、轉(zhuǎn)換和清洗(Transform)、裝載(Load),并有效集成操作(即ETL處理),按照主題進(jìn)行重新組織,構(gòu)建數(shù)據(jù)倉庫[7];OLAP是按照多維數(shù)據(jù)模型進(jìn)行再次重組,以支持用戶多角度、多層次的分析;決策支持應(yīng)用是BI系統(tǒng),實(shí)現(xiàn)報(bào)表、分析、圖表、數(shù)據(jù)集成、數(shù)據(jù)挖掘等。總體結(jié)構(gòu)如圖1所示。
圖1 決策支持系統(tǒng)的體系結(jié)構(gòu)
數(shù)據(jù)集市是按圖書館統(tǒng)計(jì)的主題,在數(shù)據(jù)倉庫中對(duì)數(shù)據(jù)進(jìn)行抽取組合,囊括了某個(gè)主題所有統(tǒng)計(jì)指標(biāo)涉及元數(shù)據(jù)。數(shù)據(jù)統(tǒng)計(jì)的規(guī)則構(gòu)成了OLAP,是對(duì)數(shù)據(jù)集市內(nèi)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的方法庫。
2.2.1 數(shù)據(jù)模型構(gòu)建子系統(tǒng)
數(shù)據(jù)模型構(gòu)建子系統(tǒng)包含模型構(gòu)建、語法檢查、模型轉(zhuǎn)換等功能模塊。其中模型構(gòu)建模塊就是根據(jù)客戶的需要構(gòu)建對(duì)應(yīng)的多維數(shù)據(jù)概念模型。語法檢查模塊就是根據(jù)所描述的建模規(guī)則對(duì)所構(gòu)建的多維數(shù)據(jù)概念進(jìn)行檢查,若語法不正確,則給出相應(yīng)的提示信息,告知用戶進(jìn)行調(diào)整。模型轉(zhuǎn)換模塊主要是便于模型的匹配與映射以及元數(shù)據(jù)的生成,將圖形化的多維數(shù)據(jù)概念模型轉(zhuǎn)換為對(duì)應(yīng)的XML文檔描述形式[8]。
2.2.2 元數(shù)據(jù)管理子系統(tǒng)
元數(shù)據(jù)管理子系統(tǒng)向下提供對(duì)各數(shù)據(jù)源的元數(shù)據(jù)抽取功能,向上為模型匹配與映射、錄入等提供元數(shù)據(jù)訪問接口,對(duì)內(nèi)提供元數(shù)據(jù)的標(biāo)準(zhǔn)化、存儲(chǔ)功能。
(1)元數(shù)據(jù)錄入功能
對(duì)各數(shù)據(jù)源進(jìn)行分類,對(duì)來源清楚、數(shù)據(jù)格式固定的元數(shù)據(jù)實(shí)施定期自動(dòng)收割入庫。對(duì)不能自動(dòng)收割數(shù)據(jù),系統(tǒng)設(shè)計(jì)入口,供各業(yè)務(wù)人員定期將數(shù)據(jù)錄入。錄入功能的運(yùn)行模式可采用C/S模式,其依據(jù)是業(yè)務(wù)人員工作地點(diǎn)固定,采用C/S模式可降低系統(tǒng)的開發(fā)難度,提高信息安全性。
(2)異構(gòu)元數(shù)據(jù)標(biāo)準(zhǔn)化功能
需要規(guī)定統(tǒng)一的元數(shù)據(jù)格式,對(duì)不符合要求的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,如將圖書館中自動(dòng)化管理系統(tǒng)與其他信息系統(tǒng)進(jìn)行整合、分類、標(biāo)準(zhǔn)化。由于元數(shù)據(jù)整合工作十分復(fù)雜,可以分層實(shí)現(xiàn),在完成核心公共模塊的前提下,先從核心元數(shù)據(jù)整合開始,然后向元數(shù)據(jù)集擴(kuò)展。
(3)元數(shù)據(jù)存儲(chǔ)功能
高校圖書館要考慮數(shù)據(jù)的長期保存問題,需要對(duì)元數(shù)據(jù)庫進(jìn)行日常維護(hù)和更新,保證數(shù)字資源的完整性、一致性、安全性。
2.2.3 綜合指標(biāo)管理子系統(tǒng)
將相關(guān)指標(biāo)組織在一起構(gòu)成指標(biāo)體系。在這個(gè)分類體系中,同位類類目之間為并列關(guān)系,下位類與上位類之間為隸屬關(guān)系,同位類類目不重復(fù)、不交叉。
綜合指標(biāo)管理包含指標(biāo)分類的管理和指標(biāo)的管理兩部分,它具有雙重作用:一是對(duì)數(shù)據(jù)倉庫中支持的分析焦點(diǎn)進(jìn)行統(tǒng)一分類管理,二是對(duì)經(jīng)過映射生成的多維數(shù)據(jù)集進(jìn)行數(shù)據(jù)綜合與錄入時(shí)提供指導(dǎo)。指標(biāo)管理模塊是以圖形化界面為用戶提供交互式指標(biāo)描述手段,根據(jù)各個(gè)高校圖書館統(tǒng)計(jì)的主題和口徑,用戶預(yù)先定義一些系統(tǒng)方法庫規(guī)則,完成整個(gè)指標(biāo)體系的定義與管理。用戶通過它可以具體定義綜合指標(biāo)的層次、類型、展現(xiàn)方式、指標(biāo)計(jì)算公式、計(jì)算觸發(fā)機(jī)制以及它與數(shù)據(jù)項(xiàng)的關(guān)聯(lián)等信息,并將定義好的指標(biāo)存放在指標(biāo)庫中,還能進(jìn)行指標(biāo)的日常管理與維護(hù)工作。
2.2.4 OLAP分析子系統(tǒng)
OLAP分析子系統(tǒng)的設(shè)計(jì)重點(diǎn)在于如何組織數(shù)據(jù)倉庫中的綜合性數(shù)據(jù),如何滿足前端用戶的多維數(shù)據(jù)分析需要。基于上面兩點(diǎn)考慮,選用基于多維數(shù)據(jù)組織的OLAP 實(shí)現(xiàn)。數(shù)據(jù)訪問和生成方式上利用旋轉(zhuǎn)、切片或切塊、向上歸納、向下鉆取等操作剖析數(shù)據(jù)。
2.2.5 資源發(fā)布子系統(tǒng)
根據(jù)系統(tǒng)使用者分散化、動(dòng)態(tài)化的特點(diǎn),對(duì)經(jīng)OLAP分析好的多維數(shù)據(jù)視圖運(yùn)用BI工具圖表化展示,并進(jìn)行B/S式信息的發(fā)布和服務(wù)。
2.3.1 建立圖書館業(yè)務(wù)數(shù)據(jù)倉庫
對(duì)圖書館內(nèi)部各信息系統(tǒng)和外部數(shù)據(jù)源抽取所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗,最終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。本系統(tǒng)選用Microsoft SQL Server作為數(shù)據(jù)倉庫數(shù)據(jù)庫。
2.3.2 按主題分離出數(shù)據(jù)集市
數(shù)據(jù)集建立在具有統(tǒng)一數(shù)據(jù)存儲(chǔ)模型的數(shù)據(jù)倉庫下,各級(jí)業(yè)務(wù)人員按照各部門特定的需求把數(shù)據(jù)進(jìn)行復(fù)制、處理、加工,并最終統(tǒng)一展現(xiàn)為有部門特點(diǎn)的數(shù)據(jù)集合。各高校圖書館可根據(jù)自己統(tǒng)計(jì)主題的需要從數(shù)據(jù)倉庫底庫中抽取數(shù)據(jù),建立自己的數(shù)據(jù)集市。
2.3.3 數(shù)據(jù)分析
通過深入分析內(nèi)部的館藏結(jié)構(gòu)數(shù)據(jù)、流通數(shù)據(jù)、電子資源使用數(shù)據(jù)、市面圖書出版數(shù)據(jù),甚至是來自外部的各種參照信息,從而分析得到本館館藏建設(shè)情況,并為圖書館管理人員提供采購決策支持。本系統(tǒng)選用Microsoft 的Analysis service作為OLAP工具。
2.3.4 結(jié)果圖表化
對(duì)分析的結(jié)果按不同維度抽取數(shù)據(jù)并圖表化呈現(xiàn)給管理者,使得管理者能對(duì)業(yè)務(wù)的發(fā)展?fàn)顩r有直觀的認(rèn)識(shí)。本系統(tǒng)使用報(bào)表工具Pentaho進(jìn)行圖表化展示。Pentaho允許開發(fā)人員創(chuàng)建報(bào)表、儀表盤、分析模型、商業(yè)規(guī)則和 BI 流程,并且能方便地集成至第三方系統(tǒng)中。如將業(yè)務(wù)報(bào)表嵌入高校公共數(shù)據(jù)平臺(tái):采用SSO(單點(diǎn)登錄)技術(shù),將報(bào)表嵌入學(xué)校的公共數(shù)據(jù)平臺(tái),并且設(shè)置權(quán)限審核機(jī)制,使得圖書館業(yè)務(wù)數(shù)據(jù)能夠被學(xué)校主管領(lǐng)導(dǎo)查看。
我們可以根據(jù)主題來設(shè)計(jì)數(shù)據(jù)集市邏輯模型,在此使用星型模型來構(gòu)建圖書館的數(shù)據(jù)集市。為加快分析速度,可以將分析頻繁的層次預(yù)先進(jìn)行聚集操作,即將信息按照屬性粒度層次來進(jìn)行聚集,當(dāng)需要進(jìn)一步分析時(shí)再到原有的基本信息中進(jìn)行搜索。紙本館藏質(zhì)量分析主題需從下面的紙本館藏結(jié)構(gòu)和圖書借閱情況模型來分析,數(shù)據(jù)模型如圖2和圖3所示。
圖2 紙本館藏結(jié)構(gòu)分析的星形模型
圖3 圖書借閱情況分析的星形模型
館藏結(jié)構(gòu)分析主要包括資金使用情況分析、館藏分布情況分析、圖書使用價(jià)值分析和館藏文獻(xiàn)比例分析等。通過剔除舊書、補(bǔ)充新書等方法不斷調(diào)整,提高圖書的使用價(jià)值,最終形成適用于本館的最佳藏書結(jié)構(gòu)??紤]到統(tǒng)計(jì)大多以年度為單位進(jìn)行,對(duì)模型事實(shí)表中的數(shù)據(jù)可按年份進(jìn)行聚集。如紙本館藏模型中事實(shí)表的圖書數(shù)量、圖書金額字段存儲(chǔ)著按中圖法一級(jí)分類的年度圖書數(shù)量、圖書金額信息。借閱情況模型事實(shí)表中的借閱量也是如此。如需月度或二級(jí)分類維度的統(tǒng)計(jì),需對(duì)維表基本數(shù)據(jù)進(jìn)行重新計(jì)算匯總。
由紙本館藏模型得出圖書館中各類紙本館藏分布比例情況。借閱情況模型反映讀者需求情況,由模型可以得出讀者對(duì)各類紙本館藏的借閱情況。兩者的比值即為圖書的符合程度。符合程度在圖書館分析中主要用于評(píng)價(jià)館藏是否合理,能否滿足讀者的需求,也可用于采購分析。符合程度的理想值為1,即某類文獻(xiàn)的流通量與其在館藏中所占份額相當(dāng)。如果這一比例遠(yuǎn)大于或遠(yuǎn)小于1時(shí),就需要對(duì)館藏做一些調(diào)整。
本文對(duì)圖書館決策支持系統(tǒng)的目標(biāo)和實(shí)現(xiàn)功能進(jìn)行了闡述,提出并設(shè)計(jì)了基于應(yīng)用數(shù)據(jù)倉庫與OLAP技術(shù)的圖書館業(yè)務(wù)決策支持方案,構(gòu)建了一個(gè)數(shù)據(jù)倉庫模型,并規(guī)劃了系統(tǒng)的設(shè)計(jì)與分析的路徑。之后,我們將在此基礎(chǔ)上進(jìn)行實(shí)踐,根據(jù)現(xiàn)實(shí)操作的具體情況再進(jìn)行修正和完善。
[1]Marek J Druzdzel,Roger R Flynn.Decision Sopput Systems[EB/OL].[2012-05-12].http://www.pitt.edu/~druzdzel/psfiles/dss.pdf.
[2]F.M.E.Uzoka,O.A.Ijatuyi.Decision support system for library acquisitions:a framework[J].The Electronic Library, 2005,23(4):453-462.
[3]S C Kao, H C Chang, C H Lin.Decision support for the academic library acquisition budget allocation via circulation database mining[J].Information Processing & Management,2003,39(1):133-147.
[4]房宜鋒.基于數(shù)據(jù)挖掘圖書館管理決策研究[D].內(nèi)蒙古:內(nèi)蒙古大學(xué),2010.
[5]夏勍,白似雪.基于Web薦購的圖書采訪決策支持系統(tǒng)設(shè)計(jì)[J].圖書館學(xué)研究,2012(1):21-25.
[6]張曉,鄧凡.科技情報(bào)機(jī)構(gòu)輔助政府決策支持系統(tǒng)建設(shè)的思考[J].軟件導(dǎo)刊,2011(1):3-4.
[7]黃志成.基于數(shù)據(jù)挖掘的校園一卡通決策支持系統(tǒng)設(shè)計(jì)與開發(fā)[J].現(xiàn)代計(jì)算機(jī), 2010(12):175-177.
[8]鄧蘇.決策支持系統(tǒng)[M].北京:電子工業(yè)出版社,2009.