王 佩孫建文吳 鋼(.武漢大學(xué)信息管理學(xué)院 武漢 43007;.華中師范大學(xué)國家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心 武漢 430079)
?
公共部門信息再利用中的信息質(zhì)量問題研究*
王佩1孫建文2吳鋼1
(1.武漢大學(xué)信息管理學(xué)院武漢430072;2.華中師范大學(xué)國家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心武漢430079)
〔摘要〕公共部門信息再利用的成效受到信息質(zhì)量的直接影響,通過分解公共部門信息再利用的信息增值流程,厘清信息提供方、信息中介和信息用戶三類參與者不同的信息質(zhì)量需求,分析公共部門信息質(zhì)量的維度,并將公共部門信息再利用過程、再利用參與者與信息質(zhì)量維度相結(jié)合,提出一套逐級遞進(jìn)的信息質(zhì)量分級體系,達(dá)到對信息再利用各個關(guān)鍵環(huán)節(jié)中信息質(zhì)量的控制,實現(xiàn)信息的有效再利用。
〔關(guān)鍵詞〕公共部門信息信息質(zhì)量信息再利用
〔分類號〕G203
〔引用本文格式〕王佩,孫建文,吳鋼.公共部門信息再利用中的信息質(zhì)量問題研究[J].圖書館,2016(4):30-37
* 本文系教育部人文社會科學(xué)研究青年項目“政府信息資源公益性增值利用對策研究”(項目編號:11YJC870025)的研究成果之一。
公共部門信息(Public Sector Information,PSI)蘊(yùn)藏的經(jīng)濟(jì)價值與社會價值已經(jīng)得到社會的廣泛認(rèn)可與重視,對公共部門信息的再利用在各國也取得了良好的應(yīng)用成效。國務(wù)院于2015年8月31日印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》中指出,將于2018年底前建成國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺,率先在信用、交通、醫(yī)療、衛(wèi)生、就業(yè)、社保、地理等二十余個重要公共部門實現(xiàn)數(shù)據(jù)資源合理適度向社會開放[1],為社會公眾對公共部門信息開展增值性、公益性開發(fā)和創(chuàng)新應(yīng)用提供數(shù)據(jù)支持和信息數(shù)量上的保障。美國、英國、歐盟等國家和地區(qū)也通過《信息自由法》、《公共部門信息再利用條例》、《公共部門信息再利用指令》等法律與政策建立了以公開為原則的公共部門信息開放制度。公共部門信息的數(shù)量通過合理開放獲取得到了保障,而其質(zhì)量問題并未獲得同等的關(guān)注。當(dāng)人們從公共部門獲取信息進(jìn)行再利用時,虛假、錯誤、不完善或過時的信息易導(dǎo)致他們做出錯誤的決定,從而引發(fā)重大的社會問題[2],公共部門信息的質(zhì)量問題亟到重視。
目前我國對于公共部門信息再利用的研究主要集中在三個方面:①公共部門信息再利用中的法律與制度問題研究,包括對公共部門信息再利用的國際立法進(jìn)展[3]和我國的政策趨勢的分析[4],以及公共部門信息再利用中的知識產(chǎn)權(quán)制度、市場制度和程序制度的研究[5-7];②公共部門信息再利用的模式研究,包括探討美國、英國等公共部門信息再利用發(fā)展較早國家的再利用模式以及對我國的啟示[8-9];③公共部門信息再利用中的信息獲取方式與定價方式研究,包括公共部門信息再利用的收費模式[10]和收費制度[11]。公共部門信息的有效再利用不僅需要法律與制度的支持、再利用模式的創(chuàng)新,同時也需要對信息質(zhì)量進(jìn)行約束,根據(jù)不同的信息再利用場景提供不同質(zhì)量等級的信息,滿足各類型信息用戶的需求。公共部門信息再利用的信息增值過程不同于單個組織中的信息增值鏈,其涉及的信息提供方、信息中介和信息用戶的范圍和類別眾多,不同的信息需求、不同的資金投入、不同的身份、不同的動機(jī)決定了參與者對信息質(zhì)量的不同看法,建立明確而有彈性的信息質(zhì)量約束機(jī)制將有助于培育新的再利用模式,有助于各方參與者達(dá)成共識。文章擬從公共部門信息再利用活動中不同增值環(huán)節(jié)、不同參與者的角度出發(fā),分析用戶對信息質(zhì)量的要求,厘清公共部門信息再利用參與者與信息質(zhì)量的關(guān)系,提出一套逐級遞進(jìn)的信息質(zhì)量等級體系,并為后續(xù)研究提供基礎(chǔ)。
公共部門信息泛指一系列由各領(lǐng)域的公共機(jī)構(gòu)在完成其公共任務(wù)時收集、制造、再加工和傳播的信息,經(jīng)濟(jì)合作與發(fā)展組織(OECD)將公共部門信息的再利用定義為商業(yè)機(jī)構(gòu)或個人對公共部門信息開展的商業(yè)化或非商業(yè)化再利用[12]。歐盟在公共部門信息再利用領(lǐng)域開展的一系列調(diào)查研究[13-14]對公共部門信息的價值進(jìn)行了量化和評估,揭示了上游公共部門信息(upstream information)的獨占特征,即某些公共部門是一類信息的唯一來源,在提供信息時沒有受到顯著的競爭,一旦向公眾開放,通過市場“看不見的手”驅(qū)動將實現(xiàn)其增值。在公共部門信息的再利用活動中,信息質(zhì)量是制約其實現(xiàn)增值的關(guān)鍵因素之一[15]。在信息再利用的背景下對信息質(zhì)量問題進(jìn)行研究,其最終目標(biāo)是基于對信息質(zhì)量的理解和控制來實現(xiàn)信息再利用成果的控制和增值,以至于通過對信息質(zhì)量的校正來達(dá)到實現(xiàn)特定信息再利用成果[16]。實現(xiàn)這一目標(biāo)需要通過三個步驟,首先梳理信息再利用的過程和參與者,揭示信息是以怎樣的流程、在怎樣的情境中、在哪些參與者之間進(jìn)行傳遞和增值;其次明確公共部門信息的特征及其質(zhì)量維度;最后,通過將信息質(zhì)量維度與信息再利用流程、參與者進(jìn)行整合和鏈接,將對信息質(zhì)量的約束與信息再利用活動有機(jī)結(jié)合,將對信息質(zhì)量的控制轉(zhuǎn)化為對信息再利用各個關(guān)鍵環(huán)節(jié)的控制并實現(xiàn)信息增值。
2.1公共部門信息的增值鏈
Taylor在其信息生命周期中的信息增值流程理論中將信息的增值描述為,通過對信息的組織將數(shù)據(jù)轉(zhuǎn)化為信息,通過整合將信息轉(zhuǎn)化為信息知識,通過評價將信息知識轉(zhuǎn)化為創(chuàng)造性知識,最終通過用戶決策利用創(chuàng)造性知識開展增值活動[17]。結(jié)合Ferro提出的公共部門信息再利用商業(yè)模式[18],可將公共部門信息的增值鏈概括為圖1所示。公共部門信息增值鏈包括四個步驟:①公共部門收集和制造原始信息,既包括公共部門以專業(yè)手段、專門收集的信息,例如氣象、地理、人口普查等信息,也包括公共部門履行其公共任務(wù)時附帶產(chǎn)生的信息,例如醫(yī)療、衛(wèi)生、教育等行業(yè)信息,公共部門對原始數(shù)據(jù)進(jìn)行初步的分類、格式化和展示,這些原始信息具有不同的載體、格式,以及不同的質(zhì)量等級和特征;②信息整合機(jī)構(gòu)對原始信息進(jìn)行整合和優(yōu)化,信息整合機(jī)構(gòu)既包括公共部門內(nèi)部的信息整合部門,也包括第三方信息中介機(jī)構(gòu),如公共部門信息門戶、開放數(shù)據(jù)門戶等,信息整合機(jī)構(gòu)通過對原始信息進(jìn)行篩選、分析、確認(rèn)、比較和編譯來對其進(jìn)行優(yōu)化;③公眾通過獲取經(jīng)過優(yōu)化的信息來開展信息再利用活動,例如利用地理信息開發(fā)的GPS定位產(chǎn)品,利用氣象信息開發(fā)的天氣預(yù)報推送服務(wù)等;④公眾通過獲取具有“目的適應(yīng)性”的信息來支持自身的決策,通過創(chuàng)造經(jīng)濟(jì)價值和社會價值的方式實現(xiàn)公共部門信息的增值,例如農(nóng)業(yè)上利用特定的地理信息、氣象信息和市場信息為作物的播種做出決策,旅游業(yè)利用特定的交通信息、氣象信息設(shè)計出游方案。
圖1 公共部門信息增值鏈
2.2集成了信息中介的公共部門信息再利用流程
信息中介是由Hagel和Rayport于1997年提出的一個概念,他們認(rèn)為信息消費者一般不會直接與信息提供者進(jìn)行協(xié)商和溝通,一類企業(yè)抓住這一機(jī)會通過成為消費者信息的保管人、代理人和經(jīng)紀(jì)人,代表信息消費者維護(hù)其隱私權(quán)、與信息提供者進(jìn)行溝通,即成為信息中介[19]。隨后這個概念逐漸擴(kuò)大,信息中介泛指一類支持與協(xié)調(diào)信息提供方與信息消費方之間信息傳遞的組織。通過信息中介來進(jìn)行信息傳遞的協(xié)調(diào)優(yōu)于信息的直接傳遞,其重要性可以體現(xiàn)在降低信息檢索成本、保護(hù)用戶的隱私權(quán)、提供更完善的信息、降低風(fēng)險和降低價格這五個方面[20]。在公共部門信息再利用背景下,信息中介可以提供獨特而專業(yè)的產(chǎn)品和服務(wù),專業(yè)化服務(wù)將有助于建立起特定類別的信息提供方與信息用戶之間的關(guān)系,通過構(gòu)建和管理大型、多功能的公共部門信息系統(tǒng)來創(chuàng)造規(guī)模經(jīng)濟(jì)效應(yīng),通過共享工具和數(shù)據(jù)集來創(chuàng)造范圍經(jīng)濟(jì)效應(yīng)[21]。Bailey和Bakos的研究將信息中介的主要作用概括為聚合信息、成為信息的可信中介、輔助開發(fā)市場和將信息提供方與信息用戶配對[22],結(jié)合德勤公司研究報告[23]中列舉的信息產(chǎn)業(yè)商業(yè)模式原型,可將公共部門信息再利用中的信息中介歸納為如下三類:
(1)整合型信息中介:這類信息中介對公共部門信息進(jìn)行搜集和聚合,通常針對某個特定主題的信息,厘清信息的相互關(guān)系并分析其效率,并以可視化形式呈現(xiàn)信息間的復(fù)雜關(guān)系[23]。例如美國的data.gov網(wǎng)站、英國的data.gov.uk網(wǎng)站、歐盟的ePSIplatform平臺是綜合性公共部門信息整合平臺,英國的DueDil公司開發(fā)的公司信息數(shù)據(jù)平臺、美國的ChemXSeer提供的化學(xué)實體、表格索引、數(shù)據(jù)索引平臺是針對特定行業(yè)的公共部門信息整合平臺。
(2)開發(fā)型信息中介:這類信息中介通過設(shè)計、開發(fā)和發(fā)布基于網(wǎng)絡(luò)的平板電腦或智能手機(jī)的應(yīng)用為信息用戶提供信息服務(wù)[23],提供基于類型豐富、更新速率較高信息而衍生的服務(wù)與產(chǎn)品,這一類型的信息中介高度依賴公共部門信息。例如美國人口普查局開發(fā)的dwellr應(yīng)用結(jié)合了人口普查數(shù)據(jù)、社區(qū)統(tǒng)計數(shù)據(jù)和gps數(shù)據(jù)為公眾提供城市宜居程度的指南,新加坡市區(qū)重建局開發(fā)的Master Plan 2014應(yīng)用結(jié)合了土地使用許可和城市建設(shè)規(guī)劃,以地圖的形式為公眾提供城市土地使用指南。
(3)強(qiáng)化型信息中介:這類信息中介通常是已經(jīng)建立了完善的大型企業(yè)或組織,他們將公共部門信息與已有的產(chǎn)品與服務(wù)相結(jié)合,對其進(jìn)行豐富和強(qiáng)化[23],這些產(chǎn)品與服務(wù)的提供并不完全依賴于公共部門信息。例如法國的Le.TAXI平臺將傳統(tǒng)出租車行業(yè)與GPS導(dǎo)航信息、出租車定位信息、移動搜索引擎相結(jié)合,為公眾提供通過智能手機(jī)預(yù)約出租車的服務(wù);美國的Safe Eats應(yīng)用將傳統(tǒng)的餐廳評價與農(nóng)業(yè)部的食品環(huán)境地圖集、紐約市餐館登記目錄相結(jié)合,為公眾提供客觀有效的餐廳指南。
集成了信息提供方、信息中介與信息用戶這三類參與者的公共部門信息再利用流程可概括為圖2所示。信息提供方為公共部門,包括各級政府部門、公共企業(yè)、其他社會團(tuán)體等組織機(jī)構(gòu);信息中介,包括了前文所述的整合型、開發(fā)型、強(qiáng)化型這三類;信息用戶為公共領(lǐng)域和私有領(lǐng)域的各類參與者,包括個人、企業(yè)、科研人員、公益組織等。在進(jìn)行信息再利用時,不同身份的參與者對信息質(zhì)量的理解和要求不盡相同,信息在傳遞過程中其質(zhì)量指標(biāo)也發(fā)生著變化,同時信息中介與信息用戶并不會完全被動接收信息,他們在對信息進(jìn)行再利用時也會向信息提供方進(jìn)行信息質(zhì)量的反饋。
圖2 公共部門信息再利用流程
2.3公共部門信息再利用的參與者與信息質(zhì)量的關(guān)系
2.3.1信息提供方與信息質(zhì)量的關(guān)系
根據(jù)不同的信息提供方式,信息提供方可分為專門收集和生產(chǎn)信息的機(jī)構(gòu)、附帶生產(chǎn)信息的機(jī)構(gòu)、將信息與其他部門信息結(jié)合后再進(jìn)行發(fā)布的機(jī)構(gòu),例如測繪機(jī)構(gòu)是專門收集和生產(chǎn)測繪地理信息的機(jī)構(gòu);教育機(jī)構(gòu)發(fā)布的學(xué)生就業(yè)統(tǒng)計、教師情況統(tǒng)計等信息是其履行教育職能時附帶產(chǎn)生的,其主要職能并非收集這些信息;中國人民銀行發(fā)布的統(tǒng)計信息是結(jié)合了其他公共部門或私營部門的統(tǒng)計報告而產(chǎn)生的。不同的信息提供方式將制約信息提供方的信息質(zhì)量水平,一般情況下,專門生產(chǎn)信息的機(jī)構(gòu)和發(fā)布整合信息的機(jī)構(gòu)在信息收集、生產(chǎn)和發(fā)布過程中獲得的資金投入、人力投入、基礎(chǔ)設(shè)施建設(shè)會更加豐富和完善,其發(fā)布的信息質(zhì)量水平和質(zhì)量控制機(jī)制將優(yōu)于附帶生產(chǎn)信息的機(jī)構(gòu)。
根據(jù)其所處的行業(yè)、領(lǐng)域不同,信息提供方所提供的信息內(nèi)容、形式和獲取方式也會有所區(qū)別。例如測繪地理信息具有專門的格式,需要特定工具和一定的專業(yè)基礎(chǔ)才能對其進(jìn)行處理;實時交通信息,包括道路堵塞、公共交通運(yùn)行等信息,具有更新速度快的特點,能夠以小時、分鐘甚至更快的速度進(jìn)行更新,這類信息通常不以直接下載的方式提供,而是以API的形式對外發(fā)布;氣象觀測數(shù)據(jù),以中國氣象數(shù)據(jù)網(wǎng)為例,實時數(shù)據(jù)可以通過在線瀏覽的方式獲取,而歷史數(shù)據(jù)則需要通過實名注冊后登錄網(wǎng)站下載。信息格式和獲取方式各異,對信息質(zhì)量的統(tǒng)一管理來說是一種挑戰(zhàn)。
各公共部門作為信息提供方為新型跨領(lǐng)域應(yīng)用與服務(wù)提供了原始數(shù)據(jù)支持,從源頭上對信息質(zhì)量進(jìn)行控制是提升信息質(zhì)量的有效手段,但一方面受公共部門自身收集和生產(chǎn)信息的方式與能力的制約,另一方面公共部門所提供信息的內(nèi)容、形式、時效性和獲取方式也不相同,如何識別不同類型、不同來源的信息質(zhì)量,如何根據(jù)原始信息的特征對其進(jìn)行統(tǒng)一而符合再利用目的的質(zhì)量管理,是值得進(jìn)一步思考的問題。
2.3.2信息中介與信息質(zhì)量的關(guān)系
信息中介既可以存在于公共部門內(nèi)部,也可以是獨立存在的第三方機(jī)構(gòu),其中既包括營利性商業(yè)組織,也包括非營利性組織。較公共部門內(nèi)部信息中介而言,獨立的第三方機(jī)構(gòu)具有更高的靈活性和適應(yīng)能力,可以根據(jù)用戶不同的需求,采用創(chuàng)新技術(shù)對信息進(jìn)行深度開發(fā),例如transportapi是由企業(yè)開發(fā)的整合了倫敦地區(qū)公共交通時間表、公共交通運(yùn)行追蹤、路程規(guī)劃、地圖信息、歷史交通信息、交通資費等信息的交通信息聚合平臺。
與其他再利用參與者相比,信息中介對信息質(zhì)量的整體要求較低。一些公共部門受自身信息處理水平和資金投入的限制,無法在現(xiàn)有條件下提供高質(zhì)量信息,此時就為信息中介提供了運(yùn)營空間,通過對原始公共部門信息進(jìn)行優(yōu)化,提升信息質(zhì)量、豐富信息展示形式,成為公共部門信息再利用價值鏈的重要環(huán)節(jié)。營利性信息中介會獲得更多的資金投入、人力投入,以及更強(qiáng)的信息處理能力,因而這類信息中介對于信息質(zhì)量的需求較非營利性中介而言會更低,他們在對信息進(jìn)行再加工時,更關(guān)注信息的數(shù)量和可獲取性,在充分獲取信息的基礎(chǔ)上投入資源對原始信息進(jìn)行優(yōu)化和再利用。
2.3.3信息用戶與信息質(zhì)量的關(guān)系
信息用戶對信息質(zhì)量的要求側(cè)重點各有不同,根據(jù)營利與否,信息用戶可分為營利性用戶和非營利性用戶,營利性用戶較非營利性用戶而言更有可能通過付費獲取高質(zhì)量信息;根據(jù)動機(jī)不同可將信息用戶分為臨時用戶(Casual User)和專業(yè)用戶(Professional User)。臨時用戶的信息再利用行為由臨時產(chǎn)生的個體需求驅(qū)動,具有行為隨意、信息處理能力較弱的特點,比如個人用戶、傳統(tǒng)行業(yè)的組織機(jī)構(gòu)等;專業(yè)用戶的信息再利用行為具有明確的目的性且信息處理能力較強(qiáng),比如科研人員、高新技術(shù)企業(yè)等。受信息處理能力的限制,臨時用戶對于信息形式上的質(zhì)量要求比專業(yè)用戶更高,包括信息的易于查找、易于理解等特性;而專業(yè)用戶對于信息內(nèi)容上的質(zhì)量要求比臨時用戶更高,包括信息的完整性、一致性、時效性等。
2.3.4公共部門信息再利用參與者對信息質(zhì)量的反饋
在公共部門信息再利用流程的最后,信息用戶可以根據(jù)自身對信息再利用的過程和效果對信息質(zhì)量提出反饋意見,根據(jù)獲取信息的渠道不同,相應(yīng)的信息質(zhì)量反饋可以通過信息中介到達(dá)信息提供方,也可以由用戶直接提交給信息提供方。持續(xù)而有目的性的質(zhì)量反饋是提升信息質(zhì)量的有效手段,通過收集用戶反饋可以對信息再利用的效率進(jìn)行監(jiān)測,便于信息提供方對信息質(zhì)量做出及時調(diào)整。用戶反饋得到充分重視后還能激勵其更積極參與信息再利用活動。
信息質(zhì)量研究橫跨多個領(lǐng)域,從信息學(xué)、信息系統(tǒng)、計算機(jī)科學(xué)等領(lǐng)域的理論研究,到質(zhì)量管理、會計學(xué)、科學(xué)決策、戰(zhàn)略管理、創(chuàng)新管理、公共管理、旅游管理等領(lǐng)域的理論與實踐相結(jié)合的研究,各學(xué)科根據(jù)信息所處的不同情境對其質(zhì)量問題進(jìn)行了不同角度的分析與闡釋。朱蘭質(zhì)量手冊第六版將質(zhì)量的定義由適用性(fitness for use)更新為適目的性(fitness for purpose),結(jié)合公共部門信息再利用的背景,信息質(zhì)量應(yīng)適合其再利用的目的。為了適合目的,任何形式的信息必須能夠真正滿足再利用參與者的需求,具備符合再利用參與者需求的正確特征,并通過無損質(zhì)量的形式加以提供[24]。由于信息對于用戶的意義是可以隨著時間而變化的,對用戶而言,信息的可用性也并非一成不變[25],在公共部門信息再利用中,根據(jù)不同的再利用目的,參與者會產(chǎn)生不同的信息需求,同時對信息質(zhì)量要求也會產(chǎn)生差異,因此建立和維護(hù)一套能夠被各方參與者認(rèn)可的信息質(zhì)量標(biāo)準(zhǔn)顯得尤為重要。
信息質(zhì)量作為一個多維度概念已經(jīng)被廣泛認(rèn)可[26],常見的信息質(zhì)量維度包括準(zhǔn)確度、時效性、完整度、相關(guān)度和一致性等[27],盡管多年來研究者從信息本身、信息的獲取、信息的語境和信息的表示等角度提出了大量的信息質(zhì)量維度指標(biāo)[28],但這些維度和指標(biāo)中也存在諸多重復(fù)和不一致。出于探析公共部門信息再利用中信息質(zhì)量問題的目的,結(jié)合Miller提出的多維信息質(zhì)量觀點[29],僅選取以下十個具有代表性的信息質(zhì)量維度作為后續(xù)論述的基礎(chǔ)。
(1)相關(guān)度(relevance):代表用戶可以獲得的、與其需求相關(guān)的信息的數(shù)量,數(shù)量越大相關(guān)度越高。如果信息在其他質(zhì)量維度得分較高,而相關(guān)度得分較低,則該項信息對于用戶來說是不符合其需求的。但低相關(guān)度信息并不一定意味著信息的質(zhì)量低,僅代表該項信息所處的類別不符合信息用戶的需求。在公共部門信息再利用的實踐中,可以通過協(xié)助用戶理解和獲取相關(guān)度高的信息,提升用戶可感知的信息可用度;通過改進(jìn)信息檢索算法提高用戶對相關(guān)信息的獲取數(shù)量。
(2)準(zhǔn)確度(accuracy):是信息最為明顯的特征,實際應(yīng)用中信息準(zhǔn)確度并非越高越好,當(dāng)信息的準(zhǔn)確度超出了用戶個人的信息處理能力時,例如個人用戶在只需獲得天氣預(yù)報時卻收到一份精確的衛(wèi)星云圖,過高的準(zhǔn)確度將增加用戶處理信息的成本和信息誤用的風(fēng)險。在公共部門信息再利用中,需從信息傳遞和信息獲取這兩個層面確保信息準(zhǔn)確度,當(dāng)信息在信息提供方、信息中介、信息用戶之間傳遞時確保其不失真,當(dāng)信息被獲取時確保其準(zhǔn)確度符合用戶期望。
(3)時效性(timeliness):也可稱為即時性(currency),反映了信息傳遞和獲取的速率。不同用戶對信息時效性有不同的要求,當(dāng)個人用戶利用交通信息對實時出行進(jìn)行規(guī)劃時,對信息的時效性要求較高,而承包商對道路建設(shè)進(jìn)行長期規(guī)劃時對交通信息的時效性要求則相對較低。在公共部門信息再利用中,同樣需要從信息傳遞和信息獲取這兩個層面確保信息的時效性,確保信息提供方收集和傳播信息的即時性、用戶能夠獲取到符合其時效性需求的信息。
(4)完整度(completeness):又可稱為綜合性(comprehensiveness),完整度低的信息將導(dǎo)致用戶陷入盲人摸象式的困境。用戶對信息完整度的需求取決于再利用目的,個人用戶基于個人使用目的對一項藥品的信息完整度需求,與科研人員基于研究目的對該信息完整度需求迥然不同,同時個人用戶在面對超出其信息處理能力的高完整度信息時也將帶來困惑和信息誤用的風(fēng)險。在公共部門信息再利用中,信息提供方和信息中介需要對用戶再利用目的進(jìn)行研究和分析,將對用戶需求的理解貫徹信息生產(chǎn)、整合和再利用的全過程。
(5)一貫性(consistency):又可稱為一致性(coherence),包括不同信息之間的一致性和信息本身的連貫性,采取不同計量單位、不同格式將產(chǎn)生不一致的信息,信息的不一致通常意味著其準(zhǔn)確度或時效性方面的缺陷。
(6)格式(format):代表信息以何種形式呈現(xiàn)給用戶,當(dāng)信息不能以有序、通用格式的形式呈現(xiàn)時,將給信息傳遞和使用帶來負(fù)擔(dān)。將紙質(zhì)文獻(xiàn)轉(zhuǎn)化為機(jī)讀文檔從而滿足用戶直接使用的需求,是提高這一信息質(zhì)量維度的有效手段。
(7)可獲取度(accessibility):代表信息在用戶需要時可被獲取的程度。公共部門信息的可獲取度由政策和技術(shù)兩方面因素決定,從政策上出于對公共安全、個人隱私、知識產(chǎn)權(quán)等方面的考量,部分公共部門信息的獲取將有一定的限制和滯后;從技術(shù)上公共部門信息的提供方和信息中介可以通過拓展信息獲取途徑和獲取效率提升這一質(zhì)量維度。信息的可獲取度還將直接影響信息用戶對再利用活動的積極性。
(8)互操作性(interoperability):也可稱為兼容性(compatibility),用以表示信息之間關(guān)聯(lián)程度。信息并不能孤立存在,信息之間交互、鏈接的關(guān)系也能影響其對用戶的適用性。在公共部門信息再利用中,各類創(chuàng)新應(yīng)用尤其需要具有高度互操作性信息的支持,如何提高信息的互操作性也需要各類信息提供方和信息中介協(xié)作解決。
(9)安全性(security):包括了在公共部門信息再利用流程中傳遞的所有信息的安全性,包括公共信息安全和個人信息安全,也包括虛擬信息安全和存儲信息實體的安全。
(10)效度(validity):也可稱為權(quán)威度(authority)或信譽(yù)度(reputation),信息的效度可以通過滿足特定標(biāo)準(zhǔn)的方式進(jìn)行驗證,包括對信息本身的驗證和對信息來源的驗證,對信息和信息再利用活動進(jìn)行審計是確認(rèn)其效度的有效手段[29]。效度相較其他單個信息質(zhì)量維度而言更類似于一種對整體信息質(zhì)量的認(rèn)可,但高效度信息并不意味著整體信息質(zhì)量的高度,例如由權(quán)威機(jī)構(gòu)提供的、卻在相關(guān)度、完整度上不足的信息,對于特定用戶來說其質(zhì)量也許并不符合預(yù)期。
通過對公共部門信息再利用過程進(jìn)行解析,可以發(fā)現(xiàn)信息的質(zhì)量是由信息提供方、信息中介和信息用戶三方參與者協(xié)作達(dá)成。公共部門信息再利用作為一項實踐活動,三方參與者在其過程中對信息質(zhì)量的需求也是以自身實踐為導(dǎo)向,因此不僅應(yīng)從理論上對參與者的信息質(zhì)量需求進(jìn)行分析,更應(yīng)從實踐角度出發(fā),將參與者的再利用活動與信息質(zhì)量聯(lián)系起來,將參與者的需求、責(zé)任與信息質(zhì)量維度進(jìn)行匹配,以期獲得涵蓋整個再利用過程的信息質(zhì)量管理的完整圖景。
表1 公共部門信息再利用環(huán)節(jié)與再利用參與者、信息質(zhì)量維度的關(guān)系
公共部門信息再利用參與者的需求不盡相同,各方參與者對于在再利用過程中出現(xiàn)的問題和如何利用信息去解決問題有著不同看法,通過對各方參與者在再利用不同環(huán)節(jié)中可能遇到的問題進(jìn)行分析,并將這些問題與信息質(zhì)量相結(jié)合,將有助于理解再利用活動與信息質(zhì)量的關(guān)系。表1列舉了一系列參與者面臨的不同再利用環(huán)節(jié)的問題和信息質(zhì)量維度的關(guān)系,歸納了英國[15, 30]、澳大利亞[31]、德國[32]、西班牙[32-34]、丹麥[35]、羅馬尼亞[36]、南非[37]這七個國家的公共部門信息再利用案例。這些文獻(xiàn)中展示的公共部門信息再利用活動的范圍和規(guī)模各不相同,通過對具體參與者的歸類,對再利用活動的程序和階段進(jìn)行識別和比較,可以發(fā)現(xiàn)各國都經(jīng)歷了或部分經(jīng)歷了表1中所列舉的再利用各個步驟,其中程序?qū)用婧图夹g(shù)層面的步驟占據(jù)了絕大部分,信息質(zhì)量并未以一個明確的面貌出現(xiàn)在這些再利用過程中,信息質(zhì)量維度與再利用的關(guān)系潛藏在再利用的每一個環(huán)節(jié)中。在這些再利用活動中,目前還缺乏一個涵蓋面廣、具有理論基礎(chǔ)、能提升再利用效率的信息質(zhì)量解決方案。
公共部門信息再利用各方參與者的信息需求源于其不同的身份和任務(wù),因此理解各參與者對信息的不同態(tài)度和需求,通過溝通,在各方的需求差異間尋找一種平衡,是提高信息質(zhì)量和促進(jìn)再利用的必要方式。公共部門信息再利用是一項由數(shù)量眾多、類型各異、需求多樣的參與者開展的跨部門、跨機(jī)構(gòu)、跨層級和跨領(lǐng)域的信息活動,其復(fù)雜性超越了一般的信息檢索、信息共享等活動,如果期望通過提升再利用活動各環(huán)節(jié)的信息質(zhì)量,達(dá)到放大信息再利用成效的目的,則需建立起一套覆蓋技術(shù)層面和組織層面的信息質(zhì)量管理程序和標(biāo)準(zhǔn)。根據(jù)信息質(zhì)量的逐級遞進(jìn),可以將公共部門信息質(zhì)量管理標(biāo)準(zhǔn)分為以下三個級別。
(1)初始級信息。作為信息提供方的各公共部門及機(jī)構(gòu)提供的原始信息需具備初始等級的信息質(zhì)量。公共部門信息由各個部門及機(jī)構(gòu)從各自的系統(tǒng)中收集或提取,其質(zhì)量參差不齊,因此提供信息的具體單位需對其信息質(zhì)量負(fù)責(zé)。受具體部門職能、資金和人力投入的限制,并非所有公共部門都具備處理原始信息滿足不同層次需求的能力,因此在初始等級上對信息質(zhì)量僅作基本的可獲取度、時效性、格式和安全上的要求,具體包括對發(fā)布信息的URL格式、可機(jī)讀格式、發(fā)布時間、發(fā)布頻率、存儲方式作出要求。初始等級信息雖然僅具有基本的質(zhì)量水平,但以其規(guī)范的格式、規(guī)律的發(fā)布頻率和可靠的獲取度,仍能為各類專業(yè)用戶所利用;同時考慮到各部門信息處理能力不均衡的問題,信息處理能力不足的公共部門也能提供符合該等級條件的信息,無需因顧慮信息質(zhì)量稍差而推遲發(fā)布信息;此外初始級信息也為信息中介提供了發(fā)揮空間,將信息優(yōu)化的工作交給專業(yè)人士處理,實現(xiàn)公共部門信息的充分、有效再利用。
(2)優(yōu)化級信息。公共部門內(nèi)部和外部的整合型信息中介將對初始級信息進(jìn)行優(yōu)化,為用戶提供具備優(yōu)化級質(zhì)量的信息。目前各國公共部門信息門戶、開放數(shù)據(jù)門戶是優(yōu)化級信息的主要來源。對信息的優(yōu)化主要表現(xiàn)在對信息可獲取度的優(yōu)化,包括對資源定位的細(xì)化要求,將相似信息以集合的形式集中發(fā)布,對信息檢索的優(yōu)化;對信息準(zhǔn)確度的優(yōu)化,包括確保發(fā)布的信息及時反映當(dāng)前真實情況,確保對原始信息的更新及時反映在發(fā)布信息中,提供對錯誤信息進(jìn)行修改的渠道;對信息的效度進(jìn)行聲明,以文檔形式聲明所提供的信息質(zhì)量,以便用戶據(jù)此對信息做出信任度判斷;對信息安全的優(yōu)化,采用異地備份的方式確保信息的物理安全,提供信息服務(wù)運(yùn)行時間、停運(yùn)時間、頻次限制方面的可用性聲明;對信息格式進(jìn)行優(yōu)化,以標(biāo)準(zhǔn)開放格式發(fā)布信息,根據(jù)信息內(nèi)容類型選擇發(fā)布格式,例如語義數(shù)據(jù)格式、標(biāo)準(zhǔn)表格格式、數(shù)據(jù)內(nèi)容標(biāo)示符、元數(shù)據(jù)標(biāo)準(zhǔn)等。
(3)適用級信息。公共部門內(nèi)部和外部的開發(fā)型、強(qiáng)化型信息中介將對優(yōu)化級信息進(jìn)一步處理使其符合用戶的再利用目的,這類信息具有最高等級的信息質(zhì)量。信息中介將公共部門信息與用戶需求進(jìn)行匹配,在對信息深度理解的基礎(chǔ)上對其進(jìn)行進(jìn)一步優(yōu)化。在相關(guān)度上,深度挖掘信息之間的潛在關(guān)聯(lián),從語義角度創(chuàng)建、揭示信息之間關(guān)系并以易于感知的形式展示;在準(zhǔn)確度和時效性上,做到所發(fā)布的信息與信息更新之間的滯后達(dá)到最小化,使得信息能準(zhǔn)確、實時反映當(dāng)前的真實情況;在完整度上,將信息收集、發(fā)布的全過程以可追溯的形式呈現(xiàn),如使用PROV數(shù)據(jù)溯源模型對信息的創(chuàng)建、處理、演化進(jìn)行記錄;在一貫性、互操作性和格式上,采用符合行業(yè)特征、基于開放標(biāo)準(zhǔn)的工具、格式對信息進(jìn)行處理和展示,例如標(biāo)準(zhǔn)統(tǒng)計數(shù)據(jù)格式(SDMX/Data Cube等)、標(biāo)準(zhǔn)地理數(shù)據(jù)格式(KML/ GeoJSON等);在可獲取度和安全度上,對信息進(jìn)行轉(zhuǎn)儲和備份,并提供不同時間點、不同類型的文件下載列表和鏈接;在效度上,建立信息持續(xù)發(fā)布的長期保證機(jī)制,提供數(shù)據(jù)驗證機(jī)制,確保用戶從信息中介處獲取的信息與原始信息相一致。
這三個等級為遞進(jìn)關(guān)系,優(yōu)化級信息首先需符合初始級信息所要求的質(zhì)量標(biāo)準(zhǔn),適用級信息需同時具備初始級信息和優(yōu)化級信息所要求的質(zhì)量標(biāo)準(zhǔn)。信息用戶可以根據(jù)其再利用目的、信息處理能力和財政預(yù)算,自由選擇符合需求的信息等級開展再利用活動。
文章通過對公共部門信息再利用的信息增值過程和參與者的闡述,分析了信息質(zhì)量對再利用過程和其參與者的重要性,再結(jié)合各國再利用的實踐案例,將再利用過程、再利用參與者與信息質(zhì)量維度聯(lián)系起來,并提出了公共部門信息質(zhì)量分級設(shè)想,筆者認(rèn)為應(yīng)從以下三個方面對公共部門信息再利用中的信息質(zhì)量問題進(jìn)行深入探討。
第一,需要對再利用的各方參與者的能力和需求進(jìn)行綜合考慮,對所建立的信息質(zhì)量管理設(shè)想進(jìn)行驗證性研究;第二,信息質(zhì)量管理是一項持續(xù)進(jìn)行的過程,需要獲得相應(yīng)參與組織內(nèi)部和外部的政策支持,應(yīng)從宏觀層面進(jìn)行信息質(zhì)量管理策略的研究,包括探討信息質(zhì)量立法、信息質(zhì)量監(jiān)察機(jī)制、信息質(zhì)量激勵機(jī)制的建設(shè)和實施;第三,信息質(zhì)量的保障和提高將通過具體的信息質(zhì)量評估和控制來實現(xiàn),因此如何將信息質(zhì)量維度與技術(shù)指標(biāo)和手段相結(jié)合值得進(jìn)行進(jìn)一步研究,包括探討所采取的信息質(zhì)量評估、信息質(zhì)量控制標(biāo)準(zhǔn)和工具。
(來稿時間:2015年12月)
1.促進(jìn)大數(shù)據(jù)發(fā)展行動綱要[EB/OL].[2015-09-19].http:// www.gov.cn/zhengce/content/2015-09/05/content_10137.htm
2. 冉從敬,陳傳夫,賀德方.公共部門信息增值利用的社會責(zé)任研究[J].中國軟科學(xué),2014(12):48-59
3. 陳傳夫,肖志鋒.公共部門信息資源再利用國際立法的進(jìn)展與對我國的建議[J].信息資源管理學(xué)報,2011(1):16-25
4. 陳傳夫,鮮冉,王迪.我國公共部門信息資源增值利用的政策趨勢分析[J].信息資源管理學(xué)報, 2015(2):4-10
5.冉從敬.公共部門信息再利用制度研究[J].中國圖書館報,2008(6):103-108
6. 冉從敬.美國公共部門信息再利用的制度體系研究[J].圖書與情報,2010(4):69-74
7. 陳傳夫,劉莎.公共部門信息增值利用中面臨的知識產(chǎn)權(quán)問題及對策[J]. 圖書館論壇,2010(6):19-22
8. 秦麗紅.美國公共部門信息再利用模式及其對我國的借鑒意義[J].圖書館學(xué)研究,2009(1):77-79
9. 趙芳,樊江宏.英國公共部門信息再利用模式分析[J].圖書館學(xué)研究,2011(6):86-90
10. 陳傳夫,馬浩琴,黃璇.我國公共部門信息資源增值利用的定價問題及對策[J].情報資料工作,2011(1):11-15
11. 冉從敬,柳楊.英國公共部門信息再利用收費制度對我國的啟示[J].圖書館論壇,2015(2):88-94
12. Recommendation of the Council for Enhanced Access and More Effective Use of Public Sector Information[EB/OL]. [2015-10-13].http://webnet.oecd.org/oecdacts/Instruments/ ShowInstrumentView.aspx?InstrumentID=122
13. Commercial exploitation of Europe’s public sector information [EB/OL].[2015-10-13].http://ec.europa.eu/information_ society/newsroom/cf/dae/document.cfm?doc_id=1196
14. Graham Vickery.A review of recent PSI re-use studies and related market developments[EB/OL].[2015-10-13].http:// ec.europa.eu/newsroom/dae/document.cfm?doc_id=1093
15. Market Assessment of Public Sector Information[R/OL]. [2015-08-28].http://www.gov.uk/government/uploads/system/ uploads/attachment_data/file/198905/bis-13-743-marketassessment-of-public-sector-information.pdf
16. Jacob Marschak.Economics of information systems[J].Journal of the American Statistical Association,1971(3):192-219
17. Robert S. Taylor.Value-added processes in the information life cycle[J].Journal of the American society for information science,1982(9):341-346
18. Enrico Ferro, Michele Osella.Eight business model archetypes for PSI re-use[EB/OL].[2015-10-03].http://www. w3.org/2013/04/odw/odw13_submission_27.pdf
19. John Hagel,Jeffrey F. Rayport.The coming battle for customer Information[J].Harvard Business Review,1997(1):53-60
20. Paul Resnick,Richard Zeckhauser,Chris Avery.Roles for electronic brokers[EB/OL].[2015-10-15].http://ccs.mit.edu/papers/ CCSWP179.html
21. Marijn Janssen,Anneke Zuiderwijk.Infomediary business models for connecting open data providers and users[J].Social Science Computer Review,2014(5): 694-711
22. Bailey J. P.,Bakos, J. Y. An exploratory study of the emerging role of electronic intermediaries[J].International Journal of Electronic Commerce,1997(3):1, 7
23. Deloitte.Open growth Stimulation demand for open data in the UK[EB/OL].[2015-09-06]. http://www2.deloitte.com/content/ dam/Deloitte/uk/Documents/deloitte-analytics/open-growth.pdf
24. 約瑟夫·M·朱蘭.朱蘭質(zhì)量手冊[M].北京:中國人民大學(xué)出版社,2014:6
25. Ballou, D.,Madnick, S.,Wang, R. Special section: assuring information quality[J].Journal of Management Information Systems,2003(20):9-11
26. Markus Helfert,Foley Owen. A context aware information quality framework[C].Fourth International Conference on Cooperation and Promotion of Information Resources in Science and Technology,2009:187-193
27. Delone William H., McLean Ephraim R..The DeLone and McLean model of information systems success: a ten-year update[J].Journal of management information systems,2003(4): 9-30
28. Wang, R. Y.,Strong, D. M..Beyond accuracy: What data quality means to data consumers[J].Journal of management information systems,1996(4):5-33
29. Miller, Holmes.The multiple dimensions of information quality[J].Information Systems Management,1996(2):79-82
30. Guidance on the implementation of the Re-use of Public Sector Information Regulations 2015[EB/OL].[2015-09-14].http:// www.nationalarchives.gov.uk/documents/information-management/ psi-implementation-guidance-public-sector-bodies.pdf
31. Houghton, J.Costs and Benefits of Data Provision. Report to the Australian National Data Service[R/OL].[2015-10-26].http:// ands.org.au/resource/houghton-cost-benefit-study.pdf
32. Sirko Hunnius, Krieger Bernhard, Schuppan,Tino. Providing, Guarding, Shielding: Open Government Data in Spain and Germany[C].2014 EGPA Annual Conference,2014
33. Emilio Garcia Garcia,Maldonado S. L. Soriano.Reuse of Public Sector Information in Spain: A solid foundation for a promising future[EB/OL].[2015-09-30].http://bid.ub.edu/29/ soriano3.htm
34. Cerrillo-i-Martínez Agustí.The Reuse of Public Sector Information in Europe and Its Impact on Transparency[J].European Law Journal,2012(6): 770-792
35. Thorhildur Jetzek. Sustainable Value of Open Government Data: Uncovering the Generative Mechanisms of Open Data through a Mixed Methods Approach[D].Copenhagen:Copenhagen Business School, 2015
36. Dragos Dacian C.,Bogdana Neamtu.Reusing Public Sector Information-Policy Choices and Experiences in some of the Member States with an emphasis on the Case of Romania[J/OL].[2015-10-01].http://eiop.or.at/eiop/pdf/2009-004.pdf
37. Sharif Raed M.Utilization and Value of Public Sector Information for Knowledge Development: the Case of South Africa[D]. New York: Syracuse University,2013
Information Quality Study in the Context of Public Sector Information Re-use
Wang Pei1Sun Jianwen2Wu Gang1
( 1. School of Information Management, Wuhan University; 2. National Engineering Research Center for e-Learning, Central China Normal University )
〔Abstract〕The result of public sector information re-use is highly affected by the quality of raw PSI information. By investigating the PSI-based value-added chain, defining user need for PSI quality from different stakeholders’ perspectives, and analyzing PSI quality dimensions, a 3-level PSI quality grading system is presented. By implementing the quality grading system, the quality of PSI can be controlled and the re-use result can be improved.
〔Keywords〕Public sector informationInformation qualityInformation re-use
〔作者簡介〕王佩(1984-),女,武漢大學(xué)信息管理學(xué)院博士研究生;孫建文(1982-),男,華中師范大學(xué)國家數(shù)字化學(xué)習(xí)工程技術(shù)研究中心副教授;吳鋼(1983-),男,武漢大學(xué)信息管理學(xué)院講師。