王藝楓
【摘要】:從數(shù)據(jù)層面和平臺(tái)層面層面考察各個(gè)地方政府?dāng)?shù)據(jù)平臺(tái)的數(shù)據(jù)資源建設(shè)情況、平臺(tái)服務(wù)情況和使用情況進(jìn)行比較研究,分析政府?dāng)?shù)據(jù)開放的現(xiàn)狀和不足,為我國建設(shè)全國性的政府?dāng)?shù)據(jù)開放平臺(tái)提供經(jīng)驗(yàn)和建議。通過調(diào)查分析,發(fā)現(xiàn)各地方政府?dāng)?shù)據(jù)開放平臺(tái)存在發(fā)展地區(qū)發(fā)展不均衡、數(shù)據(jù)集開放程度差異較大、用戶授權(quán)協(xié)議描述不全面、數(shù)據(jù)集的瀏覽檢索方式單一、元數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一等5個(gè)問題,同時(shí)為全國統(tǒng)一的政府?dāng)?shù)據(jù)開放平臺(tái)的建設(shè)提出了建議。
【關(guān)鍵詞】:政府?dāng)?shù)據(jù)開放 開放數(shù)據(jù) 政府?dāng)?shù)據(jù)開放平臺(tái) 大數(shù)據(jù)
1 引言
政府?dāng)?shù)據(jù)開放是繼政府信息公開之后政府加深政務(wù)公開、提高政府服務(wù)效率、促進(jìn)政府信息資源共享和公眾對(duì)政府信息資源利用的一項(xiàng)重大舉措。政府?dāng)?shù)據(jù)開放是指政府在其政務(wù)活動(dòng)中產(chǎn)生、收集和擁有的數(shù)據(jù),這些數(shù)據(jù)是不受著作權(quán)、專利權(quán),以及其他管理機(jī)制所限制,以機(jī)器可讀的形式開放給社會(huì)公眾,任何人都可以免費(fèi)獲取和自由使用。
2 研究目的
我國政府?dāng)?shù)據(jù)開放還處于起步階段,選取幾個(gè)具有代表性的地方政府?dāng)?shù)據(jù)開放平臺(tái),依據(jù)政府?dāng)?shù)據(jù)開放的原則、標(biāo)準(zhǔn)對(duì)選取的地方政府?dāng)?shù)據(jù)開放平臺(tái)的進(jìn)行分析研究。主要從數(shù)據(jù)層面和平臺(tái)層面建立評(píng)估指標(biāo),考察各個(gè)地方政府?dāng)?shù)據(jù)平臺(tái)的數(shù)據(jù)資源建設(shè)情況和平臺(tái)服務(wù)情況進(jìn)行比較研究,分析各地政府?dāng)?shù)據(jù)開放平臺(tái)的現(xiàn)狀和不足,為我國建設(shè)全國統(tǒng)一的政府?dāng)?shù)據(jù)開放平臺(tái)提供經(jīng)驗(yàn)和建議。
3 研究方法
3.1 研究范圍和樣本選擇
本次研究選取了部分我國政府?dāng)?shù)據(jù)開放平臺(tái)作為研究對(duì)象。篩選得到符合要求的政府?dāng)?shù)據(jù)開放平臺(tái)共27個(gè)。從27個(gè)政府?dāng)?shù)據(jù)開放平臺(tái)中選取具有代表性和滿足研究條件的平臺(tái)共16個(gè)作為研究樣本。
3.2 評(píng)估框架和指標(biāo)
本研究在結(jié)合前者研究的基礎(chǔ)上,選擇一些易于考察、獲取和比較的指標(biāo)作為評(píng)估指標(biāo)。整體上分為對(duì)“數(shù)據(jù)、平臺(tái)”兩個(gè)層面上對(duì)各政府?dāng)?shù)據(jù)開放平臺(tái)之間和同一個(gè)平臺(tái)中不同主題資源之間使用的情況進(jìn)行比較分析。
4 研究發(fā)現(xiàn)
4.1 數(shù)據(jù)層面
4.1.1 有用性
4.1.1.1 數(shù)據(jù)集總量
數(shù)據(jù)集通常是一組數(shù)據(jù)的集合,數(shù)據(jù)集的內(nèi)容通常以表格形式出現(xiàn),所對(duì)應(yīng)的是數(shù)據(jù)庫中的表。每列表代表一個(gè)特定的變量,并且每個(gè)行對(duì)應(yīng)于一個(gè)的數(shù)據(jù)樣本。政府?dāng)?shù)據(jù)開放平臺(tái)的數(shù)據(jù)集通常是可供下載的數(shù)據(jù)文件或者可以調(diào)用的API接口。
4.1.1.2 數(shù)據(jù)格式與機(jī)器可讀
機(jī)器可讀數(shù)據(jù)是可由計(jì)算機(jī)程序自動(dòng)讀取和處理的數(shù)據(jù)或元數(shù)據(jù)格式。機(jī)器可讀格式包括RDF、XML、JSON、CSV、XLS等格式。對(duì)各地政府?dāng)?shù)據(jù)開放平臺(tái)開放的數(shù)據(jù)格式分析得出,基本上所以的數(shù)據(jù)開放平臺(tái)都提供了可供用戶下載的數(shù)據(jù)格式,使用的格式包括CSV、XLS、XLSX、JSON、XML、TXT、RAR、ZIP、PDF、JPG、DOC、網(wǎng)頁鏈接和空間數(shù)等據(jù)格式類型。
4.1.1.3 元數(shù)據(jù)
本次研究選取DC元數(shù)據(jù)和W3C發(fā)布的針對(duì)開放數(shù)據(jù)的DCAT元數(shù)據(jù)的部分元素作為基本元數(shù)據(jù)來比較各政府?dāng)?shù)據(jù)開放平臺(tái)的元數(shù)據(jù)提供情況。主要使用的元數(shù)據(jù)元素有名稱、主題、描述、關(guān)鍵字、提供方、獲取權(quán)限、發(fā)布日期、更新日期、更新頻率、下載量、瀏覽量、格式、字節(jié)大小、語種、標(biāo)識(shí)符等15種基本元數(shù)據(jù)元素。目前我國政府?dāng)?shù)據(jù)開放平臺(tái)的元數(shù)據(jù)主要以描述性元數(shù)據(jù)為主,元數(shù)據(jù)的機(jī)器可讀性和互操作性相對(duì)較低。
4.1.2 可獲取性
4.1.2.1 自由下載
各地政府?dāng)?shù)據(jù)開放平臺(tái)大部分都要求需要登錄才能下載數(shù)據(jù)資源,只有少部分的平臺(tái)不需要登錄,可以直接下載數(shù)據(jù)。
4.1.2.2 提供API接口
政府?dāng)?shù)據(jù)開放平臺(tái)除了提供可下載的數(shù)據(jù)資源外,還提供部分?jǐn)?shù)據(jù)集的API接口。用戶可以調(diào)用API接口開發(fā)相關(guān)的程序和應(yīng)用軟件,是開放數(shù)據(jù)資源產(chǎn)生新的價(jià)值。選取的16個(gè)政府?dāng)?shù)據(jù)開放平臺(tái)中有12平臺(tái)開放了API接口,整體上來說大部分平臺(tái)都提供了API接口和使用說明并且形成了一定的規(guī)模,大部分平臺(tái)的API接口的調(diào)用需要向平臺(tái)提交申請(qǐng)。
4.1.3 開放授權(quán)
開放授權(quán)是指通過法律上保證數(shù)據(jù)的開放性,目前我國還沒有出臺(tái)關(guān)于數(shù)據(jù)開放權(quán)的法律,但各地的政府?dāng)?shù)據(jù)開放平臺(tái)都在網(wǎng)站的使用協(xié)議、網(wǎng)站聲明、免責(zé)條款或服務(wù)協(xié)議中對(duì)開放數(shù)據(jù)的使用進(jìn)行了授權(quán)和約束。
4.1.3.1 免費(fèi)獲取
目前我國已上線運(yùn)行的政府?dāng)?shù)據(jù)開放平臺(tái)還沒有對(duì)用戶收費(fèi)的項(xiàng)目,提供閱讀網(wǎng)站的使用協(xié)議、網(wǎng)站聲明或免職條款可以看出大部分的政府?dāng)?shù)據(jù)開放平臺(tái)都對(duì)用戶免費(fèi)獲取數(shù)據(jù)資源作了說明,但是各平臺(tái)的免費(fèi)范圍有所不同,可分為永久免費(fèi)、現(xiàn)階段免費(fèi)和為未明確免費(fèi)期限三種。
4.1.3.2 非歧視性
只有部分政府?dāng)?shù)據(jù)開放平臺(tái)的授權(quán)協(xié)議中提到了非歧視性,其余的政府?dāng)?shù)據(jù)開放平臺(tái)未明確說明非歧視性。大部分的政府?dāng)?shù)據(jù)開放平臺(tái)都需要用戶注冊(cè)登錄后才能下載數(shù)據(jù)資源,只有少部分的平臺(tái)可以直接下載資源,注冊(cè)用戶和未注冊(cè)用戶之間的區(qū)別也是一種歧視性的存在。
4.1.3.3 自由使用
部分平臺(tái)的中聲明用戶享有基于平臺(tái)提供的數(shù)據(jù)進(jìn)行商業(yè)性或非商業(yè)性的開發(fā)活動(dòng)、享有增值利用或自由使用的權(quán)利。其余各平臺(tái)為申明用戶自由使用的限度,但限制用戶有償轉(zhuǎn)賣或用于商業(yè)用途。
4.1.3.4 自由傳播與分享
對(duì)于用戶的自由傳播和分享權(quán)利了大多數(shù)平臺(tái)的開放授權(quán)協(xié)議都依據(jù)現(xiàn)有的著作權(quán)法、專利法等相關(guān)的知識(shí)產(chǎn)權(quán)法進(jìn)行了約束。部分平臺(tái)授權(quán)協(xié)議以知識(shí)產(chǎn)權(quán)法為依據(jù)限制用戶復(fù)制、傳播的權(quán)利可能會(huì)違背數(shù)據(jù)開放的原則。
4.2 平臺(tái)層面
4.2.1 易用性
4.2.1.1 檢索與瀏覽方式
檢索功能是用戶能夠通過【關(guān)鍵詞】的查找快速找到所需要的數(shù)據(jù)資源,基本上每個(gè)政府?dāng)?shù)據(jù)開放平臺(tái)都提供了使用【關(guān)鍵詞】對(duì)全部數(shù)據(jù)資源的檢索。
良好的瀏覽方式能夠幫助用戶方便快捷的找到數(shù)據(jù)資源,按照數(shù)據(jù)的主題或來源部門的分類方式進(jìn)行瀏覽,同時(shí)還要按照數(shù)據(jù)發(fā)布日期、更新日期、瀏覽量和下載次數(shù)進(jìn)行排列的功能。
4.2.1.2 數(shù)據(jù)預(yù)覽功能
數(shù)據(jù)預(yù)覽是用戶在下載數(shù)據(jù)前,可以在線查看數(shù)據(jù)集的全部或者部分內(nèi)容,根據(jù)情況決定是否下載數(shù)據(jù),這種功能功能能夠把數(shù)據(jù)集的一些不能通過標(biāo)題等描述方式的內(nèi)容呈現(xiàn)給用戶,使用戶能夠發(fā)現(xiàn)自己想要的數(shù)據(jù)資源。
4.2.1.3 數(shù)據(jù)統(tǒng)計(jì)分析與可視化工具
數(shù)據(jù)統(tǒng)計(jì)分析是政府?dāng)?shù)據(jù)開放平臺(tái)提供的對(duì)數(shù)據(jù)級(jí)的總量、分布、使用等情況的統(tǒng)計(jì)分析,可能幫助用戶了解平臺(tái)數(shù)據(jù)資源的構(gòu)成情況和使用情況。
4.2.1.4 數(shù)據(jù)應(yīng)用
政府?dāng)?shù)據(jù)開放平臺(tái)不但提供開放下載的數(shù)據(jù)資源,還展示了一些利用開放數(shù)據(jù)資源開發(fā)的應(yīng)用產(chǎn)品。
4.2.2 交流互動(dòng)
大部分平臺(tái)都提供了交流互動(dòng)的功能,比如咨詢建議、問卷調(diào)查、需求調(diào)查等交流互動(dòng)方式。還有的平臺(tái)提供了對(duì)數(shù)據(jù)資源的評(píng)價(jià)功能,比如給數(shù)據(jù)資源的滿意度進(jìn)行打分或者評(píng)論。
6 建議
6.1 加快數(shù)據(jù)開放立法工作
數(shù)據(jù)開放的立法應(yīng)當(dāng)立足于開放數(shù)據(jù)的基本原則,充分保障用戶在免于授權(quán)許可的條件下自由使用、傳播、分享數(shù)據(jù)的權(quán)利,保障用戶面授歧視的情況下獲取數(shù)據(jù)。制定數(shù)據(jù)產(chǎn)權(quán)保護(hù)、數(shù)據(jù)開放、隱私保護(hù)相關(guān)政策法規(guī)和標(biāo)準(zhǔn)體系;制定政府?dāng)?shù)據(jù)開放、互聯(lián)網(wǎng)信息服務(wù)管理、數(shù)據(jù)權(quán)屬、數(shù)據(jù)管理等相關(guān)立法。
6.2 以用戶需求作為數(shù)據(jù)集開放的導(dǎo)向
政府?dāng)?shù)開放平臺(tái)的數(shù)據(jù)集開放要以用戶需求為導(dǎo)向,采用需求調(diào)查和數(shù)據(jù)申請(qǐng)的形式,充分了解用戶迫切需要的數(shù)據(jù)類型和數(shù)據(jù)格式。分析用戶的偏好和潛在需求,提前制定好符合用戶需求的數(shù)據(jù)集開放計(jì)劃。通過網(wǎng)站和社交媒體上的互動(dòng)交流,采集公眾需求,不斷改進(jìn)完善自身工作,并為基于政府開放數(shù)據(jù)開發(fā)的應(yīng)用提供充分的展現(xiàn)平臺(tái),從而激勵(lì)社會(huì)的數(shù)據(jù)利用。
6.3 使用機(jī)器可讀格式和開放格式
政府?dāng)?shù)據(jù)開放平臺(tái)應(yīng)當(dāng)盡可能的提供以機(jī)器可讀格式和開放格式的數(shù)據(jù)集,盡可能的為每個(gè)數(shù)據(jù)集提供至少一個(gè)機(jī)器可讀格式。如果原始數(shù)據(jù)集不是機(jī)器可讀格式或開放格式,就需要進(jìn)行必要的格式轉(zhuǎn)換,將原有格式轉(zhuǎn)換成XLS或CSV等機(jī)器可讀格式或開放格式。
6.4 完善用戶授權(quán)協(xié)議
各地的政府?dāng)?shù)據(jù)開放平臺(tái)都在網(wǎng)站的使用協(xié)議、網(wǎng)站聲明、免責(zé)條款或服務(wù)協(xié)議應(yīng)當(dāng)詳細(xì)說明用戶的權(quán)利與義務(wù),制定出滿足用戶對(duì)數(shù)據(jù)集自由使用、傳播、和復(fù)制的使用需求的授權(quán)協(xié)議。政府?dāng)?shù)據(jù)開放的初衷是利用已有的數(shù)據(jù)集來創(chuàng)造出新的價(jià)值,如果對(duì)自由使用的權(quán)利進(jìn)行限制,這就違背了政府?dāng)?shù)據(jù)開放的初衷,不利于數(shù)據(jù)產(chǎn)生新的價(jià)值。
6.5建立統(tǒng)一規(guī)范的元數(shù)據(jù)標(biāo)準(zhǔn)
我國政府應(yīng)建立規(guī)范化和標(biāo)準(zhǔn)化的政府開放數(shù)據(jù)元數(shù)據(jù),借鑒和參考國外政府?dāng)?shù)據(jù)開放平臺(tái)成熟的元數(shù)據(jù)方案,依據(jù)W3C發(fā)布的針對(duì)政府?dāng)?shù)據(jù)開放的DCAT元數(shù)據(jù)的建立我國政府?dāng)?shù)據(jù)開放統(tǒng)一通用的元數(shù)據(jù)標(biāo)準(zhǔn),從而提高政府?dāng)?shù)據(jù)開放的元數(shù)據(jù)描述質(zhì)量,實(shí)現(xiàn)數(shù)據(jù)資源之間的互操作性。
7 結(jié)束語
我國政府?dāng)?shù)據(jù)開放仍處于起步階段,而且已經(jīng)有了幾年發(fā)展的成果和經(jīng)驗(yàn),上述研究發(fā)現(xiàn)的幾個(gè)問題都是目前我國地方政府?dāng)?shù)據(jù)開放平臺(tái)建設(shè)存在的不足,但是我國地方政府?dāng)?shù)據(jù)開放平臺(tái)一些較好的發(fā)展模式和建設(shè)方式,在建設(shè)全國統(tǒng)一的政府?dāng)?shù)據(jù)開放平臺(tái)時(shí)可以借鑒和學(xué)習(xí)。