曾俊軒,張 沙,戴能武
(長(zhǎng)江水利委員會(huì)網(wǎng)絡(luò)與信息中心,湖北 武漢 430010)
數(shù)據(jù)是水利信息化的核心,是各類水利業(yè)務(wù)應(yīng)用系統(tǒng)的支撐和基礎(chǔ)。隨著水利信息化進(jìn)程的不斷深入,各級(jí)政府、事業(yè)單位和社會(huì)公眾對(duì)流域內(nèi)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)的需求越來(lái)越大,要求也越來(lái)越高。社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)作為社會(huì)經(jīng)濟(jì)發(fā)展的脈搏,服務(wù)于防汛抗旱、水資源保護(hù)與管理、水土保持監(jiān)測(cè)與管理、水利工程建設(shè)與管理、農(nóng)村水電及電氣化管理、水利規(guī)劃設(shè)計(jì)管理等多種應(yīng)用業(yè)務(wù)[1],在流域管理與決策中發(fā)揮著越來(lái)越重要的作用。但是,目前可獲取到的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)大多只能提供到縣一級(jí),無(wú)法精確到鄉(xiāng)鎮(zhèn),因此對(duì)于縣級(jí)行政區(qū)中只有部分區(qū)劃在流域中的情況,如果直接使用社會(huì)經(jīng)濟(jì)數(shù)據(jù)將造成極大的誤差。
以長(zhǎng)江流域水行政管理數(shù)據(jù)庫(kù)中社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)應(yīng)用為例,從統(tǒng)計(jì)專題、指標(biāo)設(shè)計(jì)、指標(biāo)內(nèi)涵等方面分析社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)的特征,梳理了流域水行政管理中的數(shù)據(jù)應(yīng)用需求,提出一套以流域空間單元為劃分、以數(shù)據(jù)分?jǐn)倕R總為思路進(jìn)行社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)信息整合的應(yīng)用方案,并討論該方案的優(yōu)缺點(diǎn)。
社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)是社會(huì)經(jīng)濟(jì)組成要素在現(xiàn)實(shí)世界的時(shí)間與空間框架中運(yùn)動(dòng)與變化過程的反映[2],公布形式有統(tǒng)計(jì)年鑒、電子文檔、數(shù)據(jù)庫(kù)等。其中,統(tǒng)計(jì)年鑒主要根據(jù)政府公報(bào)、文件、國(guó)家重要報(bào)刊和各類統(tǒng)計(jì)報(bào)告的內(nèi)容精選編輯而成,內(nèi)容豐富、數(shù)據(jù)可靠,目前已成為了解和掌握我國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)各領(lǐng)域發(fā)展?fàn)顩r權(quán)威的、不可或缺的工具和資料來(lái)源。由于年鑒連續(xù)出版并提供逐年可比的資料與數(shù)據(jù),已吸引越來(lái)越多的用戶利用年鑒獲取所需的各種統(tǒng)計(jì)數(shù)據(jù)。
國(guó)家和地方各級(jí)統(tǒng)計(jì)局每年的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)龐大,從統(tǒng)計(jì)指標(biāo)內(nèi)容來(lái)看,涉及自然資源、國(guó)民經(jīng)濟(jì)核算、人口、就業(yè)人員和職工工資、科技教育衛(wèi)生、財(cái)政、物價(jià)指數(shù)、人民生活狀況、三大產(chǎn)業(yè)各種指數(shù)等主要方面;從統(tǒng)計(jì)范圍涉及的行政層級(jí)來(lái)看,主要分為省、市、縣3級(jí)。根據(jù)目前社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)的特點(diǎn),用戶在利用數(shù)據(jù)時(shí)需要注意以下問題:
1)部分統(tǒng)計(jì)專題在時(shí)間維度上不連續(xù)。例如,河南省統(tǒng)計(jì)年鑒 2001年市級(jí)統(tǒng)計(jì)數(shù)據(jù)有23個(gè)專題,2007年有29個(gè)專題,雖然統(tǒng)計(jì)的內(nèi)容大部分相同,但用戶在使用數(shù)據(jù)時(shí)仍可能遇到上一年存在的指標(biāo)在下一年卻空缺的情況。
2)不同行政區(qū)劃對(duì)統(tǒng)計(jì)指標(biāo)內(nèi)容和類型要求存在差異。首先,省、市、縣級(jí)統(tǒng)計(jì)指標(biāo)涵蓋范圍不完全一致,用戶在使用數(shù)據(jù)的過程中可能會(huì)出現(xiàn)某些指標(biāo)在省、市級(jí)存在而在縣級(jí)空缺的情況。例如,福建省 2009年的統(tǒng)計(jì)年鑒中包含了省、市級(jí)“有效灌溉面積”數(shù)據(jù),但縣級(jí)相應(yīng)指標(biāo)數(shù)據(jù)卻沒有。其次,年鑒中絕大部分市(自治州)目前尚無(wú)市轄區(qū)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù),用戶僅能查到部分直轄市市轄區(qū)的數(shù)據(jù)。例如,用戶可以在年鑒中找到2009年上海市轄區(qū)內(nèi)黃埔區(qū)的“年末總?cè)丝跀?shù)”,卻查不出江蘇省南京市轄區(qū)內(nèi)玄武區(qū)的“年末總?cè)丝跀?shù)”。
3)各地同類統(tǒng)計(jì)指標(biāo)的內(nèi)涵和單位不完全統(tǒng)一。例如,針對(duì)“總?cè)丝跀?shù)”,有些地區(qū)是按“戶籍人口數(shù)”統(tǒng)計(jì),而有些地區(qū)按“常住人口數(shù)”統(tǒng)計(jì)。又如,針對(duì)“總戶數(shù)”這一指標(biāo)單位,一般省、市級(jí)年鑒中是按“萬(wàn)戶”計(jì),而縣級(jí)年鑒中是按“戶”計(jì)。
只有注意到上述這些問題,才能科學(xué)合理地使用好統(tǒng)計(jì)年鑒中的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)。
長(zhǎng)江流域水行政管理數(shù)據(jù)庫(kù)中的社會(huì)經(jīng)濟(jì)數(shù)據(jù),主要包含行政區(qū)劃、人口、經(jīng)濟(jì)狀況、農(nóng)作物播種面積及產(chǎn)量等相關(guān)信息。社會(huì)經(jīng)濟(jì)信息在洪水調(diào)度預(yù)案評(píng)估、災(zāi)情跟蹤監(jiān)測(cè)與評(píng)估、水資源保護(hù)與管理、水土保持監(jiān)測(cè)與管理、水利工程建設(shè)與管理、農(nóng)村水電及電氣化管理、水利規(guī)劃設(shè)計(jì)管理等方面發(fā)揮重要作用,為防汛調(diào)度和指揮搶險(xiǎn)救災(zāi)提供科學(xué)決策依據(jù),為分析水土保持和水利工程建設(shè)對(duì)社會(huì)經(jīng)濟(jì)發(fā)展的影響提供數(shù)據(jù)支撐,為水利規(guī)劃設(shè)計(jì)提供重要的參考信息,從而提高流域管理的決策科學(xué)水平。
為了更好地服務(wù)于流域管理工作,水利信息工作者應(yīng)根據(jù)流域管理的應(yīng)用需求對(duì)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行一定的分析與處理,運(yùn)用科學(xué)的手段提煉出符合流域管理使用要求的社會(huì)經(jīng)濟(jì)數(shù)據(jù)。以下以長(zhǎng)江流域水行政管理數(shù)據(jù)庫(kù)為例,分析其對(duì)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)的應(yīng)用需求:
1)空間范圍應(yīng)針對(duì)長(zhǎng)江流域所轄行政區(qū)。長(zhǎng)江流域水行政管理工作主要是針對(duì)長(zhǎng)江流域范圍開展的,所以行政區(qū)范圍的正確性顯得尤為重要。長(zhǎng)江流域行政區(qū)劃應(yīng)根據(jù)長(zhǎng)江流域所管轄的范圍而定,提供包括19個(gè)省、市、自治區(qū)的社會(huì)經(jīng)濟(jì)數(shù)據(jù)。
2)數(shù)據(jù)統(tǒng)計(jì)范圍應(yīng)以長(zhǎng)江流域空間范圍為界。目前各級(jí)年鑒所涉及的社會(huì)經(jīng)濟(jì)數(shù)據(jù)是按行政區(qū)劃的全境范圍統(tǒng)計(jì)的,而行政區(qū)劃與流域范圍不完全重合,因此會(huì)出現(xiàn)某些指標(biāo)不僅包含長(zhǎng)江流域內(nèi)的數(shù)據(jù),還包含流域外的數(shù)據(jù)。例如,浙江省 2005年全省總?cè)丝跀?shù)為 4602.11萬(wàn)人,但該省在長(zhǎng)江流域內(nèi)的區(qū)域僅4個(gè)地級(jí)市、5個(gè)縣級(jí)市和7個(gè)縣,該省2005年流域內(nèi)的實(shí)際總?cè)丝跀?shù)應(yīng)為 818.57萬(wàn)人。從實(shí)際工作需要考慮,社會(huì)經(jīng)濟(jì)數(shù)據(jù)主要用于長(zhǎng)江流域范圍內(nèi)的管理工作,因此應(yīng)對(duì)獲得長(zhǎng)江流域相關(guān)行政區(qū)的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行處理,剔除長(zhǎng)江流域外的數(shù)據(jù),盡可能準(zhǔn)確地反映流域內(nèi)的社會(huì)經(jīng)濟(jì)狀況。
3)統(tǒng)計(jì)指標(biāo)數(shù)據(jù)應(yīng)進(jìn)行統(tǒng)一規(guī)整處理。對(duì)于調(diào)整變更后的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)總量指標(biāo)數(shù)據(jù),應(yīng)按照縣、市、省3級(jí)行政層級(jí)由下至上逐級(jí)調(diào)整和匯總,使得各級(jí)統(tǒng)計(jì)數(shù)據(jù)指標(biāo)單位統(tǒng)一,邏輯關(guān)系合理。這樣處理后的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù),結(jié)果更接近實(shí)際值,才能在流域空間范圍內(nèi)符合流域水行政管理的應(yīng)用需求。
首先要保證數(shù)據(jù)來(lái)源的正確性。資料來(lái)源主要是正規(guī)出版的按行業(yè)和行政區(qū)域分類的中央、地方、行業(yè)等年鑒數(shù)據(jù),如《中國(guó)統(tǒng)計(jì)年鑒》、《長(zhǎng)江年鑒》,以及長(zhǎng)江流域內(nèi)各省、自治區(qū)、直轄市的統(tǒng)計(jì)年鑒等。對(duì)于收集到的原始數(shù)據(jù),通過人工進(jìn)行格式統(tǒng)一、度量單位換算等初步加工,然后開展數(shù)據(jù)的填報(bào)工作。
從實(shí)際工作需要出發(fā),將行政區(qū)劃限定為流域管轄的范圍,以長(zhǎng)江流域?yàn)槔ㄉ虾J?、江蘇省、浙江省、安徽省、福建省、江西省、河南省、湖北省、湖南省、廣東省、廣西壯族自治區(qū)、重慶市、四川省、貴州省、云南省、西藏自治區(qū)、陜西省、甘肅省、青海省等19個(gè)省級(jí)行政區(qū)劃,以及包含的120個(gè)市(不含所屬市轄區(qū)),683個(gè)縣共 822個(gè)行政區(qū)域。如果行政區(qū)域有變更,則應(yīng)根據(jù)實(shí)際情況及時(shí)進(jìn)行調(diào)整。
對(duì)于部分面積在長(zhǎng)江流域內(nèi)的行政區(qū)域,應(yīng)針對(duì)“人口”、“面積”等總量指標(biāo)進(jìn)行一定比例的分?jǐn)傆?jì)算,得出最接近實(shí)際情況的數(shù)據(jù)值。
從當(dāng)前年鑒中可獲取的統(tǒng)計(jì)數(shù)據(jù)來(lái)看,選取面積百分?jǐn)?shù)為分?jǐn)偙壤^為合適,即土地面積只有部分位于長(zhǎng)江流域的區(qū)域,百分?jǐn)?shù)表示屬于長(zhǎng)江流域面積占全市、縣、區(qū)的百分比。例如,統(tǒng)計(jì)年鑒中江西省贛州市安遠(yuǎn)縣 2010年的“耕地面積”值為11082.00萬(wàn)m2,同時(shí)根據(jù)年鑒,該縣有 74% 的面積屬于長(zhǎng)江流域,按此面積占比估算,該縣在長(zhǎng)江流域中的“耕地面積”約為 8200.68萬(wàn)m2。
數(shù)據(jù)的填報(bào)應(yīng)按行政層級(jí)從下至上,由縣級(jí)逐級(jí)向上計(jì)算并調(diào)整。數(shù)據(jù)的調(diào)整修正包括以下幾種情況:
1)縣級(jí)數(shù)據(jù)。當(dāng)年鑒中有較全面的縣級(jí)統(tǒng)計(jì)數(shù)據(jù),且該縣面積在長(zhǎng)江流域所占面積的比例明確時(shí),可直接將原始統(tǒng)計(jì)數(shù)據(jù)乘以該百分比即能獲得修正后的縣級(jí)數(shù)據(jù)。計(jì)算公式為
縣級(jí)數(shù)據(jù) =年鑒原始縣級(jí)統(tǒng)計(jì)數(shù)據(jù)×縣級(jí)面積占比
2)市級(jí)數(shù)據(jù)。年鑒中一般只包含市級(jí)統(tǒng)計(jì)數(shù)據(jù),而缺少市所屬市轄區(qū)的數(shù)據(jù)(直轄市除外)。在計(jì)算“人口”、“面積”等總量指標(biāo)值時(shí),如果直接將某市所轄縣修正后的統(tǒng)計(jì)數(shù)據(jù)求和,會(huì)因缺少市轄區(qū)的數(shù)據(jù)使求和后的市級(jí)數(shù)據(jù)小于實(shí)際值。因此,考慮年鑒中有原始的縣級(jí)和市級(jí)統(tǒng)計(jì)數(shù)據(jù),且假定市轄區(qū)面積完全在長(zhǎng)江流域中,以原始的市級(jí)數(shù)據(jù)減去此市所轄縣不在長(zhǎng)江流域內(nèi)的數(shù)據(jù),可以得到修正后的市級(jí)數(shù)據(jù)。計(jì)算公式為
市級(jí)數(shù)據(jù) =年鑒原始市級(jí)統(tǒng)計(jì)數(shù)據(jù) -∑[年鑒原始縣級(jí)統(tǒng)計(jì)數(shù)據(jù)×(1-縣級(jí)面積占比)]
3)省級(jí)數(shù)據(jù)。省級(jí)數(shù)據(jù)直接由修正后的市級(jí)數(shù)據(jù)匯總得到。計(jì)算公式為
省級(jí)數(shù)據(jù) = ∑市級(jí)數(shù)據(jù)。
數(shù)據(jù)填報(bào)時(shí)采用人工校核和自動(dòng)演算相結(jié)合的方式,采用以下4個(gè)步驟對(duì)數(shù)據(jù)進(jìn)行處理:
1)縣級(jí)數(shù)據(jù)填報(bào)(人工)。通過手動(dòng)方式,對(duì)年鑒中的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行填報(bào),錄入初始的未經(jīng)分?jǐn)偟脑伎h級(jí)統(tǒng)計(jì)數(shù)據(jù)和縣級(jí)面積占比。
2)縣級(jí)數(shù)據(jù)分?jǐn)偅ㄗ詣?dòng))。使用錄入的原始縣級(jí)統(tǒng)計(jì)數(shù)據(jù)和縣級(jí)面積占比,自動(dòng)計(jì)算生成調(diào)整后的縣級(jí)數(shù)據(jù)和由調(diào)整后的縣級(jí)數(shù)據(jù)向上匯總成的市級(jí)數(shù)據(jù)(市級(jí)數(shù)據(jù)僅作為后續(xù)填報(bào)和調(diào)整的參考)。
3)市級(jí)數(shù)據(jù)調(diào)整(人工)。由人工對(duì)市級(jí)數(shù)據(jù)進(jìn)行調(diào)整,即通過原始市級(jí)數(shù)據(jù)減去此市所轄的縣不在長(zhǎng)江流域內(nèi)的數(shù)據(jù)獲得調(diào)整后的市級(jí)數(shù)據(jù)。
4)省級(jí)數(shù)據(jù)匯總(自動(dòng))。填報(bào)過程中由程序?qū)φ{(diào)整后的市級(jí)數(shù)據(jù)自動(dòng)匯總,生成省級(jí)數(shù)據(jù),完成所有數(shù)據(jù)的填報(bào)。
使用數(shù)據(jù)分?jǐn)倕R總的方法,具有數(shù)據(jù)來(lái)源可靠、操作簡(jiǎn)便、準(zhǔn)確性高等優(yōu)點(diǎn),可以獲得更符合流域管理要求的社會(huì)經(jīng)濟(jì)數(shù)據(jù)。但是,受限于年鑒發(fā)布時(shí)間較晚、市轄區(qū)數(shù)據(jù)缺失等因素,此方法在數(shù)據(jù)時(shí)效性和數(shù)據(jù)精度方面還有進(jìn)一步提高的空間。
1)數(shù)據(jù)來(lái)源可靠。數(shù)據(jù)主要來(lái)源于統(tǒng)計(jì)年鑒。統(tǒng)計(jì)年鑒是國(guó)家統(tǒng)計(jì)局編印的一種資料性年刊,是我國(guó)最全面、最具權(quán)威性的綜合統(tǒng)計(jì)年鑒,能全面反映中華人民共和國(guó)經(jīng)濟(jì)和社會(huì)發(fā)展情況。方案中通過年鑒采集數(shù)據(jù),在保證數(shù)據(jù)質(zhì)量的同時(shí),也具有較強(qiáng)的可持續(xù)操作性,便于定期對(duì)社會(huì)經(jīng)濟(jì)數(shù)據(jù)更新,保持?jǐn)?shù)據(jù)的生命力。
2)操作方法簡(jiǎn)單,準(zhǔn)確性高。數(shù)據(jù)分?jǐn)偤妥詣?dòng)匯總功能是通過程序自動(dòng)計(jì)算并生成結(jié)果的,因此在輸入時(shí)只需要填報(bào)原始的年鑒數(shù)據(jù),并提供適當(dāng)?shù)姆謹(jǐn)偙壤纯勺詣?dòng)生成數(shù)據(jù),再經(jīng)過部分人工校正即可獲取最終的填報(bào)數(shù)據(jù),節(jié)省人力投入,減少產(chǎn)生錯(cuò)誤的可能性。
3)數(shù)據(jù)更符合實(shí)際情況,邏輯合理性更強(qiáng)。對(duì)于流域應(yīng)用而言,如果直接使用年鑒中的數(shù)據(jù),則對(duì)部分行政區(qū)劃與流域交叉較少的省份會(huì)出現(xiàn)較大的數(shù)據(jù)偏差。如浙江省 2005年全省總?cè)丝跀?shù)為4602.11萬(wàn)人,但該省在 2005年流域內(nèi)的實(shí)際總?cè)丝跀?shù)應(yīng)為 818.57萬(wàn)人,如果不經(jīng)處理直接使用,則數(shù)據(jù)相差5倍,在應(yīng)用時(shí)會(huì)造成較大偏差。
1)數(shù)據(jù)時(shí)效性不高?!吨袊?guó)統(tǒng)計(jì)年鑒》一般發(fā)行于下半年,年鑒中提供的是上一年的社會(huì)經(jīng)濟(jì)數(shù)據(jù),如果再加上年鑒的獲取和數(shù)據(jù)填報(bào)復(fù)核的時(shí)間,獲得最終填報(bào)數(shù)據(jù)的日期至少會(huì)延遲1a 半以上,存在一定的遲滯性。但考慮社會(huì)經(jīng)濟(jì)發(fā)展在幾年之內(nèi)變化幅度不大,且社會(huì)經(jīng)濟(jì)數(shù)據(jù)僅提供決策評(píng)估參考,因此這一點(diǎn)對(duì)數(shù)據(jù)的正常使用影響較小。
2)數(shù)據(jù)精度有待提高。社會(huì)經(jīng)濟(jì)發(fā)展在地域上存在不均勻性,人口、耕地、工農(nóng)業(yè)等分布會(huì)因?yàn)楦鞣N環(huán)境和社會(huì)因素而改變,因此如果簡(jiǎn)單地通過使用面積占比來(lái)獲取流域內(nèi)的相關(guān)社會(huì)經(jīng)濟(jì)數(shù)據(jù),獲得的僅僅是一種理想狀態(tài)下的均值。而且,計(jì)算過程中由于缺乏市轄區(qū)數(shù)據(jù)而假設(shè)市轄區(qū)面積完全在流域內(nèi),與實(shí)際情況也會(huì)存在一定的差異。因此,需進(jìn)一步探索并獲取更準(zhǔn)確的社會(huì)經(jīng)濟(jì)分布比例和缺失數(shù)據(jù),再通過這種比例分?jǐn)偟姆椒ǐ@得接近真實(shí)狀況的數(shù)據(jù),進(jìn)一步提高數(shù)據(jù)精度。
使用數(shù)據(jù)分?jǐn)倕R總方法對(duì)社會(huì)經(jīng)濟(jì)指標(biāo)進(jìn)行填報(bào),使填報(bào)的數(shù)據(jù)更接近真實(shí)的區(qū)域內(nèi)社會(huì)經(jīng)濟(jì)指標(biāo)數(shù)據(jù),對(duì)汛情和旱情評(píng)估提供更準(zhǔn)確的參考數(shù)據(jù)。使用人工校核和自動(dòng)演算相結(jié)合的方法,不僅提高了效率,也減少了人工填報(bào)計(jì)算時(shí)的錯(cuò)誤率,保證了數(shù)據(jù)質(zhì)量。目前,此方法已應(yīng)用于長(zhǎng)江流域2008—2009年社會(huì)經(jīng)濟(jì)數(shù)據(jù)填報(bào),在獲得水利系統(tǒng)內(nèi)各級(jí)領(lǐng)導(dǎo)和長(zhǎng)江委防汛抗旱、水資源管理等各業(yè)務(wù)主管單位認(rèn)可的同時(shí),保證了數(shù)據(jù)的準(zhǔn)確性,有效地提高了數(shù)據(jù)的質(zhì)量和用戶的滿意度。
[1] 水利部信息化工作領(lǐng)導(dǎo)小組辦公室.全國(guó)水利信息化規(guī)劃[S].北京:水利部信息化工作領(lǐng)導(dǎo)小組辦公室,2003:51-61.
[2] 羅麗華.社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)時(shí)空數(shù)據(jù)服務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].開封:河南大學(xué),2007: 4.