摘要:基于問卷調(diào)研數(shù)據(jù),從農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)、人才隊伍建設(shè)、發(fā)展環(huán)境建設(shè)和信息資源建設(shè)等4個方面篩選整理了18個具體評價指標,在此基礎(chǔ)上采用聚類分析法將我國26個省份依照農(nóng)業(yè)信息化發(fā)展水平分為6類,對分類結(jié)果進行了分析,并提出了縮小區(qū)域農(nóng)業(yè)信息化發(fā)展水平差距、提高農(nóng)業(yè)信息化發(fā)展水平的相關(guān)政策建議。
關(guān)鍵詞:聚類分析;農(nóng)業(yè)信息化;發(fā)展水平;評價研究;省際差異;政策建議
中圖分類號: S126文獻標志碼: A文章編號:1002-1302(2014)09-0462-04
收稿日期:2013-11-04
基金項目:北京市農(nóng)林科學院科技創(chuàng)新能力建設(shè)專項;“三電合一”農(nóng)業(yè)信息服務(wù)項目。
作者簡介:崔利國(1987—),男,河北邢臺人,碩士,助理工程師,研究方向為農(nóng)業(yè)農(nóng)村信息化發(fā)展戰(zhàn)略。Tel:(010)51503643;E-mail:cuilg@nercita.org.cn。
通信作者:李瑾,博士,副研究員,研究方向為農(nóng)業(yè)與農(nóng)村信息化。E-mail:lij@nercita.org.cn。農(nóng)業(yè)信息化正在成為我國實現(xiàn)農(nóng)業(yè)現(xiàn)代化的重要途徑,在提高農(nóng)業(yè)生產(chǎn)效率、增加農(nóng)民收入、保障國家糧食安全、推進城鎮(zhèn)化建設(shè)等方面均發(fā)揮了積極影響。2005年以來,中央一號文件均從不同角度對農(nóng)業(yè)信息化建設(shè)作出指示,各地政府、科研院所和涉農(nóng)企業(yè)也在推進農(nóng)業(yè)信息化工作方面熱情高漲,農(nóng)業(yè)信息化評價研究也成為近年來學術(shù)研究的熱點。近年來,不少學者對我國農(nóng)業(yè)信息化發(fā)展水平進行了研究,研究方向主要分為2個方面:一是農(nóng)業(yè)信息化發(fā)展水平評價體系的理論研究,并基于構(gòu)建的評價體系對全國或某一地區(qū)的農(nóng)業(yè)信息化發(fā)展水平進行定量研究[1-5]。有學者從農(nóng)業(yè)信息化基礎(chǔ)設(shè)施、技術(shù)裝備、應(yīng)用水平、主體水平、農(nóng)業(yè)信息化對農(nóng)業(yè)發(fā)展的貢獻以及農(nóng)業(yè)信息化政策環(huán)境等方面篩選了24個指標,初步建立了農(nóng)業(yè)信息化發(fā)展水平評價體系[6]。二是對地區(qū)間農(nóng)業(yè)信息化發(fā)展水平的評價研究。如有學者基于信息資源、信息應(yīng)用、信息產(chǎn)業(yè)和信息人才等指標對山區(qū)縣域農(nóng)村信息化發(fā)展水平進行了研究[7],也有學者采取線性加權(quán)函數(shù)法和層次分析法對地市級農(nóng)業(yè)信息化發(fā)展水平展開評價和分析[8]。此外,還有學者利用神經(jīng)網(wǎng)絡(luò)模型對省際間信息化發(fā)展水平進行綜合評價與分析[9],這對比較我國省際間農(nóng)業(yè)信息化發(fā)展水平具有借鑒意義。目前,我國在農(nóng)業(yè)信息水平評價研究方面處于探索期,官方和學術(shù)界還沒有形成權(quán)威的評價指標和完善的評價體系。學者們在研究農(nóng)業(yè)信息化發(fā)展水平上主要是從地區(qū)經(jīng)濟發(fā)展水平、農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)、農(nóng)業(yè)信息資源開發(fā)利用、農(nóng)業(yè)信息技術(shù)和裝備應(yīng)用水平以及農(nóng)業(yè)信息化人才隊伍建設(shè)等方面著手,但由于指標選擇上存在不一致,分析結(jié)果也往往存在差異。本研究參考已有學者的研究結(jié)論和指標體系建立方法,并結(jié)合已有的調(diào)研數(shù)據(jù)對我國主要省份的農(nóng)業(yè)信息化發(fā)展水平進行比較研究,目的在于分析各個省份的農(nóng)業(yè)信息化發(fā)展水平及其在全國所處的地位,為國家農(nóng)業(yè)信息化主管部門和地方政府制定針對性的農(nóng)業(yè)信息化發(fā)展戰(zhàn)略提供支撐。
1研究方法與數(shù)據(jù)說明
1.1研究方法
1.1.1聚類分析方法概述農(nóng)業(yè)信息化水平評價方法有神經(jīng)網(wǎng)絡(luò)模型[9]、因子分析法[10]和主成分分析法[11]等,盡管這些方法能夠?qū)Χ鄠€對象的農(nóng)業(yè)信息化水平進行較為客觀的評價,但這些方法僅限于通過排序比較省際間農(nóng)業(yè)信息化水平而不能有效地歸類并尋找同類水平之間的共性和不同類水平之間的差異性,但聚類分析方法卻可以解決這一問題,因此本研究選擇聚類分析法來對我國各地區(qū)農(nóng)業(yè)信息化發(fā)展水平進行評價研究。
自古以來,人們所講的“物以類聚,人以群分”說的就是聚類,而在現(xiàn)代社會聚類分析是數(shù)據(jù)挖掘的一種方法,是指把整個數(shù)據(jù)分成不同的組,并使組與組之間的差距盡可能大,組內(nèi)數(shù)據(jù)的差異盡可能小。聚類分析根據(jù)研究對象的不同分為Q型聚類分析和R型聚類分析,Q型聚類是指對樣品進行聚類,R型聚類是指對變量進行聚類[12]。聚類不同于日常所說的分類,因為在分析之前并沒有具體的劃分標準,屬于一種無監(jiān)督學習[13]。聚類分析用于研究地區(qū)某一指標發(fā)展水平的文獻也有很多[10-11,14-15],而隨著我國農(nóng)業(yè)信息化水平的不斷提高和研究的不斷深入,采用聚類分析等定量分析工具對我國各省份農(nóng)業(yè)信息化發(fā)展水平進行評價和比較成為推動我國農(nóng)業(yè)信息化水平持續(xù)發(fā)展的重要環(huán)節(jié)和手段,當前已經(jīng)成為非常迫切的一個問題。
1.1.2聚類分析方法的數(shù)學步驟在聚類分析中,通常用G表示類,其中包含m個變量,一般用xi=(i=1,2,…,m)來表示,dij表示變量xi與xj之間的距離,DKL表示類GK與類GL之間的距離。類與類之間定義距離的方法有很多,常用的系統(tǒng)聚類方法有最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和法等,本研究采用類平均法來定義類與類間的距離,因為類平均法很好地利用了所有樣品之間的信息,在很多情況下它被認為是一種比較好的系統(tǒng)聚類法。類平均法定義的類GK與類GL之間的平方距離為:
1.2數(shù)據(jù)說明
1.2.1數(shù)據(jù)來源本研究所用數(shù)據(jù)來自農(nóng)業(yè)部農(nóng)業(yè)農(nóng)村信息化發(fā)展戰(zhàn)略研究課題組問卷調(diào)研,問卷內(nèi)容主要涵蓋農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)、農(nóng)業(yè)信息化人才建設(shè)、農(nóng)業(yè)信息化發(fā)展環(huán)境、農(nóng)業(yè)信息資源建設(shè)等4個方面,數(shù)據(jù)為2012年的省級面板數(shù)據(jù)。調(diào)研范圍涵蓋大陸全部30個?。ㄊ?、區(qū)),但由于部分省份的重要變量缺失,研究過程中剔除了河北、云南、新疆和廣西4個省份,具體研究中只包括26個省份的樣本數(shù)據(jù)。
1.2.2變量設(shè)定從已有的研究成果中不難發(fā)現(xiàn),農(nóng)業(yè)信息化技術(shù)應(yīng)用水平是衡量一個地區(qū)農(nóng)業(yè)信息化發(fā)展水平的重要指標之一,本研究在樣本數(shù)據(jù)選擇上并沒有選擇農(nóng)業(yè)信息化技術(shù)應(yīng)用情況的主要原因在于從調(diào)查問卷整理的數(shù)據(jù)結(jié)果中,關(guān)于農(nóng)業(yè)信息化技術(shù)應(yīng)用水平的調(diào)查選項不多,調(diào)查數(shù)據(jù)也不理想,導致在實際操作的時候數(shù)據(jù)確實無法使用,其他相關(guān)統(tǒng)計指標如表1所示。表1農(nóng)業(yè)信息化發(fā)展水平評價指標
目標層準則層指標層農(nóng)業(yè)信息化發(fā)展水平農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)固定電話普及率移動電話普及率電腦普及率已接入有線電視行政村比重接通寬帶的鄉(xiāng)鎮(zhèn)比重光纖傳輸網(wǎng)是否到村農(nóng)業(yè)信息化人才建設(shè)農(nóng)業(yè)信息中心工作人員數(shù)量農(nóng)業(yè)信息化發(fā)展環(huán)境農(nóng)業(yè)農(nóng)村信息化資金投入是否成立縣級農(nóng)業(yè)農(nóng)村信息化工作領(lǐng)導小組是否制定全省相關(guān)農(nóng)業(yè)農(nóng)村信息化工程規(guī)劃是否建立了農(nóng)業(yè)農(nóng)村信息化建設(shè)資金統(tǒng)籌管理制度農(nóng)業(yè)行政主管部門是否有農(nóng)業(yè)農(nóng)村信息化投入專項是否設(shè)有農(nóng)業(yè)農(nóng)村信息化行政管理機構(gòu)是否有兼職管理員農(nóng)業(yè)信息資源建設(shè)有無獨立農(nóng)口政府網(wǎng)站農(nóng)業(yè)數(shù)據(jù)庫數(shù)量數(shù)據(jù)年增長率是否建有內(nèi)部網(wǎng)絡(luò)辦公平臺
由于上述指標是由多個要素構(gòu)成的,各個要素數(shù)據(jù)具有不同的單位和量綱,其數(shù)值的變異很大,這會對分類結(jié)果產(chǎn)生一定的影響。因此,在進行聚類分析之前,首先要對聚類要素進行一定的預(yù)處理,消除各個要素之間的量綱差異。聚類分析中常用的數(shù)據(jù)預(yù)處理方法有中心化變換、規(guī)格化變換和標準化變換,本研究采用標準化變換對數(shù)據(jù)進行預(yù)處理,變換公式為:
2實證分析
采用MATLAB R2012b軟件首先對樣本數(shù)據(jù)進行標準化變換,之后運用類平均法將26個省份間的歐式距離進行測算,并在此基礎(chǔ)上創(chuàng)建系統(tǒng)聚類樹(圖1)。
根據(jù)圖1的聚類結(jié)果并結(jié)合我國各?。ㄊ?、區(qū))農(nóng)業(yè)農(nóng)村信息化發(fā)展實際經(jīng)驗,本研究將26個?。ㄊ?、區(qū))的農(nóng)業(yè)信息化發(fā)展水平從高到低歸納為6類(表2),具體分類結(jié)果如下:
摘要:基于問卷調(diào)研數(shù)據(jù),從農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)、人才隊伍建設(shè)、發(fā)展環(huán)境建設(shè)和信息資源建設(shè)等4個方面篩選整理了18個具體評價指標,在此基礎(chǔ)上采用聚類分析法將我國26個省份依照農(nóng)業(yè)信息化發(fā)展水平分為6類,對分類結(jié)果進行了分析,并提出了縮小區(qū)域農(nóng)業(yè)信息化發(fā)展水平差距、提高農(nóng)業(yè)信息化發(fā)展水平的相關(guān)政策建議。
關(guān)鍵詞:聚類分析;農(nóng)業(yè)信息化;發(fā)展水平;評價研究;省際差異;政策建議
中圖分類號: S126文獻標志碼: A文章編號:1002-1302(2014)09-0462-04
收稿日期:2013-11-04
基金項目:北京市農(nóng)林科學院科技創(chuàng)新能力建設(shè)專項;“三電合一”農(nóng)業(yè)信息服務(wù)項目。
作者簡介:崔利國(1987—),男,河北邢臺人,碩士,助理工程師,研究方向為農(nóng)業(yè)農(nóng)村信息化發(fā)展戰(zhàn)略。Tel:(010)51503643;E-mail:cuilg@nercita.org.cn。
通信作者:李瑾,博士,副研究員,研究方向為農(nóng)業(yè)與農(nóng)村信息化。E-mail:lij@nercita.org.cn。農(nóng)業(yè)信息化正在成為我國實現(xiàn)農(nóng)業(yè)現(xiàn)代化的重要途徑,在提高農(nóng)業(yè)生產(chǎn)效率、增加農(nóng)民收入、保障國家糧食安全、推進城鎮(zhèn)化建設(shè)等方面均發(fā)揮了積極影響。2005年以來,中央一號文件均從不同角度對農(nóng)業(yè)信息化建設(shè)作出指示,各地政府、科研院所和涉農(nóng)企業(yè)也在推進農(nóng)業(yè)信息化工作方面熱情高漲,農(nóng)業(yè)信息化評價研究也成為近年來學術(shù)研究的熱點。近年來,不少學者對我國農(nóng)業(yè)信息化發(fā)展水平進行了研究,研究方向主要分為2個方面:一是農(nóng)業(yè)信息化發(fā)展水平評價體系的理論研究,并基于構(gòu)建的評價體系對全國或某一地區(qū)的農(nóng)業(yè)信息化發(fā)展水平進行定量研究[1-5]。有學者從農(nóng)業(yè)信息化基礎(chǔ)設(shè)施、技術(shù)裝備、應(yīng)用水平、主體水平、農(nóng)業(yè)信息化對農(nóng)業(yè)發(fā)展的貢獻以及農(nóng)業(yè)信息化政策環(huán)境等方面篩選了24個指標,初步建立了農(nóng)業(yè)信息化發(fā)展水平評價體系[6]。二是對地區(qū)間農(nóng)業(yè)信息化發(fā)展水平的評價研究。如有學者基于信息資源、信息應(yīng)用、信息產(chǎn)業(yè)和信息人才等指標對山區(qū)縣域農(nóng)村信息化發(fā)展水平進行了研究[7],也有學者采取線性加權(quán)函數(shù)法和層次分析法對地市級農(nóng)業(yè)信息化發(fā)展水平展開評價和分析[8]。此外,還有學者利用神經(jīng)網(wǎng)絡(luò)模型對省際間信息化發(fā)展水平進行綜合評價與分析[9],這對比較我國省際間農(nóng)業(yè)信息化發(fā)展水平具有借鑒意義。目前,我國在農(nóng)業(yè)信息水平評價研究方面處于探索期,官方和學術(shù)界還沒有形成權(quán)威的評價指標和完善的評價體系。學者們在研究農(nóng)業(yè)信息化發(fā)展水平上主要是從地區(qū)經(jīng)濟發(fā)展水平、農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)、農(nóng)業(yè)信息資源開發(fā)利用、農(nóng)業(yè)信息技術(shù)和裝備應(yīng)用水平以及農(nóng)業(yè)信息化人才隊伍建設(shè)等方面著手,但由于指標選擇上存在不一致,分析結(jié)果也往往存在差異。本研究參考已有學者的研究結(jié)論和指標體系建立方法,并結(jié)合已有的調(diào)研數(shù)據(jù)對我國主要省份的農(nóng)業(yè)信息化發(fā)展水平進行比較研究,目的在于分析各個省份的農(nóng)業(yè)信息化發(fā)展水平及其在全國所處的地位,為國家農(nóng)業(yè)信息化主管部門和地方政府制定針對性的農(nóng)業(yè)信息化發(fā)展戰(zhàn)略提供支撐。
1研究方法與數(shù)據(jù)說明
1.1研究方法
1.1.1聚類分析方法概述農(nóng)業(yè)信息化水平評價方法有神經(jīng)網(wǎng)絡(luò)模型[9]、因子分析法[10]和主成分分析法[11]等,盡管這些方法能夠?qū)Χ鄠€對象的農(nóng)業(yè)信息化水平進行較為客觀的評價,但這些方法僅限于通過排序比較省際間農(nóng)業(yè)信息化水平而不能有效地歸類并尋找同類水平之間的共性和不同類水平之間的差異性,但聚類分析方法卻可以解決這一問題,因此本研究選擇聚類分析法來對我國各地區(qū)農(nóng)業(yè)信息化發(fā)展水平進行評價研究。
自古以來,人們所講的“物以類聚,人以群分”說的就是聚類,而在現(xiàn)代社會聚類分析是數(shù)據(jù)挖掘的一種方法,是指把整個數(shù)據(jù)分成不同的組,并使組與組之間的差距盡可能大,組內(nèi)數(shù)據(jù)的差異盡可能小。聚類分析根據(jù)研究對象的不同分為Q型聚類分析和R型聚類分析,Q型聚類是指對樣品進行聚類,R型聚類是指對變量進行聚類[12]。聚類不同于日常所說的分類,因為在分析之前并沒有具體的劃分標準,屬于一種無監(jiān)督學習[13]。聚類分析用于研究地區(qū)某一指標發(fā)展水平的文獻也有很多[10-11,14-15],而隨著我國農(nóng)業(yè)信息化水平的不斷提高和研究的不斷深入,采用聚類分析等定量分析工具對我國各省份農(nóng)業(yè)信息化發(fā)展水平進行評價和比較成為推動我國農(nóng)業(yè)信息化水平持續(xù)發(fā)展的重要環(huán)節(jié)和手段,當前已經(jīng)成為非常迫切的一個問題。
1.1.2聚類分析方法的數(shù)學步驟在聚類分析中,通常用G表示類,其中包含m個變量,一般用xi=(i=1,2,…,m)來表示,dij表示變量xi與xj之間的距離,DKL表示類GK與類GL之間的距離。類與類之間定義距離的方法有很多,常用的系統(tǒng)聚類方法有最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和法等,本研究采用類平均法來定義類與類間的距離,因為類平均法很好地利用了所有樣品之間的信息,在很多情況下它被認為是一種比較好的系統(tǒng)聚類法。類平均法定義的類GK與類GL之間的平方距離為:
1.2數(shù)據(jù)說明
1.2.1數(shù)據(jù)來源本研究所用數(shù)據(jù)來自農(nóng)業(yè)部農(nóng)業(yè)農(nóng)村信息化發(fā)展戰(zhàn)略研究課題組問卷調(diào)研,問卷內(nèi)容主要涵蓋農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)、農(nóng)業(yè)信息化人才建設(shè)、農(nóng)業(yè)信息化發(fā)展環(huán)境、農(nóng)業(yè)信息資源建設(shè)等4個方面,數(shù)據(jù)為2012年的省級面板數(shù)據(jù)。調(diào)研范圍涵蓋大陸全部30個?。ㄊ?、區(qū)),但由于部分省份的重要變量缺失,研究過程中剔除了河北、云南、新疆和廣西4個省份,具體研究中只包括26個省份的樣本數(shù)據(jù)。
1.2.2變量設(shè)定從已有的研究成果中不難發(fā)現(xiàn),農(nóng)業(yè)信息化技術(shù)應(yīng)用水平是衡量一個地區(qū)農(nóng)業(yè)信息化發(fā)展水平的重要指標之一,本研究在樣本數(shù)據(jù)選擇上并沒有選擇農(nóng)業(yè)信息化技術(shù)應(yīng)用情況的主要原因在于從調(diào)查問卷整理的數(shù)據(jù)結(jié)果中,關(guān)于農(nóng)業(yè)信息化技術(shù)應(yīng)用水平的調(diào)查選項不多,調(diào)查數(shù)據(jù)也不理想,導致在實際操作的時候數(shù)據(jù)確實無法使用,其他相關(guān)統(tǒng)計指標如表1所示。表1農(nóng)業(yè)信息化發(fā)展水平評價指標
目標層準則層指標層農(nóng)業(yè)信息化發(fā)展水平農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)固定電話普及率移動電話普及率電腦普及率已接入有線電視行政村比重接通寬帶的鄉(xiāng)鎮(zhèn)比重光纖傳輸網(wǎng)是否到村農(nóng)業(yè)信息化人才建設(shè)農(nóng)業(yè)信息中心工作人員數(shù)量農(nóng)業(yè)信息化發(fā)展環(huán)境農(nóng)業(yè)農(nóng)村信息化資金投入是否成立縣級農(nóng)業(yè)農(nóng)村信息化工作領(lǐng)導小組是否制定全省相關(guān)農(nóng)業(yè)農(nóng)村信息化工程規(guī)劃是否建立了農(nóng)業(yè)農(nóng)村信息化建設(shè)資金統(tǒng)籌管理制度農(nóng)業(yè)行政主管部門是否有農(nóng)業(yè)農(nóng)村信息化投入專項是否設(shè)有農(nóng)業(yè)農(nóng)村信息化行政管理機構(gòu)是否有兼職管理員農(nóng)業(yè)信息資源建設(shè)有無獨立農(nóng)口政府網(wǎng)站農(nóng)業(yè)數(shù)據(jù)庫數(shù)量數(shù)據(jù)年增長率是否建有內(nèi)部網(wǎng)絡(luò)辦公平臺
由于上述指標是由多個要素構(gòu)成的,各個要素數(shù)據(jù)具有不同的單位和量綱,其數(shù)值的變異很大,這會對分類結(jié)果產(chǎn)生一定的影響。因此,在進行聚類分析之前,首先要對聚類要素進行一定的預(yù)處理,消除各個要素之間的量綱差異。聚類分析中常用的數(shù)據(jù)預(yù)處理方法有中心化變換、規(guī)格化變換和標準化變換,本研究采用標準化變換對數(shù)據(jù)進行預(yù)處理,變換公式為:
2實證分析
采用MATLAB R2012b軟件首先對樣本數(shù)據(jù)進行標準化變換,之后運用類平均法將26個省份間的歐式距離進行測算,并在此基礎(chǔ)上創(chuàng)建系統(tǒng)聚類樹(圖1)。
根據(jù)圖1的聚類結(jié)果并結(jié)合我國各?。ㄊ?、區(qū))農(nóng)業(yè)農(nóng)村信息化發(fā)展實際經(jīng)驗,本研究將26個省(市、區(qū))的農(nóng)業(yè)信息化發(fā)展水平從高到低歸納為6類(表2),具體分類結(jié)果如下:
摘要:基于問卷調(diào)研數(shù)據(jù),從農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)、人才隊伍建設(shè)、發(fā)展環(huán)境建設(shè)和信息資源建設(shè)等4個方面篩選整理了18個具體評價指標,在此基礎(chǔ)上采用聚類分析法將我國26個省份依照農(nóng)業(yè)信息化發(fā)展水平分為6類,對分類結(jié)果進行了分析,并提出了縮小區(qū)域農(nóng)業(yè)信息化發(fā)展水平差距、提高農(nóng)業(yè)信息化發(fā)展水平的相關(guān)政策建議。
關(guān)鍵詞:聚類分析;農(nóng)業(yè)信息化;發(fā)展水平;評價研究;省際差異;政策建議
中圖分類號: S126文獻標志碼: A文章編號:1002-1302(2014)09-0462-04
收稿日期:2013-11-04
基金項目:北京市農(nóng)林科學院科技創(chuàng)新能力建設(shè)專項;“三電合一”農(nóng)業(yè)信息服務(wù)項目。
作者簡介:崔利國(1987—),男,河北邢臺人,碩士,助理工程師,研究方向為農(nóng)業(yè)農(nóng)村信息化發(fā)展戰(zhàn)略。Tel:(010)51503643;E-mail:cuilg@nercita.org.cn。
通信作者:李瑾,博士,副研究員,研究方向為農(nóng)業(yè)與農(nóng)村信息化。E-mail:lij@nercita.org.cn。農(nóng)業(yè)信息化正在成為我國實現(xiàn)農(nóng)業(yè)現(xiàn)代化的重要途徑,在提高農(nóng)業(yè)生產(chǎn)效率、增加農(nóng)民收入、保障國家糧食安全、推進城鎮(zhèn)化建設(shè)等方面均發(fā)揮了積極影響。2005年以來,中央一號文件均從不同角度對農(nóng)業(yè)信息化建設(shè)作出指示,各地政府、科研院所和涉農(nóng)企業(yè)也在推進農(nóng)業(yè)信息化工作方面熱情高漲,農(nóng)業(yè)信息化評價研究也成為近年來學術(shù)研究的熱點。近年來,不少學者對我國農(nóng)業(yè)信息化發(fā)展水平進行了研究,研究方向主要分為2個方面:一是農(nóng)業(yè)信息化發(fā)展水平評價體系的理論研究,并基于構(gòu)建的評價體系對全國或某一地區(qū)的農(nóng)業(yè)信息化發(fā)展水平進行定量研究[1-5]。有學者從農(nóng)業(yè)信息化基礎(chǔ)設(shè)施、技術(shù)裝備、應(yīng)用水平、主體水平、農(nóng)業(yè)信息化對農(nóng)業(yè)發(fā)展的貢獻以及農(nóng)業(yè)信息化政策環(huán)境等方面篩選了24個指標,初步建立了農(nóng)業(yè)信息化發(fā)展水平評價體系[6]。二是對地區(qū)間農(nóng)業(yè)信息化發(fā)展水平的評價研究。如有學者基于信息資源、信息應(yīng)用、信息產(chǎn)業(yè)和信息人才等指標對山區(qū)縣域農(nóng)村信息化發(fā)展水平進行了研究[7],也有學者采取線性加權(quán)函數(shù)法和層次分析法對地市級農(nóng)業(yè)信息化發(fā)展水平展開評價和分析[8]。此外,還有學者利用神經(jīng)網(wǎng)絡(luò)模型對省際間信息化發(fā)展水平進行綜合評價與分析[9],這對比較我國省際間農(nóng)業(yè)信息化發(fā)展水平具有借鑒意義。目前,我國在農(nóng)業(yè)信息水平評價研究方面處于探索期,官方和學術(shù)界還沒有形成權(quán)威的評價指標和完善的評價體系。學者們在研究農(nóng)業(yè)信息化發(fā)展水平上主要是從地區(qū)經(jīng)濟發(fā)展水平、農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)、農(nóng)業(yè)信息資源開發(fā)利用、農(nóng)業(yè)信息技術(shù)和裝備應(yīng)用水平以及農(nóng)業(yè)信息化人才隊伍建設(shè)等方面著手,但由于指標選擇上存在不一致,分析結(jié)果也往往存在差異。本研究參考已有學者的研究結(jié)論和指標體系建立方法,并結(jié)合已有的調(diào)研數(shù)據(jù)對我國主要省份的農(nóng)業(yè)信息化發(fā)展水平進行比較研究,目的在于分析各個省份的農(nóng)業(yè)信息化發(fā)展水平及其在全國所處的地位,為國家農(nóng)業(yè)信息化主管部門和地方政府制定針對性的農(nóng)業(yè)信息化發(fā)展戰(zhàn)略提供支撐。
1研究方法與數(shù)據(jù)說明
1.1研究方法
1.1.1聚類分析方法概述農(nóng)業(yè)信息化水平評價方法有神經(jīng)網(wǎng)絡(luò)模型[9]、因子分析法[10]和主成分分析法[11]等,盡管這些方法能夠?qū)Χ鄠€對象的農(nóng)業(yè)信息化水平進行較為客觀的評價,但這些方法僅限于通過排序比較省際間農(nóng)業(yè)信息化水平而不能有效地歸類并尋找同類水平之間的共性和不同類水平之間的差異性,但聚類分析方法卻可以解決這一問題,因此本研究選擇聚類分析法來對我國各地區(qū)農(nóng)業(yè)信息化發(fā)展水平進行評價研究。
自古以來,人們所講的“物以類聚,人以群分”說的就是聚類,而在現(xiàn)代社會聚類分析是數(shù)據(jù)挖掘的一種方法,是指把整個數(shù)據(jù)分成不同的組,并使組與組之間的差距盡可能大,組內(nèi)數(shù)據(jù)的差異盡可能小。聚類分析根據(jù)研究對象的不同分為Q型聚類分析和R型聚類分析,Q型聚類是指對樣品進行聚類,R型聚類是指對變量進行聚類[12]。聚類不同于日常所說的分類,因為在分析之前并沒有具體的劃分標準,屬于一種無監(jiān)督學習[13]。聚類分析用于研究地區(qū)某一指標發(fā)展水平的文獻也有很多[10-11,14-15],而隨著我國農(nóng)業(yè)信息化水平的不斷提高和研究的不斷深入,采用聚類分析等定量分析工具對我國各省份農(nóng)業(yè)信息化發(fā)展水平進行評價和比較成為推動我國農(nóng)業(yè)信息化水平持續(xù)發(fā)展的重要環(huán)節(jié)和手段,當前已經(jīng)成為非常迫切的一個問題。
1.1.2聚類分析方法的數(shù)學步驟在聚類分析中,通常用G表示類,其中包含m個變量,一般用xi=(i=1,2,…,m)來表示,dij表示變量xi與xj之間的距離,DKL表示類GK與類GL之間的距離。類與類之間定義距離的方法有很多,常用的系統(tǒng)聚類方法有最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和法等,本研究采用類平均法來定義類與類間的距離,因為類平均法很好地利用了所有樣品之間的信息,在很多情況下它被認為是一種比較好的系統(tǒng)聚類法。類平均法定義的類GK與類GL之間的平方距離為:
1.2數(shù)據(jù)說明
1.2.1數(shù)據(jù)來源本研究所用數(shù)據(jù)來自農(nóng)業(yè)部農(nóng)業(yè)農(nóng)村信息化發(fā)展戰(zhàn)略研究課題組問卷調(diào)研,問卷內(nèi)容主要涵蓋農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)、農(nóng)業(yè)信息化人才建設(shè)、農(nóng)業(yè)信息化發(fā)展環(huán)境、農(nóng)業(yè)信息資源建設(shè)等4個方面,數(shù)據(jù)為2012年的省級面板數(shù)據(jù)。調(diào)研范圍涵蓋大陸全部30個?。ㄊ小^(qū)),但由于部分省份的重要變量缺失,研究過程中剔除了河北、云南、新疆和廣西4個省份,具體研究中只包括26個省份的樣本數(shù)據(jù)。
1.2.2變量設(shè)定從已有的研究成果中不難發(fā)現(xiàn),農(nóng)業(yè)信息化技術(shù)應(yīng)用水平是衡量一個地區(qū)農(nóng)業(yè)信息化發(fā)展水平的重要指標之一,本研究在樣本數(shù)據(jù)選擇上并沒有選擇農(nóng)業(yè)信息化技術(shù)應(yīng)用情況的主要原因在于從調(diào)查問卷整理的數(shù)據(jù)結(jié)果中,關(guān)于農(nóng)業(yè)信息化技術(shù)應(yīng)用水平的調(diào)查選項不多,調(diào)查數(shù)據(jù)也不理想,導致在實際操作的時候數(shù)據(jù)確實無法使用,其他相關(guān)統(tǒng)計指標如表1所示。表1農(nóng)業(yè)信息化發(fā)展水平評價指標
目標層準則層指標層農(nóng)業(yè)信息化發(fā)展水平農(nóng)業(yè)信息化基礎(chǔ)設(shè)施建設(shè)固定電話普及率移動電話普及率電腦普及率已接入有線電視行政村比重接通寬帶的鄉(xiāng)鎮(zhèn)比重光纖傳輸網(wǎng)是否到村農(nóng)業(yè)信息化人才建設(shè)農(nóng)業(yè)信息中心工作人員數(shù)量農(nóng)業(yè)信息化發(fā)展環(huán)境農(nóng)業(yè)農(nóng)村信息化資金投入是否成立縣級農(nóng)業(yè)農(nóng)村信息化工作領(lǐng)導小組是否制定全省相關(guān)農(nóng)業(yè)農(nóng)村信息化工程規(guī)劃是否建立了農(nóng)業(yè)農(nóng)村信息化建設(shè)資金統(tǒng)籌管理制度農(nóng)業(yè)行政主管部門是否有農(nóng)業(yè)農(nóng)村信息化投入專項是否設(shè)有農(nóng)業(yè)農(nóng)村信息化行政管理機構(gòu)是否有兼職管理員農(nóng)業(yè)信息資源建設(shè)有無獨立農(nóng)口政府網(wǎng)站農(nóng)業(yè)數(shù)據(jù)庫數(shù)量數(shù)據(jù)年增長率是否建有內(nèi)部網(wǎng)絡(luò)辦公平臺
由于上述指標是由多個要素構(gòu)成的,各個要素數(shù)據(jù)具有不同的單位和量綱,其數(shù)值的變異很大,這會對分類結(jié)果產(chǎn)生一定的影響。因此,在進行聚類分析之前,首先要對聚類要素進行一定的預(yù)處理,消除各個要素之間的量綱差異。聚類分析中常用的數(shù)據(jù)預(yù)處理方法有中心化變換、規(guī)格化變換和標準化變換,本研究采用標準化變換對數(shù)據(jù)進行預(yù)處理,變換公式為:
2實證分析
采用MATLAB R2012b軟件首先對樣本數(shù)據(jù)進行標準化變換,之后運用類平均法將26個省份間的歐式距離進行測算,并在此基礎(chǔ)上創(chuàng)建系統(tǒng)聚類樹(圖1)。
根據(jù)圖1的聚類結(jié)果并結(jié)合我國各?。ㄊ小^(qū))農(nóng)業(yè)農(nóng)村信息化發(fā)展實際經(jīng)驗,本研究將26個省(市、區(qū))的農(nóng)業(yè)信息化發(fā)展水平從高到低歸納為6類(表2),具體分類結(jié)果如下: