陸 珊 朱碧琴
(湖南環(huán)境生物職業(yè)技術(shù)學(xué)院,湖南 衡陽 421001)
油茶作為一種木本油料,主要生長在我國南方,在鼓勵(lì)政策的扶持下,我國幾個(gè)油茶產(chǎn)區(qū)的發(fā)展均較為迅速。加上農(nóng)業(yè)科技輔助,集中量產(chǎn)和定產(chǎn)都具有其一定的優(yōu)勢(shì)。油茶種植又帶動(dòng)了周邊產(chǎn)業(yè)的發(fā)展,形成了油茶種植、加工、銷售等產(chǎn)業(yè)鏈條,有效帶動(dòng)了農(nóng)村經(jīng)濟(jì)的發(fā)展。規(guī)?;挠筒璁a(chǎn)業(yè)不但形成了輻射周邊的油茶經(jīng)濟(jì)圈,而且可以帶動(dòng)旅游、環(huán)保等相關(guān)產(chǎn)業(yè),打造成具有濃郁鄉(xiāng)土氣息的油茶經(jīng)濟(jì)帶,造福一方。雖然油茶經(jīng)濟(jì)具有若干的優(yōu)勢(shì),但是并不一定適合全國各地,而且盲目地建設(shè)新項(xiàng)目,存在較大的風(fēng)險(xiǎn),需要專業(yè)的團(tuán)隊(duì)進(jìn)行細(xì)致地調(diào)研,提出科學(xué)建議。為了深入地分析,科學(xué)地評(píng)判,大數(shù)據(jù)分析是一種實(shí)用、對(duì)路的好工具。大數(shù)據(jù)分析是建立在海量數(shù)據(jù)基礎(chǔ)上的分析與評(píng)判,兼顧了同業(yè)數(shù)據(jù)、周邊數(shù)據(jù)、歷史數(shù)據(jù)、成功案例、失敗教訓(xùn)等多方面信息,以特定的運(yùn)算規(guī)則進(jìn)行深度計(jì)算,得出建立在充分?jǐn)?shù)據(jù)基礎(chǔ)上的可信數(shù)據(jù),是一種廣泛應(yīng)用的尖端科技成果。將大數(shù)據(jù)分析應(yīng)用于油茶產(chǎn)業(yè)的經(jīng)濟(jì)發(fā)展規(guī)劃,可以深度挖掘歷史數(shù)據(jù),同時(shí)匯總類似產(chǎn)地經(jīng)驗(yàn),并在該基礎(chǔ)上得出方向性的建議。大數(shù)據(jù)分析技術(shù)代替了農(nóng)業(yè)專家的調(diào)研職能,有助于農(nóng)業(yè)經(jīng)濟(jì)發(fā)展。
互聯(lián)網(wǎng)信息包羅萬象,其中關(guān)于縣域油茶產(chǎn)業(yè)的相關(guān)信息才是大數(shù)據(jù)處理分析的有用信息,需要進(jìn)行刪選和甄別。該文將大數(shù)據(jù)分為傳統(tǒng)數(shù)據(jù)、感知數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)。。在傳統(tǒng)的規(guī)劃發(fā)展中,傳統(tǒng)數(shù)據(jù)作為數(shù)據(jù)集合的主力軍,其優(yōu)勢(shì)為在時(shí)間和空間2 個(gè)方面非常準(zhǔn)確地表現(xiàn)出一定區(qū)域的特點(diǎn),但是該優(yōu)勢(shì)在實(shí)際操作中體現(xiàn)得并不充分。對(duì)空間布局說,還要講求視覺審美以及空間構(gòu)造。數(shù)據(jù)缺乏人的行動(dòng)能力和空間構(gòu)造能力。那么,對(duì)這種比較靈活的規(guī)劃來說,人的影響因素也是必須要考慮的一部分。
考慮到數(shù)據(jù)分析計(jì)算中所使用的油茶產(chǎn)業(yè)數(shù)據(jù)的完整度和準(zhǔn)確度,在其產(chǎn)量因素的數(shù)據(jù)收集時(shí),主要采用的是2017—2021 年浙江、江西、廣東、湖南等幾個(gè)省份的油茶生產(chǎn)數(shù)據(jù)。經(jīng)過整理發(fā)現(xiàn),從2017—2021 年,這幾個(gè)省份的油茶產(chǎn)量占全國總產(chǎn)量的絕大部分,因此對(duì)這些地區(qū)和時(shí)間段數(shù)據(jù)的分析具有代表性,可以真實(shí)地反映出縣域油茶產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展的狀況和趨勢(shì)。為了能夠綜合評(píng)價(jià)油茶產(chǎn)業(yè)經(jīng)濟(jì)的增長潛力,在數(shù)據(jù)對(duì)象中增加了影響經(jīng)濟(jì)增長規(guī)模的油茶產(chǎn)量數(shù)據(jù)、種植面積、疏林地、灌木林地等數(shù)據(jù),以便從多個(gè)角度統(tǒng)計(jì)數(shù)據(jù),對(duì)油茶產(chǎn)量影響因素進(jìn)行定量分析。
充足的林地資源是保障油茶產(chǎn)業(yè)發(fā)展的基礎(chǔ),因此針對(duì)油茶產(chǎn)業(yè)的研究,有針對(duì)性地選擇森林資源豐富的省份。根據(jù)《中國林業(yè)統(tǒng)計(jì)年鑒》,油茶林地資源情況匯總于表1。
表1 縣域油茶林地資源表(單位:hm2)
在該研究中,影響生產(chǎn)的因素一般分為2 類,其中,基本的影響因素主要有自然資源、地理位置、氣候等對(duì)生產(chǎn)場(chǎng)合發(fā)生影響的因素;此外,人文環(huán)境也會(huì)對(duì)油茶產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展造成影響,是潛在的重要影響因素,例如縣域基礎(chǔ)公共設(shè)施、農(nóng)業(yè)專家的技術(shù)支持、地區(qū)平均收入水平等,這些因素都會(huì)直接或間接,地作用于油茶產(chǎn)業(yè)的發(fā)展?fàn)顩r。因此在核定大數(shù)據(jù)處理的信息范圍時(shí),需要充分地采集各方面信息,形成多維度、多角度、豐富的數(shù)據(jù)處理基礎(chǔ)。
完成數(shù)據(jù)采集后,核心功能是對(duì)這些數(shù)據(jù)按照設(shè)計(jì)的算法進(jìn)行計(jì)算。計(jì)算功能模塊如圖1 所示。
圖1 計(jì)算功能模塊流程圖
數(shù)據(jù)錄入是分析處理的基礎(chǔ)環(huán)節(jié),在上一步確定的數(shù)據(jù)采集范圍內(nèi),設(shè)置相應(yīng)的數(shù)據(jù)導(dǎo)入接口,有序調(diào)用數(shù)據(jù)。鑒于多地域歷年數(shù)據(jù)存在形式不統(tǒng)一,數(shù)據(jù)庫繁雜的情況,需要在數(shù)據(jù)錄入環(huán)節(jié)設(shè)計(jì)兩種接口:針對(duì)歷史孤立數(shù)據(jù)的文件導(dǎo)入接口;針對(duì)網(wǎng)絡(luò)標(biāo)準(zhǔn)數(shù)據(jù)的平臺(tái)數(shù)據(jù)調(diào)用接口。數(shù)據(jù)通過錄入環(huán)節(jié)進(jìn)入大數(shù)據(jù)分析處理的統(tǒng)一數(shù)據(jù)庫中,實(shí)現(xiàn)了數(shù)據(jù)準(zhǔn)備,下一步需要對(duì)數(shù)據(jù)進(jìn)行處理。分析過程分為預(yù)處理和處理2 個(gè)環(huán)節(jié)。其中預(yù)處理的目的是在紛雜的海量數(shù)據(jù)中發(fā)現(xiàn)有用的數(shù)據(jù),即去偽存真的過程;處理則是對(duì)有用的數(shù)據(jù)按照特定的算法運(yùn)算,找到其中的規(guī)律性內(nèi)容。
數(shù)據(jù)預(yù)處理采用聚類算法,如公式(1)所示。
式中:為聚類中偏離量;為聚類所有數(shù)據(jù)的均值;為樣本歐氏距離;為該聚類的中心;為樣本數(shù)量。
算法流程如下:對(duì)所有數(shù)據(jù)類型分類處理;針對(duì)每類計(jì)算其平均值;用該平均值替換各聚類中心的數(shù)值;在限定迭代次數(shù)內(nèi)重復(fù)計(jì)算,如果該計(jì)算結(jié)果與聚類中心的值差小于設(shè)定閾值,則終止計(jì)算并儲(chǔ)存結(jié)果,否則繼續(xù)計(jì)算。數(shù)據(jù)預(yù)處理后,形成了縮減后的數(shù)據(jù)集合。這些數(shù)據(jù)集合從不同的方面體現(xiàn)了油茶產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展的特點(diǎn)與趨勢(shì),作為后續(xù)分析提煉的基礎(chǔ),因此需要按照設(shè)計(jì)的格式與順序儲(chǔ)存,以便后續(xù)調(diào)用。為保證數(shù)據(jù)集合的有效性,需要對(duì)數(shù)據(jù)的空位、唯一性和組合關(guān)系進(jìn)行檢查,保證數(shù)據(jù)正確。空位檢查主要是檢查在一組數(shù)據(jù)中心,是否有某一個(gè)屬性數(shù)據(jù)的數(shù)值是無效的,如果出現(xiàn)了空位,就會(huì)自動(dòng)填充。唯一性檢查是檢查這組數(shù)據(jù)的屬性是不是唯一的,如果同組數(shù)據(jù)中有不同屬性的數(shù)據(jù),那么會(huì)自動(dòng)清除,并補(bǔ)充一個(gè)具有相同屬性的數(shù)據(jù)。組合關(guān)系檢查的工作主要在于對(duì)空間化的數(shù)據(jù)進(jìn)行關(guān)系檢測(cè),偵測(cè)數(shù)據(jù)前的鏈接是不是符合軟件的計(jì)算標(biāo)準(zhǔn)。完成數(shù)據(jù)有效性檢查后,即進(jìn)入核心的數(shù)據(jù)分析處理環(huán)節(jié)。數(shù)據(jù)處理主要依靠面板模型。經(jīng)過檢驗(yàn)方式選取最恰當(dāng)?shù)挠?jì)算方式。
檢驗(yàn)方式如公式(2)所示。
式中:P為第種影響因素的影響效果;x為該因素的發(fā)生概率;λ為該因素影響效果的加權(quán)因子;n代表該因素的影響頻次;γ代表該因素的影響因子;代表影響因素的總數(shù)量,即有效數(shù)據(jù)集合的總數(shù)。
通過計(jì)算每種影響因素所形成的的影響效果,加之影響因子的正向或負(fù)向定義,綜合考慮了各參與因素對(duì)發(fā)展規(guī)劃的作用與影響,形成具有綜合指導(dǎo)意義的影響效果集合{P},在該集合中代入待規(guī)劃縣的現(xiàn)實(shí)數(shù)據(jù),并對(duì)各影響因素的結(jié)果按照降序排列,即可得到大數(shù)據(jù)計(jì)算結(jié)果。
上步獲得的計(jì)算結(jié)果是建立在同業(yè)縣的歷史數(shù)據(jù)基礎(chǔ)上的分析判斷結(jié)果,直接用于指導(dǎo)待規(guī)劃縣的未來發(fā)展?fàn)顩r有失偏頗,需要對(duì)數(shù)據(jù)進(jìn)行動(dòng)態(tài)修正。建立精細(xì)優(yōu)化策略工具箱為大數(shù)據(jù)算法提供參考。精細(xì)優(yōu)化工具箱是一個(gè)紐帶,它將遇到的問題、中期的分析以及所采取的應(yīng)對(duì)措施連接為一個(gè)整體。優(yōu)化策略工具箱有4 種功能:初期數(shù)據(jù)分析、數(shù)據(jù)庫提取、數(shù)值評(píng)價(jià)與策略優(yōu)化。其中初期數(shù)據(jù)分析是對(duì)問題進(jìn)行數(shù)據(jù)挖掘,分析角度設(shè)定為對(duì)油茶產(chǎn)量的4 個(gè)基本要素,從主要方面到次要方面,從屬性到數(shù)量進(jìn)行全方位分析,包括設(shè)定位置林地的面積、空間形態(tài)以及土質(zhì)狀態(tài)。針對(duì)一個(gè)地方的優(yōu)化策略,由于基礎(chǔ)不同,其初期對(duì)應(yīng)的問題不盡相同,因此必須進(jìn)行優(yōu)化。
在數(shù)據(jù)庫提取的工作過程中,初期的問題分析已經(jīng)將方案問題屬性傳送過來,根據(jù)當(dāng)前的數(shù)據(jù)庫儲(chǔ)存量,從數(shù)據(jù)庫中選擇足夠解決問題的相對(duì)應(yīng)數(shù)據(jù),并提取出來,打包送往下一部分處理。前文提及關(guān)于縣域油茶的數(shù)據(jù),主要分為傳統(tǒng)數(shù)據(jù)、感知數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)主體為各縣統(tǒng)計(jì)部門的歷史記錄,以及農(nóng)業(yè)部門的檔案信息;感知數(shù)據(jù)主體為通過調(diào)查、收集整理到的樣本量數(shù)據(jù),是調(diào)查取樣和走訪獲取到的相關(guān)產(chǎn)業(yè)的運(yùn)營數(shù)據(jù),需要經(jīng)過分析整理才能使用;網(wǎng)絡(luò)數(shù)據(jù)主要為相關(guān)產(chǎn)業(yè)線上銷售的關(guān)聯(lián)數(shù)據(jù),以及客戶的評(píng)價(jià)信息。為了提高分析結(jié)果的精準(zhǔn)性,需要不斷完善數(shù)據(jù)庫。
在評(píng)價(jià)環(huán)節(jié)中,針對(duì)縣域油茶產(chǎn)業(yè)進(jìn)行分析。工具箱最終給出的評(píng)估內(nèi)容主要包括林地選址、勞動(dòng)力規(guī)劃、交通情況、氣候條件以及產(chǎn)品供需關(guān)系等。在該環(huán)節(jié)中,通過對(duì)比其他省市縣級(jí)單位的油茶產(chǎn)業(yè)數(shù)據(jù),查找本縣的實(shí)現(xiàn)情況與成功案例之間的差異,并在結(jié)果中對(duì)差異點(diǎn)逐項(xiàng)進(jìn)行對(duì)比,在該縣開展油茶生產(chǎn),以及相關(guān)配套產(chǎn)業(yè)的開發(fā)中,有多少資源可以聯(lián)合利用,又有什么方面會(huì)形成沖突,造成該縣的油茶產(chǎn)業(yè)不利的發(fā)展條件,都在評(píng)價(jià)環(huán)節(jié)中綜合評(píng)判。并且,任何事情不是一成不變的,在歷史時(shí)期能夠促進(jìn)油茶產(chǎn)業(yè)發(fā)展的要素中的數(shù)據(jù)時(shí)利好要素,相關(guān)的行業(yè)背景、市場(chǎng)飽和度都會(huì)對(duì)判斷結(jié)果產(chǎn)生影響。因此,需要在判斷與評(píng)價(jià)中,充分利用大數(shù)據(jù)分析的全面性,結(jié)合各方面要素,并對(duì)該縣的實(shí)際情況各項(xiàng)背景信息加權(quán)處理,留出適當(dāng)?shù)脑6?,使評(píng)價(jià)結(jié)果在限定的合理區(qū)間內(nèi)具有自由度,評(píng)價(jià)結(jié)果才有現(xiàn)實(shí)意義。最后,在顯示端給出具體的結(jié)果評(píng)估文件,正式提出優(yōu)化策略。經(jīng)過大數(shù)據(jù)采集準(zhǔn)備、數(shù)據(jù)計(jì)算分析和策略修正,完成了縣域油茶產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展規(guī)劃分析,取得了結(jié)合該縣實(shí)際情況的油茶產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展規(guī)劃建議,完成了發(fā)展規(guī)劃分析。
為了證明所設(shè)計(jì)的縣域油茶產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展規(guī)劃分析工具能夠計(jì)算出正確的結(jié)果,對(duì)縣域經(jīng)濟(jì)發(fā)展起到推動(dòng)作用,通過代入實(shí)際數(shù)據(jù)加以驗(yàn)證。
歷史數(shù)據(jù)集如公式(3)所示。
本縣油茶產(chǎn)業(yè)的對(duì)應(yīng)數(shù)據(jù)集如公式(4)所示。
殘差數(shù)列如公式(5)所示。
則絕對(duì)關(guān)聯(lián)度如公式(6)所示。
相對(duì)誤差序列如公式(7)所示。
式中:() 代表第項(xiàng)數(shù)據(jù)的原始值。
小誤差概率如公式(8)所示。
式中:代表計(jì)算過程。
均方差比值如公式(9)所示。
式中:是原始數(shù)列的方差,是殘差數(shù)列的方差。當(dāng)上述參數(shù)數(shù)值都>0 且<表2 中的數(shù)據(jù)時(shí),則分析工具的結(jié)果收斂,具有指導(dǎo)意義。
表2 精度參照表
設(shè)置該文的分析工具為實(shí)驗(yàn)組,傳統(tǒng)分析方法為對(duì)照組,從表1 中隨機(jī)抽取數(shù)據(jù)進(jìn)行對(duì)比計(jì)算。
對(duì)照組和試驗(yàn)組的三次精度計(jì)算結(jié)果見表3。
由表3 可知,試驗(yàn)組的三次計(jì)算結(jié)果精度等級(jí)都是1,并且其4 項(xiàng)參數(shù)的數(shù)值都比對(duì)照組的參數(shù)值更優(yōu)秀。證明所設(shè)計(jì)的基于大數(shù)據(jù)的縣域油茶產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展規(guī)劃分析工具在計(jì)算中形成了收斂的計(jì)算結(jié)果,與真實(shí)情況更為接近,表明該方法所分析的經(jīng)濟(jì)發(fā)展規(guī)劃更符合實(shí)際情況,對(duì)規(guī)劃的預(yù)測(cè)是有效的。
表3 試驗(yàn)結(jié)果表
縣級(jí)單位作為我國經(jīng)濟(jì)發(fā)展的基層單元,面臨著資源少、特色不明顯、外部競(jìng)爭(zhēng)激烈等很多難題,因此,在經(jīng)濟(jì)發(fā)展的規(guī)劃中常常受到許多因素制約。通過采用先進(jìn)的技術(shù)手段,對(duì)自身?xiàng)l件進(jìn)行精準(zhǔn)地分析,同時(shí)借鑒同等級(jí)其他縣城的成功經(jīng)驗(yàn)或失敗原因,可以少走彎路,更快速地帶領(lǐng)全縣人民脫貧致富。大數(shù)據(jù)分析處理技術(shù)作為一種新型的網(wǎng)絡(luò)化分析模式,具有強(qiáng)大的運(yùn)算功能,能夠在海量數(shù)據(jù)中逐一排查并發(fā)現(xiàn)有價(jià)值信息,并通過設(shè)計(jì)合理的計(jì)算模型,方便快捷地找到復(fù)雜問題的解決途徑,有助于助力地區(qū)經(jīng)濟(jì)的發(fā)展,形成別具一格的經(jīng)濟(jì)發(fā)展路徑。該文從油茶產(chǎn)業(yè)經(jīng)濟(jì)的角度嘗試了大數(shù)據(jù)分析的規(guī)劃指引能力,實(shí)現(xiàn)了第一階段的目標(biāo)。后續(xù)還將深入研究,尋找更為準(zhǔn)確的算法模型,并將其應(yīng)用于地區(qū)發(fā)展的其他領(lǐng)域,指導(dǎo)規(guī)劃發(fā)展決策,為科學(xué)策劃提供一種高技術(shù)工具。