• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于云計算的柑橘市場信息預(yù)測平臺構(gòu)建研究*

      2016-10-14 07:03:00黃曉英
      中國農(nóng)業(yè)信息 2016年14期
      關(guān)鍵詞:柑橘數(shù)據(jù)挖掘節(jié)點

      王 聰,黃曉英

      (浙江農(nóng)林大學(xué)暨陽學(xué)院,紹興 311800)

      基于云計算的柑橘市場信息預(yù)測平臺構(gòu)建研究*

      王 聰,黃曉英

      (浙江農(nóng)林大學(xué)暨陽學(xué)院,紹興 311800)

      文章設(shè)計了一種基于Hadoop的柑橘市場信息預(yù)測平臺,根據(jù)往年的柑橘產(chǎn)量、柑橘消費量、進出口量、庫存量等,通過Apriori算法在云計算平臺Hadoop下實現(xiàn)對影響柑橘價格的各類影響因素和柑橘市場信息之間的關(guān)聯(lián)分析,根據(jù)得出的關(guān)聯(lián)性和置信度預(yù)測柑橘價格和產(chǎn)量,以此構(gòu)建柑橘市場信息預(yù)測平臺,對柑橘價格和產(chǎn)量進行預(yù)測。

      云計算 數(shù)據(jù)挖掘 Hadoop 柑橘

      目前,中國柑橘生產(chǎn)面積已躍居世界第一,柑橘產(chǎn)業(yè)已經(jīng)成為中國農(nóng)業(yè)生產(chǎn)的重要力量,在發(fā)展的過程中,也面臨一系列問題。由于柑橘產(chǎn)量與需求的不平衡,使得柑橘的銷售和增收困難,柑橘價格長期劇烈的波動,使得柑橘種植商的利潤波動大,當(dāng)柑橘生產(chǎn)量遠遠大于供應(yīng)量時,就會出現(xiàn)柑橘滯銷、價格低廉,相反就會出現(xiàn)供不應(yīng)求的情況。如果通過數(shù)據(jù)挖掘技術(shù),分析柑橘市場每年的供求關(guān)系,提前知曉柑橘未來供需缺口的變化,能夠為柑橘生產(chǎn)、消費、進出口制定相應(yīng)對策提供依據(jù)的同時,保證柑橘市場的供需平衡,具有重要的意義。

      1 數(shù)據(jù)挖掘與云計算

      隨著數(shù)據(jù)量不斷的劇增,傳統(tǒng)的數(shù)據(jù)挖掘算法和分析工具在面臨海量數(shù)據(jù)時,出現(xiàn)挖掘效率低的問題,由于已有的數(shù)據(jù)挖掘大多基于傳統(tǒng)的單機模式,無法高效的處理海量數(shù)據(jù)。同時,擴展已有的挖掘體系,會造成人力物力成本上升,很多中小企業(yè)無法承擔(dān)如此高昂的成本,而且,數(shù)據(jù)挖掘成本高,效率低。

      云計算的出現(xiàn),給數(shù)據(jù)挖掘帶來新的方向。基于云計算的數(shù)據(jù)挖掘,具有在計算能力、存儲能力、可靠性、價格低等優(yōu)點,迅速地得到廣泛應(yīng)用。云計算挖掘平臺可以分為3層,包括數(shù)據(jù)挖掘云服務(wù)層、數(shù)據(jù)挖掘分析層和云計算支持平臺。云服務(wù)層通過網(wǎng)絡(luò)連接,為云用戶提供云資源例如挖掘算法服務(wù)、數(shù)據(jù)預(yù)處理服務(wù)、數(shù)據(jù)服務(wù)、調(diào)度服務(wù)等;數(shù)據(jù)挖掘能力層包括數(shù)據(jù)并行處理、調(diào)度引擎等;云計算支持平臺提供分布式存儲和計算能力,為數(shù)據(jù)挖掘提供物理支持。如圖1所示。

      2 基于Hadoop的柑橘市場信息預(yù)測平臺設(shè)計

      2.1 系統(tǒng)設(shè)計目標(biāo)

      目前,市場上柑橘種類繁多,柑橘數(shù)據(jù)來源收受域約束,分布比較分散。同時,這些數(shù)據(jù)具有時效性,在移動互聯(lián)網(wǎng)和各種物聯(lián)網(wǎng)的發(fā)展下,柑橘的數(shù)據(jù)量劇增,如果采用傳統(tǒng)數(shù)據(jù)挖掘體系,無法很好地完成挖掘功能。因此,文章采用基于云計算的Hadoop下的云計算方式進行平臺設(shè)計。

      該系統(tǒng)設(shè)計基于云計算的市場信息預(yù)測平臺要滿足以下需求。

      (1)存儲具有可擴展性。在存儲層,存儲節(jié)點具有可擴展性,由于柑橘數(shù)據(jù)來源多樣,且很多異構(gòu)數(shù)據(jù)。因此,該文采用非關(guān)系型數(shù)據(jù)庫系統(tǒng)的存儲模式存儲數(shù)據(jù),存儲方式采用分布式,便于靈活地進行系統(tǒng)擴容和系統(tǒng)伸縮。

      (2)集成化、可定制的數(shù)據(jù)挖掘能力。用戶可以根據(jù)實際添加所需要的算法,因此系統(tǒng)實現(xiàn)了可定制的數(shù)據(jù)挖掘能力。

      (3)友好的用戶展示界面。能夠直觀地顯示數(shù)據(jù)挖掘結(jié)果,用戶可以輕而易舉地理解挖掘的含義。

      因此,該設(shè)計基于云計算的柑橘市場信息預(yù)測平臺,具有可靠、高效、性能好、可擴展的特點。

      2.2 設(shè)計思路及方案

      文章設(shè)計了基于Hadoop的柑橘市場信息預(yù)測平臺,利用Hadoop的強大計算能力和存儲能力,達到以上系統(tǒng)設(shè)計目標(biāo)。

      其設(shè)計思路是:利用Hadoop的特性,將數(shù)據(jù)挖掘中需要大的計算能力的算法擴展到Hadoop集群的各個節(jié)點上,利用并行計算能力進行數(shù)據(jù)挖掘工作,提高挖掘效率。采用分層設(shè)計思想,存儲層使用HDFS存儲文件和數(shù)據(jù),通過Map Reduce計算模型來執(zhí)行海量數(shù)據(jù)挖掘。

      根據(jù)設(shè)計思路和云計算數(shù)據(jù)挖掘模型,通過分層設(shè)計思想,自頂向下的調(diào)用下層結(jié)構(gòu),最頂層是用戶和系統(tǒng)的交互層;中間層是業(yè)務(wù)處理層,提供基礎(chǔ)計算框架和業(yè)務(wù)邏輯處理;最底層為存儲層,提供分布式存儲。

      2.3 系統(tǒng)模塊功能

      數(shù)據(jù)管理框架。數(shù)據(jù)管理層建立在Hadoop下的HDFS文件系統(tǒng)之上,提供并行數(shù)據(jù)訪問和高效、可擴展的存儲服務(wù)。當(dāng)系統(tǒng)存儲能力不足時,可以在不影響已有數(shù)據(jù)情況下,添加新的存儲節(jié)點。通過多副本存儲機制保障數(shù)據(jù)安全,即使有節(jié)點出現(xiàn)存儲失效,通過副本機制將失效節(jié)點數(shù)據(jù)轉(zhuǎn)移到其他節(jié)點。

      圖1 基于云計算的數(shù)據(jù)挖掘

      基礎(chǔ)計算框架。Map Reduce為系統(tǒng)的基礎(chǔ)計算框架,它可以隱藏底層設(shè)計細(xì)節(jié),通過簡單的對外接口,實現(xiàn)各種并行計算能力,并且具有很好的擴展性和伸縮性,可以根據(jù)實際需求增加或者刪除節(jié)點。

      算法管理。用戶通過算法管理模塊查看系統(tǒng)提供的算法,并且可以上傳自己設(shè)計的算法,實現(xiàn)可定制化的數(shù)據(jù)挖掘能力。

      頁面展示。通過友好的方式展示數(shù)據(jù)挖掘結(jié)果。

      數(shù)據(jù)加載塊。由于數(shù)據(jù)種類繁多,且來源不同,數(shù)據(jù)加載模塊將來源各異的數(shù)據(jù)在數(shù)據(jù)集管理模塊中進行注冊,然后存儲到HDFS文件系統(tǒng)。

      數(shù)據(jù)挖掘算法模塊。提供各種并行挖掘算法,是基于算法管理模塊的擴展。

      數(shù)據(jù)挖掘。是系統(tǒng)的核心模塊,通過調(diào)用業(yè)務(wù)層的Map Reduce計算框架,提供高效的數(shù)據(jù)挖掘服務(wù)。

      3 基于Hadoop的柑橘市場信息預(yù)測平臺構(gòu)建

      3.1 Hadoop平臺搭建

      平臺采用B/S架構(gòu),前臺采用JSP作為開發(fā)語言;后臺選擇java語言,采用Tomcat服務(wù)器;數(shù)據(jù)存儲采用MySQL和Hadoop的HDFS;Hadoop采用4臺PC機器作為數(shù)據(jù)節(jié)點。所有機器配置:4臺HP刀片服務(wù)器組成一個內(nèi)部往來,建立一個 4個節(jié)點的Hadoop集群。其中 1個節(jié)點作為 Master,其余3 個節(jié)點作為 Slave,各個節(jié)點通過100M網(wǎng)卡進行數(shù)據(jù)訪問。Master節(jié)點服務(wù)器CPU:Inter(R)Xeon(R)E5620 2.4GHz 4*4核,Memory:6GB,Disk:500G*8。Salve節(jié) 點 服 務(wù) 器 CPU:Inter (R)Xeon(TM)3.00GHZ 4核,Memory:1GB,Disk: 146.8G*2。每臺服務(wù)器上安裝OS:64 bit CentOS6.2,Hadoop 版本1.0.3和Eclipse版本4.3.1。Hadoop默認(rèn)參數(shù)配置Block為64M,備份數(shù)為3。

      3.2 預(yù)測模型構(gòu)建

      文章采用關(guān)聯(lián)規(guī)則分析中的Apriori算法,對柑橘價格和產(chǎn)量進行分析和預(yù)測,主要通過Apriori算法,找出影響柑橘價格和產(chǎn)量之間的置信度,通過置信度構(gòu)建柑橘市場分析模型,以置信度計算柑橘市場信息。

      基于Apriori算法的柑橘市場價格預(yù)測模型,如圖3.1所示。整個柑橘價格是建立在2005~2015年的柑橘價格指數(shù)、生產(chǎn)量指數(shù)、世界柑橘價格指數(shù)等基層上,通過我國《中國統(tǒng)計年鑒》發(fā)布的數(shù)據(jù),導(dǎo)入這10年的柑橘指數(shù)作為預(yù)測模型基礎(chǔ)。利用這些數(shù)據(jù)構(gòu)建數(shù)據(jù)挖掘模型,利用Apriori算法對這些數(shù)據(jù)進行挖掘分析,得到各種因素對柑橘價格和產(chǎn)量之間的置信度,然后通過計算模型,實現(xiàn)對柑橘價格和產(chǎn)量的預(yù)測(圖2)。

      3.3 Hadoop數(shù)據(jù)預(yù)處理

      影響柑橘市場的數(shù)據(jù)主要有柑橘產(chǎn)量、柑橘消費量、進出口量、庫存量等,文章主要通過這些數(shù)據(jù),構(gòu)建柑橘市場預(yù)測模型。由于庫存量沒有統(tǒng)計數(shù)據(jù),因此,文章不考慮柑橘的庫存量對市場影響。

      (1)柑橘產(chǎn)量。柑橘產(chǎn)量數(shù)據(jù)來源于《中國統(tǒng)計年鑒》。

      (2)柑橘消費量,數(shù)據(jù)來源于《中國農(nóng)村統(tǒng)計年鑒》,根據(jù)家庭人均水果消費量,計算出柑橘中國國內(nèi)消費數(shù)據(jù)。

      (3)柑橘出口量,數(shù)據(jù)來源于聯(lián)合國貿(mào)易數(shù)據(jù)庫。

      (4)國民消費價格指數(shù),國家統(tǒng)計局獲取。

      將以上數(shù)據(jù)存儲到預(yù)測模型的數(shù)據(jù)倉庫中,在單機模式下Apriori算法執(zhí)行效率低,因此,采用云平臺方法,通過Hadoop實現(xiàn)Apriori算法。在計算過程中,首先將這些數(shù)據(jù)處理成Html格式存儲到Hadoop中,使用MapReduce對柑橘價格影響因素數(shù)據(jù)進行提取,之后將Apriori算法預(yù)測模型與Hadoop云計算框架關(guān)聯(lián)。

      圖2 柑橘市場預(yù)測模型

      圖3 基于Hadoop的柑橘市場預(yù)測模型

      4 基于Hadoop的柑橘市場信息預(yù)測

      經(jīng)過數(shù)據(jù)預(yù)處理之后,結(jié)合Hadoop云計算框架,設(shè)計基于Hadoop云計算處理的柑橘市場預(yù)測模型,如圖4.1所示,將Hadoop云計算框架部署在Linux虛擬機上,通過Hadoop框架構(gòu)建整個預(yù)測系統(tǒng),然后設(shè)計Hadoop并行Apriori處理任務(wù),將Apriori算法挖掘任務(wù)分成多個并行任務(wù),分布到各個計算節(jié)點進行處理。同時,通過預(yù)處理模塊,從柑橘市場預(yù)測數(shù)據(jù)系統(tǒng)中,導(dǎo)入柑橘產(chǎn)量、柑橘消費量、進出口量、庫存量、居民消費指數(shù)到HDFS文件系統(tǒng)中,為Hadoop執(zhí)行Apriori算法提供數(shù)據(jù)支持,最大限度地提高Apriori算法的執(zhí)行效率,最后通過Apriori算法得到各個影響因素,對糧食價格和年產(chǎn)量的置信度,交給柑橘市場預(yù)測模塊,進行計算,得到柑橘年產(chǎn)量和價格預(yù)測值(圖3)。

      以上述模型為依托,從而搭建基于Hadoop的柑橘市場信息預(yù)測平臺。

      [1] 陳康,鄭緯民.云計算系統(tǒng)實例與研究現(xiàn)狀.軟件學(xué)報,2009,20(5):1337~1348

      [2] 陳全,鄧倩妮.云計算及其關(guān)鍵技術(shù).計算機應(yīng)用,2009,29(9):2562~2567

      [3] 張建勛,古志民,鄭超.云計算研究進展綜述.計算機應(yīng)用研究,2010,27(2):429~433

      [4] 何勁,祁春節(jié).中國柑橘生產(chǎn)成本和市場價格變動的實證研究.浙江柑橘,2009,26(1):2~7

      [5] 汪曉銀.中國柑橘市場預(yù)警研究.華中農(nóng)業(yè)大學(xué),2013

      [6] Witten,F(xiàn)rank I H.Data Mining.Practical Machine Learning Tools & Techniques with Java Implementations,2011,13(4):95~97

      [7] 劉永平,郭小波,胡坤倫.采用云計算對糧食價格進行分析和預(yù)測.現(xiàn)代食品,2015,(21)

      [8] Azuaje F. Witten IH,F(xiàn)rank E: Data Mining: Practical Machine Learning Tools and Techniques. Biomedical Engineering Online,2006,5(1):1~2

      [9] 孫吉紅,彭林,鄒秋霞.基于云計算平臺的智能預(yù)測模型研究.農(nóng)業(yè)網(wǎng)絡(luò)信息,2014,(1):43~46

      [10] 徐懿瑾.基于數(shù)據(jù)挖掘的移動中高端用戶流失預(yù)警分析.上海交通大學(xué),2010

      [11] Han J,Kamber M. Data Mining: Concepts and Techniques. Data Mining Concepts Models Methods & Algorithms Second Edition,2000,5(4):1~18

      [12] 李佳鍞.基于云計算和數(shù)據(jù)挖掘技術(shù)的中小企業(yè)風(fēng)險預(yù)測模型研究.廈門大學(xué),2012

      [13] Chen M S,Han J,Yu P S. Data Mining: An Overview from a Database Perspective. IEEE Transactions on Knowledge & Data Engineering,1996,8(6):866~883

      [14] Romero C,Ventura S,Garc í a E. Data mining in course management systems: Moodle case study and tutorial. Computers & Education,2008,51(1):368~384

      [15] White T. Hadoop : the definitive guide. O’reilly Media Inc Gravenstein Highway North,2010,215(11):1 ~ 4

      [16] O’Driscoll A,Daugelaite J,Sleator R D. ‘Big data’,Hadoop and cloud computing in genomics. Journal of Biomedical Informatics,2013,46(5):774~781

      [17] Borthakur D,Gray J,Sarma J S,et al. Apache hadoop goes realtime at Facebook// Proceedings of the 2011 ACM SIGMOD International Conference on Management of data. ACM,2011:1071~1080

      [18] Dean J,Ghemawat S. MapReduce: Simplified Data Processing on Large Clusters.. In Proceedings of Operating Systems Design and Implementation OSDI,2004,51(1):107~113

      [19] Dean B J. et al .MapReduce:Simplifieddataprocessing on large clusters. Osdi’,2010,51(1):107~113

      [20] 覃雄派,王會舉,杜小勇,等.大數(shù)據(jù)分析——RDBMS與MapReduce的競爭與共生. 軟件學(xué)報,2012,23(1):32~45

      [21] 孫廣中,肖鋒,熊曦. MapReduce模型的調(diào)度及容錯機制研究. 微電子學(xué)與計算機,2007,24(9):178~180

      [22] 孫廣中,肖鋒,熊曦. MapReduce模型的調(diào)度及容錯機制研究.全國開放式分布與并行計算機學(xué)術(shù)會議,2007:178~180

      [23] 萬至臻.基于MapReduce模型的并行計算平臺的設(shè)計與實現(xiàn).浙江大學(xué),2008

      [24] 陳艷金. MapReduce模型在Hadoop平臺下實現(xiàn)作業(yè)調(diào)度算法的研究和改進.華南理工大學(xué),2011

      [25] 鐘曉,馬少平,等.數(shù)據(jù)挖掘綜述.模式識別與人工智能,2001,14(1):48~55

      [26] 程苗.基于云計算的Web數(shù)據(jù)挖掘.計算機科學(xué),2011,(Z1):146~149

      [27] 王鄂,李銘.云計算下的海量數(shù)據(jù)挖掘研究.現(xiàn)代計算機:專業(yè)版,2009,(11):22~25

      [28] 紀(jì)俊.一種基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)設(shè)計與實現(xiàn).青島大學(xué),2009

      [29] 李軍華.云計算及若干數(shù)據(jù)挖掘算法的MapReduce化研究.電子科技大學(xué),2010

      [30] 賀瑤,王文慶,薛飛.基于云計算的海量數(shù)據(jù)挖掘研究.微機發(fā)展,2013,(2):69~72

      教育部人文社科基金項目(12YJA870008);浙江農(nóng)林大學(xué)暨陽學(xué)院大學(xué)生科技創(chuàng)新項目(TMKC1442)

      猜你喜歡
      柑橘數(shù)據(jù)挖掘節(jié)點
      CM節(jié)點控制在船舶上的應(yīng)用
      Analysis of the characteristics of electronic equipment usage distance for common users
      吃柑橘何來黃疸——認(rèn)識橘黃病
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于AutoCAD的門窗節(jié)點圖快速構(gòu)建
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      柑橘大實蠅綜合治理
      “五及時”柑橘凍害恢復(fù)技術(shù)
      浙江柑橘(2016年4期)2016-03-11 20:12:59
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      抓住人才培養(yǎng)的關(guān)鍵節(jié)點
      宁国市| 通州市| 策勒县| 且末县| 临泉县| 墨玉县| 渭南市| 瓮安县| 涿州市| 汽车| 邮箱| 安新县| 廊坊市| 富裕县| 正蓝旗| 新河县| 静宁县| 瑞丽市| 徐州市| 抚顺市| 外汇| 武定县| 德阳市| 洛宁县| 铅山县| 东明县| 凌云县| 中江县| 广平县| 水富县| 确山县| 秭归县| 马关县| 湖北省| 永福县| 芦溪县| 庄浪县| 南开区| 芮城县| 灵宝市| 鄂托克旗|