王宇
(眉山職業(yè)技術學院,四川眉山620010)
基于大數(shù)據(jù)分析的茶葉質量評估
王宇
(眉山職業(yè)技術學院,四川眉山620010)
茶葉是我國的特色產(chǎn)業(yè),已經(jīng)成為家家戶戶日常飲用和待客過程中不可或缺的重要物品。茶葉質量既關系到人們飲茶的口感,也關系到我國的食品健康安全,更關系到茶葉生產(chǎn)商的品牌形象和信譽。近年來,隨著市場競爭的加劇,質量已經(jīng)成為各大品牌商獲得市場空間的前提和保障。本文以大數(shù)據(jù)分析為平臺,對網(wǎng)絡背景下的茶葉種植狀況和生產(chǎn)情況進行評估,從而對茶葉種植和生產(chǎn)流程進行控制,并對我國茶葉種植和生產(chǎn)過程中的不足進行彌補,為人們提供優(yōu)質茶源,為茶葉生產(chǎn)提供良好的物質保障,提升我國茶葉的國際知名度和市場競爭力。
大數(shù)據(jù)分析;茶葉質量評估;云計算;數(shù)據(jù)網(wǎng)絡
茶葉是我國的一大傳統(tǒng)型產(chǎn)業(yè),其既關系到茶加工企業(yè)的生存和發(fā)展,又關系到與茶相關的邊緣產(chǎn)品的開發(fā)和生產(chǎn)。茶葉的產(chǎn)量和質量決定了我國茶葉市場的發(fā)展動向。但是,氣候條件、環(huán)境條件和生態(tài)條件的不穩(wěn)定性,使我國茶葉在生產(chǎn)和開發(fā)過程中存在諸多問題。茶葉質量是茶葉加工企業(yè)獲得市場空間的基礎,也是人們享受到綠色茶源的基本前提。政府和相關部門要結合茶葉發(fā)展過程中的諸多訴求,對茶葉種植和生產(chǎn)過程進行監(jiān)測,確保對其種植和生產(chǎn)過程中的每一個環(huán)節(jié)進行有效的把控,進而充分發(fā)揮我國茶產(chǎn)業(yè)的市場潛力。但是,依托于傳統(tǒng)的茶葉種植和生產(chǎn)方式對茶葉進行人工現(xiàn)場采樣、評估和監(jiān)測等,會耗費大量的人力和物力,并且受到外部因素制約,采樣效果比較差,進而影響茶葉的整體質量評估效率。計算機技術和網(wǎng)絡技術的快速發(fā)展為茶質量評估提供了廣闊的空間,使茶葉質量評估過程中得以對網(wǎng)絡技術和計算機基礎進行充分應用,進而提升了其質量評估的整體效益。相關人員可以借助網(wǎng)絡技術對天氣、溫度、濕度和病蟲害等不可控信息進行收集和整理,進而結合相關數(shù)據(jù)對其進行分析和預測,實現(xiàn)大數(shù)據(jù)背景下,以茶葉種植和生產(chǎn)為基礎的茶葉質量評估,提高我國的茶葉和茶產(chǎn)品供應質量。
茶葉是我國國民經(jīng)濟發(fā)展過程中的重要組成部分,具有豐富的歷史內涵和文化內涵。而茶葉質量又是我國茶產(chǎn)業(yè)發(fā)展過程中的主要要素。茶葉質量直接關系到人們的飲茶健康和安全。近年來,消費觀念發(fā)生了轉變,人們對茶葉質量提出了更高的要求,政府也不斷凈化茶葉市場環(huán)境,以確保茶產(chǎn)品質量安全,最大程度維護消費者的利益。茶葉質量關系到茶企業(yè)的效益,也關系到國內外消費者對中國茶葉的整體認可度。借助茶葉種植和茶葉生產(chǎn)開發(fā)對茶葉質量進行評估,能夠凈化茶葉市場環(huán)境,降低人們日常飲茶過程中的安全隱患,推進我國茶產(chǎn)業(yè)的快速發(fā)展。同時,對茶葉質量進行評估,能夠從根本上推動我國傳統(tǒng)茶葉種植技術的變革,使相關技術人員積極研發(fā)新型茶葉種植和開發(fā)技術,減少茶葉種植過程中易溶于水的農藥使用量,確保百姓真正喝到放心茶和安心茶。
2.1大數(shù)據(jù)分析與云計算
茶葉質量評估過程中,大數(shù)據(jù)分析的應用原理是借助非結構化和無規(guī)律性的數(shù)據(jù)篩選,對有效的茶葉數(shù)據(jù)信息進行提取,將其廣泛應用到茶葉種植、生產(chǎn)和銷售等各個環(huán)節(jié),進而提升我國茶葉產(chǎn)業(yè)的整體發(fā)展效益。大數(shù)據(jù)分析并不是對茶葉質量評估過程中的相關數(shù)據(jù)進行隨機抽取,而是對所有數(shù)據(jù)進行全面分析。因此,在大數(shù)據(jù)背景下,對茶葉質量進行評估,可以不受采集過程中主觀采集方式和樣本等因素的影響,從根本上提升了數(shù)據(jù)分析結果的準確性。近年來,隨著數(shù)據(jù)分析在茶葉質量評估過程中的廣泛應用,出現(xiàn)了越來越多的分析方式。例如,谷歌公司通過借助互聯(lián)網(wǎng)對網(wǎng)絡環(huán)境背景下的流感數(shù)據(jù)進行分析,進而應用聚合方式對流感發(fā)展情況進行預測,提升了數(shù)據(jù)分析的準確性。同理,借助大數(shù)據(jù)分析技術對網(wǎng)絡上的茶葉信息進行整合,并結合茶企業(yè)本身的發(fā)展特色,選擇合理的茶葉質量分析方式,對茶葉質量進行評估和預測。
云計算是一種分布式平行計算方法,其能夠同時對多種數(shù)據(jù)信息進行處理,并確保數(shù)據(jù)的處理效率和質量。在茶葉質量評估過程中,應用云計算,能夠提升茶葉質量分析速度和計算效率,降低茶葉質量評估過程中的成本。云計算的開發(fā)平臺和應用過程都比較簡單,并且具有容錯性和節(jié)點擴充方面的優(yōu)勢。
2.2平臺設計框架
在云計算背景下進行大數(shù)據(jù)處理,能夠借助網(wǎng)絡對茶葉質量評估中涉及到的相關要素進行分析和處理,并實現(xiàn)數(shù)據(jù)的導入和導出。其主要特點表現(xiàn)在以下幾個方面。首先,其借助Hadoop進行存儲,并將其作為存儲中心,通過多個數(shù)據(jù)源對相關數(shù)據(jù)進行讀取。其次,借助流分析技術實現(xiàn)各種實時數(shù)據(jù)的分析和處理。第三,對經(jīng)過處理的數(shù)據(jù)進行導出操作,并將相關數(shù)據(jù)庫作為其導出對象。第四,實現(xiàn)茶葉質量評估過程中,不同數(shù)據(jù)類型的協(xié)同分析,進而提供有用的茶葉質量評估信息。
大數(shù)據(jù)平臺主要包括數(shù)據(jù)層、數(shù)據(jù)處理層和管理層。數(shù)據(jù)層主要是以流的形式,將茶葉質量評估過程中涉及到的相關數(shù)據(jù)發(fā)送到數(shù)據(jù)處理層。數(shù)據(jù)處理層是在云計算平臺背景下,對數(shù)據(jù)層傳入的數(shù)據(jù)流進行分析和處理。管理層主要是將茶葉質量評估中的相關數(shù)據(jù)進行管理,進而將其處理結果傳送給終端客戶。以DAP為平臺,對不同茶葉質量評估方法進行考慮和應用,進而借助相關技術支持,對茶葉質量評估相關執(zhí)行方案進行確定,從而以大數(shù)據(jù)分析為依托,進行茶葉質量的評估和預測。
3.1數(shù)據(jù)層
數(shù)據(jù)層涵蓋的工作內容和要素比較多。其主要在茶葉質量評估中對茶葉種植和生產(chǎn)過程中涉及到的相關數(shù)據(jù)進行采集和篩選,并借助互聯(lián)網(wǎng)平臺,對茶葉的相關過濾和提取數(shù)據(jù)執(zhí)行情況進行監(jiān)控。應用Hadoop分布式文件系統(tǒng)對處理過的茶葉數(shù)據(jù)信息進行存儲。以云計算為背景,數(shù)據(jù)層能夠實現(xiàn)網(wǎng)絡茶葉數(shù)據(jù)資源的快速采集、整理和更改,進而提高茶葉質量評估過程中的數(shù)據(jù)處理質量和效率,并且操作過程也比較簡單。
在大數(shù)據(jù)背景下對相關茶葉信息采集和分析,一般會對茶葉種植過程中涉及到的環(huán)境和生態(tài)等相關要素進行提取。茶葉種植過程中,影響茶葉質量的因素包括自然環(huán)境、土壤、大氣環(huán)境、氣候和工藝流程等。部分茶葉產(chǎn)地含有重金屬,其會對茶葉造成污染,同時,氣候變暖為病蟲害提供了生長空間,進而影響茶葉的種植質量和產(chǎn)量。在茶葉種植過程中,要嚴格遵循正確的種植流程和標準,對茶葉種植過程中的不利因素進行控制,最大程度避免氣候問題和病蟲害問題的影響,降低茶葉種植效益。利用計算機技術和網(wǎng)絡平臺,對茶葉種植過程中的相關影響要素進行收集和分析,進而借助數(shù)據(jù)分析平臺對相關數(shù)據(jù)進行采集、過濾和存儲。再加上茶企業(yè)往年發(fā)展過程中的茶葉質量評估經(jīng)驗,對茶葉種植和生產(chǎn)過程中的質量進行全面控制,從而凈化茶葉市場,為人們供應優(yōu)質茶葉和茶源,推進我國茶文化傳播和茶產(chǎn)業(yè)的快速發(fā)展。
3.2數(shù)據(jù)處理層
數(shù)據(jù)處理層主要是對經(jīng)過數(shù)據(jù)層處理之后的相關茶葉數(shù)據(jù)進行分析,進而最大程度確保茶葉質量評估的準確性和合理性。筆者以關聯(lián)模型作為茶葉質量評估過程中的核心技術,進行相關操作。
將不同時間和地點背景下的相關氣象生態(tài)信息數(shù)據(jù)向量用X進行假設而茶葉質量數(shù)據(jù)用向量Y進行假設。其中,(X,Y)=X∪Y,任意向量M?(X,Y),其中Supp(M)=Count(M)為M支持度,在向量集合{(X,Y)}中,M的出現(xiàn)次數(shù)用Count(M)表示;針對任意向量,我們將Xi→Yi的關聯(lián)可信度定義為Conf(Xi→Yi)/Supp(Xi);將可信度閾值設為λ,將關聯(lián)規(guī)則集合定義為{Xk→Yk}={Xk,Yk},whereConf(Xk→Yk)≥λ。該模型的執(zhí)行流程為:
首先,借助數(shù)據(jù)層對各種數(shù)據(jù)向量集進行過濾分析。
其次,將閾值設置為λ,計算規(guī)則集合為{Xk,Yk},其中{Xk}為條件集合。
第三,將當前需要評估的條件數(shù)據(jù)設定為X,需要對X與集合{Xk}各個向量的Jaccard相似度進行計算,并對Xm的條件向量進行計算。
該計算模型是在MaoReduce和Hadoop框架云計算背景下,通過并行處理技術對茶葉種植和生產(chǎn)過程中的成本進行降低,進而確保在單個節(jié)點背景下對相關數(shù)據(jù)進行處理。
3.3管理層
大數(shù)據(jù)分析背景下的茶葉質量評估是通過SOA思想設計而成的。面向茶葉質量評估過程中的需要對有關數(shù)據(jù)進行增加和刪除。前臺頁面是借助HTML完成相關設計工作的,其能夠確保與移動設備之間的互動和訪問,通過借助大數(shù)據(jù)工作流思路對相關數(shù)據(jù)信息進行挖掘。進而縮短分析過程和數(shù)據(jù)結果導入時間,提升茶葉質量評估效率。同時,該模式背景下,也為移動終端交互提供了相應的支持,以確保對茶葉種植過程中的相關信息進行快速而準確的獲得,從而提升茶葉的整體種植和生產(chǎn)效益。
大數(shù)據(jù)平臺的應用改變了我國傳統(tǒng)的粗放型茶葉種植和生產(chǎn)模式,很大程度上提高了茶葉種植效率和市場效益。其能夠通過對相關信息數(shù)據(jù)技術的應用,提升茶葉種植過程中的可預測性。傳統(tǒng)茶葉監(jiān)測方式比較落后,其監(jiān)測過程中受到諸多因素的限制,很難確保整體監(jiān)測質量和效率。大數(shù)據(jù)背景下的質量監(jiān)測平臺是網(wǎng)絡時代背景下我國茶葉種植和茶產(chǎn)業(yè)發(fā)展過程中的必然。當前,我國在茶葉質量評估層面已經(jīng)取得了相應的技術成就,相關科研機構和部門要結合我國茶葉種植和發(fā)展狀況,提升茶葉質量評估過程中的技術性和先進性,促進我國茶產(chǎn)業(yè)的健康快速發(fā)展。
[1]何曉葉,李建科,趙偉,劉潤,張琳,孔祥虹.化學指紋圖譜技術在茶葉質量控制中的應用[J].食品科學技術學報,2015(1):49-54.
[2]周峰,馮小萍.基于大數(shù)據(jù)分析的茶葉質量評估[J].現(xiàn)代工業(yè)經(jīng)濟和信息化,2015(9):92-93+104.
[3]劉英,吳曙光,尹州,吳廣紅,曹麗芬.指紋圖譜技術在茶葉研究上的應用[J].茶葉科學,2013(1):13-20.
[4]劉新,張穎彬,潘蓉,王國慶,汪慶華,金壽珍,魯成銀.我國茶葉加工過程的質量安全問題及對策[J].食品科學技術學報,2014(2):16-19.
[5]孫慶磊,楊秀芳,王盈峰,鄒新武,張士康.基于數(shù)據(jù)統(tǒng)計分析的我國茶葉質量安全狀況調查[J].中國茶葉加工,2012(2):4-8.
王宇(1982-),女,四川眉山人,研究生,講師,研究方向:計算機、課程與教學論、計算機輔助教學與管理。