田玉梅 胡君君 黃紀(jì)權(quán) 高盛
摘要:離散型制造企業(yè)存在產(chǎn)品組成零件多、工序不連續(xù)、數(shù)據(jù)信息繁多的特點(diǎn),這些數(shù)據(jù)存儲(chǔ)在不同業(yè)務(wù)系統(tǒng)中,隨著業(yè)務(wù)系統(tǒng)的增多,使得數(shù)據(jù)孤島的現(xiàn)象越發(fā)嚴(yán)重。近年來(lái),大型離散制造企業(yè)越來(lái)越重視業(yè)務(wù)大數(shù)據(jù)平臺(tái)的建設(shè),打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)互通共享,為企業(yè)創(chuàng)造更多有用的數(shù)據(jù)價(jià)值。本文主要通過(guò)業(yè)務(wù)大數(shù)據(jù)平臺(tái)的搭建,實(shí)現(xiàn)了ERP、CRM、MES、PLM、SRM等業(yè)務(wù)系統(tǒng)數(shù)據(jù)集成,為各個(gè)業(yè)務(wù)部門的數(shù)據(jù)分析實(shí)現(xiàn)統(tǒng)一數(shù)據(jù)源。通過(guò)實(shí)現(xiàn)對(duì)集團(tuán)中人員、產(chǎn)品、物流、物料等全體數(shù)據(jù)的集中采集、存儲(chǔ)、處理、分析等,加快了數(shù)據(jù)更新的速率,減少了執(zhí)行人員、管理人員的工作量,并為決策層的決策提供可靠依據(jù)。
關(guān)鍵詞:離散制造,數(shù)據(jù)共享,業(yè)務(wù)大數(shù)據(jù)
1 背景和目的
在當(dāng)今競(jìng)爭(zhēng)越發(fā)激烈的產(chǎn)業(yè)環(huán)境下,為更好幫助全球制造業(yè)應(yīng)對(duì)挑戰(zhàn),各個(gè)發(fā)達(dá)國(guó)家都提出了工業(yè)發(fā)展的戰(zhàn)略,如德國(guó)最先提出工業(yè)4.0這個(gè)概念,這些都離不開(kāi)物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能這些先進(jìn)技術(shù)。借助大數(shù)據(jù)技術(shù)實(shí)現(xiàn)快速準(zhǔn)確的決策,是全球制造企業(yè)正在嘗試的方向。
近幾年,國(guó)內(nèi)龍頭制造企業(yè)借助越來(lái)越來(lái)成熟的信息技術(shù)在提高產(chǎn)品產(chǎn)量和提升質(zhì)量服務(wù)方面獲得了顯著成效。隨著信息系統(tǒng)的增多,國(guó)內(nèi)其他大中型企業(yè)也開(kāi)始意識(shí)到數(shù)據(jù)重要性,并紛紛建立了自己的大數(shù)據(jù)平臺(tái)。國(guó)家電網(wǎng)下屬的省公司、三一重工、中聯(lián)中科等企業(yè)均搭建了自己的業(yè)務(wù)大數(shù)據(jù)平臺(tái),旨在通過(guò)數(shù)據(jù)的集中管理與綜合分析,輔助業(yè)務(wù)部門進(jìn)行業(yè)務(wù)改善、為決策層正確決策提供數(shù)據(jù)支撐。
2 業(yè)務(wù)大數(shù)據(jù)平臺(tái)的關(guān)鍵技術(shù)
2.1 Hadoop
Hadoop[1]是以JAVA語(yǔ)言為基礎(chǔ)實(shí)現(xiàn)的Apache[2] 的開(kāi)源軟件框架,可以使用簡(jiǎn)單的編程模型用以處理和分析海量數(shù)據(jù)的平臺(tái)。Hadoop主要由MapReduce、HDFS、HBase、Hive等核心組件組成,使該框架具有可靠、高效、可伸縮的特點(diǎn)[3]。該框架的可靠性主要體現(xiàn)在它可對(duì)存儲(chǔ)或計(jì)算失敗的數(shù)據(jù)重新分布處理。它的高效性體現(xiàn)在其采用了數(shù)據(jù)并行處理方式,相較于傳統(tǒng)的數(shù)據(jù)處理方式具有較快的處理速度,過(guò)程更加高效。Hadoop還具有可伸縮性,能夠處理PB級(jí)數(shù)據(jù),可對(duì)大型數(shù)據(jù)集進(jìn)行分布式處理,從而通過(guò)在多個(gè)數(shù)據(jù)塊之間利用“分而治之”的方法來(lái)消除數(shù)據(jù)上限。
2.2 HDFS
HDFS是分布式文件系統(tǒng)的簡(jiǎn)稱,是Hadoop架構(gòu)的底部基礎(chǔ),它的上一層是MapReduce引擎[4]。HDFS的數(shù)據(jù)分布并行處理方式使其具有可靠性、容錯(cuò)性、易擴(kuò)展等特點(diǎn)。HDFS是以M/S(主從)模式運(yùn)行的,由NameNode、SecondaryNameNode 和 DataNode三個(gè)組件組成,它們?cè)诩荷鲜前凑?:1:N的比例組成。其中,Master上運(yùn)行的節(jié)點(diǎn)由NameNode和SecondaryNameNode各一個(gè)組成,Slave上運(yùn)行的節(jié)點(diǎn)則是由單種類節(jié)點(diǎn)DataNode多個(gè)組成。NameNode能夠?qū)ξ募脑獢?shù)據(jù)信息、文件命名、客戶端對(duì)文件進(jìn)行訪問(wèn)等數(shù)據(jù)進(jìn)行管理。SecondaryNameNode能夠?qū)ameNode上的edits 和 fsimage 文件定期合并并進(jìn)行處理。DataNode是負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行刪除、存儲(chǔ)等處理的存儲(chǔ)單元。
2.3 MapReduce
MapReduce是Hadoop框架組成部分,與HDFS共同組成Hadoop體系結(jié)構(gòu)的核心[5]。其對(duì)數(shù)據(jù)的處理遵循分而治之的原則,在工作過(guò)程中將數(shù)據(jù)拆分到不同的計(jì)算機(jī)中,加快服務(wù)器對(duì)數(shù)據(jù)的訪問(wèn)和處理,在可擴(kuò)展的方式下能對(duì)超過(guò)TB級(jí)的數(shù)據(jù)進(jìn)行處理。MapReduce主要由Map(映射)和Reduce(規(guī)約)兩部分組成。在工作過(guò)程中,程序會(huì)將輸入的文件拆分成多個(gè)splits,map task將會(huì)對(duì)每個(gè)splits逐一處理,并將結(jié)果輸出到緩沖區(qū)shuffle中。map task任務(wù)完成之后,在Reduce任務(wù)啟動(dòng)之前,線程會(huì)將每個(gè)map結(jié)果拉取到相應(yīng)的reduce task中進(jìn)行合并,最終將所有的reduce task任務(wù)合并在一起,由Reduce輸出。
2.4 HIVE
HIVE是以Java語(yǔ)言為基礎(chǔ)的Apache構(gòu)建,是Hadoopd的一個(gè)數(shù)據(jù)倉(cāng)工具。相較于Hadoopd,直接使用HIVE的開(kāi)發(fā)難度和學(xué)習(xí)成本都相對(duì)較低。HIVE由用戶接口、元數(shù)據(jù)存儲(chǔ)和解釋器、編譯器等組件組成,可對(duì)數(shù)據(jù)進(jìn)行提取、轉(zhuǎn)換和加載等操作。并通過(guò)使用類SQL語(yǔ)言就可在Hadoopd上進(jìn)行存儲(chǔ)、查詢、分析等操作。其中用戶接口提供實(shí)現(xiàn)命令行、JAVA實(shí)現(xiàn)、瀏覽器訪問(wèn)HIVE的功能。元數(shù)據(jù)存儲(chǔ)提供元數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)的功能。解釋器、編譯器等實(shí)現(xiàn)查詢語(yǔ)句的詞法分析、存儲(chǔ)、調(diào)用等功能。
3 研究?jī)?nèi)容與技術(shù)架構(gòu)
3.1 研究?jī)?nèi)容
業(yè)務(wù)大數(shù)據(jù)平臺(tái)本著實(shí)現(xiàn)數(shù)據(jù)共享的設(shè)計(jì)理念,意在將集團(tuán)分散在ERP、CRM、MES、PLM、SRM等業(yè)務(wù)系統(tǒng)內(nèi)的訂單、財(cái)務(wù)、物料、客戶、采購(gòu)、庫(kù)存等數(shù)據(jù)進(jìn)行集中管理與分析,為各業(yè)務(wù)人員在做數(shù)據(jù)分析時(shí)提供統(tǒng)一的數(shù)據(jù)源。為實(shí)現(xiàn)以上目的,本文將從以下幾個(gè)方面進(jìn)行研究:(1);完成業(yè)務(wù)大數(shù)據(jù)平臺(tái)的搭建;(2)實(shí)現(xiàn)數(shù)據(jù)集成、清洗、整理、計(jì)算、存儲(chǔ)等功能;(3)實(shí)現(xiàn)數(shù)據(jù)可視化。目前大數(shù)據(jù)平臺(tái)按照業(yè)務(wù)場(chǎng)景分為財(cái)務(wù)、供應(yīng)鏈、質(zhì)量、人力資源、服務(wù)等業(yè)務(wù)板塊來(lái)進(jìn)行數(shù)據(jù)處理并實(shí)現(xiàn)各板塊數(shù)據(jù)可視化功能。
3.2 技術(shù)架構(gòu)
業(yè)務(wù)大數(shù)據(jù)平臺(tái)基于互聯(lián)網(wǎng)技術(shù)進(jìn)行構(gòu)建,其系統(tǒng)功能架構(gòu)如圖1所示。平臺(tái)采用開(kāi)源hadoop的生態(tài)系統(tǒng)作為大數(shù)據(jù)基礎(chǔ)平臺(tái)底座,提供大數(shù)據(jù)處理的全生命周期配套組件,可根據(jù)業(yè)務(wù)場(chǎng)景,如財(cái)務(wù)、供應(yīng)鏈、質(zhì)量、人力資源、服務(wù)等業(yè)務(wù)場(chǎng)景實(shí)現(xiàn)數(shù)據(jù)分析與應(yīng)用服務(wù)。上層交互采用springboot+react實(shí)現(xiàn)前后端交付服務(wù),實(shí)現(xiàn)后臺(tái)一套代碼可應(yīng)用到不同的可視化端。并且提供了組件mysql/es/redis/minio等,解決了主從架構(gòu)存在數(shù)據(jù)不一致的問(wèn)題。
3.2.1 數(shù)據(jù)集成
數(shù)據(jù)集成作為底層基礎(chǔ)支撐性服務(wù),是大數(shù)據(jù)平臺(tái)的核心功能之一[6]。通過(guò)數(shù)據(jù)接入工具將集團(tuán)結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行集成,并為業(yè)務(wù)大數(shù)據(jù)平臺(tái)提供原始數(shù)據(jù)支撐。在據(jù)集成過(guò)程中數(shù)據(jù)源可以是公司內(nèi)部的業(yè)務(wù)信息系統(tǒng)數(shù)據(jù)庫(kù),也可以是外部的WEB網(wǎng)頁(yè)。并且在配置抽取方法時(shí),也可按照業(yè)務(wù)的應(yīng)用場(chǎng)景來(lái)選擇抽取方式和抽取時(shí)間。目前抽取方式分為全量抽取和增量抽取,抽取時(shí)間分為實(shí)時(shí)抽取和定時(shí)抽取。
3.2.2 數(shù)據(jù)存儲(chǔ)
數(shù)據(jù)存儲(chǔ)作為數(shù)據(jù)采集的上層功能,為數(shù)據(jù)分析共享提供支撐,也是大數(shù)據(jù)平臺(tái)的核心功能[7]。數(shù)據(jù)存儲(chǔ)需要滿足對(duì)結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一存儲(chǔ)和查詢的需求。在數(shù)據(jù)存儲(chǔ)層中通過(guò)數(shù)據(jù)倉(cāng)四層架構(gòu)和建立事實(shí)表、維度表等方式對(duì)數(shù)據(jù)進(jìn)行整理和存儲(chǔ)。文中大數(shù)據(jù)平臺(tái)的數(shù)倉(cāng)四層架構(gòu)主要是包括ODS、DWD、DWS、ADS四層模型有,以及數(shù)倉(cāng)DIM維度建模。
3.2.3 數(shù)據(jù)開(kāi)發(fā)
數(shù)據(jù)開(kāi)發(fā)是將集成數(shù)據(jù)作為原始數(shù)據(jù)來(lái)獲取有價(jià)值的信息,即將數(shù)據(jù)轉(zhuǎn)化為信息的過(guò)程。這個(gè)過(guò)程主要是將各種結(jié)構(gòu)數(shù)據(jù)按照業(yè)務(wù)需求進(jìn)行加工處理,其過(guò)程主要包括加工、分類、歸并、計(jì)算、排序等一系列演變與推導(dǎo)過(guò)程[8]。數(shù)據(jù)開(kāi)發(fā)要結(jié)合具體的業(yè)務(wù)場(chǎng)景進(jìn)行,比如財(cái)務(wù)、質(zhì)量、服務(wù)等不同業(yè)務(wù)場(chǎng)景的開(kāi)發(fā)應(yīng)用。
3.2.4 數(shù)據(jù)分析
數(shù)據(jù)分析作為業(yè)務(wù)大數(shù)據(jù)平臺(tái)提供數(shù)據(jù)深度挖掘和分析服務(wù)的核心功能,利用分布式存儲(chǔ)和并行計(jì)算框架,結(jié)合多種分布式計(jì)算引擎,對(duì)各類結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化的信息資源進(jìn)行快速的分布式計(jì)算。在數(shù)據(jù)分析中要根據(jù)具體業(yè)務(wù)點(diǎn)進(jìn)行,例如,在服務(wù)板塊中就可以按照產(chǎn)品月度服務(wù)滿意度、產(chǎn)品年度滿意服務(wù)度等具體點(diǎn)進(jìn)行數(shù)據(jù)開(kāi)發(fā)。
3.2.5 數(shù)據(jù)呈現(xiàn)
數(shù)據(jù)呈現(xiàn)即使數(shù)據(jù)可視化,可視化是對(duì)結(jié)合業(yè)務(wù)場(chǎng)景進(jìn)行數(shù)據(jù)整理的最終應(yīng)用。該模塊可根據(jù)用戶的層級(jí)和部門業(yè)務(wù)類型來(lái)分配查看相應(yīng)的可視化數(shù)據(jù),幫助用戶了解當(dāng)前業(yè)務(wù)的運(yùn)營(yíng)情況,從而作出更精準(zhǔn)的預(yù)測(cè)和判斷。數(shù)據(jù)呈現(xiàn)可以在PC端、移動(dòng)端以圖表呈現(xiàn)、報(bào)表推送等形式進(jìn)行展示。
4 實(shí)踐應(yīng)用
業(yè)務(wù)大數(shù)據(jù)平臺(tái)搭建后,可應(yīng)用日常工作和日常管理的方方面面,基于本平臺(tái)搭建后的相關(guān)實(shí)踐經(jīng)驗(yàn),將對(duì)部分應(yīng)用場(chǎng)景進(jìn)行介紹。
4.1 業(yè)務(wù)應(yīng)用
4.1.1 員工職業(yè)全生命周期
員工信息數(shù)據(jù)通過(guò)業(yè)務(wù)大數(shù)據(jù)平臺(tái)進(jìn)行數(shù)據(jù)可視化分析展示,圖3中(1)圖從人員數(shù)量、男女比例、學(xué)歷分布、層級(jí)比例等顯示了不同系統(tǒng)的人員整體情況。其余三個(gè)圖則是從每個(gè)員工的個(gè)人詳細(xì)情況進(jìn)行呈現(xiàn),全方位展示每個(gè)員工從入職到離職的信息,包括人員基本信息、教育、薪資社保、培訓(xùn)、資產(chǎn)等。
4.1.2 產(chǎn)品生產(chǎn)制造全生命周期
在跟進(jìn)產(chǎn)品全生命周期時(shí),通過(guò)根據(jù)產(chǎn)品類型和銷售屬性分不同界面顯示每臺(tái)產(chǎn)品從市場(chǎng)到回款不同時(shí)間節(jié)點(diǎn)的進(jìn)度完成情況。并且在詳細(xì)界面以每臺(tái)設(shè)備為基礎(chǔ)對(duì)其每個(gè)時(shí)間節(jié)點(diǎn)進(jìn)行詳細(xì)描述。以產(chǎn)品DZXXX為例,可在市場(chǎng)節(jié)點(diǎn)中查詢?cè)摦a(chǎn)品合同信息,包括項(xiàng)目名稱、客戶名稱等詳細(xì)信息。在物資采購(gòu)節(jié)點(diǎn)可查詢?cè)摴?jié)點(diǎn)計(jì)劃進(jìn)行時(shí)間和實(shí)際進(jìn)行時(shí)間,以及不同物料屬性的簽約率和到貨率。解決了業(yè)務(wù)人員需要在不同業(yè)務(wù)系統(tǒng)查詢不同節(jié)點(diǎn)的信息的問(wèn)題,統(tǒng)一了數(shù)據(jù)來(lái)源,降低了時(shí)間成本,減少了工作量,避免了數(shù)據(jù)人工統(tǒng)計(jì)出錯(cuò),幫助業(yè)務(wù)人員從整體到局部全方位把控生產(chǎn)進(jìn)度,提高了工作效率。產(chǎn)品生產(chǎn)制造整體進(jìn)度情況如4所示,產(chǎn)品生產(chǎn)制造進(jìn)度詳細(xì)內(nèi)容如圖5所示。
4.1.3 指揮監(jiān)控中心
根據(jù)業(yè)務(wù)類型制作不同的可視化監(jiān)控大屏,本文將主要從經(jīng)營(yíng)、生產(chǎn)、服務(wù)三個(gè)業(yè)務(wù)板塊進(jìn)行介紹。經(jīng)營(yíng)計(jì)劃板塊,從客戶分布的地圖顯示可直接看出客戶各地分布集中情況,客戶分類匯總中可看出公司產(chǎn)品主要面向的客戶行業(yè)以及項(xiàng)目進(jìn)度監(jiān)控可了解到某臺(tái)產(chǎn)品的整體進(jìn)度概況。生產(chǎn)制造板塊,主要顯示了工位的使用情況,以及設(shè)備的利用率和生產(chǎn)人員分布情況的分析。售后服務(wù)板塊,主要分析內(nèi)容為每種產(chǎn)品派工次數(shù)、產(chǎn)品的分布情況,服務(wù)人員調(diào)度信息,服務(wù)達(dá)成率,以及服務(wù)滿意度等內(nèi)容。
4.2 成效分析
4.2.1 經(jīng)濟(jì)效益分析
業(yè)務(wù)大數(shù)據(jù)平臺(tái)的搭建,改變了公司員工傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)分析方式,減少工作量,保證了數(shù)據(jù)統(tǒng)一性,提升了工作效率,減少人力物力和生產(chǎn)成本輸出。具體體現(xiàn)在:一是員工不需要再去各個(gè)業(yè)務(wù)系統(tǒng)里下載業(yè)務(wù)需求的數(shù)據(jù)再線下人工進(jìn)行統(tǒng)計(jì)分析,只需將工作中涉及到的業(yè)務(wù)系統(tǒng)和業(yè)務(wù)指標(biāo)計(jì)算邏輯提供給大數(shù)據(jù)人員即可;二是業(yè)務(wù)大數(shù)據(jù)平臺(tái)可對(duì)其他業(yè)務(wù)系統(tǒng)進(jìn)行集成,抽取目標(biāo)業(yè)務(wù)數(shù)據(jù),規(guī)范了數(shù)據(jù)源,減少了不同部分由于系統(tǒng)不相通而造成的數(shù)據(jù)偏差,保持了數(shù)據(jù)統(tǒng)一性;三是利用機(jī)器學(xué)習(xí)對(duì)業(yè)務(wù)的歷史數(shù)據(jù)進(jìn)行學(xué)習(xí)挖掘,如對(duì)物料的采購(gòu)、庫(kù)存情況進(jìn)行分析預(yù)測(cè),減少物料呆滯,降低生產(chǎn)成本。
4.2.2 時(shí)間效益分析
面對(duì)離散分布在各業(yè)務(wù)系統(tǒng)的海量數(shù)據(jù),傳統(tǒng)的處理方式需要在不同的業(yè)務(wù)系統(tǒng)中進(jìn)行運(yùn)算再合并,需要耗費(fèi)大量的時(shí)間,而業(yè)務(wù)大數(shù)據(jù)平臺(tái)可以將這些業(yè)務(wù)數(shù)據(jù)快速集成運(yùn)算,減少了計(jì)算的時(shí)間消耗。
5 總結(jié)與展望
5.1 研究創(chuàng)新
業(yè)務(wù)大數(shù)據(jù)平臺(tái),依據(jù)企業(yè)關(guān)于業(yè)務(wù)服務(wù)的個(gè)性化要求,實(shí)現(xiàn)了數(shù)據(jù)集中處理,規(guī)范化了產(chǎn)品離散制造數(shù)據(jù)來(lái)源,提高了企業(yè)產(chǎn)品制造和服務(wù)的管理水平,為公司不同層級(jí)的員工提供了高效的運(yùn)行服務(wù)管理平臺(tái)。
(1)基于Hadoop平臺(tái)搭建集團(tuán)數(shù)據(jù)倉(cāng)庫(kù),進(jìn)行結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)管理。當(dāng)進(jìn)行業(yè)務(wù)數(shù)據(jù)集成時(shí),會(huì)面對(duì)各種不同的數(shù)據(jù)源,如結(jié)構(gòu)化數(shù)據(jù)源Hive、MySQL、SQL、Server、PostgreSQL、Oracle、DB2L等,和非結(jié)構(gòu)化數(shù)據(jù)源Mongodb等。本平臺(tái)的搭建可以各種數(shù)據(jù)源類型的業(yè)務(wù)平臺(tái)進(jìn)行數(shù)據(jù)抽取,打破了各業(yè)務(wù)系統(tǒng)數(shù)據(jù)壁壘的現(xiàn)象,實(shí)現(xiàn)了數(shù)據(jù)共享,為業(yè)務(wù)部門的數(shù)據(jù)調(diào)用規(guī)范了數(shù)據(jù)來(lái)源,提高了數(shù)據(jù)利用率,促進(jìn)了各業(yè)務(wù)系統(tǒng)數(shù)據(jù)治理的進(jìn)度。
(2)將機(jī)器學(xué)習(xí)算法應(yīng)用于業(yè)務(wù)分析及預(yù)測(cè)。根據(jù)收集來(lái)的不同數(shù)據(jù)源的信息,利用機(jī)器算法對(duì)數(shù)據(jù)進(jìn)行價(jià)值挖掘,對(duì)業(yè)務(wù)的發(fā)展進(jìn)行預(yù)測(cè)。
(3)全流程數(shù)據(jù)鏈路可視化管理。通過(guò)業(yè)務(wù)大數(shù)據(jù)平臺(tái)可視化模塊實(shí)現(xiàn)報(bào)表設(shè)計(jì)功能與報(bào)表管理功能,在報(bào)表設(shè)計(jì)模塊中,配置數(shù)據(jù)源實(shí)現(xiàn)從大數(shù)據(jù)平臺(tái)數(shù)據(jù)倉(cāng)庫(kù)中獲取數(shù)據(jù),進(jìn)行統(tǒng)計(jì)分析,以圖表形式在瀏覽器中實(shí)現(xiàn)可視化展示。同時(shí)根據(jù)公司員工的業(yè)務(wù)部門以及層級(jí)對(duì)報(bào)表進(jìn)行權(quán)限控制,保證報(bào)表資源安全管控,幫助業(yè)務(wù)人員在日常工作中實(shí)現(xiàn)全流程數(shù)據(jù)鏈路可視化的管理。
5.2 不足與展望
本文中的業(yè)務(wù)大數(shù)據(jù)平臺(tái)已建設(shè)完成,但實(shí)際應(yīng)用還處在初期。目前已完成數(shù)據(jù)集成進(jìn)行業(yè)務(wù)數(shù)據(jù)分析,但是數(shù)據(jù)的更深層次價(jià)值的挖掘還有待我們進(jìn)步一步研究。
參考文獻(xiàn):
[1]李建平.Hadoop大數(shù)據(jù)計(jì)算平臺(tái)搭建實(shí)踐[J].中國(guó)無(wú)線電,2021(04):98-101.
[2]李學(xué)龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述[J].中國(guó)科學(xué):信息科學(xué),2015,45(01):1-44.
[3]李曉晴.大數(shù)據(jù)平臺(tái)技術(shù)分析[J].信息記錄材料,2021,22(01):117-118.
[4]員青澤.人工智能大數(shù)據(jù)平臺(tái)及應(yīng)用分析[J].電腦知識(shí)與技術(shù),2020,16(26):171-172+175.
[5]李曉東,葉思水.基于Hadoop的高可靠分布式計(jì)算平臺(tái)的構(gòu)建[J].北京電子科技學(xué)院學(xué)報(bào),2014,22(02):25-29.
[6]顧軍華,官磊,張建,高星,張素琪.基于Hadoop的IPTV隱式評(píng)分模型[J].計(jì)算機(jī)應(yīng)用,2017,37(11):3188-3193.