謝梅源
摘? ?要:針對(duì)高職院校招生信息化面臨的諸多問(wèn)題,本文借助大數(shù)據(jù)技術(shù),提出了基于大數(shù)據(jù)技術(shù)的高職招生平臺(tái)建設(shè)研究,并對(duì)平臺(tái)的整體架構(gòu)和主要功能設(shè)計(jì)進(jìn)行了探討。本研究整合學(xué)校招生、培養(yǎng)、就業(yè)數(shù)據(jù)并抓取網(wǎng)絡(luò)上的相關(guān)信息,為高職院校輔助制定招生政策提供指導(dǎo)服務(wù)。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);招生平臺(tái)研究;輔助招生決策
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2019)07-0062-04
隨著現(xiàn)代科技的發(fā)展,信息技術(shù)的應(yīng)用越來(lái)越廣泛,高校招生已經(jīng)有了非常豐富的報(bào)考和招生信息。隨著新高考改革的推進(jìn),高職院校的招生模式不斷創(chuàng)新和多樣化,優(yōu)質(zhì)生源競(jìng)爭(zhēng)也越來(lái)越激烈,各高校在制定招生專業(yè)計(jì)劃時(shí),需對(duì)歷年本校及競(jìng)爭(zhēng)學(xué)校招生錄取過(guò)程中收集到的各種招生數(shù)據(jù)信息進(jìn)行研究分析,同時(shí)也需對(duì)市場(chǎng)上的就業(yè)招聘信息與招生工作進(jìn)行相關(guān)分析,從而更科學(xué)地制定招生政策、招生計(jì)劃,提高生源質(zhì)量,促進(jìn)學(xué)校發(fā)展。
1.招生各數(shù)據(jù)源信息不一致
大多數(shù)高校是面向全國(guó)招生的,各省份招生政策存在差異,下載數(shù)據(jù)在結(jié)構(gòu)上有較大差異,考生信息數(shù)據(jù)列、數(shù)據(jù)含義也有較大差別。甚至同一個(gè)省份的多元化招生模式,如提前招生、五年制合作、普高高考、單獨(dú)考試等,不同招生類型考生數(shù)據(jù)信息也不統(tǒng)一。生源數(shù)據(jù)結(jié)構(gòu)和標(biāo)準(zhǔn)不統(tǒng)一,給數(shù)據(jù)共享和統(tǒng)計(jì)分析造成了很大工作量。
2.各系統(tǒng)各自獨(dú)立形成信息孤島
大多數(shù)高校各部門為了工作方便都會(huì)有信息化系統(tǒng),但缺乏統(tǒng)一規(guī)劃,系統(tǒng)間彼此獨(dú)立,互不兼容,造成存在不同的數(shù)據(jù)格式標(biāo)準(zhǔn)和數(shù)據(jù)庫(kù);甚至同一部分在不同時(shí)期建立的系統(tǒng)之間也未能形成信息共享體系,如招生宣傳網(wǎng)、招生數(shù)據(jù)管理、提前招生,就業(yè)管理等多個(gè)系統(tǒng),這些數(shù)據(jù)孤立地存放在本地?cái)?shù)據(jù)庫(kù)里,對(duì)這些系統(tǒng)數(shù)據(jù)隱含的價(jià)值以及數(shù)據(jù)之間的關(guān)聯(lián)沒(méi)有深入挖掘和利用,無(wú)法提供更深層次的決策服務(wù)。
3.“招生-培養(yǎng)-就業(yè)”未形成聯(lián)動(dòng)
高校的人才培養(yǎng)由招生、培養(yǎng)和就業(yè)構(gòu)成,三個(gè)環(huán)節(jié)緊密相連,共同構(gòu)成高校人才培養(yǎng)的系統(tǒng)過(guò)程。通過(guò)多年的招生、培養(yǎng)、就業(yè)數(shù)據(jù)積累,數(shù)據(jù)體現(xiàn)出數(shù)據(jù)量巨大、數(shù)據(jù)價(jià)值增加、數(shù)據(jù)種類多樣、數(shù)據(jù)處理復(fù)雜等重要特點(diǎn),當(dāng)前就業(yè)招聘市場(chǎng)的信息變化常常預(yù)示后繼幾年社會(huì)對(duì)人才需求的變化,高校當(dāng)前招生專業(yè)及人數(shù)的精準(zhǔn)管理需要同時(shí)研究就業(yè)市場(chǎng)的數(shù)據(jù)來(lái)進(jìn)行優(yōu)化,如果沒(méi)有應(yīng)用大數(shù)據(jù)平臺(tái)來(lái)進(jìn)行分析和挖掘,就不能充分利用招生、就業(yè)數(shù)據(jù)的價(jià)值,就無(wú)法形成三個(gè)環(huán)節(jié)數(shù)據(jù)的聯(lián)動(dòng)。
建立一個(gè)基于大數(shù)據(jù)的招生平臺(tái)必須要有一個(gè)技術(shù)層次合理的系統(tǒng)架構(gòu)(如圖1所示)。平臺(tái)從下往上可以分為四層:一是數(shù)據(jù)治理層,負(fù)責(zé)招生數(shù)據(jù)及相關(guān)就業(yè)數(shù)據(jù)的導(dǎo)入、抓取、清洗、規(guī)范化等數(shù)據(jù)治理工作;二是大數(shù)據(jù)平臺(tái)層,運(yùn)用以Hadoop為代表的大數(shù)據(jù)技術(shù),對(duì)歸集的招生、就業(yè)、招聘數(shù)據(jù)進(jìn)行處理;三是數(shù)據(jù)應(yīng)用層,對(duì)大數(shù)據(jù)處理層處理的結(jié)果基于招生業(yè)務(wù)需要進(jìn)行功能設(shè)計(jì)、統(tǒng)計(jì)分析、數(shù)據(jù)相關(guān)性計(jì)算等,并進(jìn)行大數(shù)據(jù)展示,以及歷年招生大數(shù)據(jù)的展現(xiàn),用于招生政策決策分析;四是應(yīng)用門戶,將數(shù)據(jù)應(yīng)用層產(chǎn)生的業(yè)務(wù)結(jié)果數(shù)據(jù)以網(wǎng)站、手機(jī)APP、手機(jī)微信應(yīng)用等多種形式提供給用戶端使用。
1.數(shù)據(jù)治理層
招生平臺(tái)數(shù)據(jù)來(lái)源:一方面有學(xué)校歷年的招生數(shù)據(jù),數(shù)據(jù)源格式有Excel、各類文件、關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù),這些數(shù)據(jù)的格式差別很大,需要進(jìn)行數(shù)據(jù)規(guī)范化、標(biāo)準(zhǔn)化后導(dǎo)入招生平臺(tái)數(shù)據(jù)倉(cāng)庫(kù);另一方面,為了開(kāi)展招生、培養(yǎng)、就業(yè)全過(guò)程數(shù)據(jù)的分析研究,我們還要導(dǎo)入學(xué)校學(xué)生培養(yǎng)期間成績(jī)數(shù)據(jù)、企業(yè)招聘數(shù)據(jù)、學(xué)生就業(yè)數(shù)據(jù)等,這些數(shù)據(jù)來(lái)源有Excel、各類文件、關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù),以及通過(guò)Python爬蟲(chóng)爬取的互聯(lián)網(wǎng)各類網(wǎng)站上的數(shù)據(jù)。簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)治理就是處理數(shù)據(jù)的策略——收集、驗(yàn)證、存儲(chǔ)、訪問(wèn)、保護(hù)和使用數(shù)據(jù)。數(shù)據(jù)治理層就是針對(duì)這些不同的數(shù)據(jù)源、不同的數(shù)據(jù)格式,通過(guò)數(shù)據(jù)治理工具開(kāi)展數(shù)據(jù)格式規(guī)整、數(shù)據(jù)值域規(guī)范化、元數(shù)據(jù)標(biāo)準(zhǔn)化相關(guān)工作,同時(shí)通過(guò)ETL工具去除一部分臟數(shù)據(jù),將元數(shù)據(jù)、主數(shù)據(jù)、招生就業(yè)數(shù)據(jù)、企業(yè)招聘參考數(shù)據(jù)生成標(biāo)準(zhǔn)、規(guī)范、有價(jià)值的數(shù)據(jù)集并導(dǎo)入招生平臺(tái)數(shù)據(jù)倉(cāng)庫(kù)。
2.大數(shù)據(jù)平臺(tái)層
大數(shù)據(jù)平臺(tái)層對(duì)數(shù)據(jù)治理后導(dǎo)入的招生、就業(yè)、學(xué)業(yè)、招聘相關(guān)信息進(jìn)行數(shù)據(jù)處理?;跀?shù)據(jù)類型多樣及數(shù)據(jù)量龐大,采用關(guān)系數(shù)據(jù)庫(kù)、NoSql和Hbase數(shù)據(jù)庫(kù)相結(jié)合的模式。Hadoop主要由兩部分組成:一是HDFS,即Hadoop Distributed file System,是屬于Hadoop的分布式文件系統(tǒng);二是Hadoop MapReduce,它是一種分布式計(jì)算引擎,包括大規(guī)模的文字處理、數(shù)據(jù)挖掘等,它分兩個(gè)階段,一個(gè)是Map階段,一個(gè)是Reduce階段,Map階段就是把輸入來(lái)的諸多并行任務(wù)分給各個(gè)節(jié)點(diǎn)分別計(jì)算處理,Reduce則將Map分到各節(jié)點(diǎn)處理的結(jié)果進(jìn)行匯總。Hive是一個(gè)構(gòu)建在Hadoop上的數(shù)據(jù)倉(cāng)庫(kù)工具,通過(guò)Hive將存儲(chǔ)在HDFS平臺(tái)上的數(shù)據(jù)與傳統(tǒng)SQL結(jié)合起來(lái),輕松地向Hadoop遷移。
3.數(shù)據(jù)應(yīng)用層
根據(jù)大數(shù)據(jù)平臺(tái)層的基礎(chǔ)數(shù)據(jù)與業(yè)務(wù)數(shù)據(jù)處理結(jié)果,開(kāi)發(fā)招生業(yè)務(wù)相關(guān)的招生志愿填報(bào)智能服務(wù)、中高職銜接、招生宣傳管理、招生數(shù)據(jù)綜合分析展現(xiàn)等應(yīng)用,同時(shí)將就業(yè)數(shù)據(jù)、企業(yè)招聘數(shù)據(jù)與招生數(shù)據(jù)進(jìn)行相關(guān)性研究,提供招生政策、招生計(jì)劃來(lái)輔助決策功能。
4.應(yīng)用門戶層
應(yīng)用門戶層是將招生平臺(tái)的功能與數(shù)據(jù)向用戶端推送。用戶端的形式有Web門戶網(wǎng)站、手機(jī)APP、手機(jī)微信公眾號(hào)和微信小程序,同時(shí)將數(shù)據(jù)應(yīng)用層開(kāi)發(fā)業(yè)務(wù)邏輯封裝成HTML5頁(yè)面提供給第三方用戶端門戶,包括電視終端。用戶端查詢、交互性能基于業(yè)務(wù)邏輯及 Hadoop數(shù)據(jù)平臺(tái)進(jìn)行優(yōu)化。
1.分析數(shù)據(jù)結(jié)構(gòu),設(shè)計(jì)萬(wàn)能導(dǎo)入模板
通過(guò)研究不同省份錄取數(shù)據(jù)的含義及數(shù)據(jù)列的差別,分析浙江省不同招生類型的數(shù)據(jù)源,結(jié)合用戶需求及業(yè)務(wù)管理流程,設(shè)計(jì)標(biāo)準(zhǔn)化數(shù)據(jù)結(jié)構(gòu)。平臺(tái)實(shí)現(xiàn)以用戶自定義的差異化數(shù)據(jù)模板為基準(zhǔn),將導(dǎo)入平臺(tái)的數(shù)據(jù)與對(duì)應(yīng)模板進(jìn)行自動(dòng)匹配,轉(zhuǎn)換成統(tǒng)一的數(shù)據(jù)格式。這種自定義的萬(wàn)能模板,支持各種無(wú)序數(shù)據(jù)的導(dǎo)入,大大縮短了以往手工處理與管理數(shù)據(jù)所需要的時(shí)間和精力。另外,隨著其它省份新高考改革推進(jìn)所帶來(lái)的錄取規(guī)則及數(shù)據(jù)變化,用戶也只需要修改現(xiàn)有的模板規(guī)則,輕松完成數(shù)據(jù)導(dǎo)入。
2.利用爬蟲(chóng)技術(shù),抓取招生數(shù)據(jù)和招聘數(shù)據(jù)
浙江省2017年新高考按專業(yè)投檔后,各高校專業(yè)投檔信息可以通過(guò)考試院網(wǎng)站數(shù)據(jù)下載處理分析獲得,而其他省份招生數(shù)據(jù)并沒(méi)有在其考試院進(jìn)行公布,可以通過(guò)各高校招生網(wǎng)獲取更多專業(yè)在省外的招生數(shù)據(jù),但人工獲取統(tǒng)計(jì)工作量極大,需利用爬蟲(chóng)技術(shù)進(jìn)行獲取。為了收集更多目標(biāo)考生,進(jìn)行精準(zhǔn)宣傳,通過(guò)爬蟲(chóng)技術(shù)在各高校招生網(wǎng)、百度貼吧等問(wèn)答帖收集考生信息。另外,為進(jìn)一步優(yōu)化專業(yè)結(jié)構(gòu),不斷提高人才培養(yǎng)和社會(huì)需求的契合度,通過(guò)爬蟲(chóng)技術(shù)在“51Job”、“智聯(lián)招聘”等網(wǎng)站搜集招聘信息。爬蟲(chóng)技術(shù)分為三個(gè)部分:①Url管理器:對(duì)關(guān)注的招生就業(yè)網(wǎng)站URL進(jìn)行管理,包括已爬取Url和待爬取Url。②網(wǎng)頁(yè)下載器:根據(jù)爬取的Url地址,將網(wǎng)頁(yè)下載并保存到本地,存儲(chǔ)為字符串。③網(wǎng)頁(yè)解析器:將招生和就業(yè)網(wǎng)頁(yè)字符串中有價(jià)值的數(shù)據(jù)進(jìn)行解析,將解析出來(lái)的數(shù)據(jù)導(dǎo)入大數(shù)據(jù)層的數(shù)據(jù)倉(cāng)庫(kù)加以利用。
3.規(guī)范招生流程,設(shè)計(jì)招生業(yè)務(wù)系統(tǒng)
“招生數(shù)據(jù)管理系統(tǒng)”具有招生過(guò)程數(shù)據(jù)管理、招生計(jì)劃編制、生源校維護(hù)管理、各年份招生數(shù)據(jù)導(dǎo)入導(dǎo)出等功能?!罢猩麄鞴芾怼卑▽I(yè)介紹、歷年分?jǐn)?shù)線、招生動(dòng)態(tài)、在線報(bào)名、在線咨詢、在線查詢、微信互動(dòng)等功能?!案呖贾驹干上到y(tǒng)”包括各校各專業(yè)錄取投檔線查詢及新高考志愿填報(bào)模板的生成功能,這種免費(fèi)服務(wù)考生的系統(tǒng),可以吸引考生訪問(wèn)網(wǎng)站,提高學(xué)校的口碑宣傳,強(qiáng)化目標(biāo)用戶黏度,拓寬招生口徑。“中高職銜接管理”這種分段制培養(yǎng)模式是在兩個(gè)不同學(xué)校,分別完成各自的中、高職教育,培養(yǎng)和管理目標(biāo)銜接性,可以分析中職學(xué)校招生情況、生源質(zhì)量、在校生流失、人才培養(yǎng)計(jì)劃、學(xué)習(xí)成績(jī)和選拔升學(xué)成績(jī)等情況,可以為高校是否繼續(xù)與該中職學(xué)校合作招生的決策提供數(shù)據(jù)依據(jù)。浙江省各高校專業(yè)投檔數(shù)據(jù)分析功能包括提前招生、單獨(dú)考試、藝術(shù)類、普通高考等招生計(jì)劃的處理,結(jié)合各段投檔信息及剩余計(jì)劃,生成浙江省各專業(yè)各段投檔線、錄取數(shù)、各專業(yè)錄取分?jǐn)?shù)線及未完成計(jì)劃等信息。
4.分析招生工作流程,研究專業(yè)招生模型
專業(yè)招生分析模型(如圖2所示)分為專業(yè)設(shè)置、招生宣傳、專業(yè)錄取、專業(yè)培養(yǎng)及就業(yè)等階段,各階段數(shù)據(jù)互相影響依賴,形成業(yè)務(wù)閉環(huán)。該分析模型對(duì)招生過(guò)程中的新老專業(yè)進(jìn)行設(shè)置,并分析冷熱門專業(yè),對(duì)計(jì)劃分配、人才培養(yǎng)方案制定、市場(chǎng)人才需求預(yù)測(cè)和精準(zhǔn)招生宣傳等具有指導(dǎo)作用。
例如:研究分析專業(yè)冷熱度,專業(yè)熱度代表當(dāng)年社會(huì)對(duì)專業(yè)的向往程度。浙江省新高考實(shí)施后,分段進(jìn)行投檔,不同分?jǐn)?shù)段考生選擇專業(yè)的出發(fā)點(diǎn)會(huì)有所區(qū)別,因此分本科和高職進(jìn)行統(tǒng)計(jì)。同一學(xué)校的不同專業(yè)往往越熱門的分?jǐn)?shù)越高,專業(yè)在每一所學(xué)校的相對(duì)位置以百分比來(lái)衡量,對(duì)位置百分比進(jìn)行分段賦分,排名位置越前面對(duì)其賦分分值越大,表示專業(yè)越熱門,最后把所有院校某個(gè)專業(yè)的熱度值求平均值,用這個(gè)平均值來(lái)排名分析專業(yè)冷熱度。
5.通過(guò)數(shù)據(jù)可視化技術(shù),輔助招生政策制定
平臺(tái)數(shù)據(jù)可視化讓新生報(bào)到情況、招生錄取情況、重點(diǎn)生源校、招生計(jì)劃、冷熱門專業(yè)、專業(yè)需求、招聘崗位需求等數(shù)據(jù)分析結(jié)果更直觀生動(dòng),招生錄取情況等可“一目了然”。通過(guò)分析專業(yè)熱門度,可使招生相關(guān)領(lǐng)導(dǎo)及時(shí)關(guān)注到專業(yè)在社會(huì)、學(xué)生及家長(zhǎng)中的認(rèn)可度,以此調(diào)整專業(yè)招生數(shù)量,確保優(yōu)勢(shì)專業(yè)招生人數(shù)和生源質(zhì)量,限制劣勢(shì)專業(yè)的招生,科學(xué)規(guī)劃學(xué)校的新舊專業(yè)設(shè)置。
6.就業(yè)招生數(shù)據(jù)相關(guān)性研究
通過(guò)爬蟲(chóng)抓取網(wǎng)上的當(dāng)年招聘信息、學(xué)生就業(yè)信息等大數(shù)據(jù)信息,將前面兩個(gè)因素設(shè)為與招生計(jì)劃相關(guān)的因素。通過(guò)數(shù)據(jù)統(tǒng)計(jì)及相關(guān)性理論[3],我們嘗試將兩個(gè)因素大數(shù)據(jù)處理后算出相關(guān)性系統(tǒng)再分級(jí)標(biāo)簽化。比如將抓取的招聘信息按企業(yè)等級(jí)分類統(tǒng)計(jì)反映某類專業(yè)市場(chǎng)需求變化標(biāo)簽化(增長(zhǎng)為+,最大為5+,最少為1+;減少為-,最大為5-,最少為1-),學(xué)生就業(yè)企業(yè)的等級(jí)與大致薪水也按此法標(biāo)簽化。給學(xué)校今年計(jì)劃招生的專業(yè)根據(jù)以上算法都標(biāo)上標(biāo)簽,供制定每個(gè)專業(yè)具體招生人數(shù)決策時(shí)參考,或者供學(xué)校領(lǐng)導(dǎo)根據(jù)這些標(biāo)簽化的信息來(lái)統(tǒng)籌分配各專業(yè)招生人數(shù)之間的微調(diào)。每年每個(gè)招生專業(yè)的具體招生人數(shù)根據(jù)招聘、就業(yè)大數(shù)據(jù)產(chǎn)生的標(biāo)簽微調(diào)執(zhí)行后的結(jié)果存貯,可用于來(lái)年對(duì)產(chǎn)生大數(shù)據(jù)標(biāo)簽的算法進(jìn)行改進(jìn),從而提高相關(guān)性算法的準(zhǔn)確度。
1.招生工作流程信息化
本平臺(tái)從學(xué)校實(shí)際需求出發(fā),合理規(guī)劃流程,改變繁瑣的數(shù)據(jù)處理過(guò)程,減少不必要的中間環(huán)節(jié),提高招生工作效率。如招生計(jì)劃編制,原來(lái)為各專業(yè)通過(guò)Excel文件報(bào)到招生處統(tǒng)籌安排,需多次優(yōu)化調(diào)整并進(jìn)行反饋,才能形成最終計(jì)劃輸入到全國(guó)普通高校來(lái)源計(jì)劃系統(tǒng)中,并且還要進(jìn)行多次核對(duì)?,F(xiàn)在,通過(guò)使用大數(shù)據(jù)招生平臺(tái),可以智能調(diào)整專業(yè)招生計(jì)劃分配,簡(jiǎn)化計(jì)劃,優(yōu)化次數(shù),并自動(dòng)生成數(shù)據(jù)模板導(dǎo)入全國(guó)普通高校來(lái)源計(jì)劃系統(tǒng),大大減少工作量。通過(guò)招生平臺(tái),可以針對(duì)不同類型考生進(jìn)行招生宣傳,提供相對(duì)應(yīng)的生源基地建設(shè)與宣傳,同時(shí)系統(tǒng)智能提供招生方案建議,并向目標(biāo)考生推送感興趣的信息,進(jìn)行精準(zhǔn)宣傳。平臺(tái)可為注冊(cè)用戶提供志愿填報(bào)智能服務(wù),讓考生們能夠準(zhǔn)確選上自己喜歡的專業(yè)。這些精細(xì)化的運(yùn)營(yíng)舉措,不但能真正達(dá)到服務(wù)考生的目的,同時(shí)提升了招生宣傳效果。
2.大數(shù)據(jù)輔助招生政策及招生計(jì)劃決策
招聘、就業(yè)大數(shù)據(jù)與招生計(jì)劃相關(guān)性的研究結(jié)果,通過(guò)標(biāo)簽化用于招生計(jì)劃執(zhí)行時(shí)參照,可以在一定程度上提高招生工作與市場(chǎng)招聘、歷年就業(yè)之間的相關(guān)性,有利于下一步進(jìn)行“招生-培養(yǎng)-就業(yè)”聯(lián)動(dòng)數(shù)據(jù)分析。
大數(shù)據(jù)招生平臺(tái)的運(yùn)用能夠提高招生管理工作的效率,能夠轉(zhuǎn)變招生宣傳模式,推動(dòng)精準(zhǔn)招生宣傳,吸引高質(zhì)量的生源報(bào)考,大數(shù)據(jù)可視化技術(shù)可以為招生決策提供更直觀的分析參考。招聘、就業(yè)信息與招生、培養(yǎng)信息的相關(guān)性研究只是嘗試,下一步將引入高維數(shù)據(jù)相關(guān)的語(yǔ)義分析算法再作深入研究,提高招聘就業(yè)信息對(duì)招生工作相關(guān)性價(jià)值的深度利用,促進(jìn)招生政策與招生計(jì)劃編制的科學(xué)性。
[1]李珊珊,王平月,楊陽(yáng)等.基于共享數(shù)據(jù)中心的高校業(yè)務(wù)流程再造研究[J].中國(guó)教育信息化,2018(23):47-50.
[2]梁吉業(yè),馮晨嬌,宋鵬等.大數(shù)據(jù)相關(guān)分析綜述[J].計(jì)算機(jī)學(xué)報(bào),2016(1):1-18.
[3]王博文,淺析基于Hadoop的大數(shù)據(jù)分析與應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2015(4):226-226.
[4]王光翔.數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在招生決策系統(tǒng)中的應(yīng)用[J].貴州大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,23(4):359-391.
[5]廖素嫻,張立遷,王頂明等.高校研究生招生計(jì)劃分配及其優(yōu)化研究[J].學(xué)位與研究生教育,2018(7):28-33.
[6]張偉.基于 Hadoop 的大數(shù)據(jù)分析管理平臺(tái)架構(gòu)設(shè)計(jì)[J].網(wǎng)絡(luò)與信息安全,2018(11):30-33.
[7]張蕾,章毅.大數(shù)據(jù)分析的無(wú)限深度神經(jīng)網(wǎng)絡(luò)方法[J].計(jì)算機(jī)研究與發(fā)展,2016,53(1):68-79.
[8]崔杰,李陶深,蘭紅星.基于Hadoop的海量數(shù)據(jù)存儲(chǔ)平臺(tái)設(shè)計(jì)與開(kāi)發(fā)[J].計(jì)算機(jī)研究與發(fā)展,2012(S1):12-18.
[9]徐光偉,白艷珂,燕彩蓉等.大數(shù)據(jù)存儲(chǔ)中數(shù)據(jù)完整性驗(yàn)證結(jié)果的檢測(cè)算法[J].計(jì)算機(jī)研究與發(fā)展,2017,54(11): 2487-2496.
[10]向小佳,趙曉芳,劉洋等.一種正交分解大數(shù)據(jù)處理系統(tǒng)設(shè)計(jì)方法及實(shí)現(xiàn)[J].計(jì)算機(jī)研究與發(fā)展,2017,54(5): 1097-1108.
[11]張澤,李良,李曉峰等.大數(shù)據(jù)時(shí)代下高校決策支持系統(tǒng)籌劃與探索[J].邢臺(tái)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2014(6):42-45.
[12]陳樂(lè).基于Python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)[J].電子世界,2018(16):163-165.
[13]黃有福.數(shù)據(jù)挖掘技術(shù)在招生數(shù)據(jù)平臺(tái)的應(yīng)用研究[J].電腦知識(shí)與技術(shù),2015(11):3-4.
[14]丁晶,李剛,譚毅培等.基于Hadoop系統(tǒng)大數(shù)據(jù)平臺(tái)在天津市地震局的應(yīng)用[J].電子技術(shù)與軟件工程,2017(18):159-161.
(編輯:王曉明)