張鴻
摘? 要: 大數(shù)據(jù)蘊藏的巨大價值日趨凸顯,引發(fā)了培訓行業(yè)的廣泛關(guān)注。通過分析大數(shù)據(jù)時代帶來的信息化建設(shè)思維變革與校園信息化面臨的新挑戰(zhàn),總結(jié)了現(xiàn)階段企業(yè)培訓機構(gòu)信息化建設(shè)的發(fā)展方向與重點。并在此基礎(chǔ)上,提出了制定數(shù)據(jù)戰(zhàn)略、打造一體化智能平臺、以數(shù)據(jù)驅(qū)動培訓創(chuàng)新的大數(shù)據(jù)建設(shè)策略。
關(guān)鍵詞: 大數(shù)據(jù);信息技術(shù);培訓;信息化
【Abstract】: Big datas great value has triggered widespread concern in training industry. By analyzing the paradigm? shift of information construction and the new challenges of campus informatization, the author summarizes the emphasis and tendency of information construction development. On that basis, the article presents the big data construction tactics of enterprise training institution, which containing making data strategy, creating intelligence platform and data-diving training innovation.
【Key words】: Big data; Information technology; Training; Informatization
0? 引言
互聯(lián)網(wǎng)的發(fā)展帶動了云計算、物聯(lián)網(wǎng)、大數(shù)據(jù)等新信息技術(shù)的興起,在這其中,大數(shù)據(jù)因其蘊藏的巨大價值,贏得了產(chǎn)業(yè)界和學術(shù)界的廣泛關(guān)注,并在許多領(lǐng)域得到了成功應用。就教育培訓行業(yè)而言,隨著近年來信息技術(shù)與培訓教學的深入融合,信息化已經(jīng)成為實現(xiàn)培訓理念創(chuàng)新、方法創(chuàng)新、手段創(chuàng)新的重要途徑,因此分析大數(shù)據(jù)給培訓帶來的機遇與挑戰(zhàn),明確在新的技術(shù)背景下培訓信息化? 建設(shè)的目標與策略,將是今后推動培訓創(chuàng)新的重要環(huán)節(jié)。
1? 大數(shù)據(jù)概述
自2012年的世界經(jīng)濟論壇年會將“大數(shù)據(jù)、大影響”作為重要議題起,大數(shù)據(jù)近年來得到了蓬勃發(fā)展,美、英等國紛紛將大數(shù)據(jù)作為國家戰(zhàn)略,把其放在了重要的戰(zhàn)略位置。我國對大數(shù)據(jù)的研究與應用工作也十分重視,國家“973計劃”、“863計劃”
和國家自然基金都針對大數(shù)據(jù)研究成立了專項。
關(guān)于大數(shù)據(jù)的定義,目前IDC(Internet Data Center,互聯(lián)網(wǎng)數(shù)據(jù)中心)報告中給出的定義認可度較高,即“大數(shù)據(jù)描述了一個技術(shù)和體系的新時代,被設(shè)計于從大規(guī)模多樣化的數(shù)據(jù)中通過高速捕獲、發(fā)現(xiàn)和分析技術(shù)提取數(shù)據(jù)的價值”。從報告中提煉的大容量(volume)、多樣性(variety)、高速度(velocity)和低價值密度(value)“4V”大數(shù)據(jù)特征也得到了廣泛認可[1]。
從應用研究角度看,大數(shù)據(jù)主要包含了兩個方面,一個方面是大數(shù)據(jù)技術(shù),另一個方面是大數(shù)據(jù)分析。前者側(cè)重解決海量數(shù)據(jù)存儲和分布式計算等關(guān)鍵技術(shù)問題,而后者更為側(cè)重發(fā)現(xiàn)數(shù)據(jù)中的關(guān)聯(lián)關(guān)系,提取數(shù)據(jù)價值。
大數(shù)據(jù)技術(shù)的核心是Apache基金會開發(fā)的Hadoop分布式基礎(chǔ)架構(gòu),用戶可以在不了解其底層細節(jié)的情況下,開發(fā)分布式程序,充分利用集群優(yōu)勢進行高速存儲和運算。Hadoop有兩個核心組件,
HDFS(Hadoop Distributed File System,分布式文件系統(tǒng))和MapReduce(分布式計算系統(tǒng)),它們分別有效解決了數(shù)據(jù)分布式存儲和分布式運算問題。
大數(shù)據(jù)分析是在數(shù)據(jù)密集型環(huán)境下,對數(shù)據(jù)科學的重新思考和新模式探索,其核心是以一種高效的方式從海量數(shù)據(jù)中獲取價值。盡管大數(shù)據(jù)分析與傳統(tǒng)數(shù)據(jù)分析基于不同的分析目的和技術(shù)基礎(chǔ),但經(jīng)典的分析方法在大數(shù)據(jù)分析中仍然適用,數(shù)據(jù)可視化、統(tǒng)計分析和數(shù)據(jù)挖掘依然是非常重要的數(shù)據(jù)分析方法,并在大數(shù)據(jù)領(lǐng)域應用廣泛。
2? 大數(shù)據(jù)時代的信息化思維變革
大數(shù)據(jù)時代的數(shù)據(jù)處理變得更加容易和迅速,人們能夠在瞬間處理成千上萬的數(shù)據(jù)。在新的技術(shù)背景下,需要我們以新的方式理解和處理信息。雖然傳統(tǒng)模式仍然具有重要意義和地位,但傳統(tǒng)的信息化思維需要適當調(diào)整,以適應新的技術(shù)和業(yè)務需求。
2.1? 從樣本采集到全量數(shù)據(jù)
很長時間以來,人們通常采用采樣方法對大量數(shù)據(jù)進行分析,這種方法在保證分析結(jié)果有效的前提下大大減少了分析的時間與成本。但隨著信息技術(shù)的發(fā)展,數(shù)據(jù)收集不在向從前那樣困難,數(shù)以萬計的傳感器、網(wǎng)站、移動應用可以隨時隨地對海量數(shù)據(jù)進行采集。
以Lytro相機為例,該相機不在向傳統(tǒng)相機那樣只記錄單束光,而是記錄整個光場的所有光束,因此用戶可以在拍攝結(jié)束任意改變圖像焦點,具體生成什么樣的照片可以在拍攝完成后再根據(jù)需要決定,這使得圖像的可利用性大幅提升[2]。
隨著全量數(shù)據(jù)收集優(yōu)勢的逐漸凸顯和存儲設(shè)備性價比的不斷提升,信息化建設(shè)思維開始從對特定目標數(shù)據(jù)采集轉(zhuǎn)向到對復雜全量數(shù)據(jù)采集,以便從海量數(shù)據(jù)中發(fā)現(xiàn)新價值,進一步革新工作方式方法。
2.2? 從微觀精準到宏觀紛繁
在“小數(shù)據(jù)”時代,采集數(shù)據(jù)最重要和最基本的要求是確保數(shù)據(jù)的準確性,盡一切可能減少數(shù)據(jù)錯誤。因為在有限的數(shù)據(jù)下,微小的錯誤就可能導致巨大的偏差。而在如今的大數(shù)據(jù)背景下,許多科研團隊卻從紛繁的非精準數(shù)據(jù)中找到了諸多難題的突破口,例如谷歌的機器翻譯系統(tǒng)。谷歌在2006年開始涉足機器翻譯領(lǐng)域,2007年首次參加美國國家標準研究院測評就奪得頭名,系統(tǒng)成功的核心不在于更加先進的算法,而在于高于競爭對手上萬倍的語料庫[3]。雖然這些詞句未必各個精確,但通過統(tǒng)計語言模型卻大幅提升了系統(tǒng)翻譯的質(zhì)量。
大數(shù)據(jù)時代的信息化建設(shè),需要我們更加重視對非精準數(shù)據(jù)的采集與利用,而不再僅僅專注于如何清洗數(shù)據(jù)使數(shù)據(jù)更加準確。
2.3? 從因果關(guān)系到關(guān)聯(lián)關(guān)系
尋找因果關(guān)系是人們長久以來的習慣,信息化建設(shè)也不例外,例如機房的環(huán)境監(jiān)控系統(tǒng),正常情況下溫度傳感器發(fā)生報警,則說明機房溫度超過了閥值,這是十分清晰的因果關(guān)系。然而,在很多情況下確定因果關(guān)系是十分困難的,比如客戶兩次采購商品之間的因果關(guān)系。
拋開因果關(guān)系,事物之間關(guān)聯(lián)關(guān)系往往也隱藏著巨大價值。亞馬遜通過大數(shù)據(jù)量化產(chǎn)品間的相關(guān)關(guān)系,成功利用商品之間的相關(guān)性大幅提升了購物推薦系統(tǒng)的商品推薦精準率。
在大數(shù)據(jù)時代,信息化不在僅僅強調(diào)抓住事物的因果關(guān)系,更要強調(diào)尋找事物之間的關(guān)聯(lián)關(guān)系,這將給我們提供了更加開闊的建設(shè)思路,并從中發(fā)現(xiàn)新的價值增長點。
3? 校園信息化建設(shè)面臨的新挑戰(zhàn)
經(jīng)過十余年的高速發(fā)展,我國教育培訓行業(yè)的信息化水平大幅提升,校園網(wǎng)絡(luò)基礎(chǔ)設(shè)施、在線學習系統(tǒng)和面向業(yè)務的管理信息系統(tǒng)已經(jīng)基本建設(shè)完成,但隨著大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)、移動互聯(lián)的廣泛應用,校園信息化建設(shè)遇到了諸多挑戰(zhàn),其中網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)和業(yè)務融合問題顯得尤為突出。
3.1? 網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)的新要求
安全、穩(wěn)定、高速的網(wǎng)絡(luò)環(huán)境是校園信息化建設(shè)的基礎(chǔ),是大數(shù)據(jù)背景下信息化全面提升的必要保障,因此網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)也顯得尤為重要。
第一,網(wǎng)絡(luò)安全成為關(guān)注焦點。隨著《中國人民共和國網(wǎng)絡(luò)安全法》的頒布,信息化建設(shè)過程中的安全問題凸顯,切實保證網(wǎng)絡(luò)安全,確保安全技術(shù)措施同步規(guī)劃、同步建設(shè)、同步使用已經(jīng)成為必要的法律義務。
第二,網(wǎng)絡(luò)性能要求進一步提升。打造大數(shù)據(jù)環(huán)境需要更加穩(wěn)定、快速的網(wǎng)絡(luò)支撐,要選擇高性能、高可靠性的網(wǎng)絡(luò)核心設(shè)備,充分考慮未來培訓業(yè)務發(fā)展變化,為新增設(shè)備和數(shù)據(jù)流量做好冗余。
第三,可擴展性與技術(shù)前瞻性不容忽視。信息技術(shù)仍在迅猛發(fā)展,在大數(shù)據(jù)背景下的基礎(chǔ)設(shè)施建設(shè)更加強調(diào)互聯(lián)網(wǎng)、移動網(wǎng)與物聯(lián)網(wǎng)的全面互聯(lián)互通,要求網(wǎng)絡(luò)架構(gòu)更加靈活,易于擴展,能夠為培訓業(yè)務的快速迭代升級提供有力支持。
3.2? 業(yè)務融合的新要求
智慧校園建設(shè)已經(jīng)成為當下校園信息化建設(shè)的重要課題,要實現(xiàn)校園管理、校園服務、教學環(huán)境和教學資源的智慧化,需要各項業(yè)務打破壁壘,相互融合。
首先,業(yè)務獨立、數(shù)據(jù)封閉的信息化架構(gòu)已完全不符合現(xiàn)階段建設(shè)要求。必須基于物聯(lián)網(wǎng)、云計算和大數(shù)據(jù)技術(shù)打造全新的校園一體化信息平臺,通過智能感知、智能控制、智能視窗等智慧化應用全面融合業(yè)務系統(tǒng),為教學、管理和服務的融合提供有力支持。其次,需要通過“云”與“端”的廣泛結(jié)合,實現(xiàn)對海量數(shù)據(jù)的收集、存儲與挖掘分析,推進業(yè)務數(shù)據(jù)的全面融合,逐步形成價值導向的知識管理體系和大數(shù)據(jù)服務體系,為進一步發(fā)現(xiàn)教育培訓規(guī)律,推動業(yè)務創(chuàng)新提供動力。
4? 大數(shù)據(jù)建設(shè)策略
4.1? 制定數(shù)據(jù)戰(zhàn)略
企業(yè)培訓機構(gòu)對如何收集和利用數(shù)據(jù)普遍存在困惑,因為不同于互聯(lián)網(wǎng)公司,大多數(shù)培訓機構(gòu)沒有足夠的資金投入和技術(shù)能力實現(xiàn)對海量數(shù)據(jù)存儲和挖掘,甚至沒有獲取大量數(shù)據(jù)的有效渠道。因此,在大數(shù)據(jù)背景下,培訓機構(gòu)需要一個清晰的數(shù)據(jù)戰(zhàn)略來指導信息化建設(shè)。
這個戰(zhàn)略的核心是匹配培訓機構(gòu)業(yè)務的實際情況。要明確需要哪些信息,哪些數(shù)據(jù)是可得到且有分析價值的[4]。同時,要合理規(guī)劃數(shù)據(jù)生命周期,盡可能拋棄過時陳舊的數(shù)據(jù),集中力量標準化現(xiàn)有傳統(tǒng)數(shù)據(jù),整合新的數(shù)據(jù)格式和數(shù)據(jù)類型,形成清晰的數(shù)據(jù)收集、處理和分析思路。
4.2? 打造一體化智慧信息平臺
基于制定的數(shù)據(jù)戰(zhàn)略,培訓機構(gòu)需要分階段逐步搭建面向大數(shù)據(jù)的一體化智慧信息平臺,以支撐教學、管理與科研等業(yè)務的全面整合。初始階段這個平臺應具備四項基本特性。首先,平臺需要具有開放性,可以提供存儲、計算、開發(fā)接口等服務,能夠?qū)崿F(xiàn)多系統(tǒng)的融合與集成[5]。其次,平臺需要具有繼承性,能夠?qū)崿F(xiàn)從傳統(tǒng)部署向云部署的過渡,保障平臺可平滑遷移至新環(huán)境。第三,平臺需要具有安全性,在信息安全問題日益突顯的今天,必須嚴格落實信息系統(tǒng)等級保護要求,確保數(shù)據(jù)的機密性、完整性和可用性。第四,平臺需要智能化,應該具備豐富的知識庫和知識化引擎、具有一定的數(shù)據(jù)挖掘與分析能力。
4.3? 以數(shù)據(jù)驅(qū)動培訓創(chuàng)新
隨著一體化智能信息平臺的建成,數(shù)據(jù)孤島將被逐步消除,培訓機構(gòu)所擁有的數(shù)據(jù)量將快速增長。通過大數(shù)據(jù)分析技術(shù),數(shù)據(jù)在決策管理、培訓教學、后勤服務等方面的價值將逐步凸顯,其對培訓創(chuàng)新的作用不可小覷。
第一,以數(shù)據(jù)驅(qū)動培訓精準化。借助大數(shù)據(jù)可以全方位掌握學員的知識結(jié)構(gòu)、能力結(jié)構(gòu)和個性特征,從多維度對學員學習需求進行分析,從而實現(xiàn)“一人一策略”的精準培訓,提升培訓的針對性[6]。
第二,以數(shù)據(jù)驅(qū)動培訓資源整合。通過大數(shù)據(jù)可以全面了解企業(yè)及社會培訓資源情況,從而進一步優(yōu)化師資,構(gòu)建與企業(yè)發(fā)展相適應的課程體系,推進培訓資源的共享共建,突破資源碎片化困境。
第三,以數(shù)據(jù)驅(qū)動培訓評價機制完善。依托大數(shù)據(jù)可以長期跟蹤學員訓后工作績效與綜合能力提升,將傳統(tǒng)的經(jīng)驗性評價轉(zhuǎn)變?yōu)榛跀?shù)據(jù)的過程性評價,從而更加客觀的評價培訓效果,以數(shù)據(jù)支持評價體系建設(shè)。
5? 結(jié)束語
在大數(shù)據(jù)背景下,理解新階段信息化建設(shè)的思維變化、抓住建設(shè)過程中的突出問題是企業(yè)培訓機構(gòu)信息化快速發(fā)展的重要基礎(chǔ)。在此之上,充分結(jié)合企業(yè)培訓實際,制定合理的數(shù)據(jù)戰(zhàn)略、打造智慧化的信息化平臺,并基于數(shù)據(jù)持續(xù)推動培訓創(chuàng)新,才能充分發(fā)揮大數(shù)據(jù)給企業(yè)培訓帶來的價值。
參考文獻
[1]李均. 大數(shù)據(jù)從海量到精準[M]. 北京: 清華大學出版社, 2014.
[2]維克托·邁爾-舍恩伯(英), 肯尼斯·庫克耶(英). 大數(shù)據(jù)時代[M]. 杭州: 浙江人民出版社, 2013.
[3]吳軍. 數(shù)學之美[M]. 北京: 人民郵電出版社, 2014.
[4]伯納德·馬爾 (美). 智能大數(shù)據(jù)SMART準則[M]. 北京: 電子工業(yè)出版社, 2015.
[5]郝利娟, 劉冬枝. 智慧城市空間大數(shù)據(jù)云平臺建設(shè)技術(shù)大綱研究[J]. 地理空間信息, 2019(6): 33-35.
[6]豐俊功. 大數(shù)據(jù)時代干部教育培訓創(chuàng)新與發(fā)展[J]. 教育決策, 2019(4): 80-86.
[7]官思發(fā), 孟璽, 李宗潔, 劉揚. 大數(shù)據(jù)分析研究現(xiàn)狀、問題與對策[J]. 情報雜志, 2015(5): 98-104.
[8]于長虹, 王運武. 大數(shù)據(jù)背景下數(shù)字校園建設(shè)的目標、內(nèi)容與策略[J]. 中國電化教育, 2013(10): 30-35.
[9]田蓓, 王曉東. 大數(shù)據(jù)技術(shù)對高校管理的變革作用及其應用研究[J]. 計算機科學, 2018(10): 25-28.
[10]倪玉琴, 陸松巖, 周忠浩. 教育信息化2. 0時代開放大學辦學模式變革的思考. 成人教育[J]. 2019(1): 31-36.