凌建國
(晉中師范高等??茖W校,山西 晉中 030600)
根據 IDC 機構的定義,大數據是指為了更經濟更有效地從高頻率、大容量、不同結構和類型的數據中獲取有價值的信息而設計的新一代架構和技術,人們用它來描述和定義 信息爆炸時代產生的海量數據,并命名與之相關的技術發(fā)展與創(chuàng)新。
“大”字不僅意味著數據的數量龐大,還代表著數據種類繁多、結構復雜,變化速度極快。大數據呈現(xiàn)四種特性:Volume(極大的數據量)、Velocity(極快的處理速度)、Value(更多價值)、Variety(極多的數據種類)?!按蟆弊植粌H意味著數據的數量龐大,還代表著數據種類繁 多、結構復雜,變化速度極快。大數據呈現(xiàn)四種特性:Volume(極大的數據量)、Velocity(極快的處理速度)、Value(更多價值)、Variety(極多的數據種類)。
Volume 是指數據量龐大,如今有許 多企業(yè)已面臨單日數據量以數十、數百TB(萬億字節(jié),1 TB=1024 GB)的速度增加,而近幾年累加的總數據量也達到了 PB(1000 個TB)甚至 EB(一百萬個 TB)等級,這樣的數據量已讓傳統(tǒng)的 數據庫難以處理;
Velocity 是指企業(yè)數據增加的速度越來越快,諸如移動化、社交網絡的廣泛應用,使得數據增加的速度比傳統(tǒng) 的企業(yè)應用程式快很多,一旦數據增生速度越快,數據處理、分析的速度也就得跟上;
Value 是指大數據的價值往往價值密度低 即稀疏性的特點。
Variety 是指數據的多樣性、復雜性,一方面互 聯(lián)網不但產生文字資訊,同時也不斷產出與以往不同的數據:照片、視頻、微博等,另一方面,IT 遍及工作生活中的每個角落,各種各樣的傳感器、監(jiān)控器也不斷產生,各種機器資訊數據的形 式日趨復雜、多樣,從結構化數據到非結構化數據不斷轉化。這些催生了對大數據技術的強烈需求。
大數據將使傳統(tǒng)教育管理由“模糊”時代進入到精確化、科學化時代。教育不像自然科學那樣可以“精確”計算研究對象,因為教育的研究對象是人,人的復雜性使得教育的結果變得不可測或者不易測。借助于大數據,教育教學管理就像有了醫(yī)學上的“核磁共振成像”技術,使得學生的思維在一定程度上成為可測的。核磁共振成像技術是通過連續(xù)切片動畫,再合成繪制成物體內部的結構圖像;大數據則是通過記錄學生個體“行為軌跡”,再聚合、分析學生群體的行為數據,進而描繪出學生思維狀況圖。單個學生學習行為數據看似雜亂無章、毫無規(guī)律可循,但當相關數據累積到一定程度時,學生的群體行為就會呈現(xiàn)出一定的規(guī)律。大數據的研究方式是人類思維方式的大轉變,維克托·邁爾-舍恩伯格教授指出,這種轉變包涵著三個顯著的特點:“不要隨機樣本,而是全體數據”;“不是精確性,而是混雜性”;“不是因果關系,而是相關關系”。大數據的精確、全面、及時和“讓數據說話”,為塑造教育新思維開拓了新的發(fā)展空間。
傳統(tǒng)的教學,完全取決于教師的經驗和閱歷。大數據使得教學有了更加科學的依據和方法,并且國內的一些學者業(yè)已展開了相關方面的研究,像2010年張杰夫利用南非教學系統(tǒng)進行的小學英語教學實驗,根據非英語國家,特別是中國人難以張口說英語的原因,制定了相應實驗方案,通過利用英語語音系統(tǒng)對學生進行72音素自動化訓練,以期達到:“經過一年音素訓練,學生達到沒有不會讀的詞和句子的目標?!边@種教學效果是傳統(tǒng)教學無法企及的。大數據時代使得教學方式比以往任何時候都更接近發(fā)現(xiàn)真正的學生,進而了解學生的思維。學生的行為過程往往隱含著他們的思維特點,大數據可以捕捉這些表征,像學生在觀看教學視頻中暫停或回放情況;解題過程中答題時間、答對了多少、錯了多少等情況;學習上有哪些特點、缺陷、困難、偏好、規(guī)律等;在學習論壇寫下的評論等。通過對這些碎片化的數據進行整合分析、系統(tǒng)挖掘,就能從中發(fā)現(xiàn)學生的思維的特點和規(guī)律,幫助我們找到影響教學的真正因素。
傳統(tǒng)教學學生成績會呈現(xiàn)正態(tài)曲線分布,其主要原因是在學生的學習過程中出現(xiàn)的認知偏差無法得到及時糾正,進而形成積累,結果造成學生的“好中差”之分。這與教育人力不足和現(xiàn)行的教學評價方式有關?,F(xiàn)行的評價方式關注的是對學生“入門”和“結果”的關注,基本上采取的是結果式的評價方式,對學習過程關注相對較弱。而大數據時代,教學系統(tǒng)可以讓成千上萬學生同時進行個性化學習,并對學習過程進行實時監(jiān)控、反饋和評價,及時發(fā)現(xiàn)和糾正學生的認知偏差。“過程性評價”與以往的“結果式評價”相比,更加關注教學流程的再造和教學方式的變革,對于教師的教學能力提出了更高的要求,也為教學方式的變革提供了新的契機。
大數據讓教育決策和管理建立在客觀分析教育教學規(guī)律的基礎上,并且擁有大量的實證數據作為數據支撐,為教育管理的精確化、科學化提供了可能。學生是教育的主體,在準確了解、反映學生群體規(guī)律方面,大數據是可以發(fā)揮獨特作用。以此為基礎,系統(tǒng)還可以提供每個班級、院系甚至整個學校的基本教育信息。有了這些信息,教育管理者可以相互比較,找出差距,調整發(fā)展策略,教育也由原來粗獷的管理模式走向精細化、科學化管理道路。對于高職教育而言,精細化、科學化的管理模式是使人才培養(yǎng)和學校發(fā)展邁向新臺階的催化劑。
高職院校的班級管理主要目的在于培養(yǎng)學生獨立進行分析的能力,所以只有了解和懂得大數據產生的時代背景、特點屬性以及運用方式,才能更好的實現(xiàn)數據為教學服務、數據為實踐服務,下面簡單闡述大數據時代下嘗試進行高職院校班級管理的建設步驟。
大數據的來源通常主要有這樣幾方面:一是媒體數據;二是各類企業(yè)的生產、銷售、管理等等數據;三是政府部門的數據;四是物聯(lián)網、各種傳感器產生的數據,以及未聯(lián)網的各種攝像頭拍攝的數據;五是民眾個人留存的數據。數據開發(fā)者通常通過基于物化或ETL方法的引擎(materialization or ETL engine)、基于聯(lián)邦數據庫或中間件方法的引擎(federation engine or mediator)、基于數據流方法的引擎(stream engine)和基于搜索引擎的方法(search engine)來抽取和集成數據。在班級管理的過程中,要善于抽取和集成學生在課堂、作業(yè)以及日常生活中的各種數據、教師在教學和研究中的各種傾向,把看似碎片化的數據都收集起來,然后結合學科優(yōu)勢,通過建立數學模型的方式將其展現(xiàn)出來,進而分析兩種行為的主因和交互影響作用,實現(xiàn)為提高教學質量、展現(xiàn)教學成果服務的數據開發(fā)目標。
數據分析是整個大數據處理流程的核心,因為大數據的價值產生于分析過程。從異構數據源抽取和集成的數據構成了數據分析的原始數據。根據不同應用的需求可以從這些數據中選擇全部或部分進行分析。但是數據分析過程中必須要注意以下幾個方面:
1. 數據量大并不一定意味著數據價值的增加,相反這往往意味著數據噪音的增多。因此在數據分析之前必須進行數據清洗等預處理工作,大數據時代的數據清洗過程必須更加謹慎,因為相對細微的有用信息混雜在龐大的數據量中。如果信息清洗的粒度過細,很容易將有用的信息過濾掉。清洗粒度過粗又無法達到真正的清洗效果,因此在質與量之間需要進行仔細的考量和權衡。但是預處理如此大量的數據對于機器硬件以及算法都是嚴峻的考驗。
2. 數據結果好壞的衡量。得到分析結果并不難,但是結果好壞的衡量卻是大數據時代數據分析的新挑戰(zhàn)。大數據時代的數據量大、類型龐雜,進行分析時往往對整個數據的分布特點掌握的不太清楚,這會導致最后在設計衡量的方法以及指標時遇到諸多困難。因此需要不把握數據分析的三點基本原則,即依靠基于理論的方法,而不是盲目地進行數據挖掘;對數據對象保持一種大局觀;堅持干中學。
大數據的資源極為繁雜豐富,如果沒有明確的目標,就會非常迷茫甚至走入迷途。因此,首先,要確定運用大數據的短中期目標,定義價值數據標準,之后再使用那些能夠解決特定領域問題的工具,逐步推廣,步步為營。數據分析的目標設定不準確,會導致數據收集和分析成本劇增,產生數據結果的產出與數據成本的投入產生較大差異等問題。
許多組織啟動大數據運營的一個最重要的挑戰(zhàn),就是數據的碎片化問題。以往的數據都散落在互不連通的數據庫中,而且相應的數據技術也都存在于不同部門中,如何將這些孤立錯位的數據庫打通、互聯(lián),并且實現(xiàn)技術共享,才是能夠最大化大數據價值的關鍵。在教學課改的過程中,應當格外留意的是,數據策略的成功要訣在于無縫對接數據連接的每一步驟,從數據收集到數據收集、提取、挖掘、應用等。
大數據通常只提供參考答案,不提供最終答案。大數據分析過程放棄了對因果關系的渴求,而只關注相關關系,因而數據結果的展示只是知其然,而不知其所以然。因此有必要構建起學生成長的時間軸(Timeline),簡單說,Timeline是用戶自我編輯的個人時間軸,用來記錄用戶的行為軌跡,并可以控制個人信息只給想展示的人。時間軸可以展示學生的各類活動,并為之創(chuàng)建一個動態(tài)的時間軸主頁。時間軸賦予學生一個載體,將其在學校中的零散時光串聯(lián)起來,用全新的方式設釋個人在學習、社交中的角色。時間軸能真實地呈現(xiàn)學生更加個性化、立體化、互動化的數據和信息,更好地為學生的成長服務。
[1]維克托.邁爾·舍恩伯格.大數據時代:生活、工作與思維的大變革[M].浙江人民出版社, 2013.
[2]胡絡繹.大數據,讓營銷更精確[J].軟件工程師,2013(Z1).
[3]孟小峰,慈祥.大數據管理:概念、技術與挑戰(zhàn)[J]計算機研究與發(fā)展,2013,50(1).
[4]范曉東.時間軸:大數據的“生死簿”[J]互聯(lián)網周刊,2013,1(05).
[5]姜奇平.大數據的時代變革力量[J].互聯(lián)網周刊,2013,1(05).