于文磊 南京航空航天大學(xué)
大數(shù)據(jù)是一個較為抽象的概念,其融合了統(tǒng)計學(xué)、數(shù)據(jù)分析學(xué)以及數(shù)據(jù)整理等多個學(xué)科知識與技術(shù),可以全面的對事物做出較為準(zhǔn)確的分析與判斷,近年來,大數(shù)據(jù)技術(shù)已經(jīng)進入了各行各業(yè)之中,尤其是與物聯(lián)網(wǎng)、云計算技術(shù)等結(jié)合應(yīng)用,共同推動了社會的發(fā)展。大數(shù)據(jù)技術(shù)可以高速捕獲、發(fā)現(xiàn)和分析大量多樣化的數(shù)據(jù)中的價值。傳統(tǒng)的大學(xué)管理主要是以經(jīng)驗為主的主觀管理模式,在管理過程中依賴于決策層自身的能力,雖然也有調(diào)研、交流、學(xué)習(xí)等方式提升管理過程中的科學(xué)性,但是整體上效率偏低,尤其是管理效果難以及時評估,需要較長時間之后才能看出效果,這對于大學(xué)管理較為不利。
數(shù)據(jù)分析的理念與概念出現(xiàn)的較高,通過數(shù)據(jù)分析結(jié)果,做出決策是一種科學(xué)理想的決策思維。但是傳統(tǒng)的數(shù)據(jù)收集、處理、分析技術(shù)效率地下,需要大量的人力與物力,依然難以做到面面俱到。而隨著人類社會的發(fā)展,數(shù)據(jù)的增量已然極為恐怖。大數(shù)據(jù)技術(shù)是基于這樣的背景下誕生的高校的數(shù)據(jù)收集、處理、分析技術(shù)。
作為最高等級的教育場所,以數(shù)據(jù)為依據(jù)進行決策是其科學(xué)性的重要體現(xiàn)。這一點在每個的大學(xué)院校中體現(xiàn)的極為突出,美國院?;径荚O(shè)有數(shù)據(jù)分析與研究機構(gòu),其主要職能就是通過數(shù)據(jù)分析為院校決策提供依據(jù),進行科學(xué)的大學(xué)管理。通過數(shù)據(jù)分析與研究,可以建立有效的數(shù)字模型,決策者可以通過模型直觀的看出管理中的問題,當(dāng)大學(xué)管理出現(xiàn)問題時,首先就是對數(shù)據(jù)分析結(jié)果進行回溯,然后以此為依據(jù)進行決策,實現(xiàn)以數(shù)據(jù)分析為基礎(chǔ)的科學(xué)管理。
大數(shù)據(jù)的大不單單指的是數(shù)據(jù)量大,還包括了數(shù)據(jù)類型大、數(shù)據(jù)來源大以及數(shù)據(jù)復(fù)雜性大。一般情況下,我們可以簡單的將數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)是指不同數(shù)據(jù)之間的存在著較為明顯的聯(lián)系性,結(jié)構(gòu)化數(shù)據(jù)分析的作用很多,但是全面性不足,傳統(tǒng)的數(shù)據(jù)分析技術(shù)由于分析能力有限,主要是對結(jié)構(gòu)化數(shù)據(jù)進行分析。非結(jié)構(gòu)數(shù)據(jù)分析極大的提升了數(shù)據(jù)分析的全面性,在大學(xué)管理中應(yīng)用,可以提供更為全面科學(xué)的決策依據(jù)。比如在對學(xué)生進行評價時,不單單是分?jǐn)?shù)、技能、學(xué)術(shù)活動、在校經(jīng)歷等指標(biāo)性的評價,學(xué)生的價值觀、道德觀、人生態(tài)度等非指標(biāo)性的評價也非常重要。指標(biāo)性評價的數(shù)據(jù)統(tǒng)計分析非常簡單,通過歷次考試與活動的記錄即可以清晰評價,但非指標(biāo)性的評價要想保持客觀性較為困難,因此在傳統(tǒng)評價中多以主觀為主。而大數(shù)據(jù)可以解決這一問題,其通過對學(xué)生在校期間產(chǎn)生的所有數(shù)據(jù),如社交平臺數(shù)據(jù)等,進行分析處理,可以全面的揭示學(xué)生行為與心理發(fā)展過程,進而進行全面科學(xué)的評價。
有因就有果,這是我們常說的一句話。因果關(guān)系是我們探索世界的基本思維模式,大數(shù)據(jù)技術(shù)就是探尋數(shù)據(jù)因果關(guān)系的一種技術(shù)。數(shù)據(jù)相關(guān)性是數(shù)據(jù)研究的基礎(chǔ),隨著大學(xué)教育信息管理系統(tǒng)的完善,院校數(shù)據(jù)庫越來越豐富,其內(nèi)蘊含的財富也越來越巨大,院校決策者與研究人員從中尋找因果關(guān)系,發(fā)現(xiàn)新問題成為提升大學(xué)管理的重要途徑。比如,我們常認(rèn)為按時吃早餐可以有效提高學(xué)習(xí)效率,但是復(fù)旦大學(xué)宓詠老師通過挖掘?qū)W生早餐消費次數(shù)與成績績點(GPA)的關(guān)系發(fā)現(xiàn),早餐次數(shù)較多的學(xué)生成績績點不會太低,但早餐消費次數(shù)較少的學(xué)生中成績績點高的也大有人在。說明,早餐與成績并無直接關(guān)系,這打破了我們原有的慣性思維認(rèn)知帶來的偏差。
現(xiàn)階段我們正位于大數(shù)據(jù)蓬勃發(fā)展的時代,大數(shù)據(jù)在我國高校中的應(yīng)用效果也初見端倪,但是需要承認(rèn)的是,在整體上我國的院校研究還落后于先進國家,尤其是美國,而相比于我國的電子商務(wù)等行業(yè),大數(shù)據(jù)技術(shù)在院校研究中的應(yīng)用也有所不足。突出表現(xiàn)在軟件、算法、工具等方面,要想改變這一現(xiàn)狀,需要做好以下幾點內(nèi)容:
大數(shù)據(jù)及時的核心是數(shù)據(jù),因此數(shù)據(jù)文化的營造非常重要,只有營造好數(shù)據(jù)文化,切實意識到數(shù)據(jù)的重要性,提高數(shù)據(jù)的質(zhì)量才能更好的發(fā)揮大數(shù)據(jù)技術(shù)的特點與優(yōu)勢。首先要認(rèn)識到數(shù)據(jù)是客觀存在的,是理性思維,科學(xué)決策的基礎(chǔ),避免經(jīng)驗主義,主觀決策的思想;其次要保證數(shù)據(jù)收集的真實性與一致性,提高數(shù)據(jù)質(zhì)量,高質(zhì)量的數(shù)據(jù)才可以提供高質(zhì)量的決策依據(jù),尤其是在數(shù)據(jù)爆炸的當(dāng)下,不實數(shù)據(jù)與垃圾數(shù)據(jù)橫向,要缺少提高數(shù)據(jù)的甄選能力。
數(shù)據(jù)系統(tǒng)的建設(shè)是大數(shù)據(jù)技術(shù)有效實施的基礎(chǔ),在大數(shù)據(jù)時代的院校研究中要切實加快數(shù)據(jù)系統(tǒng)的建設(shè),盡快將不同院校納入到數(shù)據(jù)系統(tǒng)之中,實現(xiàn)數(shù)據(jù)信息的公開、共享與應(yīng)用。比如學(xué)術(shù)數(shù)據(jù)系統(tǒng),知網(wǎng)空間就是一個較為成功的范例。要做到以下幾點:
(1)完善以國家為主導(dǎo)建設(shè)的教育信息管理系統(tǒng),推動其逐漸向社會與高校開發(fā),通過設(shè)置不同權(quán)限保證其安全性的同時,提高其共享性,發(fā)揮社會功能。
(2)建立高效減的數(shù)據(jù)系統(tǒng)聯(lián)盟,實現(xiàn)高校間的數(shù)據(jù)共享。在推動過程中,要注意設(shè)置不同高校間的界限,嚴(yán)格區(qū)分可共享數(shù)據(jù)與不可共享數(shù)據(jù),促進學(xué)術(shù)交流的同時,保護院校師生的個人信息安全。
(3)制定統(tǒng)一的院校數(shù)據(jù)標(biāo)準(zhǔn),開發(fā)一套共同話語和標(biāo)準(zhǔn)界定以及科學(xué)的操作流程,有效整合院校研究數(shù)據(jù)和資源,實現(xiàn)行業(yè)整合發(fā)展。
數(shù)據(jù)系統(tǒng)的建設(shè)是基礎(chǔ),數(shù)據(jù)挖掘分析是手段,而數(shù)據(jù)的應(yīng)用是目的。做好數(shù)據(jù)系統(tǒng)的基礎(chǔ)后,要切實提高數(shù)據(jù)的挖掘分析能力。數(shù)據(jù)挖掘技術(shù)是針對計算機的數(shù)據(jù)庫進行全方面的分析與判斷,從而尋找出有效信息的一種技術(shù)。在我們的日常生活中會產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)可能是有用的,也可能是無效的,數(shù)據(jù)挖掘就是對所有的信息進行深入的發(fā)掘,尋找有用的信息。分析不同信息之間的關(guān)聯(lián),進行聚類與分類。通過數(shù)據(jù)挖掘之后,原本紛亂繁雜的信息并的井井有條,可以為相關(guān)的數(shù)據(jù)分析與數(shù)據(jù)決策提供基礎(chǔ)。數(shù)據(jù)挖掘的應(yīng)用場景不同,其應(yīng)用目的與相關(guān)算法也有所區(qū)別,要根據(jù)實際應(yīng)用需求選擇與數(shù)據(jù)特征相關(guān)的算法。數(shù)據(jù)系統(tǒng)建成之后,數(shù)據(jù)挖掘技術(shù)是實現(xiàn)大數(shù)據(jù)技術(shù)進行院校研究的基本手段。
總之,對當(dāng)前中國院校研究而言,知識和智慧是最有價值的,但是數(shù)據(jù)庫建設(shè)和運用數(shù)據(jù)的技術(shù)是最為緊迫和關(guān)鍵的。數(shù)據(jù)也是現(xiàn)代大學(xué)管理的一個新的戰(zhàn)略制高點,我們必須通過有效的院校研究,用數(shù)據(jù)改進大學(xué)管理、用數(shù)據(jù)推動中國大學(xué)創(chuàng)新。