陳植元
【中圖分類號】G64 【文獻(xiàn)標(biāo)識碼】A 【文章編號】2095-3089(2016)03-0235-02
1.引言
隨著云時代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關(guān)注,成為學(xué)術(shù)界和業(yè)界所共同關(guān)注的熱點(diǎn)和焦點(diǎn)。對許多企業(yè)來講,對大數(shù)據(jù)的收集、儲存、分析、提供和利用的能力和程度是衡信息獲取和利用能力的關(guān)鍵指標(biāo),是促進(jìn)企業(yè)在激烈競爭中取勝的最重要的能力之一。企業(yè)要在激烈的同行競爭中立于不敗之地的關(guān)鍵要素之一就是要具備良好的大數(shù)據(jù)處理能力。而作為大學(xué)生,要在莘莘學(xué)子中脫穎而出的必備技能之一就是良好的數(shù)據(jù)處理能力。因此,在就業(yè)形勢嚴(yán)峻的當(dāng)今社會,擁有良好的數(shù)據(jù)分析能力能為大學(xué)生在求職過程中增加取勝的籌碼。
2.數(shù)據(jù)處理方法和工具
數(shù)據(jù)科學(xué)是一門橫跨網(wǎng)絡(luò)科學(xué)、信息科學(xué)、經(jīng)濟(jì)學(xué)等多個領(lǐng)域的交叉學(xué)科,大數(shù)據(jù)時代的到來讓人們對這門學(xué)科的重視程度和熱情空前高漲。數(shù)據(jù)科學(xué)分析工具主要有以下幾點(diǎn)發(fā)展趨勢:(1)大數(shù)據(jù)集分析;(2)優(yōu)秀的可視化能力;(3)數(shù)據(jù)分析以分布式為主。
2.1可視化分析
大數(shù)據(jù)時代的到來,為各行各業(yè)利用數(shù)據(jù)進(jìn)行預(yù)判、分析、優(yōu)化都起到了至關(guān)重要的作用。大數(shù)據(jù)的使用人群也不再局限于大數(shù)據(jù)分析專家,普通用戶也逐漸意識到大數(shù)據(jù)的重要性并嘗試?yán)么髷?shù)據(jù)挖掘?qū)ψ约河杏玫男畔ⅰ5且陨蟽煞N群體對于大數(shù)據(jù)最基本的要求就是可視化分析,一方面是因為可視化分析能夠直觀的呈現(xiàn)出大數(shù)據(jù)的特點(diǎn),另一方面就是可視化分析的結(jié)果能夠非常容易地被使用者接受,尤其是對普通用戶群體來說,可視化分析呈現(xiàn)的結(jié)果就好比看圖說話一樣簡單明了。
2.2數(shù)據(jù)挖掘算法
不同與傳統(tǒng)的普查和抽樣等調(diào)查方法取得一手?jǐn)?shù)據(jù)及通過非調(diào)查手段獲的二手?jǐn)?shù)據(jù),大數(shù)據(jù)在數(shù)據(jù)搜集方式上主要是通過在線互聯(lián)網(wǎng)數(shù)據(jù)庫獲得的二手?jǐn)?shù)據(jù)。在數(shù)據(jù)分析上,大數(shù)據(jù)分析方法也與傳統(tǒng)數(shù)據(jù)分析有所不同,傳統(tǒng)統(tǒng)計學(xué)方法采取的是對樣本數(shù)據(jù)的有目的的建模,而大數(shù)據(jù)分析技術(shù)則是通過與計算平臺對大數(shù)據(jù)進(jìn)行挖掘。
2.3語義搜索引擎
語義搜索引擎是語義網(wǎng)時代的搜索引擎,是語義技術(shù)最直接的應(yīng)用,它從詞語所表達(dá)的語義層次上來認(rèn)識和處理用戶的檢索請求。具體地說,語義搜索引擎就是通過對網(wǎng)絡(luò)中的資源對象進(jìn)行語義上的標(biāo)注,以及對用戶的查詢表達(dá)進(jìn)行語義處理,使得自然語言具備語義上的邏輯關(guān)系,并且能夠在網(wǎng)絡(luò)環(huán)境下進(jìn)行廣泛高效的語義推理,從而更加準(zhǔn)確、全面的實現(xiàn)用戶的檢索。
3.在校生需要掌握的數(shù)據(jù)處理能力
3.1客觀數(shù)據(jù)的有效獲取能力
客觀數(shù)據(jù)是指在研究任務(wù)中具有客觀性的數(shù)據(jù),包括符合自然狀態(tài)的原始數(shù)據(jù)和完整反映自然屬性的見解數(shù)據(jù), 數(shù)據(jù)的有效獲取是在研究范圍內(nèi),全面、完整、系統(tǒng)和及時低獲取研究所需的數(shù)據(jù)。有效地獲取數(shù)據(jù)的能力恰恰是當(dāng)前高校學(xué)生最缺乏的能力,學(xué)術(shù)上的輕視、教學(xué)上的疏忽加上學(xué)生的主觀帶惰性造成了大學(xué)生數(shù)據(jù)獲取能力嚴(yán)重缺失。在各大高校中,普遍彌漫著重思辯輕實證、親議論遠(yuǎn)數(shù)據(jù)的學(xué)術(shù)氛圍。在傳統(tǒng)教學(xué)方式中,教師往往不太注重甚至忽視對數(shù)據(jù)處理能力和學(xué)生實證研究能力的培養(yǎng),教師在教學(xué)和示范中對數(shù)據(jù)的輕視導(dǎo)致學(xué)生在數(shù)據(jù)獲取和處理分析方面的怠慢和主觀惰性,因此在很多高校中都可以看到學(xué)生脫離數(shù)據(jù)進(jìn)行研究的現(xiàn)象。
3.2研究數(shù)據(jù)的合理處理能力
對于一些項目團(tuán)隊來講,他們的任務(wù)是通過數(shù)據(jù)分析運(yùn)用專業(yè)技術(shù)解決課題,要想響應(yīng)社會需求,高校學(xué)生應(yīng)該具備以下基本能力:
(1)系統(tǒng)的數(shù)學(xué)與統(tǒng)計學(xué)知識。脫離數(shù)學(xué)進(jìn)行數(shù)據(jù)分析是不切實際的,在進(jìn)行數(shù)據(jù)分析時往往不可避免要使用適當(dāng)?shù)睦碚撃P停挥芯邆淞艘欢ǖ臄?shù)學(xué)與統(tǒng)計學(xué)理論知識才能正確理解這些模型。
(2)完整的數(shù)據(jù)庫理論知識。在任何情況下,數(shù)據(jù)的搜集都是數(shù)據(jù)分析流程中的基礎(chǔ)步驟,大數(shù)據(jù)分析工作者必須具備從互聯(lián)網(wǎng)上搜集數(shù)據(jù)的能力,因此,大數(shù)據(jù)分析工作者要具備對數(shù)據(jù)庫尤其是大數(shù)據(jù)運(yùn)用的秉性數(shù)據(jù)庫的設(shè)計和部署知識,并且能夠靈活應(yīng)對環(huán)境的變化對實踐中的數(shù)據(jù)搜集方法和途徑進(jìn)行改良。
(3)對研究領(lǐng)域背景知識的掌握。大數(shù)據(jù)的分析不僅是對數(shù)據(jù)進(jìn)行簡單的處理而得出結(jié)論,而是要求數(shù)據(jù)分析者充分理解每個數(shù)據(jù)表示的含義,清楚地認(rèn)識到自己的工作內(nèi)容,只有在這個前提下,他才會對特定的某些數(shù)據(jù)產(chǎn)生敏感,意識到數(shù)據(jù)反映的信息。
3.3數(shù)據(jù)處理結(jié)果的正確解釋能力
數(shù)據(jù)分析的目的是將隱藏在一大批看起來雜亂無章的數(shù)據(jù)信息集中、萃取和提煉出來,以找出所研究對象的內(nèi)在規(guī)律。數(shù)據(jù)分析可幫助人們做出正確判斷,以便采取適當(dāng)?shù)男袆?。對在高校學(xué)生數(shù)據(jù)處理結(jié)果正確解釋能力的培養(yǎng)需要從以下幾個方面入手:
(1)提升學(xué)生的專業(yè)知識與研究能力。精深的專業(yè)知識和扎實的專業(yè)研究能力是正確解釋數(shù)據(jù)處理結(jié)果的根本保障。數(shù)據(jù)分析工作者能夠依托精深的專業(yè)知識和研究能力,正確把握研究范圍內(nèi)的問題性質(zhì),查明數(shù)據(jù)分析結(jié)果的因果性、相關(guān)性和類聚性,有效避免落入假因果的陷阱。
(2)加強(qiáng)數(shù)據(jù)處理能力的培養(yǎng)。獲得正確的數(shù)據(jù)分析結(jié)果的前提是具備良好的數(shù)據(jù)處理能力,包括對數(shù)據(jù)處理工具的熟練使用能力、對數(shù)據(jù)處理工具使用情景和約束條件的正確判斷和豐富靈活的數(shù)據(jù)處理技巧。
(3)加強(qiáng)科學(xué)方法論素養(yǎng)。作為一名數(shù)據(jù)分析工作者,科學(xué)研究方法論素養(yǎng)是其提升和發(fā)揮自身專業(yè)技能和研究能力的必要思想基礎(chǔ)。在數(shù)據(jù)處理過程中,要遵循辯證實證的科學(xué)研究方法論,正確選擇數(shù)據(jù)處理工具和解釋數(shù)據(jù)處理結(jié)果。
4.高校教育改革
4.1課程體系改革
數(shù)據(jù)的處理需要依托深厚的數(shù)學(xué)功底,首先在課程體系上要特別重視基礎(chǔ)數(shù)學(xué)學(xué)科的課程設(shè)置。當(dāng)前在理工類專業(yè)中都會開設(shè)高等數(shù)學(xué),數(shù)理統(tǒng)計,線性代數(shù),計量經(jīng)濟(jì)學(xué)等基礎(chǔ)學(xué)科,理工類專業(yè)的學(xué)生數(shù)學(xué)功底相對較為扎實。但文科專業(yè)或偏文科專業(yè)往往都忽視這些數(shù)學(xué)類的基礎(chǔ)學(xué)科,少有文科專業(yè)會給學(xué)生開設(shè)這類課程,導(dǎo)致學(xué)生數(shù)學(xué)基礎(chǔ)知識匱乏,何談處理數(shù)據(jù)。
4.2教學(xué)方法改革
要提高學(xué)生的數(shù)據(jù)處理能力,必須鼓勵對現(xiàn)有的教學(xué)方法進(jìn)行適當(dāng)?shù)母母铩T趥鹘y(tǒng)教學(xué)中,通常是教師講解,學(xué)生聆聽,課堂上缺乏師生間的互動。這種教學(xué)方法不利于學(xué)生對知識的吸收,新的教學(xué)方法應(yīng)當(dāng)鼓勵學(xué)生積極思考,在課堂上踴躍提出自己的觀點(diǎn)和見解甚至提出自己的質(zhì)疑,只有這樣學(xué)生才會深入了解這些理論并把它變成自己的東西。
4.3教材改革建設(shè)
要切實貫徹以上的教學(xué)改革思想,必須要有高水平的教材作為基礎(chǔ)。教材建設(shè)是整個教學(xué)內(nèi)容的基礎(chǔ)環(huán)節(jié),沒有高水平的教材很多理論教學(xué)和實踐教學(xué)都很難達(dá)到預(yù)期的目標(biāo)。在大多數(shù)高校的教學(xué)中,很少會有學(xué)校自己開發(fā)的教材,這樣存在一個嚴(yán)重的弊端就是學(xué)生手中的教材和老師的教學(xué)大綱脫節(jié),教材不適應(yīng)教師的教學(xué)計劃,學(xué)生也很難將教學(xué)大綱與課本聯(lián)系起來。
因此,提高學(xué)生的數(shù)據(jù)處理能力重要的一個環(huán)節(jié)就是積極開發(fā)適合本院校學(xué)生和教師的教材。新的教材旨在提高該專業(yè)學(xué)生的數(shù)據(jù)綜合分析能力,教材的內(nèi)容要突破傳統(tǒng)的教材模式,以培養(yǎng)學(xué)生的綜合素質(zhì)作為最終的目標(biāo)。此外,傳統(tǒng)的教材過于單調(diào),在教學(xué)過程中可以配合多媒體教案,豐富教學(xué)形式,提高學(xué)生的學(xué)習(xí)興趣。
參考文獻(xiàn):
[1]周渝,唯奕.大數(shù)據(jù)———企業(yè)運(yùn)營中的新資本[J].信息與電腦,2012,(11):19-21
[2]李奕.大數(shù)據(jù)應(yīng)用方式:從數(shù)據(jù)服務(wù)、信息服務(wù)到知識服務(wù)[N].中國計算機(jī)報,2012-07-09,(24)
[3]Big Data:A Revolution That Will Transform How We Live, Work, and Think
[4]范金城.數(shù)據(jù)分析[M]. 2版. 北京: 科學(xué)出版社, 2010:3endprint