任 韜
(首都經(jīng)濟貿(mào)易大學(xué)統(tǒng)計學(xué)院,北京豐臺區(qū)100070)
大數(shù)據(jù)時代背景下對數(shù)據(jù)分析教育的思考——以財經(jīng)類高校為例
任韜
(首都經(jīng)濟貿(mào)易大學(xué)統(tǒng)計學(xué)院,北京豐臺區(qū)100070)
大數(shù)據(jù)時代對財經(jīng)類高校研究生的培養(yǎng)提出了新的要求。本文首先分析了財經(jīng)類高校數(shù)據(jù)分析課程的特點,繼而給出了財經(jīng)類高校數(shù)據(jù)分析課程建設(shè)的思路。根據(jù)該思路,以R語言課程為例,本文進一步給出了該課程的建設(shè)方案。
財經(jīng)類高校;數(shù)據(jù)分析課程;課程建設(shè)
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)分析在各行業(yè)的重要性日益凸顯出來。大數(shù)據(jù)時代要求人才具有極強的“數(shù)據(jù)視野”、“數(shù)據(jù)意識”和“數(shù)據(jù)能力”,即對所處行業(yè)數(shù)據(jù)的形式種類詳盡把握,對數(shù)據(jù)的作用深刻理解,對數(shù)據(jù)分析方法和分析軟件熟練運用。其中“數(shù)據(jù)能力”是前兩者的基礎(chǔ),是實現(xiàn)大數(shù)據(jù)所有思想和理念的根本保證,是現(xiàn)代經(jīng)濟管理人才的重要基本素養(yǎng)和技能。
我國的財經(jīng)類院校肩負著為社會培養(yǎng)經(jīng)濟管理類高級專業(yè)人才的重任,在大數(shù)據(jù)時代,社會對于經(jīng)濟管理類高級人才在數(shù)據(jù)分析方面的要求極大增加,現(xiàn)代經(jīng)濟管理理論的發(fā)展趨勢也體現(xiàn)出越來越重視數(shù)據(jù)分析的特點。這要求人才既有深厚的經(jīng)濟管理理論功底,又能夠熟練使用數(shù)據(jù)分析工具對業(yè)務(wù)數(shù)據(jù)進行分析,并得到結(jié)論。特別是在研究生教育層面,對數(shù)據(jù)分析能力培養(yǎng)更加重要。
然而,目前在研究生數(shù)據(jù)分析能力的培養(yǎng)方面各財經(jīng)類院校均存在著較多的不足。首先是覆蓋面小,除各院校的統(tǒng)計學(xué)院(或類似學(xué)科的學(xué)院和專業(yè))外,強調(diào)這方面能力的培養(yǎng)的學(xué)院和專業(yè)較少,導(dǎo)致研究生對數(shù)據(jù)的運用和分析能力不足;其次是形式單一,主要以課堂教學(xué)為主,完全忽視了數(shù)據(jù)分析的實踐性,教學(xué)效果不好;再次是教學(xué)所用軟件平臺薄弱,多數(shù)使用SPSS,極少數(shù)專業(yè)學(xué)習(xí)SAS,對于在學(xué)術(shù)界和業(yè)界非常流行R語言、python等平臺則少有涉及。因此,合理設(shè)計數(shù)據(jù)分析類型課程,提高經(jīng)濟管理類研究生在數(shù)據(jù)分析方面的理論水平與實踐能力,是廣大財經(jīng)類高校不得不面對的迫切問題。本文講就財經(jīng)類高校數(shù)據(jù)分析類課程的特點、建設(shè)思路和建設(shè)方案,結(jié)合筆者在教學(xué)實踐中的一些心得談一談自己的看法。
數(shù)據(jù)分析的目的就是從數(shù)據(jù)中提取有價值的信息,進而形成知識。因此在絕大多數(shù)專業(yè)領(lǐng)域均有大量的數(shù)據(jù)分析需求,對人才的數(shù)據(jù)分析能力均有較高的需求。從財經(jīng)類高校的專業(yè)分布看,可以把對數(shù)據(jù)分析能力的需求分成三個不同的類型。
第一類是以統(tǒng)計學(xué)院、信息學(xué)院(或類似學(xué)科的學(xué)院和專業(yè))。這兩類專業(yè)的教學(xué)主要突出理論性、基礎(chǔ)性和方法性,立足于對學(xué)生的“數(shù)據(jù)視野”、“數(shù)據(jù)意識”和“數(shù)據(jù)能力”進行全面訓(xùn)練,使學(xué)生能夠在畢業(yè)后在任意領(lǐng)域迅速承擔起高級數(shù)據(jù)分析的任務(wù)。
第二類是經(jīng)濟學(xué)門類的相關(guān)學(xué)科。這類學(xué)科對于數(shù)據(jù)分析教學(xué)的要求偏重應(yīng)用,即學(xué)生的“數(shù)據(jù)視野”、“數(shù)據(jù)意識”,但由于部分專業(yè)(如數(shù)量經(jīng)濟學(xué))對數(shù)據(jù)分析能力要求較高,因此對于“數(shù)據(jù)能力”的培養(yǎng)也需要兼顧。
第三類是管理學(xué)門類的相關(guān)學(xué)科。當前的管理學(xué)實踐離不開數(shù)據(jù),對數(shù)據(jù)分析教學(xué)主要是應(yīng)用層面的。要求學(xué)生具有良好的學(xué)生的“數(shù)據(jù)視野”和“數(shù)據(jù)意識”,而對于學(xué)生的“數(shù)據(jù)能力”的培養(yǎng)則并沒有太高要求。
基于上述分析,研究生數(shù)據(jù)分析課程建設(shè)應(yīng)當采取分層設(shè)課的原則,基于不同的教學(xué)需求,設(shè)置不同的課程群。
對于上述第一類專業(yè),需要在專業(yè)核心課程群的基礎(chǔ)上,重點建設(shè)大數(shù)據(jù)相關(guān)課程。如分布式計算、非結(jié)構(gòu)化數(shù)據(jù)分析、R語言、python語言等。在教學(xué)中,案例化教學(xué)和上機實操應(yīng)當成為教學(xué)的主要形式,尤其軟件類課程應(yīng)當在機房進行,保證學(xué)生有足夠時間熟悉操作并能隨時與教師互動。
對于上述第二類專業(yè),需要以一門基礎(chǔ)課程為先導(dǎo)(如統(tǒng)計學(xué)導(dǎo)論),在配合若干專業(yè)課與軟件課的組合,如計量經(jīng)濟學(xué)、時間序列分析、縱向數(shù)據(jù)分析與Eviews、SAS和R語言的配合。在教學(xué)時,理論與實操并重,在實操方面突出學(xué)生的軟件使用能力訓(xùn)練,SPSS類型的軟件不應(yīng)當成為此類專業(yè)的主要數(shù)據(jù)分析平臺(學(xué)生應(yīng)當在學(xué)習(xí)專業(yè)課程時自主學(xué)習(xí)使用)。
對于上述第三類專業(yè),可以考慮以一門數(shù)據(jù)分析課程為基礎(chǔ),配合合適的軟件平臺,同時在其他專業(yè)課程教學(xué)中突出各個課程的數(shù)據(jù)分析教學(xué)內(nèi)容和實踐環(huán)節(jié),既可以基本達到教學(xué)目的。這類課程教學(xué)的重點在于對數(shù)據(jù)分析方法模型的理解,切忌死記硬背,同時輔以一定的案例和上機實操。在軟件平臺使用上,以SPSS這類擁有完善的GUI環(huán)境,所見即所得的平臺為主,也可以使用R語言強大的圖形能力作為演示工具,在演示的同時潛移默化地使學(xué)生了解R系統(tǒng),進而為其進一步學(xué)習(xí)建立基層。
在上述三類專業(yè)的數(shù)據(jù)分析課程建設(shè)中,R語言均扮演了重要角色。因此本部分將以R語言課程為例介紹建設(shè)方案。
(一)R語言的優(yōu)勢
R語言作為功能全面地數(shù)據(jù)分析平臺,在國際學(xué)術(shù)界和業(yè)界得到了廣泛的認同,是應(yīng)用最普遍的數(shù)據(jù)分析軟件之一。與其他統(tǒng)計分析平臺(如SAS、SPSS、S-PLUS等)相比,R語言具有若干明顯的優(yōu)勢:
第一,完全免費,完全開源。與SAS多達幾十萬元的價格相比,R語言是一個完全免費的平臺,且功能同樣強大。
第二,安裝簡便,更新迅速,功能完善。R語言的安裝對于硬件的需求很低,且擁有Windows、Mac、Linux等多個平臺的版本。并且R通過其大量的程序包實現(xiàn)了功能的擴展,用戶總是能通過下載功能包獲得最新的分析模塊。
第三,R語言是被國際學(xué)術(shù)界廣泛認可,絕大多數(shù)國際知名高校都將R作為基本的教學(xué)和科研工具。
第四,R語言既是編程語言,又是高度功能化的數(shù)據(jù)分析平臺,同時具有編程語言的靈活性和功能化數(shù)據(jù)分析軟件的易用性。
(二)開展研究生R語言教學(xué)的必要性
首先,作為一種編程語言,R語言的教學(xué)可以訓(xùn)練學(xué)生抽象思維、邏輯思維能力,同時作為一種數(shù)據(jù)分析平臺,R語言可以訓(xùn)練學(xué)生數(shù)據(jù)分析模型的應(yīng)用能力和實際操作能力,這一功能是其他非語言類軟件系統(tǒng)無法實現(xiàn)的。
其次,在研究生教學(xué)中開設(shè)R語言課程,可以極大提升學(xué)生在求職就業(yè)、考博和出國深造方面的競爭力。由于R語言在國內(nèi)外學(xué)術(shù)界和業(yè)界有著巨大的影響,因此熟練掌握R語言無疑會使我們的研究生更加具備競爭力。
(三)研究生R語言教學(xué)的現(xiàn)狀及改革的迫切性
從當前的教學(xué)現(xiàn)狀來看,R語言僅僅是少數(shù)專業(yè)才有的課程。但是基于本人這幾年的教學(xué)和指導(dǎo)研究生的經(jīng)驗來看,當前我國財經(jīng)類高校研究生的動手能力較弱。其根本原因之一是缺少數(shù)據(jù)分析能力的訓(xùn)練。若要在不過分增加研究生課程量的前提下迅速提高研究生這方面能力,R語言這種將抽象思維、邏輯思維、數(shù)據(jù)分析模型和數(shù)據(jù)分析實操緊密集合的平臺是最好的選擇。
(四)R語言教學(xué)的內(nèi)容劃分
R語言集合了計算機語言與數(shù)據(jù)分析系統(tǒng)的特點,既能像SPSS那樣通過簡單操作即得到結(jié)果,又能夠項C語言那樣進行新功能的開發(fā),尤其是其強大的圖形能力,更為數(shù)據(jù)分析人員提供了強大的數(shù)據(jù)可視化平臺。為了能夠為學(xué)生全面地講授上述內(nèi)容,需要對課時進行合理分配,輔以合理的教學(xué)模式和考核模式。下面本文將以48學(xué)時的研究生課程為例,介紹R語言課程的基本內(nèi)容和結(jié)構(gòu)。
1.教學(xué)內(nèi)容和學(xué)時分配
第一部分,R語言簡介(2學(xué)時),介紹R語言的歷史、基本操作環(huán)境、相關(guān)網(wǎng)站、系統(tǒng)本身和軟件包的安裝方法以及參考書籍等。
第二部分,R語言的數(shù)據(jù)結(jié)構(gòu)(12學(xué)時),介紹向量、因子、索引、數(shù)組和矩陣、數(shù)據(jù)框、列表等概念和相關(guān)算法。這部分是后面教學(xué)的基礎(chǔ),同時也是R語言區(qū)別于其他編程語言的重要方面,在教學(xué)時要突出對因子、索引(以及利用索引實現(xiàn)篩選等功能)、數(shù)據(jù)框等數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)分析的關(guān)系的介紹。
第三部分,R語言的編程結(jié)構(gòu)(12學(xué)時),介紹成組、選擇和循環(huán)三種結(jié)構(gòu)。在這部分教學(xué)中,重點在不能按照傳統(tǒng)程序設(shè)計語言的模式進行教學(xué),要突出數(shù)據(jù)分析的特征,可以考慮使用R語言自己編制景點統(tǒng)計方法的代碼,如最小二乘法、距離判別、快速聚類等。
第四部分,R語言的繪圖功能(12學(xué)時),介紹高級繪圖語句、低級繪圖語句、交互繪圖語句以及ggplot2軟件包等。繪圖是R語言的優(yōu)勢,允許使用者自由的定義圖形,尤其是ggplot2軟件包的出現(xiàn),更是將R的繪圖功能推上了新的高度。這部分不但是上述第一類、第二類專業(yè)研究生所需要掌握的內(nèi)容,也是第三類專業(yè)研究生應(yīng)當了解的內(nèi)容。
第五部分,R語言的基本統(tǒng)計功能(10學(xué)時),經(jīng)過前述四個部分的教學(xué),學(xué)生已經(jīng)對R語言具有了較為深入的了解,并應(yīng)該具有獨立編制代碼的能力。在此基礎(chǔ)上,可以進行本部分的教學(xué),即對于使用R語言實現(xiàn)諸如回歸分析、多元統(tǒng)計分析、時間序列分析的方法進行介紹。由于這一部分功能均有對應(yīng)的軟件包和函數(shù),因此在軟件操作方面非常簡單,如果跳過前面幾個步驟直接進行這部分的教學(xué)會使學(xué)生對R語言一知半解,缺少對R語言核心知識的理解。
2.教學(xué)及考核方式
由于R語言是一個操作性非常強的語言平臺,傳統(tǒng)的課堂教學(xué)+上機的教學(xué)模式會使得理論與實踐脫節(jié)。因此建議該課程全程在機房進行,這種教學(xué)方法的優(yōu)勢有三個方面:
第一,教師講解更到位。編程類課程重要的是思考過程而不是結(jié)果,因此傳統(tǒng)的課堂上聽講,上機課練習(xí)的模式會使得思考過程與結(jié)果脫節(jié)。而在機房上課則可以使學(xué)生跟隨教師的講解隨時練習(xí)和實驗,使得教學(xué)效果更好。
第二,師生互動更容易。學(xué)習(xí)編程的過程就是不斷試錯的過程,學(xué)生需要不斷地從發(fā)現(xiàn)錯誤——解決錯誤的過程中提高能力,而在這個過程中教師與學(xué)生的互動非常重要。
第三,課堂練習(xí)更直接。課堂練習(xí)在學(xué)習(xí)編程過程中具有非常高的重要性,傳統(tǒng)授課模式下,無法做到當天的學(xué)習(xí)內(nèi)容當天聯(lián)系,是知識技能的掌握不牢,效率低下。
在考核方面,建議采取開卷上機考核的方式。由于R語言的教學(xué)具有極大的實踐性,因此“會用”才是最終的目的。同時,由于R語言極強的可擴充性,因此單純地考查學(xué)生對于R語言中一些功能代碼的記憶沒有任何意義,采取開卷的方式,重點考查學(xué)生解決數(shù)據(jù)分析問題的能力的上級考試才能夠?qū)崿F(xiàn)對學(xué)生R語言學(xué)習(xí)水平的測度目的。
當今社會已進入大數(shù)據(jù)時代,任何財經(jīng)類專業(yè)人才的培養(yǎng)脫離了數(shù)據(jù)分析類教學(xué)內(nèi)容都是不能適應(yīng)社會需求的。而數(shù)據(jù)分析課程的理論與實踐并重的特點,要求在教學(xué)過程中既重視數(shù)據(jù)分析理論模型的講解,又重視數(shù)據(jù)分析平臺的訓(xùn)練。只有這樣,才能使得財經(jīng)類人才的培養(yǎng)跟上市場對于人才需求內(nèi)容的轉(zhuǎn)變,培養(yǎng)出符合市場需要的人才。
[1]崔路云.基于大數(shù)據(jù)時代背景對統(tǒng)計學(xué)教育的幾點思考[D].首都經(jīng)濟貿(mào)易大學(xué),2014.
[2]何蘊毅.大數(shù)據(jù)背景下教育變革的思考與實踐[J].教育信息技術(shù),2014(12).
[責任編輯張敬亞]
G64
A
1673-9132(2016)34-0040-03
10.16657/j.cnki.issn1673-9132.2016.34.020
任韜(1978—),男,北京市人,首都經(jīng)濟貿(mào)易大學(xué)統(tǒng)計學(xué)院,副教授。
課題項目:首都經(jīng)濟貿(mào)易大學(xué)校級教改立項(研究生項目)《研究生R語言教學(xué)模式與方法研究》的階段性成果。