李志杰
(湖南理工學(xué)院 信息科學(xué)與工程學(xué)院,湖南 岳陽 414006)
大數(shù)據(jù)是信息化發(fā)展的新階段。對于大學(xué)工科專業(yè),無論是培養(yǎng)科研后備力量,還是為工業(yè)界輸送技術(shù)人才,都應(yīng)該拓展大數(shù)據(jù)相關(guān)理論方法與應(yīng)用的教學(xué)[1]。據(jù)報道,中國大數(shù)據(jù)與人工智能人才缺口超過500 萬人,大數(shù)據(jù)已上升到國家戰(zhàn)略的高度。
2017 年2 月以來,教育部積極推進(jìn)新工科建設(shè),大數(shù)據(jù)教育是重要內(nèi)容,我國一些高校陸續(xù)新開設(shè)了大數(shù)據(jù)專業(yè)。教育部分別于2016 年2 月、2017 年3 月、2018 年3 月公布了第一批、第二批、第三批新增數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的高校名單,獲批高校的數(shù)量分別為3、32、250所,呈井噴狀態(tài)增加。同時,高校已辦的許多信息類相關(guān)專業(yè)(范圍涵蓋理科、工科,甚至是文科),為了使培養(yǎng)的學(xué)生適應(yīng)新形勢的需要,在原有專業(yè)課程培養(yǎng)體系內(nèi),也開始增設(shè)一些大數(shù)據(jù)相關(guān)課程,如大數(shù)據(jù)基礎(chǔ)、云計算與大數(shù)據(jù)、數(shù)據(jù)分析等。
不過,大數(shù)據(jù)教育越是大熱門,越需要冷思考。目前,國內(nèi)高校的大數(shù)據(jù)教育處于起步階段,數(shù)據(jù)人才需求巨大、師資力量薄弱、教育體系不足、教學(xué)方法陳舊……這些現(xiàn)象都有不同程度的表現(xiàn)。在彌補高達(dá)500 萬的大數(shù)據(jù)和人工智能人才缺口之前,中國的大數(shù)據(jù)與人工智能教育必須先跨過這些門檻,才有可能進(jìn)入世界的第一梯隊[2-3]。
新工科建設(shè)需要新的教育理念和新的教學(xué)方法作為支撐。數(shù)據(jù)人才培養(yǎng)是一項系統(tǒng)工程,為了培養(yǎng)出合格的數(shù)據(jù)科學(xué)人才,必須創(chuàng)新數(shù)據(jù)人才培養(yǎng)模式。
1)部分高校未開設(shè)專門的大數(shù)據(jù)教學(xué)模塊。
國內(nèi)還有部分高校,至今尚未開設(shè)專門的大數(shù)據(jù)教學(xué)模塊。就本科教學(xué)而言,這些高校數(shù)據(jù)統(tǒng)計分析與挖掘的教學(xué),主要放在大學(xué)三年級的數(shù)據(jù)基礎(chǔ)模塊,代表性課程為概率論,開課教師多為理學(xué)院教師,帶有通識性教育的特點。這些基礎(chǔ)教學(xué)模塊并沒有對大數(shù)據(jù)及相關(guān)的理論分析與應(yīng)用技術(shù)做充分的強調(diào)與訓(xùn)練[4]。
2)已開設(shè)的大數(shù)據(jù)類課程教學(xué),實驗平臺建設(shè)面臨不少挑戰(zhàn)[5]。
大數(shù)據(jù)類課程實驗教學(xué)面臨的挑戰(zhàn)主要如下:①實際案例太少;②沒有完善的平臺支持(如平臺搭建、實驗環(huán)境等);③師資力量不強,任課教師的知識結(jié)構(gòu)需更新;④大數(shù)據(jù)實驗門檻太高(對計算資源需求大);⑤學(xué)生只靠十幾個實驗學(xué)時是無法真正提高技能的;⑥學(xué)生能隨時隨地做大數(shù)據(jù)的實驗;⑦課件和案例需要更新;⑧學(xué)校網(wǎng)絡(luò)環(huán)境不好,需要離線實驗;⑨機(jī)房教師工作負(fù)擔(dān)過重、壓力大,效率低。
美國數(shù)據(jù)分析科學(xué)家Derek Wang 博士認(rèn)為,“企業(yè)數(shù)據(jù)分析,中美在理念方面相差2~3 年,而在實際執(zhí)行層面或許有5 年左右的差距。”3~5年的差距,在瞬息萬變的信息社會,是一道不小的鴻溝。那么這道鴻溝,到底是怎么造成的呢?
美國在數(shù)據(jù)分析方面的教育上,就在努力轉(zhuǎn)型實踐“T”字形理念:科研項目不再是由計算機(jī)系、商學(xué)院或者統(tǒng)計專業(yè)的學(xué)生單獨進(jìn)行,而是多個專業(yè)融合起來,形成整體戰(zhàn)略方向,也就是“T”的那一“橫”。這種前沿的教育理念,即使在美國,也才出現(xiàn)不到三四年,但它取得的效果是根本性的:正是在這樣的教育方式下,美國培養(yǎng)出了第一批數(shù)據(jù)科學(xué)家,引導(dǎo)了企業(yè)的數(shù)據(jù)革命。
中國受到傳統(tǒng)教育體制的限制,更重視縱深的專業(yè)技能,也就是“T”的那一“豎”,缺少跨學(xué)科和專業(yè)的綜合性體制建立。這樣培養(yǎng)出來的人才,無法主動引導(dǎo)企業(yè)建立和完善數(shù)據(jù)分析機(jī)制,讓企業(yè)可以在短時間內(nèi)就從“數(shù)據(jù)分析”中受益。這也反映出中美人才梯隊和培養(yǎng)機(jī)制的巨大區(qū)別[6-8]。在Derek Wang 博士看來,數(shù)據(jù)人才培養(yǎng)上的差異,是造成中美大數(shù)據(jù)產(chǎn)業(yè)“五年鴻溝”的根本原因。
針對國內(nèi)高校大數(shù)據(jù)教學(xué)現(xiàn)狀,比較中美兩國數(shù)據(jù)人才培養(yǎng)上的差異,本文探討新形勢下的數(shù)據(jù)人才培養(yǎng)模式。這種數(shù)據(jù)人才培養(yǎng)模式主要圍繞彌補教育體系不足、轉(zhuǎn)型數(shù)據(jù)人才培養(yǎng)觀、產(chǎn)學(xué)研融合、大數(shù)據(jù)項目案例驅(qū)動教學(xué)改革等方面展開,如圖1 所示。
近年來的諸多實踐證明,想培養(yǎng)真正合格的大數(shù)據(jù)人才,產(chǎn)學(xué)研融合是一條可行之路,也是必由之路。甚至可以說,大數(shù)據(jù)產(chǎn)業(yè)的高速發(fā)展正在倒逼高校大數(shù)據(jù)與人工智能學(xué)科的建設(shè)。這也是為什么中國像百度、騰訊、華為、阿里巴巴、科大訊飛等互聯(lián)網(wǎng)企業(yè)如此重視與高校的合作,或推出一站式開發(fā)平臺,或向高校輸送企業(yè)導(dǎo)師,或與教育主管部門合作舉辦師資培訓(xùn)班并進(jìn)行教材編纂……雖然這些舉措對于企業(yè)來說顯得有些“不務(wù)正業(yè)”,但從某種程度上來說,這些企業(yè)的眼光才是真的長遠(yuǎn)[9]。
眾所周知,學(xué)界和業(yè)界應(yīng)該教學(xué)相長,這個教學(xué)相長也是雙贏的過程。高校可以從企業(yè)界得到最前沿的資源和數(shù)據(jù);企業(yè)則可通過一系列的措施進(jìn)行人才儲備、產(chǎn)業(yè)布局、技術(shù)迭代等,從而占得發(fā)展先機(jī)。
在大數(shù)據(jù)蓬勃發(fā)展的今天,無論是高校還是企業(yè),如果能更好地抓住產(chǎn)學(xué)研融合的機(jī)遇,勢必能贏得先機(jī)和主動,獲得長足的發(fā)展。中國的大數(shù)據(jù)教育最終會在高校和企業(yè)不懈地努力與深入合作之下,開花結(jié)果,培養(yǎng)出真正合格的數(shù)據(jù)人才。這是中國高校大數(shù)據(jù)教育的必由之路。
建設(shè)在線學(xué)習(xí)與實驗平臺,給學(xué)生創(chuàng)造隨時隨地學(xué)習(xí)的實驗環(huán)境。一臺筆記本就可以開始實驗,有網(wǎng)絡(luò)時用網(wǎng)絡(luò)上的大平臺實驗(如百度的AIStudio 在線平臺),無網(wǎng)絡(luò)時用我們開發(fā)的實驗系統(tǒng)也能實驗。學(xué)生可以隨時隨地沉浸式學(xué)習(xí)。例如,開課用的實驗平臺采用多種平臺集成VMWare+Ubuntu+Spark+PaddlePaddle 等。該平臺對硬件平臺的要求低,I5CPU+4G 內(nèi)存的普通PC 能在2 個小時的上機(jī)時間內(nèi)完成多個大數(shù)據(jù)實驗,一站式解決大數(shù)據(jù)上機(jī)難的問題。該方案適合解決學(xué)校短期內(nèi)大數(shù)據(jù)平臺建設(shè)尚未完善、經(jīng)費不足而急需開課的問題[9-10]。
大數(shù)據(jù)理論教學(xué)必須與工科專業(yè)結(jié)合,以相關(guān)案例驅(qū)動大數(shù)據(jù)教學(xué)過程。
在理論教學(xué)中,以案例應(yīng)用為載體,采用以點帶面的思路進(jìn)行教學(xué)內(nèi)容的組織,細(xì)化教學(xué)目標(biāo)并編寫講義。例如,在大數(shù)據(jù)教育體系中,“大數(shù)據(jù)基礎(chǔ)”課程是一門必修基礎(chǔ)課程。該課程基于分布式架構(gòu)實現(xiàn)技術(shù),技術(shù)內(nèi)容豐富,涵蓋數(shù)據(jù)采集、預(yù)處理、存儲、管理、數(shù)據(jù)分析與可視化等。通過分析該課程的定位、教學(xué)內(nèi)容與教材現(xiàn)狀,我們細(xì)化教學(xué)目標(biāo),確立了以相關(guān)案例驅(qū)動大數(shù)據(jù)教學(xué)過程的思路,并組織編寫教材用于實際教學(xué),取得了良好的教學(xué)效果。
實驗教學(xué),以知識應(yīng)用與實踐技能培養(yǎng)為重點內(nèi)容。在大數(shù)據(jù)實驗實訓(xùn)環(huán)節(jié),以案例應(yīng)用為載體,設(shè)計實際應(yīng)用場景,學(xué)生組隊(3~5 人一組)完成項目案例實驗。同時,適度引入大數(shù)據(jù)最新技術(shù)以保證課程內(nèi)容先進(jìn)性。以“大數(shù)據(jù)基礎(chǔ)”課程為例,該課程需要系統(tǒng)講述大數(shù)據(jù)典型軟件的安裝、使用和基礎(chǔ)編程方法,使學(xué)生系統(tǒng)地掌握操作系統(tǒng)(Linux 和Windows)、開發(fā)工具(Eclipse)以及大數(shù)據(jù)相關(guān)軟件(Kafka、Hadoop、HDFS、MapReduce、HBase、Hive、Spark、數(shù)據(jù)可視化工具)。為了達(dá)到教學(xué)目標(biāo),我們在編寫教材時,精心設(shè)計了15 個實驗案例,基本覆蓋了課程的主要知識點,“大數(shù)據(jù)基礎(chǔ)”課程教學(xué)全過程由大數(shù)據(jù)實際項目案例驅(qū)動。
針對大數(shù)據(jù)處理需要復(fù)雜度更低的可行算法,甚至在有些情況下需要設(shè)計并行算法,安排專門環(huán)節(jié)教授并行計算相關(guān)內(nèi)容,設(shè)計實踐導(dǎo)向的課程項目,訓(xùn)練學(xué)生的自主編程能力。由于基于分布式架構(gòu)實現(xiàn)技術(shù),相對于傳統(tǒng)課程,“大數(shù)據(jù)基礎(chǔ)”課程的教師教學(xué)與學(xué)生學(xué)習(xí)難度更大。對于分布式并行環(huán)境下的機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘主要算法,如MapReduce 編程、PageRank 算法、深度學(xué)習(xí)應(yīng)用案例等,我們都安排專門環(huán)節(jié)教授相關(guān)內(nèi)容并設(shè)計實驗案例,確保學(xué)生并行計算自主編程能力達(dá)到教學(xué)目標(biāo)要求。
實踐表明,以在線學(xué)習(xí)與實驗平臺為基礎(chǔ),通過案例問題導(dǎo)向的方式更容易激發(fā)學(xué)生的學(xué)習(xí)興趣和對理論的理解。另外,在具體案例分析過程中,多采用以點帶面的內(nèi)容安排技巧,從一點出發(fā)逐步擴(kuò)展,可以更好地幫助學(xué)生獲得課程理論的清晰脈絡(luò)。
大數(shù)據(jù)教育對教師提出了更高的要求。教師既要對計算機(jī)等信息類學(xué)科有較深的認(rèn)識和理解,又要熟悉大數(shù)據(jù)應(yīng)用技術(shù),特別是要有大數(shù)據(jù)實際系統(tǒng)開發(fā)經(jīng)驗[9]。
目前,相當(dāng)多的高校盡管已開設(shè)了大數(shù)據(jù)相關(guān)專業(yè)或課程,卻存在師資嚴(yán)重缺乏的現(xiàn)象。由于數(shù)據(jù)科學(xué)人才需求旺盛,愿意進(jìn)入高校從事大數(shù)據(jù)教育的人才非常多,但現(xiàn)有的師資大多來源于計算機(jī)等與大數(shù)據(jù)相近的學(xué)科,多數(shù)教師并無大數(shù)據(jù)項目經(jīng)驗。此外,由于時間緊迫以及經(jīng)費不足等原因,教師培訓(xùn)機(jī)會也不多。
合格的師資哪里來?①大數(shù)據(jù)教學(xué)不是單純的課堂理論教學(xué),它的實踐性要求由項目案例驅(qū)動教學(xué)。教師需要科學(xué)研究的積累,才能設(shè)計出好的大數(shù)據(jù)項目案例,教師要想盡辦法多申請或參與大數(shù)據(jù)方面的課題;②加強與企業(yè)的交流與合作,參與大公司的實際項目。大數(shù)據(jù)教育工作者最缺乏的就是易于理解與操作的實例,而這些實例恰恰不在高校,在企業(yè)中;③有計劃地選派教師參加大數(shù)據(jù)師資培訓(xùn),由于大數(shù)據(jù)與行業(yè)結(jié)合緊密,培訓(xùn)最好結(jié)合企業(yè)實際案例,切實提高教師對應(yīng)用層面項目的實戰(zhàn)教學(xué)能力;④鼓勵教師積極采用現(xiàn)代教育技術(shù),建設(shè)大數(shù)據(jù)精品課程,在項目案例驅(qū)動的大數(shù)據(jù)教學(xué)改革中,引入工業(yè)界廣泛應(yīng)用的框架和項目案例,開發(fā)實驗系統(tǒng)平臺、編寫實驗指導(dǎo)書、開放在線學(xué)習(xí)與交流平臺,全方位地提高教師教學(xué)能力與水平。
相對于傳統(tǒng)課程,無論教師教學(xué)還是學(xué)生學(xué)習(xí),大數(shù)據(jù)課程的難度更大。為了取得良好的教學(xué)效果,實現(xiàn)課程教學(xué)的目標(biāo),教學(xué)方式的改革很有必要。
在大數(shù)據(jù)課程教學(xué)實踐中,以學(xué)生為主體,根據(jù)學(xué)生志趣與課程特點,在理論與實驗教學(xué)過程中,設(shè)計以案例驅(qū)動教學(xué)、以問題提升教學(xué)、以“鼓勵”提升教學(xué)3 種先進(jìn)教學(xué)方法。同時,積極使用現(xiàn)代教學(xué)技術(shù)與手段,如申報慕課、借鑒翻轉(zhuǎn)課堂手段等。
在課程考核方面,采用平時、理論與實踐相結(jié)合的多樣化考核方法??己藘?nèi)容強調(diào)實踐操作能力與應(yīng)用技能考核,加大實踐考核的比例。比如,在總分100 分中,平時成績(包括考勤、作業(yè)、課堂提問等)占20%,理論考核(期末)占30%,實踐技能考核占50%。
大數(shù)據(jù)課程考核的成績評定由平時、理論、實踐相結(jié)合綜合評定,考核方法向多元化、全程化、科學(xué)化、綜合化轉(zhuǎn)變,通過課程考核的引領(lǐng)作用來激勵學(xué)生的積極性,切實提高教學(xué)質(zhì)量。
“以學(xué)生為中心”,以多種方式充分激發(fā)學(xué)生的主動性與創(chuàng)造性。
1)完成課程設(shè)計。
只靠十幾個課程實驗學(xué)時,只能完成實驗環(huán)境及基本技能訓(xùn)練,還要通過工程實訓(xùn)與課后學(xué)習(xí)等環(huán)節(jié)完成課程設(shè)計。
2)參加技術(shù)競賽。
數(shù)據(jù)科學(xué)人才僅僅在課堂上的培養(yǎng)是遠(yuǎn)遠(yuǎn)不夠的,需要通過實操的方式來學(xué)習(xí)知識。技術(shù)競賽是最好的實操,考驗著參與者全方位的技能,也能在短期內(nèi)最大限度地激發(fā)人的潛力[10]。
3)鞏固與分享知識。
學(xué)生通過查閱大數(shù)據(jù)慕課教師課堂總結(jié)、完成工程實訓(xùn)課程設(shè)計、參加技術(shù)競賽等方式,將課堂教學(xué)獲得的知識得到鞏固、內(nèi)化與提升。通過慕課小組論壇,學(xué)生也可以分享學(xué)習(xí)體會和學(xué)習(xí)經(jīng)驗。
現(xiàn)階段大數(shù)據(jù)教學(xué)存在的主要問題,一方面是重視不夠,不少高校還沒有開設(shè)專門的大數(shù)據(jù)教學(xué)模塊;另一方面,已開設(shè)的大數(shù)據(jù)相關(guān)課程,常常存在專業(yè)案例教學(xué)弱化,忽視自主編程能力培養(yǎng)等現(xiàn)象。這些現(xiàn)象與問題,是與國家大力提倡的新工科的要求相悖的,需要引起足夠重視。
新工科背景下,大數(shù)據(jù)課程教學(xué)改革與實踐,其目標(biāo)是通過交叉融合、共享、創(chuàng)新等主要途徑培養(yǎng)多元化、創(chuàng)新型數(shù)據(jù)人才。要以社會需求與企業(yè)需求為導(dǎo)向,計算機(jī)科學(xué)與技術(shù)、統(tǒng)計學(xué)、智能科學(xué)等相關(guān)專業(yè)進(jìn)行交叉融合,重構(gòu)人才知識體系。創(chuàng)新教學(xué)方式與技術(shù)、精選教學(xué)內(nèi)容、強化實踐創(chuàng)新創(chuàng)業(yè)能力,加強產(chǎn)學(xué)研融合、切實做好大數(shù)據(jù)課程建設(shè)工作,為金融、商業(yè)、電信等領(lǐng)域數(shù)據(jù)科學(xué)工作提供合格的高級工程技術(shù)創(chuàng)新人才。