黃晉 湯俊偉 羅瑞奇 陳佳
[摘 要] 基于對大數(shù)據(jù)專業(yè)實訓(xùn)教學(xué)的探索,將物聯(lián)網(wǎng)的云平臺和數(shù)據(jù)分析處理技術(shù)引入大數(shù)據(jù)課程實訓(xùn)教學(xué)中。針對大數(shù)據(jù)專業(yè)實訓(xùn)的特點和難點,嘗試以云平臺為專業(yè)實訓(xùn)基本手段、以物聯(lián)網(wǎng)設(shè)備作為前端數(shù)據(jù)獲取技術(shù)組織教學(xué),以提高學(xué)生的綜合設(shè)計水平和實踐能力。針對前端數(shù)據(jù)預(yù)處理和后端數(shù)據(jù)智能處理需求,進(jìn)行前沿數(shù)據(jù)分析的理論知識和實踐方法教學(xué),拓展學(xué)生的專業(yè)深度和廣度,為國家培養(yǎng)復(fù)合型信息技術(shù)人才。
[關(guān)鍵詞] 大數(shù)據(jù);物聯(lián)云平臺;智能處理;實訓(xùn)
[基金項目] 2020年度湖北省自然科學(xué)基金計劃一般面上項目“基于MR影像的柔性生物組織變形場測量應(yīng)用研究”(2020CFB801)
[作者簡介] 黃 晉(1982—),男,湖北武漢人,博士,武漢紡織大學(xué)計算機(jī)與人工智能學(xué)院講師,主要從事大數(shù)據(jù)方向研究;湯俊偉(1990—),男,湖北蘄春人,博士,武漢紡織大學(xué)計算機(jī)與人工智能學(xué)院講師,主要從事移動安全與人工智能研究;陳 佳(1982—),女,湖北武漢人,博士,武漢紡織大學(xué)計算機(jī)與人工智能學(xué)院副教授(通信作者),主要從事圖像處理、人工智能研究。
[中圖分類號] G642 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1674-9324(2022)25-0033-04 [收稿日期] 2022-03-17
引言
大數(shù)據(jù)學(xué)科是隨著互聯(lián)網(wǎng)的飛速發(fā)展和數(shù)據(jù)科學(xué)的發(fā)展逐漸形成的,它針對數(shù)據(jù)獲取、數(shù)據(jù)分析和數(shù)據(jù)可視化各個環(huán)節(jié),利用計算機(jī)網(wǎng)絡(luò)技術(shù)進(jìn)行數(shù)據(jù)傳輸,借助數(shù)學(xué)模型和人工智能算法進(jìn)行數(shù)據(jù)處理和分析,并利用二維和三維技術(shù)實現(xiàn)分析結(jié)果的可視化。在當(dāng)前世界信息化和全球化的趨勢面前,做好高等院校大數(shù)據(jù)專業(yè)的教學(xué)研究工作,為國家培養(yǎng)適應(yīng)形勢變化的復(fù)合型信息技術(shù)人才越發(fā)重要。
武漢紡織大學(xué)計算機(jī)與人工智能學(xué)院下設(shè)大數(shù)據(jù)專業(yè)和人工智能專業(yè),并于2019年開始招收全日制本科生。開設(shè)了大數(shù)據(jù)專業(yè)的全套本科課程,包括“數(shù)據(jù)科學(xué)導(dǎo)論”“數(shù)據(jù)采集與網(wǎng)絡(luò)爬蟲”“數(shù)據(jù)分析與實踐”“大數(shù)據(jù)可視化技術(shù)”等。目前,我校大數(shù)據(jù)教學(xué)方面還有長足的發(fā)展和較大的提升空間。
針對大數(shù)據(jù)課程的特點,結(jié)合我們在專業(yè)實訓(xùn)中的實際經(jīng)驗,就大數(shù)據(jù)專業(yè)實訓(xùn)內(nèi)容提出自己的想法和若干建議,希望能為大數(shù)據(jù)專業(yè)建設(shè)提供新的思路。
一、大數(shù)據(jù)專業(yè)實訓(xùn)特點
(一)大數(shù)據(jù)專業(yè)實訓(xùn)的特點
1.大數(shù)據(jù)專業(yè)內(nèi)容涉及面廣。大數(shù)據(jù)是一門新興學(xué)科,也是一門綜合性很強的學(xué)科,涉及計算機(jī)網(wǎng)絡(luò)、人工智能和機(jī)器學(xué)習(xí)、概率論等諸多學(xué)科。
2.大數(shù)據(jù)專業(yè)基礎(chǔ)課程體系復(fù)雜?;A(chǔ)類課程包括數(shù)學(xué)基礎(chǔ)課、計算機(jī)基礎(chǔ)課、大數(shù)據(jù)基礎(chǔ)課程;進(jìn)階類課程包括數(shù)據(jù)獲取類課程、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)類課程、數(shù)據(jù)可視化類課程。每一類課程由若干門課程構(gòu)成,且課程之間存在較多的依賴關(guān)系。
3.大數(shù)據(jù)專業(yè)知識更新快,前沿性強。隨著互聯(lián)網(wǎng)的飛速發(fā)展,新的數(shù)據(jù)類型不斷產(chǎn)生,新的應(yīng)用需求不斷發(fā)展。這就要求針對新的需求和數(shù)據(jù)類型,提出新的大數(shù)據(jù)技術(shù)和理論,解決不斷出現(xiàn)的實際問題。
(二)大數(shù)據(jù)專業(yè)實訓(xùn)中面臨的困難
大數(shù)據(jù)專業(yè)實訓(xùn)中的主要困難有:(1)大數(shù)據(jù)知識和技術(shù)資源相對獨立和分散;(2)理論知識和實踐知識結(jié)合得不緊密;(3)前沿內(nèi)容眾多且理論難度較大;(4)省屬高校學(xué)生能力參差不齊。
二、物聯(lián)云平臺實驗的概念和模式
物聯(lián)云平臺實驗是學(xué)科專業(yè)實訓(xùn)與云計算發(fā)展的產(chǎn)物。隨著計算機(jī)網(wǎng)絡(luò)和傳感器的飛速發(fā)展,海量數(shù)據(jù)大多數(shù)產(chǎn)生于該類平臺?;谠擃愋推脚_進(jìn)行專業(yè)實訓(xùn)[1-3],能夠讓學(xué)生實際體驗平臺的內(nèi)容和特點,提高實踐能力。
現(xiàn)有物聯(lián)網(wǎng)設(shè)備主要包含多種類型的傳感器設(shè)備,如視頻、音頻、紅外等;其中樹莓派是一種使用廣泛的開源嵌入式平臺[4,5]。該平臺選用的Linux操作系統(tǒng)是一種嵌入式的系統(tǒng)。目前云平臺包括新浪云、百度云和阿里云,這幾種云架構(gòu)[6,7]是類似的。其中新浪云使用較為廣泛,且部分可以免費使用;阿里云商用最為廣泛,但是費用較高;而百度云使用較少,不在我們考慮之列。
根據(jù)目前業(yè)界開發(fā)應(yīng)用需求,并結(jié)合目前市場上提供的設(shè)備及在線云資源的情況,物聯(lián)網(wǎng)前端傳感器負(fù)責(zé)數(shù)據(jù)采集和預(yù)處理,擬采用基于平臺樹莓派的硬件平臺。該平臺軟硬件都具有較高開放性,軟硬件支持非常豐富。后端云平臺負(fù)責(zé)數(shù)據(jù)管理,擬采用新浪云。
三、智能數(shù)據(jù)處理實驗的概念和模式
智能數(shù)據(jù)處理實驗是大數(shù)據(jù)專業(yè)和產(chǎn)業(yè)技術(shù)應(yīng)用深度融合的產(chǎn)物,將人工智能和數(shù)據(jù)挖掘中的各種技術(shù)和算法[8-10]在實訓(xùn)的實驗中加以應(yīng)用。國內(nèi)外智能數(shù)據(jù)處理技術(shù)總結(jié)如下。
Tensorflow是由谷歌公司開發(fā)的開源深度學(xué)習(xí)平臺,尤其擅長分析圖像和自然語言,主要技術(shù)是使用卷積神經(jīng)網(wǎng)絡(luò),內(nèi)置各種最先進(jìn)的深度模型。Pytorch是另一種開源的深度學(xué)習(xí)開發(fā)平臺,與Tensorflow類似,且其編程方式更加簡潔并易于理解,硬件同時支持CPU和GPU。國內(nèi)也有自主研發(fā)的類似平臺,如百度的飛槳(Paddle)和清華大學(xué)的計圖(Jittor),軟件部分實現(xiàn)了自主可控。智能數(shù)據(jù)處理實驗?zāi)J饺鐖D1所示。針對具體的產(chǎn)業(yè)應(yīng)用需求,在物聯(lián)網(wǎng)平臺和云平臺上構(gòu)建數(shù)據(jù)處理算法支撐環(huán)境,進(jìn)行算法的學(xué)習(xí)和實踐。智能數(shù)據(jù)處理教學(xué)分為兩個部分的內(nèi)容。
(一)物聯(lián)網(wǎng)前端軟硬件學(xué)習(xí)和處理算法學(xué)習(xí)與實踐
物聯(lián)網(wǎng)前端設(shè)備負(fù)責(zé)原始數(shù)據(jù)的采集和數(shù)據(jù)的預(yù)處理,預(yù)處理通常采用機(jī)器學(xué)習(xí)或者圖像處理的方法。因此,需要學(xué)習(xí)在樹莓派的嵌入式Linux操作系統(tǒng)環(huán)境中進(jìn)行環(huán)境配置及編程實踐方法,將預(yù)處理后的數(shù)據(jù)通過網(wǎng)絡(luò)發(fā)送至遠(yuǎn)程云平臺。
(二)云平臺中數(shù)據(jù)分析算法學(xué)習(xí)與實踐
首先,學(xué)習(xí)內(nèi)容方面,在學(xué)習(xí)Python的基礎(chǔ)上進(jìn)一步掌握機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的理論和實驗。其次,技能實踐方面,需要掌握云平臺中各種算法庫的使用方法,以及算法集成技術(shù),為了將這些算法功能在項目工作中正常使用。最后,完成項目設(shè)計、程序設(shè)計實踐,并完成最終的演示和報告內(nèi)容。
四、大數(shù)據(jù)專業(yè)實踐教學(xué)方案
通過對現(xiàn)有應(yīng)用和教學(xué)經(jīng)驗的研究,將物聯(lián)云平臺和智能數(shù)據(jù)處理算法應(yīng)用到大數(shù)據(jù)專業(yè)實訓(xùn)的教學(xué)實踐中。課程設(shè)置方案包括準(zhǔn)備階段、教學(xué)階段、實踐階段。
1.準(zhǔn)備階段:配發(fā)講義,其內(nèi)容主要與教材《Raspberry Pi用戶指南》(Raspberry Pi User Guide)和《利用Python進(jìn)行數(shù)據(jù)分析》(Python for Data Analysis)的內(nèi)容接近。本階段還要安排教學(xué)進(jìn)度,其進(jìn)度可以根據(jù)具體時間長短對內(nèi)容進(jìn)行精簡或擴(kuò)充。
典型教學(xué)進(jìn)度安排包括教學(xué)階段和實踐階段兩部分,總計16個學(xué)時,具體分為四個階段。第一階段,基礎(chǔ)知識教學(xué)階段。安排2個學(xué)時,主要介紹樹莓派及設(shè)備的安裝和使用,以及Linux系統(tǒng)安裝使用以及簡單編程開發(fā)。由于課堂教學(xué)時間非常有限,需要學(xué)生在課下熟悉和掌握Linux平臺c語言和Pyhton語言開發(fā)方法和應(yīng)用實例。第二階段,系統(tǒng)架構(gòu)搭建階段。安排6個學(xué)時,完成云架構(gòu)的設(shè)計和實現(xiàn)、傳感器網(wǎng)絡(luò)通信的協(xié)議和方法,以及應(yīng)用端的設(shè)計和實現(xiàn),同時要求學(xué)生在課下開通云平臺賬號,使用Python實現(xiàn)傳感器的數(shù)據(jù)采集、傳輸和云端存儲,并學(xué)習(xí)使用php實現(xiàn)云平臺數(shù)據(jù)管理。第三階段,進(jìn)階實踐階段。安排4個學(xué)時,完成數(shù)據(jù)分析核心算法,包括使用Python語言在Linux中實現(xiàn)數(shù)據(jù)預(yù)處理算法,使用php語言在云端實現(xiàn)數(shù)據(jù)分析算法。第四階段,評估階段。安排4個學(xué)時,以小組的方式進(jìn)行,每組2~3人,選出1人為組長負(fù)責(zé)溝通和安排工作,最終以小組為單位向大家講解和展示項目成果,并完成小組互評和教師點評。
2.教學(xué)階段:根據(jù)教學(xué)進(jìn)度安排,實施教學(xué)。教學(xué)過程中結(jié)合樹莓派的軟硬件資料和云端開發(fā)的教學(xué)資源供學(xué)生參考和使用。針對不同的應(yīng)用場景,教師講解,學(xué)生組成合作小組,根據(jù)教學(xué)安排給出設(shè)計方案并完成系統(tǒng)搭建。
3.實踐階段:學(xué)生根據(jù)教學(xué)安排和內(nèi)容完成系統(tǒng)設(shè)計和實現(xiàn)工作。在設(shè)計階段,首先畫出整體層次框架,包括具體的功能模塊及模塊之間的交互內(nèi)容和方式。完成云平臺的搭建、前端物聯(lián)網(wǎng)設(shè)備的初始化和數(shù)據(jù)通信,以及設(shè)備端和云端的數(shù)據(jù)分析。通過團(tuán)隊合作,完成一系列的設(shè)計和實現(xiàn),進(jìn)一步鞏固、實踐所學(xué)習(xí)的理論知識。
五、教學(xué)心得體會
將物聯(lián)云平臺和智能數(shù)據(jù)處理教學(xué)引入大數(shù)據(jù)專業(yè)實訓(xùn)教學(xué)中,使得教學(xué)模式和方法產(chǎn)業(yè)化、智能化、規(guī)范化,旨在提高學(xué)生實際工程能力,擴(kuò)展學(xué)生知識的廣度和深度,并接觸業(yè)界最前沿的技術(shù)和知識。具體意義描述詳見圖2。
搭建包含物聯(lián)網(wǎng)的云平臺開發(fā)環(huán)境,將專業(yè)實訓(xùn)和當(dāng)前產(chǎn)業(yè)應(yīng)用相融合。在實訓(xùn)教學(xué)過程中將傳感器硬件、物聯(lián)網(wǎng)、云平臺的軟件和硬件優(yōu)化組合,探索本類案例的產(chǎn)業(yè)特點,旨在調(diào)動學(xué)生學(xué)習(xí)積極性、深入實踐、鍛煉能力。通過該物聯(lián)云平臺,整合大數(shù)據(jù)實訓(xùn)的相關(guān)資源,提供針對實踐的教學(xué)服務(wù),同時培養(yǎng)學(xué)生的工程能力和動手能力。
引入智能數(shù)據(jù)處理的實訓(xùn)內(nèi)容,將人工智能和數(shù)據(jù)挖掘算法融入實訓(xùn)內(nèi)容。學(xué)習(xí)并探討產(chǎn)業(yè)和學(xué)術(shù)前沿的技術(shù)內(nèi)容,在此基礎(chǔ)上探索適合大數(shù)據(jù)專業(yè)的教學(xué)內(nèi)容和教學(xué)方法方式,在專業(yè)實訓(xùn)的教學(xué)過程中,講授算法的原理及算法的實際應(yīng)用場景。將算法能力培養(yǎng)與大數(shù)據(jù)專業(yè)實訓(xùn)融合起來。在此過程中,平臺和智能算法將共同發(fā)揮作用,旨在提高學(xué)生的算法應(yīng)用能力、拓展前沿知識,為國家培養(yǎng)出面向產(chǎn)業(yè)的高素質(zhì)專業(yè)人才。
本論文的探索方向主要是鼓勵主動自學(xué)、注重實踐、開放思考。選擇的講授方式為線上線下結(jié)合的教學(xué)模式,激發(fā)學(xué)生學(xué)習(xí)熱情,提高學(xué)習(xí)的主動性,提高學(xué)生的實踐動手能力。通過物聯(lián)云平臺中各類應(yīng)用技術(shù),逐步提高學(xué)生的實踐動手能力,擴(kuò)展知識的廣度和深度。
結(jié)語
在計算機(jī)教學(xué)中,專業(yè)實訓(xùn)是非常重要的一環(huán)。專業(yè)實訓(xùn)能夠提升學(xué)生的動手能力,使學(xué)生能夠更加深刻地理解和掌握理論知識,并初步掌握實際工程中分析問題和解決問題的能力。同時,本次實訓(xùn)探索能夠完善學(xué)校實訓(xùn)內(nèi)容,并進(jìn)一步推動實訓(xùn)與產(chǎn)業(yè)和實踐的深度結(jié)合。此外,所選軟件和硬件平臺成本較低且開放程度高,不會給學(xué)校和學(xué)生帶來明顯的經(jīng)濟(jì)負(fù)擔(dān)。通過實踐教學(xué)證明了專業(yè)實訓(xùn)的可行性和有效性。然而實訓(xùn)的內(nèi)容和方式還有改進(jìn)的空間,需要在今后的教研中更進(jìn)一步地探索。
參考文獻(xiàn)
[1]王彤,夏利,張立立.基于樹莓派的計算機(jī)類專業(yè)實訓(xùn)教學(xué)探索[J].計算機(jī)教育,2018(1):25-29.
[2]關(guān)靜麗,艾紅,陳雯柏.基于樹莓派和Yeelink的開放實驗室監(jiān)控系統(tǒng)設(shè)計[J].實驗研究與探索,2017(36):115-119.
[3]朱軼,曹清華.基于Android、樹莓派、Arduino、機(jī)器人的創(chuàng)客技能教育探索與實踐[J].實驗技術(shù)與管理,2016(33):172-175.
[4]嚴(yán)莆青,朱劍林.基于Raspberry Pi的老年人室內(nèi)移動監(jiān)測系統(tǒng)設(shè)計與實現(xiàn)[D].武漢:中南民族大學(xué),2017.
[5]李文勝.基于樹莓派的嵌入式Linux開發(fā)教學(xué)探索[J].電子技術(shù)與軟件工程,2014(9):219-220.
[6]龔洪敏.基于云計算環(huán)境的優(yōu)質(zhì)資源共享平臺的研究[D].西安:陜西師范大學(xué),2013.
[7]吳玫.基于SAE與微信公眾平臺的校園信息化服務(wù)系統(tǒng)[D].上海:復(fù)旦大學(xué),2013.
[8]KRIZHEVSKY Alex, SUTSKEVER Ilya, HINTON Geoffrey E. ImageNet classification with deep convolutional neural networks[J]. Advances in neural information processing systems, 2012(25):1106-1114.
[9]GIRSHICK Ross. Fast R-CNN[C]. IEEE International Conference on Computer Vision (ICCV), 2015:1440-1448.
[10]SCHROFF Florian, KALENICHENKO Dmitry, PHILBIN James. FaceNet: a unified embedding for face recognition and clustering[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), 2015:815-823.
Exploration on the Professional Training of Big Data Based on IOT-Cloud Platform and Intelligent Processing
HUANG Jin, TANG Jun-wei, LUO Rui-qi, CHEN Jia
(School of computer Science and Artificial Intelligence, Wuhan Textile University, Wuhan, Hubei 430200, China)
Abstract: This paper explores the practice training and teaching of big data major, and explores the introduction of the IOT-Cloud platform and the data analysis and processing technology into the practice training of the courses of bid data major. According to the characteristics and the difficulties of big data professional training, we try organize teaching by taking the IOT-Cloud platform as the basic means of professional training and IOT equipment as the front-end data acquisition technology, so as to improve students’ comprehensive design level and practical ability. According to the needs of front-end data pre-processing and back-end data intelligent processing, we will discuss the theoretical knowledge and practical methods of cutting-edge data analysis, expand the professional depth and breadth of students, and cultivate compound information technology talents for the country.
Key words: big data; IOT-Cloud platform; intelligent processing; practice training