秦華鋒 王興瓊
摘要:隨著這人工智能算法尤其是深度學習的快速發(fā)展,已經(jīng)對各行各業(yè)產(chǎn)生了影響。為了能夠跟上技術(shù)和理論發(fā)展的步伐,培養(yǎng)企業(yè)和行業(yè)所需的人才,當前高校的人工智能課程需要做出調(diào)整。本文以模式識別課程為例,探討人工智能背景下高校課程的改革方案。首先分析了目前模式識別課程存在的問題。然后,針對模式識別的課程特點,提出將前沿科技引入教學內(nèi)容,并對教學內(nèi)容和教學方式進行改革。最后,開發(fā)了相應(yīng)的實驗平臺,并在實驗教學環(huán)節(jié)中介紹了基于深度卷積神經(jīng)網(wǎng)絡(luò)手寫體識別的實驗案例。
關(guān)鍵詞:模式識別;課程改革;深度學習;人工智呢;實驗平臺
中圖分類號:G642? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)20-0160-03
開放科學(資源服務(wù))標識碼(OSID):
Abstract: With the rapid development of this artificial intelligence algorithm, especially deep learning, it has already had an impact on various industries. In order to keep up with the pace of technological and theoretical development and to cultivate the talents needed by enterprises and industries, the current artificial intelligence courses in colleges and universities need to be adjusted. This paper takes the pattern recognition course as an example to discuss the reform plan of college curriculum under the background of artificial intelligence. First, the problems existing in the current pattern recognition course are analyzed. Then, according to the characteristics of the curriculum of pattern recognition, it is proposed to introduce new technology into course, and reform the teaching content and teaching methods. Finally, the corresponding experimental platform was developed, and the experimental case based on deep convolutional neural network handwriting recognition was introduced in the experimental teaching section.
Key words:Pattern recognition; curriculum reform; deep learning; artificial intelligence; experimental platform
1 引言
目前很多高校組建了人工智能專業(yè)。而且,部分高校將人工智能與傳統(tǒng)的學科專業(yè)進行交叉融合形成了具有智能化特色的專業(yè)。在此背景下,各高校智能科學與技術(shù)相關(guān)專業(yè)的本科和研究生教學模式不但具有專業(yè)本身的特色,還融入了智能化特色[1]。模式識別課程是各個高校人工智能開設(shè)的核心專業(yè)課[2],其主要討論以統(tǒng)計學為基礎(chǔ)的模式識別理論和方法,內(nèi)容包括:貝葉斯決策理論以及參數(shù)估計方法、以誤差函數(shù)最小化為原則的線性和非線性判別、近鄰規(guī)則、特征提取和選擇、聚類分析、神經(jīng)網(wǎng)絡(luò)、支撐矢量機、隨機方法、非度量方法、獨立于算法的機器學習等內(nèi)容[3]。特別是近年來,深度學習受到了廣泛關(guān)注,目前已經(jīng)應(yīng)用于計算視覺、語音識別、自然語言處理等方面并取得了令人鼓舞的結(jié)果。這些為模式別識別課程注入了新的血液。然而,我國的人工智能的發(fā)展尚屬初級階段,膜識別課程和教學都處于建設(shè)和摸索階段。因此,隨著深度學習理論和技術(shù)的發(fā)展,必然會推動該課程的改革。
2 模式識別教學的現(xiàn)狀
2.1教學內(nèi)容與前沿知識的脫軌
模式識別是對表征事物或現(xiàn)象的各種形式的信息進行處理和分析,以對事物或現(xiàn)象進行描述、辨認、分類和解釋的過程,是信息科學的重要組成部分[1-2]。它不僅是一門理論基礎(chǔ)特別強,而同時與工程實踐又緊密結(jié)合的學科。然而,隨著人工智能的快速發(fā)展與應(yīng)用,各種理論和技術(shù)也不斷涌現(xiàn)。例如,近來的深度神經(jīng)網(wǎng)絡(luò)、增強學習等理論取得了較大的進展。 然而,目前模式識別教學卻幾乎忽視了人工智能領(lǐng)域的最新發(fā)展。
2.2課程培養(yǎng)方案不合理
模式識別是一門理論與實踐緊密結(jié)合的學科,其理論基礎(chǔ)涉及高等數(shù)學、線性代數(shù)、數(shù)理統(tǒng)計、矩陣論、隨機過程、工程優(yōu)化方法、小樣本統(tǒng)計學習理論、模糊數(shù)學等學科[2]。然而,然而除了高等數(shù)學、線性代數(shù)和數(shù)理統(tǒng)計,其他課程都是研究生階段才能開設(shè)的課程。這就使得大部分本科學生還不具備足夠的知識儲備,很難深刻理解模式識別這門課程,容易產(chǎn)生厭學情緒。
2.3 學生實際動手能力很難得到提高
模式識別是一門緊密聯(lián)系實際的課程,針對模式識別的應(yīng)用需求非常多,比如生物特征識別、自然語言處理、智能交通等都要用到模式識別的基礎(chǔ)知識。然而,由于實驗資源有限,往往很難有效培養(yǎng)的學生的實際動手能力。例如,學生實驗課時不足而且很多時候提供給學生的硬件設(shè)備缺乏,這些使得學生很難再有限的實驗完成規(guī)定的實驗內(nèi)容。這種問題在一些地方院校中尤為突出。 久而久之,學生在這些實際應(yīng)用的驅(qū)動下很難產(chǎn)生高漲的興趣。
3 將深度學習引入模式識別教學內(nèi)容
深度學習是基于學習數(shù)據(jù)表示的更廣泛的機器學習方法中的一部分,而不是特指某一種算法[4-6]。深度學習算法試圖讓機器自己學習輸入數(shù)據(jù)的特征,在建立模型和參數(shù)優(yōu)化的過程中,機器能夠?qū)⑤斎霐?shù)據(jù)轉(zhuǎn)變?yōu)楦邔哟?、更加抽象的?shù)據(jù)表征,從而自動地學習到更加有效、表達力更強的特征信息。
近些年來,隨著計算機硬件技術(shù)的不斷進步,深度學習算法已經(jīng)廣泛應(yīng)用于包括計算機視覺[7]、語音識別[8]、自然語言處理[9]等領(lǐng)域,并在對應(yīng)領(lǐng)域取得了相應(yīng)地研究成果。例如,在2016年3月人工智能圍棋比賽中,由谷歌旗下DeepMind公司開發(fā)的AlphaGo[10]戰(zhàn)勝了人類圍棋世界冠軍李世石,這使得深度學習算法更加聲名遠播。
如今深度學習模型主要有[11]:深度置信網(wǎng)絡(luò)模型、自動編碼器模型、卷積神經(jīng)網(wǎng)絡(luò)模型。隨著深度學習技術(shù)的快速發(fā)展,深度學習模型衍生出幾個變體模型,如稀疏自編碼器模型,全卷積神經(jīng)網(wǎng)絡(luò)模型等。
稀疏自編碼器是一種無監(jiān)督的機器學習算法,通過計算自編碼的輸出與原輸入的誤差,不斷調(diào)節(jié)自編碼器的參數(shù),最終訓練出模型。其中,自編碼器可以用于壓縮輸入信息,提取有用的輸入特征。稀疏自編碼器是指在自編碼器的基礎(chǔ)上加入了稀疏性條件,以減少過擬合。
全卷積神經(jīng)網(wǎng)絡(luò)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),前饋是相對于反向而言,不對神經(jīng)網(wǎng)絡(luò)進行調(diào)整,直接計算每一層中每一個神經(jīng)元的輸出并向下一層傳遞,最后傳遞到輸出層,進而計算網(wǎng)絡(luò)的輸出結(jié)果。本質(zhì)上是一種輸入到輸出的映射網(wǎng)絡(luò),它能夠?qū)W習大量的輸入與輸出之間的映射關(guān)系,而不需要任何輸入和輸出之間精確的數(shù)學表達式。
深度置信網(wǎng)絡(luò)是一個概率生成模型,與傳統(tǒng)的判別模型的神經(jīng)網(wǎng)絡(luò)不同,生成模型是建立一個觀察數(shù)據(jù)和標簽之間的聯(lián)合分布,以推斷出數(shù)據(jù)樣本分布。深度置信網(wǎng)絡(luò)模型通過訓練網(wǎng)絡(luò)結(jié)構(gòu)中神經(jīng)元間的權(quán)重使得整個神經(jīng)網(wǎng)絡(luò)依據(jù)最大概率生成訓練數(shù)據(jù),形成高層抽象特征,以得到更好的特征表達。
從目前的深度學習理論知識可以看出, 深度學習是對傳統(tǒng)學習方法的一個補充,將其引入教學過程,不僅能夠增加學生的知識面,也可以使學生順應(yīng)社會的需求。
4? 開發(fā)深度學習試驗,增強學生動手能力
動手能力能夠激發(fā)學生的學習興趣。為了增強學生的動手能力,有效掌握深度學習相關(guān)知識,需要搭建深度學習試驗平臺。
4.1 深度學習平臺工具
隨著深度學習的深入研究,大量的深度學習平臺被提出,例如Tensorflow、Theano、Caffe、Matlab等,表1總結(jié)了這些工具的主要情況。
其中,在眾多平臺中,Tensorflow是相對高階的機器學習庫,用戶可以方便的用它設(shè)計神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),且目前使用的研究人員也遠遠多于其他平臺。除此之外,Matlab編碼簡單,且繪圖功能也相當強大,因此本文主要采用Tensorflow和Matlab作為實驗工具。因為Matlab安裝比較簡單,故詳細闡述Tensorflow平臺的搭建過程。
4.2 Tensorflow平臺搭建
Tensorflow平臺搭建的具體實驗環(huán)境配置如表2所示。Tensorflow的安裝版本分為GPU版和CPU版,其安裝方式有4種,分別是:基于Docker的安裝、基于VitualEnv的安裝、基于Anaconda的安裝和基于源碼的安裝?;趯嶒灜h(huán)境,本文選擇了基于Anaconda的GPU版Tensorflow安裝。在Ubuntu系統(tǒng)上,首先下載相應(yīng)的軟件版本,然后分別安裝nvidia顯卡驅(qū)動、cuda、cudnn、anaconda和tensorflow,主要操作過程如下。
5? 實驗案例
在實驗開始之前,教師先向?qū)W生介紹基于TensorFlow環(huán)境和卷積前饋型人工神經(jīng)網(wǎng)絡(luò)的實驗方案。 然后,在搭建的深度學習平臺上,利用卷積神經(jīng)網(wǎng)絡(luò)模型對手寫體數(shù)據(jù)進行識別,如圖2所示。該實驗簡單易于操作、效果直觀,讓學生更好地理解卷積神經(jīng)網(wǎng)絡(luò)及其應(yīng)用。該實驗屬于驗證性實驗,主要目的在于引導學生入門,激發(fā)學生興趣,使得知識點更易于理解。
6? 結(jié)束語
本文通過提高 學生的學習興趣目的,綜合考慮模式識別的課程特征和學生的知識儲備,將目前的先見的技術(shù)引入教學內(nèi)容,重構(gòu)教學大綱和授課計劃,注重學生動手能力的培養(yǎng),激發(fā)學生的創(chuàng)新潛力,積極培養(yǎng)學生的自主學習能力。通過實踐研究表明,本文的方法 在調(diào)動學生的學習積極性方面是有效的。
參考文獻:
[1] 鐘義信. 智能科學技術(shù)導論[M]. 北京: 北京郵電大學出版社, 2007. (下轉(zhuǎn)第165頁)
(上接第162頁)
[2] 顧波. 《模式識別》本科教學方法淺談[J]. 中國科教創(chuàng)新導刊, 2010(4):68-68.
[3] 戚玉濤. 模式識別教學實踐與課程改革[J]. 計算機教育, No.127(19):28-30.
[4] 郭麗麗, 丁世飛. 深度學習研究進展[J]. 計算機科學, 2015, 42(5):28-33.
[5] Bengio Y , Courville A , Vincent P . Representation Learning: A Review and New Perspectives[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2012, 35(8):1798-1828.
[6]. Schmidhuber, Jürgen. Deep learning in neural networks: An overview[J]. Neural Networks, 2015(61):85-117.
[7]. 張慧, 王坤峰, 王飛躍. 深度學習在目標視覺檢測中的應(yīng)用進展與展望[J]. 自動化學報, 2017(8).
[8] 奚雪峰, 周國棟. 面向自然語言處理的深度學習研究[J]. 自動化學報, 2016, 42(10): 1445-1465.
[9] 奚雪峰, 周國棟. 面向自然語言處理的深度學習研究[J]. 自動化學報, 2016, 42(10): 1445-1465.
[10] Silver D , Schrittwieser J , Simonyan K , et al. Mastering the game of Go without human knowledge[J]. Nature, 2017, 550(7676):354-359.
[11] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553):436.
【通聯(lián)編輯:王力】