• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      方法論視野下的計算思維

      2017-01-06 19:02李廉
      中國大學(xué)教學(xué) 2016年7期
      關(guān)鍵詞:歸納推理大數(shù)據(jù)

      李廉

      摘要:通過計算模型與物理模型和數(shù)學(xué)模型的比較,從方法論角度解釋了計算思維有別于實證思維和邏輯思維的不同之處。著重分析了學(xué)習(xí)模型的一些理論和方法特點,針對大數(shù)據(jù)的應(yīng)用,探討學(xué)習(xí)模型在適用范圍、性能效率以及屬性特點等方法論方面的性質(zhì)。對于學(xué)習(xí)模型產(chǎn)生結(jié)論的PAC形式做了重點討論,這是計算思維所蘊含的豐富礦藏,也是當(dāng)今創(chuàng)新的重要思想來源和技術(shù)動力,需要在教學(xué)中予以充分的關(guān)注和啟發(fā)。

      關(guān)鍵詞:計算模型;學(xué)習(xí)模型;PAC方式;歸納推理;關(guān)聯(lián)關(guān)系;大數(shù)據(jù)

      隨著信息技術(shù)的快速發(fā)展,大數(shù)據(jù)、云計算、互聯(lián)網(wǎng)這些名詞已經(jīng)越來越頻繁地進入我們的日常生活,并對整個社會結(jié)構(gòu)和運行秩序產(chǎn)生了深刻的影響。這種情況也毫不例外地影響著計算機科學(xué)和工程的教學(xué)改革,其中對于這些科學(xué)與技術(shù)發(fā)展背后帶來的思維模式的特點顯得尤為突出和重要,培養(yǎng)計算思維能力是當(dāng)前計算機基礎(chǔ)課程改革的目標。但是對于計算思維的內(nèi)涵究竟是什么,它與我們熟悉的實證思維和邏輯思維之間有什么不同,它的內(nèi)容和形式有什么特點,仍然是一個需要繼續(xù)探討的問題。這些探討將進一步理清計算思維的內(nèi)涵以及應(yīng)用范圍。本文通過計算模型與物理模型和數(shù)學(xué)模型的比較,解釋了計算思維有別于實證思維和邏輯思維的不同之處,從方法論角度論證了計算思維是并列于實證思維和邏輯思維的第三種科學(xué)思維模式。

      一、物理模型與數(shù)學(xué)模型

      分析問題和解決問題的第一步是對問題的抽象,抽象的過程是略去與問題無關(guān)的部分,而關(guān)注于問題的本質(zhì)。抽象最常見的結(jié)果是模型,一個適當(dāng)?shù)哪P头从沉藛栴}的因果關(guān)系或者數(shù)量關(guān)系。從而可以采用已有的理論或者技術(shù)來分析模型,解決其中的問題。這種建模的方法是所有科學(xué)研究中的通用的原則,根據(jù)模型的不同,一般分為物理模型和數(shù)學(xué)模型,物理模型通過模擬物理運動來揭示因果關(guān)系,數(shù)學(xué)模型通過數(shù)學(xué)方程來揭示邏輯關(guān)系。在現(xiàn)實的處理問題的方法中,由于計算機的出現(xiàn),人們似乎更加偏愛采用數(shù)學(xué)模型。

      物理建模是抽取對象的本質(zhì)屬性,在實驗室建立簡化的系統(tǒng),研究物體在這個簡化世界中的行為,以確定因果關(guān)系。伽利略著名的斜坡實驗是自由落體的物理模型,通過斜坡稀釋了時間,使得觀察和比較成為可能。

      數(shù)學(xué)建模是通過抽取本質(zhì)屬性,建立屬性之間的邏輯關(guān)系(數(shù)學(xué)關(guān)系),通常以方程的形式加以描述。借助方程解的形式來解釋自然現(xiàn)象或者社會現(xiàn)象。

      無論是物理模型還是數(shù)學(xué)模型,都需要把問題理想化和簡單化。面對自然現(xiàn)象和社會問題,各種因素的影響縱橫交錯,其中的關(guān)系也是錯綜復(fù)雜,因此在抽象的過程中,一般需要預(yù)設(shè)結(jié)論,提出其中的因果關(guān)系假設(shè),并為此設(shè)計一個模型系統(tǒng),其中只有預(yù)設(shè)的因素而排除了其他因素,在這個簡化的物理模型中,觀察因素之間的相互作用。在數(shù)學(xué)模型中,則通過簡化的數(shù)量形式,建立相應(yīng)的數(shù)學(xué)方程,借助解的形式與性質(zhì)來獲取問題的解決。理論上說,任何建模的方法都不可能涵蓋所有的客觀因素,只能根據(jù)假設(shè),提煉部分因素進行抽象,其中還不乏對于一些關(guān)系的理想化處理。

      一般而言,物理模型和數(shù)學(xué)模型都屬于“確定性”模型,即通過模型得到的結(jié)論是完全確定的,因果關(guān)系是確定的,邏輯關(guān)系也是確定的,其結(jié)論具有非此即彼的性質(zhì)。即使對于統(tǒng)計模型(數(shù)學(xué)模型的一種),雖然結(jié)論具有某些不確定性,但是這種不確定性是建立在確定數(shù)學(xué)公理上的,它是一種由確定性導(dǎo)出的不確定性,本質(zhì)上仍然屬于邏輯關(guān)系。

      所有這些模型以及其背后的依據(jù)和邏輯,已經(jīng)發(fā)展成為系統(tǒng)的方法,有建模的步驟和程式,模型的建構(gòu),以及如何從模型得到結(jié)論的準則等。我們從小學(xué)到大學(xué)已經(jīng)被無數(shù)次訓(xùn)練,對于這些方法也是爛熟于胸,熟悉的似乎已經(jīng)是天經(jīng)地義,無可懷疑。但是大數(shù)據(jù)的出現(xiàn),對這一切都提出了嚴峻的挑戰(zhàn),為我們展示了一種嶄新的認知世界的新方法和新觀點。在物理模型和數(shù)學(xué)模型之外,出現(xiàn)了新的模型形式和建模方法,這就是計算模型。

      二、計算模型

      由于信息技術(shù)的發(fā)展,人類獲取數(shù)據(jù)的能力較之過去有了飛速的進步?,F(xiàn)在每天都要產(chǎn)生數(shù)以E比特量的數(shù)據(jù),大量的數(shù)據(jù)帶給我們的不僅僅是量的增加,更重要的是帶來了一種新的認知觀。這就是從觀察數(shù)據(jù)中獲取知識的新的途徑。

      實際上,從人類認知的歷史來看,最早了解自然規(guī)律的手段就是觀察和歸納,人類最早就是從數(shù)據(jù)中獲取知識的。只是到了17世紀之后,由伽利略等逐步開創(chuàng)了現(xiàn)代實證主義研究的手段,觀察研究就讓位于實驗。除了少數(shù)無法進行實驗的學(xué)科(例如宇宙學(xué)),在絕大多數(shù)自然學(xué)科中,實驗成為形成結(jié)論的標準手段,任何結(jié)論必須在實驗室里面被驗證,僅僅在自然界被觀察到是不夠的。在現(xiàn)代科學(xué)體系中,通過觀察獲取知識的方法被邊緣化,究其原因,還是因為過去的觀察手段比較落后,難以獲得大量數(shù)據(jù),而建立在小數(shù)據(jù)基礎(chǔ)上的分析,其結(jié)論往往是不準確的,得到的結(jié)論也缺乏說服力。既然過去是受限于數(shù)據(jù)的不足,使得人們研究自然問題的方法主要依賴于實證主義的實驗方法,那么現(xiàn)在隨著信息技術(shù)的發(fā)展,獲取數(shù)據(jù)的能力有了極大提高,進入了大數(shù)據(jù)時代,我們是否可以重新回到先輩那里,采用觀察的方法來研究問題,獲取知識。特別是在人文科學(xué)和社會科學(xué)等無法采用實驗方法研究的領(lǐng)域,通過觀察設(shè)備(傳感器)作用于各種自然現(xiàn)象,社會活動和人類行為,產(chǎn)生了大量的數(shù)據(jù),分析和處理這些數(shù)據(jù),并且進行歸納和提煉。人們研究科學(xué)又可以重新回到了觀察這個最原始和最基本的手段,但是這一次的回歸是螺旋式上升,從古代依靠人的感官來觀察現(xiàn)象,到現(xiàn)在依靠傳感器來觀察現(xiàn)象,數(shù)據(jù)的密度、廣度、準確性和一致性已經(jīng)不能同日而語了,因此觀察這種研究手段在大數(shù)據(jù)時代煥發(fā)了新的生命力,成為新時代的新的科學(xué)研究方法。

      《大數(shù)據(jù)時代》的作者舍恩伯格寫道:“大數(shù)據(jù)標志著‘信息社會終于名副其實。我們所收集的所有數(shù)字信息現(xiàn)在都可以用新的方式加以利用。我們可以嘗試新的事物并開啟新的價值形式。但是,這需要一種新的思維方式,并將挑戰(zhàn)我們的社會機構(gòu),甚至挑戰(zhàn)我們的認同感?!边@個新的認同感是什么?由于大數(shù)據(jù)進入我們的社會只有短短的歷史,現(xiàn)在還不能做出最終的結(jié)論。舍恩伯格繼續(xù)寫道:“大數(shù)據(jù)時代對我們的生活,以及與世界的交流方式都提出了挑戰(zhàn)。最驚人的是,社會需要放棄它對于因果關(guān)系的渴求,而只需關(guān)注關(guān)聯(lián)關(guān)系,也就是說,僅需要知道是什么,而不需要知道為什么。這就推翻了自古以來的慣例,而我們做決定和理解現(xiàn)實的最基本方式也將受到挑戰(zhàn)?!比绻岫鞑袼詾閷?,那么這種新的認知觀和對于世界的新的解釋就是建立在關(guān)聯(lián)關(guān)系,而不是傳統(tǒng)物理學(xué)所強調(diào)的因果關(guān)系,或者數(shù)學(xué)所強調(diào)的邏輯關(guān)系。實際上,近期一些借助大數(shù)據(jù)得到的重大甚至具有里程碑意義的成果都說明,上述的預(yù)言正在成為一種新的世界觀和方法論,當(dāng)采用大數(shù)據(jù)的分析方法和處理手段來解決問題,或者當(dāng)采用關(guān)聯(lián)關(guān)系來解釋世界時,我們得到了一系列對于世界的新認知,極大地提高了我們認識能力,也豐富了我們的知識體系。這些成果包括AlghaGo、語音識別、圖像判斷、自動駕駛等領(lǐng)域。

      現(xiàn)在我們回到方法論的問題上來。既然大數(shù)據(jù)提供了一種新的不同于物理學(xué)和數(shù)學(xué)的觀點,自然也就帶來了研究問題的不同于物理學(xué)和數(shù)學(xué)的方法。這種方法是關(guān)注于現(xiàn)象之間的關(guān)聯(lián)關(guān)系而不是因果關(guān)系或者邏輯關(guān)系,因此必然要有與之相應(yīng)的新的理論、技術(shù)和工具。也就是說,我們不僅關(guān)心大數(shù)據(jù)給我們帶來的關(guān)聯(lián)關(guān)系的新視角,更加關(guān)心如何來獲取這種關(guān)聯(lián)關(guān)系,即計算模型和如何構(gòu)建計算模型的問題。

      從計算機科學(xué)的角度,大致上可以分為三類模型,分別是指稱模型,算法模型和學(xué)習(xí)模型。第一類指稱模型包括各種文法系統(tǒng)、重寫系統(tǒng)以及演算系統(tǒng),主要是建立各種符號變換之間的層次關(guān)系、順序關(guān)系、或者替代關(guān)系,是計算或者系統(tǒng)形式化的抽象模型。第二類是算法模型,包括各種算法,其中既有確定算法,也有非確定算法,還包括近似算法、隨機算法以及演化算法等。算法構(gòu)成了計算機科學(xué)的主要組成部分,通過建立算法模型是計算機解決問題的常用途徑。第三類就是最近比較活躍的學(xué)習(xí)模型。實際上,指稱模型建立了符號之間的變換,嚴格說這些變換純粹是一種形式轉(zhuǎn)換,它只是被指稱所約定,并不關(guān)心這些符號之間是否有因果關(guān)系和邏輯關(guān)系,因此是一種關(guān)聯(lián)關(guān)系的建立。算法模型中有一類是經(jīng)過嚴格數(shù)學(xué)證明的,這類算法其輸入和輸出之間是有著邏輯關(guān)系的;但是也有一類算法,它的過程中有一些策略是依據(jù)實際情況變化的,是一種“就事論事”的方法,其結(jié)果的正確性不能邏輯上予以證明,這類算法的輸入和輸出之間是一種關(guān)聯(lián)而不是邏輯。指稱模型和算法模型已經(jīng)有了很多研究,不在本文的討論范圍,本文主要討論近年來隨著大數(shù)據(jù)一起受到重視的學(xué)習(xí)模型。

      一個學(xué)習(xí)模型是一個結(jié)構(gòu)(裝置),連同一個算法,通過對于大量數(shù)據(jù)的訓(xùn)練或者分析輸出相應(yīng)的結(jié)論。常見的學(xué)習(xí)模型有支持向量機(SVM,Suppog Vector Machine)、人工神經(jīng)網(wǎng)絡(luò)(ANN,Artificial Neural Network)、聚類分析(CA,Cluster Analysis)、鄰近分類(kNN,k-NearestNeighbor)等。不同的模型有著不同的獲取結(jié)論的理論和方法。機器學(xué)習(xí)是利用學(xué)習(xí)模型獲取結(jié)論的過程。機器學(xué)習(xí)需要有一個預(yù)設(shè)的任務(wù)T,以及衡量指標P,通過選取合適的模型和數(shù)據(jù)E,以P的要求完成任務(wù)T。這里數(shù)據(jù)E即包括觀察的數(shù)據(jù),也包括諸如規(guī)則和經(jīng)驗這樣的先驗知識。以二分類問題為例,二分類問題定義了一個目標函數(shù)h:X→{0,1},其中X是所有實例的集合,h是一個客觀存在分類函數(shù)。數(shù)據(jù)被表示為特征的向量,所有的特征稱為數(shù)據(jù)的特征空間?,F(xiàn)假設(shè)我們有X的一部分數(shù)據(jù),稱為樣例集合S。由于我們只有部分樣例,而沒有關(guān)于h的確切信息,因此事先并不知道h的準確定義。學(xué)習(xí)問題就是選取合適的模型和算法,使得從這些樣例集合S得到一個函數(shù)g,g稱為期望函數(shù)。學(xué)習(xí)目標就是獲取與h盡可能一致的期望函數(shù)g。一方面,顯然樣例個數(shù)越多,越可能接近這個函數(shù);另一方面,如果沒有所有的實例信息,僅憑不完整的部分信息,理論上是不可能確切地得到h。對于不同的任務(wù),需要選擇不同的學(xué)習(xí)模型,這樣才能達到快速高效完成任務(wù)的目標。

      機器學(xué)習(xí)是當(dāng)前計算機領(lǐng)域發(fā)展十分迅速的內(nèi)容,原來通過傳統(tǒng)數(shù)學(xué)或者物理的方法難以解決的問題,借助機器學(xué)習(xí)的方法獲得了突破性的進展。

      三、歸納學(xué)習(xí)與PAC原則

      學(xué)習(xí)模型的目標是從大量的數(shù)據(jù)中獲取結(jié)論,或者更具體的是獲取期望函數(shù)。因此從總體上講,學(xué)習(xí)模型是一種歸納學(xué)習(xí)的方式,盡管有些技術(shù)采用了分析學(xué)習(xí),但是絕大多數(shù)的應(yīng)用是以歸納學(xué)習(xí)為主。這是學(xué)習(xí)模型的本質(zhì)特征,僅從這一點就可以看出學(xué)習(xí)模型與物理模型和數(shù)學(xué)模型的不同。

      從觀察數(shù)據(jù)中獲取結(jié)論,這種研究方式在古代就已有之。早期的人類主要是通過觀察自然現(xiàn)象歸納總結(jié)出相應(yīng)的認識,形成知識內(nèi)容和科學(xué)體系。但是由于觀察手段的簡陋,數(shù)據(jù)量不足,只能從小數(shù)據(jù)中得到結(jié)論,這需要極大的智慧和運氣,而且說服力不足,科學(xué)知識難以普及和應(yīng)用。因此在歷史的發(fā)展中,逐步被現(xiàn)代科學(xué)方法所邊緣化。隨著技術(shù)的進步,現(xiàn)在我們具備了大量獲取數(shù)據(jù)的能力,無論是處理數(shù)據(jù)的能力還是分析數(shù)據(jù)的手段都有了過去無法想象的提升,從而通過歸納學(xué)習(xí)的方法再次進入人們的視野,通過這種煥然一新的古老方法開辟一條新的獲取知識的途徑。但是在現(xiàn)代科學(xué)的背景下,使用學(xué)習(xí)模型進行歸納學(xué)習(xí)需要回答以下的問題:

      (1)從一個學(xué)習(xí)模型出發(fā),有多大把握學(xué)習(xí)到期望函數(shù)?

      (2)學(xué)到的期望函數(shù)與目標函數(shù)之間的誤差是多少?

      (3)學(xué)習(xí)復(fù)雜度是多少?

      (4)至少需要多少數(shù)據(jù)才能達到學(xué)習(xí)目標?

      (5)學(xué)習(xí)穩(wěn)定性如何,即如果換一組數(shù)據(jù)是否還能學(xué)到相同性能的期望函數(shù)?

      只有回答了這些問題,學(xué)習(xí)模型作為一種方法論才具備科學(xué)的基礎(chǔ),獲取的結(jié)論才具有說服力。因此我們現(xiàn)在重提歸納學(xué)習(xí),并不是回到過去那種需要憑借天才的猜測和聯(lián)想的研究方法,而是在現(xiàn)代科學(xué)體系架構(gòu)下的,經(jīng)過嚴格證明和規(guī)范標準的新方法。這種方法與實驗方法和推理方法都具有可重復(fù)性,可應(yīng)用性和可檢驗性。

      由于學(xué)習(xí)模型和機器學(xué)習(xí)的發(fā)展歷史不長,現(xiàn)在還無法深入回答上面的5個問題,但是學(xué)習(xí)理論已經(jīng)對這些問題做了很有意義的探索,至少對于其中的一部分有了較為清晰的答案。

      學(xué)習(xí)模型的本質(zhì)是歸納學(xué)習(xí),通過部分數(shù)據(jù)獲取結(jié)論,因此和所有歸納推理一樣,理論上得到的結(jié)論只能是相對正確。為了準確刻畫這種相對正確性,學(xué)習(xí)模型引入了一個很重要的原則,即可能近似正確(PAC,ProbablyApproximate Correct)。它的定義是16]:

      設(shè)L是一個學(xué)習(xí)模型,如果對于任意給定的0<δ,ε<1,L能夠以1—δ的概率獲取期望函數(shù)g,g與目標函數(shù)h的誤差不超過ε。則稱L以PAC方式獲取函數(shù)h。

      PAC方式有兩個不確定性,一個是獲取結(jié)論的不確定,一個是結(jié)論本身的不確定。這與我們熟悉的物理學(xué)通過實驗獲取結(jié)論,或者數(shù)學(xué)通過推理獲取結(jié)論有本質(zhì)的區(qū)別。事實上,所有通過部分數(shù)據(jù)獲取結(jié)論的歸納方法都具有PAC性質(zhì)。PAC方式是一種新的認知世界的模式,它的不精確性可能不是缺點,反而是一個優(yōu)點。對此舍恩伯格有精辟的論述:“當(dāng)我們掌握了大量新型數(shù)據(jù)時,精確性就不那么重要了,我們同樣可以掌握事情的發(fā)展趨勢。大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無法實現(xiàn)精確性。然而,除了一開始會與我們的直覺相矛盾之外,接受數(shù)據(jù)的不精確和不完美,我們反而能夠更好地進行預(yù)測,也能夠更好地理解這個世界?!睆倪@段論述看出,無論采用確定的方式獲取結(jié)論還是以PAC方式獲取結(jié)論,都只是一個習(xí)慣問題,也許在大數(shù)據(jù)時代,我們需要逐步適應(yīng)使用PAC方式來思考問題和解決問題,這也構(gòu)成了計算思維的重要內(nèi)容。PAC方式拓寬了人類獲取知識的途徑,豐富了我們的科學(xué)體系和文化內(nèi)涵,并且與傳統(tǒng)的確定方式共同組成了人類認知和理解世界的方法。

      在上面關(guān)于PAC的定義中,δ和ε可以任意逼近0,當(dāng)兩者都等于0時,就是確定性的算法和結(jié)論。作為物理發(fā)現(xiàn),要求δ和ε都非常小。對于一般地應(yīng)用而言,不需要如此苛刻的條件。一些行業(yè)規(guī)定了產(chǎn)品要求或者企業(yè)管理的標準,基本上達到3σ就可以,也就是合格率(正確率)達到99.73%。就一般問題來說,達到2σ也能滿足要求,即置信度為95%。因此可以根據(jù)實際問題來設(shè)置δ和ε,使其符合應(yīng)用需要即可,這個性質(zhì)刻畫了學(xué)習(xí)模型的學(xué)習(xí)性能。

      四、學(xué)習(xí)模型與大數(shù)據(jù)

      學(xué)習(xí)模型分為許多類,每一類都有嚴格的結(jié)構(gòu)定義和相應(yīng)的算法描述。從方法論的角度,對于給定的任務(wù),選擇合適的學(xué)習(xí)模型和恰當(dāng)?shù)乃惴ǎ怪軌蛲瓿蓪W(xué)習(xí)任務(wù)。雖然這些模型和算法大多都有嚴格的證明和描述,但是學(xué)習(xí)模型的一個神奇之處就是當(dāng)啟動學(xué)習(xí)過程后,可能完全不知道最后學(xué)出來結(jié)果是什么。我們只能從模型輸出結(jié)果來判斷是否達到要求,但是無法獲知其中的因果關(guān)系和邏輯關(guān)系。即使能夠得到模型最終的參數(shù),也無法得知這些參數(shù)究竟表示何種意義。就許多學(xué)習(xí)模型而言,相對于我們就是一個黑箱。一個典型的例子是AlphaGo,盡管其結(jié)構(gòu)和算法都是人們事先給定的,但是在通過大量的訓(xùn)練之后,已經(jīng)無法對它的行為進行預(yù)測。這種不確定性正是學(xué)習(xí)模型的特殊之處,也是區(qū)別于物理模型和數(shù)學(xué)模型的分野。

      學(xué)習(xí)模型是通過大量的數(shù)據(jù)進行歸納來產(chǎn)生結(jié)論的,因此數(shù)據(jù)對于學(xué)習(xí)模型來說是根本性的。作為方法論的描述,對于數(shù)據(jù)采集、儲存、清洗和處理都有很多理論和技術(shù),也開發(fā)了一些工具。同時對于如何選擇學(xué)習(xí)模型也有了一些準則和經(jīng)驗,這些都構(gòu)成了學(xué)習(xí)模型方法論方面的內(nèi)容,根據(jù)這些方法,人們可以根據(jù)任務(wù)要求,通過學(xué)習(xí)模型的建模和運行,達到解決問題的目標。比如說,下面這個定理就描述了對于具體的任務(wù),需要多少數(shù)據(jù)就可以產(chǎn)生期望的結(jié)論:

      定理(Blumer et al,1989):設(shè)X是實例的集合,S是樣例的集合,h是目標函數(shù),如果:

      (1)S與X具有相同的分布;

      (2)h是一個二分類函數(shù);

      (3)h在算法A的假設(shè)空間中;

      那么,對于任意給定的δ和ε,當(dāng)數(shù)據(jù)量N滿足

      由于篇幅限制,這里不討論該定理的推導(dǎo)和一些符號的含義。另外前面提到的學(xué)習(xí)復(fù)雜度問題,學(xué)習(xí)穩(wěn)定性問題,以及學(xué)習(xí)可靠性問題都是學(xué)習(xí)方法的理論基礎(chǔ),我們也不再討論。只是說明,在一定條件下,對于通過學(xué)習(xí)模型得到期望的函數(shù)已經(jīng)有了一些較為深刻的結(jié)果。比如該定理就明確指出為了完成學(xué)習(xí)任務(wù)所需要的數(shù)據(jù)量。這個量依賴于給定的精度要求δ和ε,并且與學(xué)習(xí)模型的假設(shè)空間的VC維數(shù)有關(guān)。盡管這些結(jié)果仍是初步的,但是足可以說明在大數(shù)據(jù)時代,人們對于學(xué)習(xí)模型和歸納學(xué)習(xí)的理解已經(jīng)遠遠超越了古代,大數(shù)據(jù)學(xué)習(xí)是在現(xiàn)代科學(xué)的起點上發(fā)展這一古老的理論和技術(shù)。

      學(xué)習(xí)模型表現(xiàn)出一些良好的性質(zhì),它是通過大數(shù)據(jù)來獲取對于規(guī)律的認知;通過數(shù)據(jù)交互的方式,逐步加細認知精度;以及學(xué)習(xí)結(jié)果可以任意逼近需要的精度。相比于物理模型和數(shù)學(xué)模型,學(xué)習(xí)模型不需要精確分析或者實驗室工作,建模成本較低或者可以分解成本。同時學(xué)習(xí)模型可以充分利用已有的案例和經(jīng)驗進行歸納,這在資源利用和解題思路上是合理的。最后,學(xué)習(xí)模型通過計算機運行,因此模型的可維護性好,修改模型也較為容易。

      五、教學(xué)啟示和結(jié)論

      計算模型,特別是學(xué)習(xí)模型,為我們提供了新的認識世界和理解世界的方法。舍恩伯格認為,在大數(shù)據(jù)時代,這些新的分析工具和思路為我們提供了一系列新的視野和有用的預(yù)測,我們看到了很多以前不曾注意到的聯(lián)系,還掌握了以前無法理解的復(fù)雜技術(shù)和社會動態(tài)。但最重要的是,通過探求“是什么”而不是“為什么”,關(guān)聯(lián)關(guān)系幫助我們更好地了解了這個世界。關(guān)聯(lián)關(guān)系很有用,不僅僅是因為它能為我們提供新的視角,而且提供的視角都很清晰。而我們一旦把因果關(guān)系考慮進來,這些視角就有可能被蒙蔽掉。關(guān)聯(lián)關(guān)系是學(xué)習(xí)模型的精髓,正像因果關(guān)系之如物理模型,邏輯關(guān)系之如數(shù)學(xué)模型。因此從教學(xué)的角度也為我們提出了新的問題:

      (1)正確把握計算思維的內(nèi)涵和核心概念。上面的討論可以看出,僅僅從方法論的角度,計算思維的內(nèi)容已經(jīng)具有了廣泛的新穎性和特色性。而且對于我們認識社會和自然的觀點與方法也帶來深刻的啟蒙。

      (2)建立基于大數(shù)據(jù)的分析方法和認知手段。大數(shù)據(jù)給當(dāng)今社會帶來的影響僅是開始,今后會越來越深刻,而且將融入社會的方方面面,因此通過學(xué)習(xí)模型來處理問題,并且通曉它的基本原理和技術(shù)是十分必要的。

      (3)克服對于物理模型和數(shù)學(xué)模型的依賴性,培養(yǎng)計算模型的意識和能力。加強學(xué)生在這方面的訓(xùn)練實有必要,特別是養(yǎng)成借助學(xué)習(xí)模型解決問題的能力。

      (4)處理好應(yīng)用能力與思維意識的關(guān)系,建立和養(yǎng)成PAC方式解決問題的習(xí)慣。革新思維意識,提升應(yīng)用能力。通過對于計算模型的理解與學(xué)習(xí),掌握好機器學(xué)習(xí)這一有效技術(shù),從新的視角分析和解決復(fù)雜問題,培養(yǎng)真正的創(chuàng)新競爭力。

      最后,我們提出三點作為本文的結(jié)論:

      (1)計算思維不僅僅是對于已有方法和技術(shù)的詮釋,更是蘊含新方法和新技術(shù)的豐富礦藏。通過學(xué)習(xí)模型來分析和解決問題就是一個廣闊的嶄新領(lǐng)域,由于機器學(xué)習(xí)本質(zhì)上是通過觀察來獲取結(jié)論,獲取的結(jié)論具有某些不確定性,這正是學(xué)習(xí)模型與物理模型和數(shù)學(xué)模型的不同之處,也是學(xué)習(xí)模型的引人入勝之處。正如舍恩伯格所說,這種不確定性不是表示學(xué)習(xí)模型不如物理模型和數(shù)學(xué)模型,而是說明大數(shù)據(jù)提供了一種新的認知世界的模式。

      (2)學(xué)習(xí)模型并不排斥傳統(tǒng)的物理學(xué)和數(shù)學(xué)的研究模式,相反,學(xué)習(xí)模型建立的關(guān)聯(lián)關(guān)系可以為因果關(guān)系和邏輯關(guān)系的研究提供佐證和啟示。巴拉巴西(Albert-Laszlo Barabfisi)在《爆發(fā):大數(shù)據(jù)時代預(yù)見未來的新思維》一書中,對此有深刻的闡述:“關(guān)聯(lián)關(guān)系分析本身意義重大,同時它也為研究因果關(guān)系奠定了基礎(chǔ)。通過找出可能相關(guān)的事物,我們可以在此基礎(chǔ)上進行進一步的因果關(guān)系分析,如果存在因果關(guān)系的話,我們再進一步找出原因。這種便捷的機制通過嚴格的實驗降低了因果分析的成本。我們也可以從相互聯(lián)系中找到一些重要的變量,這些變量可以用到驗證因果關(guān)系的實驗。”

      (3)因此在教學(xué)上,要通過案例引導(dǎo)學(xué)生關(guān)注大數(shù)據(jù)給我們帶來的影響,這種影響不僅表現(xiàn)在一些日常行為分析、商品推銷、服務(wù)推送方面,更重要的是表現(xiàn)在對于世界認識的方法和手段。這些內(nèi)容極大地開拓了理解世界和考慮問題的思維空間,可以解決以前無法解決的問題,達到以前無法想象的新的技術(shù)高度。就像汽車自動駕駛、語音識別技術(shù)、AlphaGo給我們帶來的震撼一樣。

      [責(zé)任編輯:余大品]

      猜你喜歡
      歸納推理大數(shù)據(jù)
      小學(xué)生數(shù)學(xué)歸納推理能力培養(yǎng)之我見
      例談對學(xué)生推理能力的培養(yǎng)
      對一類數(shù)列通項公式的探究
      數(shù)學(xué)教學(xué)中加強歸納推理的應(yīng)用研究
      歸納推理在高中拋物線的定義教學(xué)中新思考
      大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
      巧用“應(yīng)答評價” 發(fā)展創(chuàng)新素養(yǎng)
      沁源县| 神农架林区| 政和县| 图片| 柳州市| 嘉义市| 讷河市| 武陟县| 克拉玛依市| 馆陶县| 安化县| 五家渠市| 商丘市| 星座| 祁东县| 红桥区| 广西| 十堰市| 临沭县| 水城县| 平邑县| 湖南省| 平谷区| 黑龙江省| 镇坪县| 舟曲县| 桓仁| 平邑县| 岫岩| 平乡县| 景宁| 连南| 泸州市| 临邑县| 中江县| 高青县| 甘南县| 祁连县| 普宁市| 安新县| 贵德县|