吳康寧
摘 要:近30年新興著很多科研學科,機器學習作為其之一已經(jīng)被廣泛運用到現(xiàn)代的互聯(lián)網(wǎng)網(wǎng)生活與信息生活。幾期學習具體包括:計算科學、數(shù)理統(tǒng)計學、邏輯科學、信息控制理論、神經(jīng)科學等等?,F(xiàn)如今,機器學習也衍生出了很多分支,比如:機器人的智能控制、生物信息學、深度學習、數(shù)據(jù)挖掘、遙感信息安全、模式識別等等。目前機器學習已經(jīng)取得了很大的進步,相信在未來的信息社會一定會取得更大的輝煌成就。
關鍵詞:機器學習;數(shù)理統(tǒng)計;人工智能
人工智能領域發(fā)展最快的某個分支之一就是機器學習。其本質(zhì)是運用計算機系統(tǒng)強大的數(shù)據(jù)與運算處理能力,并借助大量的數(shù)據(jù)訓練,使得計算機能夠有自發(fā)模擬人類學習行為,不斷學習獲取技能與知識,對自身性能不斷進行改善,從而實現(xiàn)人工智能的一種思想?,F(xiàn)如今互聯(lián)網(wǎng)技術(shù)不斷更新進步,當中表現(xiàn)最為明顯的是信息爆炸現(xiàn)象。對于如今的社會互聯(lián)網(wǎng)每天所產(chǎn)生的眾多數(shù)字化數(shù)據(jù),比如:數(shù)字化的網(wǎng)頁瀏覽數(shù)據(jù)、數(shù)字化的微博數(shù)據(jù)、數(shù)字化的聊天記錄等等。面對眾多的數(shù)據(jù),當今社會研究的熱點問題之一也就是大數(shù)據(jù)(BigData)處理,因此,如何進行分析海量數(shù)據(jù)并且對于有價值的規(guī)律信息按照嚴格的數(shù)學定理進行提取,今后學科的發(fā)展中機器學習是占著很重要的位置。
1 機器學習的發(fā)展歷史
1.1 機器學習“萌芽”階段
機器學習技術(shù)研究在20世紀五、六十年代正處于“萌芽”階段,人類嘗試通過編程手段使其機器更具有邏輯推理能力。在這階段是由H.Simon與A.Newell完成的代表性工作。具體工程包含著各種“邏輯”程序以及之后的“求解”程序等等。也由此H.Simon與A.Newell獲得了1975年圖靈獎。但是,進一步的研究證明只具有邏輯并不能使機器具有智能化,E.A.Feigenbaum 等人認為,必須具有先驗“知識”這個前提才能使得智能存在。
1.2 機器學習“發(fā)展”階段
被稱為機器學習的“發(fā)展”階段為20世紀七、八十年代。在該時期的主流是“專家系統(tǒng)”。被稱為“知識工程”之父的E.A.Feigenbaum為此獲得了1994年的圖靈獎章。然而,所謂“專家系統(tǒng)”也要面臨“知識困境”,也就是說近乎無限的信息人類是很難過自身思維提取規(guī)則并賦予計算設備。也要由此關于機器自主學習的設想浮出水面。在20世紀50年代機器學習就已經(jīng)展開了,其主要研究是關于基于神經(jīng)網(wǎng)絡的訓練學習方面。多種學習技術(shù)在20世紀六七十年代層出不窮,比如:基于決策理論的強化學習技術(shù)以及統(tǒng)計學習技術(shù)等等,其代表作品有:“學習機器”與“跳棋程序”等等,這樣符號學習技術(shù)與統(tǒng)計學習理論也就開始萌芽。其中有不少頂尖專家著作的書籍都產(chǎn)生很大的影響,比如:1983年,Tioga出版社出版了R.S.Michalski|J.G.Carbonell和T.M.Mitchell等頂尖專家聯(lián)合主編的圖書教材《機器學習:一種人工智能途徑》面世,該著作系統(tǒng)的總結(jié)和闡述當時多年機器學習領域的研究工作,引領了學術(shù)方向,深深地影響著機器學習的發(fā)展。
1.3 機器學習“繁榮”階段
在20世紀80年代到現(xiàn)今,作為一門獨立的學科領域并開始爆發(fā)式發(fā)展的機器學習,不斷涌現(xiàn)各種機器學習技術(shù),呈現(xiàn)多樣化的機器學習算法。機器學習研究開始進入“繁榮”階段,該時期機器學習研究劃分為“觀察發(fā)現(xiàn)學習”、“實例學習”、“指令學習”、“求解規(guī)劃學習”等很多范疇。而E.A.Feigenbaum等專家所合著的《人工智能手冊》中,是從另一個角度把機器學習技術(shù)重新分為四大范疇:“類比學習”、“機械學習”、“示教學習”、“歸納學習”4種。到現(xiàn)如今,機器學習已經(jīng)演化了很多分支,比如:模式識別、數(shù)據(jù)挖掘、語音識別等等。在信息處理特別是互聯(lián)網(wǎng)海量數(shù)據(jù)的分析處理中廣泛運用著大量機器學習算法。
2 機器學習的發(fā)展趨勢
從如今研究的發(fā)展趨勢看,機器學習在未來有幾個熱點的研究方向,如下:
(1)在人類本身出發(fā)找出關于大腦自身生物學習機制,并經(jīng)過過嚴格數(shù)學化應用于機器學習。
(2)不斷對學習算法進行優(yōu)化發(fā)展和改良在已有的人工智能方法的基礎上,并且同時對新的研究算法展開開發(fā)工作。
(3)讓眾多的機器學習算法在“象牙塔”走出來,建立實用的機器學習的算法應用系統(tǒng),尤其是開展多種學習方法集成化的研究在互聯(lián)網(wǎng)方面。
(4)同步協(xié)調(diào)使用多種機器學習算法,利用多種算法是優(yōu)勢規(guī)避其中的不足,學習系統(tǒng)性能不斷得以改善。
3 結(jié)語
現(xiàn)如今的人工智能系統(tǒng)與計算機系統(tǒng)從其實現(xiàn)原理上和硬件結(jié)構(gòu)不具備自主學習能力,至多也只是具有非常低級的“被動”學習能力,因此不能滿足生產(chǎn)與科技提出的新要求。對機器學習進行比較系統(tǒng)化的方向把握和討論,對于今后進行相應的科研工作和學習研究機器學習的知識有著方向性引導作用。學習機器學習本質(zhì)就是將控研究機器學習算法的內(nèi)在數(shù)學原理、建立通過數(shù)據(jù)訓練使其現(xiàn)今的計算機系統(tǒng)具有提高自身和不斷學習的能力水平。近年來機器學習理論在許多領域比如:互聯(lián)網(wǎng)、天氣預報、軍事等取得很多成功,這也是現(xiàn)今計算機科學的基礎研究熱點之一。
參考文獻
[1]鄭南寧.認知過程的信息處理和新型人工智能系統(tǒng)[J].中國基礎科學,2000,(8):9-18.
[2]第31屆機器學習國際會議(英文)[J].智能系統(tǒng)學報,2014,(1):85.
(作者單位:上海中和軟件有限公司)