郭若宇 廣州外國語學(xué)校
1997年5月3日國際象棋世界冠軍卡斯帕羅夫與IBM超級(jí)電腦“深藍(lán)”展開首次“人機(jī)大戰(zhàn)”,以一勝二負(fù)三和的戰(zhàn)績敗北。2016年、2017年人工智能圍棋程序“AlphaGo”先后兩次戰(zhàn)勝圍棋屆頂尖高手韓國的李世石與中國的柯潔對(duì)戰(zhàn)。由于計(jì)算機(jī)超強(qiáng)的運(yùn)算能力是人類無法企及的,從這個(gè)意義上來說,“AlphaGo”的勝利是計(jì)算能力和算法的勝利。就像代表人類出戰(zhàn)的中國圍棋職業(yè)九段棋手柯潔以0:3完敗于“AlphaGo”之后感慨的“人類是會(huì)犯錯(cuò)的,而機(jī)器不會(huì)犯錯(cuò)”。
隨著現(xiàn)代科技日新月異的快速發(fā)展,智能手機(jī)、智能穿戴設(shè)備等智能數(shù)碼產(chǎn)品已經(jīng)成為我們生活中的重要組成部分,而且由于性能的不斷提升使得產(chǎn)品的更新?lián)Q代速度越來越快,性價(jià)比也越來越高,這一切都可歸因于20多年來以機(jī)器學(xué)習(xí)為核心的人工智能技術(shù)的飛躍式發(fā)展。
“AlphaGo”的出現(xiàn)讓“人工智能(Artificial Intelligence)”和“機(jī)器學(xué)習(xí)(Machine Learning)”前所未有地為大眾所熟知。在多數(shù)人看來,二者之間可以劃等號(hào),都指可以代替人類工作的先進(jìn)生產(chǎn)力,事實(shí)并非如此。人工智能指的是以人工方式制造具有或類似“人類智能”的機(jī)器,而機(jī)器學(xué)習(xí)指的是使電腦或其它數(shù)碼產(chǎn)品在人工編程之外自主運(yùn)作的能力,它是人工智能的核心,是使計(jì)算機(jī)或其它數(shù)碼產(chǎn)品實(shí)現(xiàn)“像人類一樣思考、判斷并解決問題”的能力的途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域:數(shù)據(jù)挖掘、計(jì)算機(jī)視覺、自然語言處理、生物特征識(shí)別、搜索引擎、醫(yī)學(xué)診斷、檢測(cè)信用卡欺詐、證券市場(chǎng)分析、DNA測(cè)序、語音和手寫識(shí)別、戰(zhàn)略游戲和機(jī)器人運(yùn)用等,體現(xiàn)在普通人生活中的就是數(shù)碼產(chǎn)品上層出不窮的App應(yīng)用,讓我們的生活越來越便捷和舒適。
由于訓(xùn)練方法和應(yīng)用領(lǐng)域的不同,機(jī)器學(xué)習(xí)主要分為監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等四種類型。機(jī)器學(xué)習(xí)必須是建立在海量數(shù)據(jù)的基礎(chǔ)之上,
(1)監(jiān)督學(xué)習(xí)(Supervised Learning)
監(jiān)督學(xué)習(xí)又被稱為“有老師的學(xué)習(xí)”,所謂的老師就是事物特征對(duì)應(yīng)的標(biāo)簽,比如水果的顏色、形狀、味道和香氣等。監(jiān)督學(xué)習(xí)的過程為先通過已知的訓(xùn)練樣本(如已知輸入和對(duì)應(yīng)的輸出)來訓(xùn)練,從而得到一個(gè)最優(yōu)模型,再將這個(gè)模型應(yīng)用在新的數(shù)據(jù)上,映射為輸出結(jié)果。再經(jīng)過這樣的過程后,模型就有了預(yù)知能力。比如小朋友第一次看見蘋果和桔子兩種水果,老師告訴他(她)哪種是蘋果,哪種是桔子,并且從形狀、顏色、味道和香氣等方面加以解釋,下一次小朋友再看見這兩種水果后就能進(jìn)行準(zhǔn)確的分辨,這是監(jiān)督學(xué)習(xí)。當(dāng)在人工智能中,監(jiān)督學(xué)習(xí)主要被應(yīng)用于快速高效地教受AI 現(xiàn)有的知識(shí)。例如多次打敗圍棋世界冠軍的“AlphaGo”, 就是利用監(jiān)督學(xué)習(xí)來“記憶理解”上千萬盤的人類對(duì)弈棋譜,通過人類輸入的“現(xiàn)成的”信息來進(jìn)行學(xué)習(xí)的。
(2)無監(jiān)督學(xué)習(xí)(Unsupervised Learning)
無監(jiān)督學(xué)習(xí)被稱為“沒有老師的學(xué)習(xí)”,和監(jiān)督學(xué)習(xí)相比,是沒有“老師指導(dǎo)”的訓(xùn)練過程,而是直接拿數(shù)據(jù)進(jìn)行建模分析,意味著這些都是要通過機(jī)器自行學(xué)習(xí)后探索事物間的關(guān)系或規(guī)律。還是以第一次看見蘋果和桔子兩種水果的小朋友為例,這一次沒人告訴他(她)哪個(gè)是蘋果哪個(gè)是桔子,但小朋友根據(jù)他們的形狀、顏色、味道和香氣等特征的不同鑒別出這是兩種不同的水果,并對(duì)特征歸類,這是無監(jiān)督學(xué)習(xí)。在人類探索認(rèn)識(shí)世界的過程中經(jīng)常會(huì)用到無監(jiān)督學(xué)習(xí),這是人類文明發(fā)展進(jìn)步的重要力量。無監(jiān)督學(xué)習(xí)說起來比監(jiān)督學(xué)習(xí)更難一點(diǎn),因?yàn)檫@個(gè)過程非常像老師沒講知識(shí)點(diǎn)就給我們一堆沒有答案的習(xí)題,然后讓我們自己做,看我們能不能從中學(xué)到什么。和監(jiān)督學(xué)習(xí)相比,無監(jiān)督學(xué)習(xí)相當(dāng)于在黑暗中摸索,存在耗時(shí)長以及學(xué)習(xí)效果不佳的問題。
(3)半監(jiān)督學(xué)習(xí)(Semi-Supervised Learning)
目前海量存在的網(wǎng)頁分類、文本分類、基因序列比對(duì)、蛋白質(zhì)功能預(yù)測(cè)、語音識(shí)別和計(jì)算機(jī)視覺等數(shù)據(jù)大部分屬于無標(biāo)簽數(shù)據(jù),只有極少一部分?jǐn)?shù)據(jù)通過特殊設(shè)備或經(jīng)過昂貴且用時(shí)非常長的實(shí)驗(yàn)過程獲得標(biāo)簽,這種大量無標(biāo)簽數(shù)據(jù)和少量標(biāo)簽數(shù)據(jù)共存的情況催生了半監(jiān)督學(xué)習(xí),即將大量的無類標(biāo)簽的樣例加入到有限的有類標(biāo)簽的樣本中一起訓(xùn)練來進(jìn)行學(xué)習(xí),期望能對(duì)學(xué)習(xí)性能起到改進(jìn)的作用。對(duì)于半監(jiān)督學(xué)習(xí),其訓(xùn)練數(shù)據(jù)的一部分是有標(biāo)簽的,另一部分沒有標(biāo)簽,而沒標(biāo)簽數(shù)據(jù)的數(shù)量常常極大于有標(biāo)簽數(shù)據(jù)數(shù)量(這也是符合現(xiàn)實(shí)情況的),通過一些有標(biāo)簽數(shù)據(jù)的局部特征,以及更多沒標(biāo)簽數(shù)據(jù)的整體分布,就可以得到可以接受甚至是非常好的分類結(jié)果。在AI咨詢公司Joostware工作Delip Rao構(gòu)建了一個(gè)使用半監(jiān)督學(xué)習(xí)的解決方案,每個(gè)類中只需使用30個(gè)標(biāo)簽,就可以達(dá)到與使用監(jiān)督學(xué)習(xí)訓(xùn)練的模型相同的準(zhǔn)確度,而在這個(gè)監(jiān)督學(xué)習(xí)模型中,每個(gè)類中需要1360個(gè)左右的標(biāo)簽。因此,這個(gè)半監(jiān)督學(xué)習(xí)方案使得他們的客戶能夠非??斓貙⑵漕A(yù)測(cè)功能從20個(gè)類別擴(kuò)展到110個(gè)類別。半監(jiān)督學(xué)習(xí)避免了數(shù)據(jù)和資源的浪費(fèi),同時(shí)解決了監(jiān)督學(xué)習(xí)的模型泛化能力不強(qiáng)和無監(jiān)督學(xué)習(xí)的模型不精確等問題.
(4)強(qiáng)化學(xué)習(xí)(Reinforcement Learning)
強(qiáng)化學(xué)習(xí)是指機(jī)器自身收集環(huán)境中的相關(guān)信息作出判斷,并綜合成自己的“經(jīng)驗(yàn)”。它有點(diǎn)像平時(shí)老師讓我們用學(xué)到的知識(shí)去解決某些答案并不確定的復(fù)雜問題,例如我們?cè)趯W(xué)習(xí)數(shù)學(xué)的過程中,老師分別講解了三角、圓、矩形等多個(gè)單元的知識(shí)點(diǎn)后,將相關(guān)的知識(shí)點(diǎn)揉在一起出一個(gè)綜合題來考察我們解決問題的能力。再以海洋館常見的海豚跳圈表演為例,假設(shè)海豚在平時(shí)的訓(xùn)練中已經(jīng)掌握了跳一個(gè)圈的能力(順利完成動(dòng)作會(huì)得到食物獎(jiǎng)賞),現(xiàn)在訓(xùn)練師想讓它完成更復(fù)雜的動(dòng)作,比如增加呼啦圈的數(shù)量、改變呼啦圈的位置等,并且每次完成一個(gè)既定目標(biāo)就可以獲得相應(yīng)的食物獎(jiǎng)賞,而且獎(jiǎng)賞的豐富程度與動(dòng)作的復(fù)雜程度相匹配,這樣經(jīng)過多次“訓(xùn)練-失敗-沒獎(jiǎng)賞”、“訓(xùn)練-成功-獎(jiǎng)賞”的“強(qiáng)化學(xué)習(xí)” 之后,海豚就可以自如地進(jìn)行表演了。AlphaGo 利用監(jiān)督學(xué)習(xí)參照人類的走法大致學(xué)會(huì)了預(yù)測(cè)下一步,但是缺乏實(shí)戰(zhàn)經(jīng)驗(yàn),于是計(jì)算機(jī)科學(xué)家讓兩個(gè)非監(jiān)督學(xué)習(xí)下建立的AlphaGo 互相下棋并不斷調(diào)整,保留勝方的模式和參數(shù),經(jīng)過3000 萬盤強(qiáng)化訓(xùn)練后,AlphaGo 便通過“左右互搏”提高了“實(shí)戰(zhàn)能力”。強(qiáng)化學(xué)習(xí)這一方法背后的數(shù)學(xué)原理,與監(jiān)督/ 非監(jiān)督學(xué)習(xí)略有差異。監(jiān)督/非監(jiān)督學(xué)習(xí)更多地應(yīng)用了統(tǒng)計(jì)學(xué),而強(qiáng)化學(xué)習(xí)更多地結(jié)合了離散數(shù)學(xué)、隨機(jī)過程這些數(shù)學(xué)方法。
機(jī)器學(xué)習(xí)是基于海量的有標(biāo)簽或無標(biāo)簽的數(shù)據(jù)的,不管是什么領(lǐng)域,只要呈現(xiàn)充足的數(shù)據(jù)并經(jīng)過適當(dāng)?shù)挠?xùn)練就可以自動(dòng)識(shí)別里面的規(guī)律,進(jìn)行分類、預(yù)測(cè)等。比如我們?cè)诰W(wǎng)絡(luò)購物時(shí)就會(huì)發(fā)現(xiàn),購物網(wǎng)站會(huì)根據(jù)我們之前的購物行為大致判斷出我們的購物喜好,從而自動(dòng)推薦一些我們喜歡的商品供我們參考,由此可見,隨著我們購物次數(shù)的增加,在網(wǎng)上積累的相關(guān)數(shù)據(jù)就越多,個(gè)人的購物特征就會(huì)越來越清晰。與此同時(shí),對(duì)大量消費(fèi)者的購物特征數(shù)據(jù)加以集中和強(qiáng)化學(xué)習(xí),就又可以增強(qiáng)機(jī)器判斷的本領(lǐng),比如性別、年齡、收入水平和家庭結(jié)構(gòu)等對(duì)購物行為的影響,進(jìn)而給購物網(wǎng)站的經(jīng)營者帶來更多更有用的信息,提高網(wǎng)站的盈利能力。這就是機(jī)器學(xué)習(xí)的本質(zhì)。
機(jī)器學(xué)習(xí)的發(fā)展與云計(jì)算的普及幾乎同步,其原因在于云應(yīng)用程序、平臺(tái)和基礎(chǔ)設(shè)施的無縫集成將信息孤島打破,把各個(gè)組織及其網(wǎng)絡(luò)的數(shù)據(jù)都吸引進(jìn)來,為機(jī)器學(xué)習(xí)所用。機(jī)器學(xué)習(xí)所基于的算法需要盡可能多的、來自不同領(lǐng)域的數(shù)據(jù)。聚集的數(shù)據(jù)量越多,它就會(huì)變得越聰明,其決策潛能也就越大。機(jī)器學(xué)習(xí)的基礎(chǔ)是數(shù)據(jù)的掌握和應(yīng)用。如果擁有更多的數(shù)據(jù)并且有更強(qiáng)的數(shù)據(jù)處理和分析的能力,機(jī)器學(xué)習(xí)的效果就更好,甚至可以超出人類的水平,甲骨文公司提出自治的云平臺(tái)的概念,這個(gè)概念就像無人駕駛汽車一樣,將一些局部的應(yīng)用結(jié)合成為一個(gè)整體,成為一個(gè)基于機(jī)器學(xué)習(xí)的無人干預(yù)的云平臺(tái)。
Strategy Analytics近期發(fā)布的研究報(bào)告指出,全球今年銷售的智能手機(jī)每三臺(tái)就有一臺(tái)使用基于人工智能(AI)的虛擬助手,而且基于設(shè)備的機(jī)器學(xué)習(xí)功能會(huì)大大提高智能手機(jī)AI的運(yùn)行速度。機(jī)器學(xué)習(xí)技術(shù)已經(jīng)被應(yīng)用到智能手機(jī)的各類應(yīng)用中。最為著名的是智能手機(jī)上的“Siri”和Cortana(微軟小娜)等虛擬手機(jī)助手,可以幫助你管理日程,設(shè)置鬧鐘、打電話、發(fā)信息、打開應(yīng)用、搜索、導(dǎo)航、翻譯,并回答你的任何問題。還能根據(jù)你的喜好,主動(dòng)推送專屬于你的定制信息。此外還有許多新穎的智能App被不斷研發(fā)出來,如飲食助手APP“Bitesnap”,可以通過拍照識(shí)別飯菜并計(jì)算它的熱量營養(yǎng),協(xié)助用戶進(jìn)行熱量攝入控制,更有效地執(zhí)行用戶的膳食計(jì)劃。當(dāng)你碰到喜歡的東西,但不知道產(chǎn)品的商業(yè)信息時(shí),一款名為“拍立淘”的軟件可以大顯身手,通過這個(gè)應(yīng)用對(duì)感興趣的物品進(jìn)行拍照,我們很快便會(huì)在阿里系的購物網(wǎng)站上獲得該物品的信息,目前拍立淘的適用商品基本覆蓋了消費(fèi)者的所有需求,包括男女裝、鞋包、配飾到瓶飲、日用品、化妝品等等。訊飛輸入法APP是一款可以識(shí)別方言的語音輸入法,不僅支持粵語、英語、普通話識(shí)別,還支持客家話、四川話、河南話、東北話、天津話、湖南(長沙)話、山東(濟(jì)南)話、湖北(武漢)話、安徽(合肥)話、江西(南昌)話、閩南語、陜西(西安)話、江蘇(南京)話、山西(太原)話、上海話等方言識(shí)別,具有強(qiáng)大的語音識(shí)別效果,語音識(shí)別率超過95%。形色APP是一款識(shí)別花卉、分享附近花卉的APP應(yīng)用??梢砸幻刖湍茏R(shí)別植物,支持識(shí)別4千種植物,準(zhǔn)確率高達(dá)82%,可以在1~5秒內(nèi)給出花名,App內(nèi)部也有識(shí)花大師幫忙鑒定植物,地圖上更有特色植物景點(diǎn)攻略。綜上,上述智能App的開發(fā)和應(yīng)用就是源于大數(shù)據(jù)的機(jī)器學(xué)習(xí)的結(jié)果。2018年3月6日下午,芯片廠商ARM在北京舉辦發(fā)布會(huì)上公布了4款新GPU,分別為Mali-G52、Mali-G32、Mali-D51和Mali-V52,在最重要的機(jī)器學(xué)習(xí)能力上,Mali-G52是上一代產(chǎn)品的3.6倍,這意味著絕大多數(shù)智能設(shè)備在未來都能擁有機(jī)器學(xué)習(xí)能力。
現(xiàn)代社會(huì)文明的快速發(fā)展,使得人們追求“健康生活”的愿望日益強(qiáng)烈,人們比以往更加關(guān)注自己的身體健康,在這種背景之下,以實(shí)時(shí)監(jiān)測(cè)血液、心臟及運(yùn)動(dòng)能耗等生理指標(biāo)的智能穿戴產(chǎn)品應(yīng)運(yùn)而生,如智能手環(huán)、智能手表、智能眼鏡等,我們的體力活動(dòng)、位置以及身體生理數(shù)據(jù)等每一點(diǎn)變化都成為了可被記錄和分析的數(shù)據(jù)?;诩铀俣忍綔y(cè)技術(shù)的智能可穿戴設(shè)備,通過加速度傳感器探測(cè)人體身體活動(dòng)的加速度,再依靠一系列算法估算人體體力活動(dòng)的能量消耗,為我們的健康飲食和運(yùn)動(dòng)方式提供大量的數(shù)字化信息。2017年11月美國斯坦福醫(yī)院就宣布和蘋果合作,通過iWatch對(duì)心率的監(jiān)測(cè)探索是否能對(duì)房顫等心臟病進(jìn)行預(yù)警。蘋果公司通過軟件采集人體生理數(shù)據(jù),基于機(jī)器學(xué)習(xí)算法對(duì)光電反射傳感器采集的心率大數(shù)據(jù),針對(duì)于該用戶進(jìn)行自適應(yīng)的個(gè)性化心律曲線分析,并針對(duì)該用戶建立相匹配的心律狀況評(píng)價(jià)函數(shù),實(shí)時(shí)分析出用戶心律狀況,區(qū)分心臟節(jié)律與其他雜音,從而發(fā)現(xiàn)心律異常等問題并將信息發(fā)送到蘋果手機(jī)上并進(jìn)行心律異常狀況預(yù)測(cè)和預(yù)警。微軟公司也在2017年Build大會(huì)上則展示了一款可以識(shí)別帕金森患者顫抖頻率的手環(huán),并通過同樣頻率的顫抖幫助帕金森患者寫字。通過不斷地進(jìn)行多種形式的機(jī)器學(xué)習(xí),智能穿戴設(shè)備有望給我們的生活帶來不斷的驚喜。以睡眠為例,手環(huán)對(duì)體征的監(jiān)測(cè)完全可以被融入到物聯(lián)網(wǎng)的大話題下,手環(huán)把監(jiān)測(cè)到的數(shù)據(jù)和歷史數(shù)據(jù)進(jìn)行對(duì)比和分析,得出“用戶最近的睡眠質(zhì)量差”的判斷,可以直接推薦用戶購買褪黑素等保健產(chǎn)品以及針對(duì)性的生活方式方面的個(gè)性化建議。比如智能球拍在進(jìn)行大量的“機(jī)器學(xué)習(xí)”鍛煉后,就可以記錄用戶手臂的運(yùn)動(dòng)軌跡并進(jìn)行分析,通過震動(dòng)的方式矯正用戶運(yùn)動(dòng)姿勢(shì)。
機(jī)器學(xué)習(xí)是一個(gè)活躍且充滿生命力的研究領(lǐng)域,同時(shí)也是一個(gè)困難和爭議較多的研究領(lǐng)域。從目前研究趨勢(shì)看,機(jī)器學(xué)習(xí)今后主要的研究方向如下:
人類和機(jī)器誰是未來世界的主宰一直存在大量爭論,機(jī)器是人類發(fā)明的,但其初衷是希望幫助人類更好地發(fā)展,目前在很多問題的處理上還存在諸多不足,因此需要進(jìn)一步借鑒人類學(xué)習(xí)機(jī)制,拓展現(xiàn)有的機(jī)器學(xué)習(xí)思路。
從目前機(jī)器學(xué)習(xí)的4種主要方式來看,均各有其長處和不足,有必要通過新的方法和手段進(jìn)一步完善現(xiàn)有的學(xué)習(xí)方式。即如何通過更少的數(shù)據(jù)(標(biāo)簽數(shù)據(jù)或非標(biāo)簽數(shù)據(jù)),建立更有效的數(shù)學(xué)模型,進(jìn)行更準(zhǔn)確的結(jié)果判斷或解決方案。
進(jìn)一步拓展機(jī)器學(xué)習(xí)研究的領(lǐng)域及深度,開發(fā)出更多、更好的智能App應(yīng)用。