• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      機(jī)器學(xué)習(xí)發(fā)展現(xiàn)狀及應(yīng)用的研究

      2018-06-01 10:14:38劉崧淏
      中國科技博覽 2018年24期
      關(guān)鍵詞:強(qiáng)化學(xué)習(xí)機(jī)器學(xué)習(xí)無人駕駛

      劉崧淏

      [摘 要]本文首先介紹了近幾年有關(guān)機(jī)器學(xué)習(xí)的一些熱門事件,例如大為火熱的AlphaGo以及2017年首次舉行的中國人工智能大會(CCAI)。接下來將文章分為3個部分來闡述機(jī)器學(xué)習(xí):第一部分詳細(xì)介紹機(jī)器學(xué)習(xí)的發(fā)展歷程,包括萌芽-發(fā)展-繁榮三個階段;第二部分著重分析了機(jī)器學(xué)習(xí)的常見方法,有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)以及強(qiáng)化學(xué)習(xí);最后介紹了機(jī)器學(xué)習(xí)在各行各業(yè)中的一些具體應(yīng)用。

      [關(guān)鍵詞]人工智能;機(jī)器學(xué)習(xí);強(qiáng)化學(xué)習(xí);無人駕駛

      中圖分類號:S265 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-914X(2018)24-0227-02

      1.引言

      2016年年初,AlphaGo以4:1戰(zhàn)勝了世界圍棋冠軍李世石,這一大事件瞬間引起了全球?qū)θ斯ぶ悄艿呐d趣。一時間,人們茶余飯后都在圍繞著人工智能這一領(lǐng)域展開。2017年07月22-23號在杭州舉行了中國國內(nèi)級別最高,規(guī)模最大的人工智能大會—中國人工智能大會(CCAI)。大會上匯聚了全球人工智能領(lǐng)域的頂級專家、學(xué)者和產(chǎn)業(yè)界優(yōu)秀人才,圍繞當(dāng)前人工智能熱點話題、核心技術(shù)以及廣泛關(guān)注的科學(xué)問題進(jìn)行深入交流和探討,再一次將人工智能推向了熱潮。

      人工智能的主要三大驅(qū)動力:大數(shù)據(jù),機(jī)器學(xué)習(xí)以及硬件GPU。本文主要從人工智能的算法——機(jī)器學(xué)習(xí)方面來展開論述。機(jī)器學(xué)習(xí)(MachineLearning)的本質(zhì)是基于互聯(lián)網(wǎng)的海量數(shù)據(jù)以及系統(tǒng)強(qiáng)大的并行運(yùn)算能力,讓機(jī)器自主模擬人類學(xué)習(xí)的過程,通過不斷“學(xué)習(xí)”數(shù)據(jù)來做出智能決策行為。

      2.機(jī)器學(xué)習(xí)的發(fā)展歷程與相關(guān)要素

      2.1 機(jī)器學(xué)習(xí)的發(fā)展歷程

      機(jī)器學(xué)習(xí)屬于人工智能中一個較為年輕的分支,可以大致分為以下三個發(fā)展歷程:

      第一階段:20世紀(jì)50年代中期—60年代中期,這一時期處于萌芽時期。人們試圖通過軟件編程來操控計算機(jī)完成一系列的邏輯推理功能,進(jìn)而使計算機(jī)具有一定程度上類似人類一樣的智能思考能力。然而這時期計算機(jī)所推理的結(jié)果遠(yuǎn)遠(yuǎn)沒有達(dá)到人們對機(jī)器學(xué)習(xí)的期望。通過進(jìn)一步研究發(fā)現(xiàn),只具有邏輯推理能力并不能使得機(jī)器智能。研究者們認(rèn)為,使得機(jī)器擁有人工智能的前提還必須是擁有大量的先驗知識[1]。

      第二階段:20世紀(jì)60年代中期—80年代中期,這一時期處于發(fā)展時期。人們試圖利用自身思維提取出來的規(guī)則來教會計算機(jī)執(zhí)行決策行為,主流之力便是各式各樣的“專家系統(tǒng)”,然而這些系統(tǒng)總會面臨“知識稀疏”的問題,即面對無窮無盡的知識與信息,人們無法總結(jié)出萬無一失的規(guī)律。因此,讓機(jī)器自主學(xué)習(xí)的設(shè)想自然地浮出水面?;?0世紀(jì)50年代對于神經(jīng)網(wǎng)絡(luò)的研究,人們開始研究如何讓機(jī)器自主學(xué)習(xí)。

      第三階段:20世紀(jì)80年代—至今,機(jī)器學(xué)習(xí)達(dá)到了一個繁榮時期。由于這一時期互聯(lián)網(wǎng)大數(shù)據(jù)以及硬件GPU的出現(xiàn),使得機(jī)器學(xué)習(xí)脫離了瓶頸期。機(jī)器學(xué)習(xí)開始爆炸式發(fā)展,開始成為了一門獨(dú)立熱門學(xué)科并且被應(yīng)用到各個領(lǐng)域。各種機(jī)器學(xué)習(xí)算法不斷涌現(xiàn),而利用深層次神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)也得到進(jìn)一步發(fā)展。同時,機(jī)器學(xué)習(xí)的蓬勃發(fā)展還促進(jìn)了其他分支的出現(xiàn),例如模式識別,數(shù)據(jù)挖掘,生物信息學(xué)和自動駕駛等等。

      2.2 機(jī)器學(xué)習(xí)的常見方法

      機(jī)器學(xué)習(xí)發(fā)展至今,常用的主要有以下三大類:監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)(圖1)。

      2.2.1 監(jiān)督學(xué)習(xí)

      監(jiān)督學(xué)習(xí)表示機(jī)器學(xué)習(xí)的數(shù)據(jù)是帶標(biāo)記的,這些標(biāo)記可以包括數(shù)據(jù)類別,數(shù)據(jù)屬性以及特征點位置等等。這些標(biāo)記作為預(yù)期效果,不斷來修正機(jī)器的預(yù)測結(jié)果。具體首先過程是:通過大量帶有標(biāo)記的數(shù)據(jù)來訓(xùn)練機(jī)器,機(jī)器將預(yù)測結(jié)果與期望結(jié)果進(jìn)行比對;之后根據(jù)比對結(jié)果來修改模型中的參數(shù),再一次輸出預(yù)測結(jié)果;再將預(yù)測結(jié)果與期望結(jié)果進(jìn)行比對……重復(fù)多次直至收斂,最終生成具有一定魯棒性的模型來達(dá)到智能決策的能力。

      常見的監(jiān)督學(xué)習(xí)有分類,回歸。分類(classification)是將一些實例數(shù)據(jù)分到合適的類別中,它的預(yù)測結(jié)果是離散的?;貧w(regression)是將數(shù)據(jù)歸到一條“線”上,即為離散數(shù)據(jù)生產(chǎn)擬合曲線,因此其預(yù)測結(jié)果是連續(xù)的。

      2.2.2 無監(jiān)督學(xué)習(xí)

      無監(jiān)督學(xué)習(xí)表示機(jī)器學(xué)習(xí)的數(shù)據(jù)是沒有標(biāo)記的。機(jī)器從無標(biāo)記的數(shù)據(jù)中探索并推斷出潛在的聯(lián)系。常見的無監(jiān)督學(xué)習(xí)有聚類,降維。

      在聚類(clustering)工作中,由于事先不知道數(shù)據(jù)類別,因此只能通過分析數(shù)據(jù)樣本在特征空間中的分布,例如基于密度或是基于統(tǒng)計學(xué)概率模型等等,從而將不同數(shù)據(jù)分開,把相似數(shù)據(jù)聚為一類。

      降維(dimensionality reduction)是將數(shù)據(jù)的維度降低。例如描述一個西瓜,若只考慮外皮色澤,根蒂,敲聲,紋理,密度以及含糖率這6個屬性,這6個屬性代表了西瓜數(shù)據(jù)的維度為6。進(jìn)一步考慮降維的工作,由于數(shù)據(jù)本身具有龐大的數(shù)量和各種屬性特征,若對全部數(shù)據(jù)信息進(jìn)行分析,將會增加訓(xùn)練的負(fù)擔(dān)和存儲空間。因此可以通過主成分分析等其他方法,考慮主要影響因素,舍棄次要因素,來平衡準(zhǔn)確度與效率。

      2.2.3 強(qiáng)化學(xué)習(xí)

      強(qiáng)化學(xué)習(xí)是帶激勵的,具體來說就是,如果機(jī)器行動正確,將施與一定的“正激勵”;如果行動錯誤,也同樣會給出一個懲罰(也可稱為“負(fù)激勵”)。因此在這種情況下,機(jī)器將會考慮如何在一個環(huán)境中行動才能達(dá)到激勵的最大化,具有一定的動態(tài)規(guī)劃思想[2]。例如在貪吃蛇游戲中,貪吃蛇需要不斷吃到“食物”來加分。為了不斷提高分?jǐn)?shù),貪吃蛇需要考慮在自身位置上如何轉(zhuǎn)向才能吃到“食物”,這種學(xué)習(xí)過程便可理解為是一種強(qiáng)化學(xué)習(xí)。

      強(qiáng)化學(xué)習(xí)最為火熱的一個應(yīng)用便是谷歌AlphaGo的升級品—AlphaGo Zero。相較于AlphaGo,AlphaGo Zero舍棄了先驗知識。不再需要人為設(shè)計特征,直接將棋盤上黑白棋子的擺放情況作為原始數(shù)據(jù)輸入到模型中,機(jī)器使用強(qiáng)化學(xué)習(xí)來自我博弈,不斷提升自己最終出色完成下棋。AlphaGo Zero的成功證明了在沒有人類的經(jīng)驗和指導(dǎo)下,深度強(qiáng)化學(xué)習(xí)依然能夠出色完成指定任務(wù)。

      3.機(jī)器學(xué)習(xí)的應(yīng)用

      由于近20年科技的迅速發(fā)展,機(jī)器學(xué)習(xí)已經(jīng)成為了一門活躍并且充滿生命力的學(xué)科。機(jī)器學(xué)習(xí)具備了一定的解決實際生活問題的能力,通過把機(jī)器學(xué)習(xí)當(dāng)作是一種基礎(chǔ)與服務(wù)技術(shù),和不同領(lǐng)域進(jìn)行結(jié)合碰撞出火花[3]。而在各行各業(yè)里都少不了機(jī)器學(xué)習(xí)的應(yīng)用。

      (1)醫(yī)療行業(yè)

      機(jī)器學(xué)習(xí)算法被應(yīng)用到提供醫(yī)療輔助、癌癥檢測和新藥物研制等。廣泛推進(jìn)醫(yī)療智能化,對全球醫(yī)療事業(yè)的發(fā)展有著非常重要的意義[4]。其中最為著名的也是當(dāng)屬IBM的智能機(jī)器人沃森。IBM技術(shù)團(tuán)隊首先將龐大的數(shù)據(jù)信息輸入到沃森中,這個龐大的數(shù)據(jù)庫包括了醫(yī)療論文與報道,臨床指南,藥物使用報告以及上千上萬本患者病歷等。之后利用AI算法進(jìn)行分析處理,從而為醫(yī)生提供醫(yī)療輔助,更高效精準(zhǔn)地進(jìn)行醫(yī)療診斷。

      (2)傳媒行業(yè)

      通過內(nèi)容傳播機(jī)器人以及品牌傳播機(jī)器人,一鍵生成用戶想要的內(nèi)容,一分鐘內(nèi)可出一萬篇文章,并且進(jìn)行有效的傳播?;跈C(jī)器學(xué)習(xí)搭建的智能媒體平臺,可以通過研究媒體的投遞和發(fā)送規(guī)則,結(jié)合當(dāng)前熱點事件、輿論和公關(guān)營銷內(nèi)容,自動生成用戶想要閱讀的內(nèi)容。并且可以智能地對接主流媒體平臺,自動同步發(fā)送,實現(xiàn)了高效傳播。

      (3)汽車行業(yè)

      汽車行業(yè),以自動駕駛為例,谷歌(如圖2)、百度、特斯拉等傳統(tǒng)巨頭紛紛加入其中。自動駕駛是汽車行業(yè)與人工智能、物聯(lián)網(wǎng)等新一代信息技術(shù)深度融合的產(chǎn)物,是當(dāng)前全球交通出行智能化和網(wǎng)聯(lián)化的重要方向。自動駕駛利用傳感器和激光雷達(dá)等感知器采集路況和行人信息,結(jié)合先進(jìn)機(jī)器學(xué)習(xí)算法,不斷優(yōu)化并最終規(guī)劃出最優(yōu)路線以及操控方案。

      4.總結(jié)

      機(jī)器學(xué)習(xí)作為最近三十年新興起的科研學(xué)科之一,已經(jīng)在現(xiàn)代信息生活各個領(lǐng)域上都有了較為廣泛的應(yīng)用。并且發(fā)展至今,機(jī)器學(xué)習(xí)已經(jīng)衍生出了眾多分支,如數(shù)據(jù)挖掘、深度學(xué)習(xí)、模式識別、機(jī)器人的智能控制、遙感信息安全等。因此,機(jī)器學(xué)習(xí)與各行各業(yè)的結(jié)合,必將引起一番改革大浪潮。

      參考文獻(xiàn)

      [1] 吳康寧.基于人工智能下的機(jī)器學(xué)習(xí)歷史及展望研究[J].科技尚品.2017(6):187.

      [2] 高陽,陳世福,陸鑫.強(qiáng)化學(xué)習(xí)研究綜述[J].自動化學(xué)報.2004,30(1):86-100.

      [3] 陳春霞.淺析機(jī)器學(xué)習(xí)的發(fā)展與應(yīng)用[J].信息系統(tǒng)工程.2017(8):99-100.

      [4] 孔祥溢與王任直,人工智能及在醫(yī)療領(lǐng)域的應(yīng)用.醫(yī)學(xué)信息學(xué)雜志,2016.37(11):第1-5頁.

      [5] 劉忠寶.機(jī)器學(xué)習(xí)方法在個性化推薦系統(tǒng)中的應(yīng)用[J].情報探索.2016(4):80-82.

      猜你喜歡
      強(qiáng)化學(xué)習(xí)機(jī)器學(xué)習(xí)無人駕駛
      我們村的無人駕駛公交
      無人駕駛車輛
      科學(xué)(2020年3期)2020-11-26 08:18:28
      無人駕駛公園
      基于強(qiáng)化學(xué)習(xí)的在線訂單配送時隙運(yùn)能分配
      論“以讀促寫”在初中英語寫作教學(xué)中的應(yīng)用
      智能交通車流自動導(dǎo)引系統(tǒng)
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      分布式系統(tǒng)中基于非合作博弈的調(diào)度算法
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
      時代金融(2016年27期)2016-11-25 17:51:36
      前綴字母為特征在維吾爾語文本情感分類中的研究
      桓台县| 凤山县| 互助| 凤山市| 镶黄旗| 阿坝| 无为县| 华宁县| 新竹市| 赤壁市| 湾仔区| 五原县| 玉田县| 武汉市| 三亚市| 绥德县| 潮州市| 雷山县| 吉木萨尔县| 望江县| 桂阳县| 张家港市| 绍兴市| 澎湖县| 鄂托克前旗| 上虞市| 徐汇区| 四平市| 化隆| 吉安县| 彰武县| 额敏县| 延津县| 平湖市| 汪清县| 巧家县| 扶沟县| 安国市| 丹寨县| 红桥区| 九龙坡区|