• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      AI學習的秘密

      2018-12-25 09:20:04習翔宇
      知識就是力量 2018年12期
      關(guān)鍵詞:池化像素點神經(jīng)元

      習翔宇

      人工智能已經(jīng)成為一個具有眾多實際應(yīng)用和活躍研究課題的領(lǐng)域,并且正在蓬勃發(fā)展。尤其是近幾年深度學習發(fā)展迅猛,取得了很好的效果。很多基于深度學習的應(yīng)用也進入我們生活中,例如圖像目標識別、機器翻譯、自動駕駛系統(tǒng)等。今天就讓我們一同走進深度學習的世界,看看擁有如此強大能力的深度學習是如何工作的吧!

      深度學習之路

      神經(jīng)網(wǎng)絡(luò)是深度學習的基礎(chǔ),深度學習的發(fā)展也是以神經(jīng)網(wǎng)絡(luò)模型的發(fā)展為基礎(chǔ)的,而神經(jīng)網(wǎng)絡(luò)的發(fā)展可謂經(jīng)歷了漫長的過程。

      1958年,計算機科學家弗蘭克·羅森布拉特(Frank Rosenblatt)提出了兩層神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò),稱之為感知器。一個感知器接受若干個二進制輸入,并產(chǎn)生一個二進制輸出,因此能夠?qū)斎氲亩嗑S數(shù)據(jù)進行二分類。其中的計算方法為通過加權(quán)與閾值比較,如果加權(quán)大于閾值,就輸出1,否則輸出0。該方法使用梯度下降法從訓練樣本中自動學習更新權(quán)值。

      但感知器本質(zhì)上是一種線性模型,只能處理線性問題,就連最簡單的異或問題都無法進行正確分類。例如,小紅和小麗是好朋友,有一天老師讓她們一起打掃教室。我們用x1=1來表示小紅打掃教室,x1=0表示小紅沒打掃教室,x2=1來表示小麗打掃教室,x2=0來表示小麗沒打掃教室;用y=1表示只有一個人打掃了教室,否則為0,那么結(jié)果只有四種情況如右頁表1所示。但是采用感知器模型卻無法對此進行正確分類,因此神經(jīng)網(wǎng)絡(luò)的研究也陷入了20年的停滯,直到“神經(jīng)網(wǎng)絡(luò)之父”杰弗里·辛頓(Geoffrey Hinton)在1986年發(fā)明了適用于多層感知器的反向傳播算法,并且引入了Sigmoid函數(shù)對加權(quán)結(jié)果進行非線性變換,才解決了這個問題。

      2012年,亞歷克斯參加ImageNet圖像識別比賽,構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的AlexNet模型并取得了冠軍,且準確率遠超第二名,使得CNN成為在圖像識別分類的核心算法模型,帶來了深度學習的大爆發(fā)。從此,深度學習吸引了學術(shù)界和工業(yè)界的關(guān)注,在不同領(lǐng)域內(nèi)逐漸開始應(yīng)用,不同的神經(jīng)網(wǎng)絡(luò)模型和架構(gòu)也層出不窮,并取得了極好的效果。

      圖像分類之謎

      我們用全連接神經(jīng)網(wǎng)絡(luò)進行圖像分類的例子,來說明深度學習是如何工作的。比如在寄快遞的時候,人們會寫電話或者手機號碼(均由數(shù)字0~9組成),如果我們能讓電腦識別出人手寫的數(shù)字是什么,就能夠自動通知收件人來收取快遞。

      假設(shè)對圖像進行掃描切割,每次都對包含一個數(shù)字的圖像進行識別,可能是1,也可能是8,總共有0~9十個數(shù)字。若每個圖片長、寬均為28個像素,并且是黑白圖像,則該圖片包含28×28=784個像素點,每個像素點范圍在0和1之間,0表示白色,1表示黑色,0~1之間表示灰色。

      全連接的前饋神經(jīng)網(wǎng)絡(luò)(人工神經(jīng)網(wǎng)絡(luò)的一種)通常包括三層:輸入層(input layer)、隱藏層(hidden layer)和輸出層(output layer)。其中,輸入層是接收原始輸入;隱藏層可能有多層,每層隱藏層都對輸入進行非線性運算,然后輸出給下一層隱藏層,作為下一層隱藏層的輸入繼續(xù)運算,直到遇到輸出層;輸出層對隱藏層進行運算分類,得到最終的分類結(jié)果。每一層都包含了多個神經(jīng)元(神經(jīng)元是一個運算單元,執(zhí)行最基本的運算操作),通常每個神經(jīng)元對自己的輸入進行非線性運算,并將結(jié)果傳遞給它連接到的所有下一層神經(jīng)元。

      具體到我們的圖像分類任務(wù)中,輸入層的輸入是每幅圖像,也就是784個像素點;中間是一個隱藏層,包含了15個神經(jīng)元來進行非線性運算;輸出層包含了10個神經(jīng)元,對隱藏層的輸出進行運算和分類,第n個神經(jīng)元就代表這個圖片是第n個數(shù)字的概率。例如,輸出層第一個神經(jīng)元的輸出表示這個圖像包含了數(shù)字0的概率,第5個神經(jīng)元的輸出表示該圖像包含了數(shù)字4的概率。其中哪個神經(jīng)元輸出值最大,就作為模型預測到的結(jié)果。若輸出概率如下表2所示,那么就認為圖像包含數(shù)字為5,概率最大為0.6。

      延伸閱讀

      圖像由像素點組成,一般用長、寬所具有的像素點來描述圖像,例如一張黑白圖片長為900像素(即px),寬為700像素,則該圖片共有900×700=630000個像素點。如果該圖片是彩色圖片,每個像素均由R、G、B三個分量組成,則該圖像共有900×700×3=1890000個像素點。

      AlphaGo的秘密:卷積神經(jīng)網(wǎng)絡(luò)

      在卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)以前,人們使用全連接網(wǎng)絡(luò)處理圖像,但它存在一些問題,比如參數(shù)數(shù)量太多導致計算速度減慢、沒有利用像素之間的位置信息、網(wǎng)絡(luò)層數(shù)限制等。而卷積神經(jīng)網(wǎng)絡(luò)有效減少了這些問題,因此在圖像處理上有非常突出的表現(xiàn)。

      人觀察圖像時,往往會只關(guān)注局部信息,例如我們觀察一張貓的照片,看到貓的額頭或者貓爪就能夠知道這是貓的照片了,而不需要每個部分都看完了才知道,因此圖像的局部信息能夠提供大量的有效特征。基于這個基本概念,卷積神經(jīng)網(wǎng)絡(luò)采用卷積層和池化層兩種計算來提取相關(guān)信息。

      卷積層采用一個小的矩陣窗口來對圖像進行處理,例如長和寬均為3像素的矩陣,我們稱之為過濾器或者內(nèi)核。每次在圖像中選擇長為3像素、寬為3像素的區(qū)域,總共有3×3=9個像素點,然后進行按位乘法之后相加。在卷積完第一個局部信息之后,卷積核往右挪一位,然后繼續(xù)進行該操作,繼續(xù)往右挪動,直到挪動到了最右邊;然后挪動到下一行,從左往右繼續(xù)進行卷積操作,如右頁上圖所示。

      右頁上圖中左邊為圖像信息,中間為卷積核矩陣,兩者計算之后得到新的矩陣如圖右邊所示。大家可以手動計算一遍哦!

      在卷積層之后,得到融合了局部信息的隱藏層,然后我們需要挑選最優(yōu)的局部信息,一般采用最大池化(max-pooling)或者平均池化(average-pooling)來進行操作。假設(shè)我們采用最大池化操作,并且過濾器大小為2×2,那么對于一個5×5大小的矩陣我們最大池化之后得到4×4大小的矩陣,如右二圖所示。例如藍色部分中,包括四個點分別是0、1、1、2,那么最大的就取2;再比如紅色部分中,包括四個點是1、3、1、0,那么取最大就是3。

      池化操作與卷積操作類似,也是需要從左往右、從上往下進行移動,這樣遍歷完了整個卷積結(jié)果。隨后池化的結(jié)果會往后傳播,進行分類、識別等操作。采用多個卷積層+池化層的方式來提取特征,最后將提取到的特征“喂”給一個分類層進行圖像識別,例如AlexNet就是采用了多層卷積神經(jīng)網(wǎng)絡(luò)來進行圖像識別,并在ImageNet上取得了非常好的效果。

      在AlphaGo中,卷積神經(jīng)網(wǎng)絡(luò)就起到了很大的作用,這款人工智能圍棋程序由DeepMind公司開發(fā),戰(zhàn)勝了眾多人類圍棋高手,包括曾獲世界圍棋冠軍的李世石和排名人類圍棋世界第一的柯潔。

      AlphaGo主要由卷積神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹搜索組成。其中卷積神經(jīng)網(wǎng)絡(luò)如上介紹,對棋盤進行卷積運算,并采用蒙特卡洛樹進行評估,得到當前應(yīng)該下的棋的位置。通過機器和機器對弈的方法來創(chuàng)造足夠多的棋局,在這個過程中,AlphaGo越來越強大,也就從絲毫不會下棋,成長到可以輕松戰(zhàn)勝人類中最頂尖的棋者。

      猜你喜歡
      池化像素點神經(jīng)元
      基于緊湊型雙線性網(wǎng)絡(luò)的野生茵識別方法研究
      無線電工程(2024年8期)2024-09-16 00:00:00
      基于Sobel算子的池化算法設(shè)計
      卷積神經(jīng)網(wǎng)絡(luò)中的自適應(yīng)加權(quán)池化
      軟件導刊(2022年3期)2022-03-25 04:45:04
      《從光子到神經(jīng)元》書評
      自然雜志(2021年6期)2021-12-23 08:24:46
      基于卷積神經(jīng)網(wǎng)絡(luò)和池化算法的表情識別研究
      躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
      基于canvas的前端數(shù)據(jù)加密
      基于逐像素點深度卷積網(wǎng)絡(luò)分割模型的上皮和間質(zhì)組織分割
      基于二次型單神經(jīng)元PID的MPPT控制
      毫米波導引頭預定回路改進單神經(jīng)元控制
      兴业县| 盱眙县| 宣武区| 九龙城区| 故城县| 湟源县| 台江县| 基隆市| 陇南市| 博乐市| 栾川县| 宝清县| 广平县| 河北省| 无极县| 五常市| 孟州市| 平利县| 永靖县| 武宣县| 吐鲁番市| 蒙阴县| 阜城县| 贵定县| 甘孜县| 韶山市| 马龙县| 大化| 芷江| 汝南县| 沈丘县| 蚌埠市| 克东县| 昌江| 伊宁市| 新和县| 屏边| 泰宁县| 缙云县| 化州市| 远安县|