陳心滿, 鐘智堅, 岳志秀 , 朱 俊, 高芳亮, 史艷麗, 章 勇
(1. 華南師范大學半導體科學與技術學院, 佛山 528225; 2. 中山火炬職業(yè)技術學院, 中山 528436; 3. 華南農業(yè)大學圖書館, 廣州 510642)
隨著智能時代對大規(guī)模數(shù)據(jù)處理要求不斷提高,基于Von Neumann架構的計算機正面臨著嚴峻的挑戰(zhàn)。例如,Google Brain團隊利用上萬個通用處理器建立了人工神經網絡并應用于面部識別、國際象棋等場景;基于深度學習算法的AlphaGo機器人需要在上千個通用處理器和數(shù)百個圖形處理器的幫助下才能玩一局圍棋,耗費巨大。無人駕駛、深度學習和智能機器人等智能技術是人類科學技術發(fā)展的重要方向,但基于傳統(tǒng)通用處理器的實現(xiàn)方案無疑會增加成本并限制性能。因此,構建新一代低成本、高效率、低功耗的人工神經網絡是智能技術的重要步驟。人腦中存在約1 000億個神經元,神經元通過神經突觸連接共同構成復雜但高效、低功耗的神經網絡,維持人的正常生命活動。像人腦一樣能夠對信息進行學習、記憶和靈活處理的智能計算機是未來計算機發(fā)展的方向和目標。神經形態(tài)網絡就是一種受人腦啟發(fā)提出的類腦計算系統(tǒng)。由于生物體神經突觸是完成大腦神經元信息傳遞和協(xié)調的基本單元,也是生物神經網絡進行學習、記憶、感知等復雜生命活動的重要基礎結構,其中突觸可塑性(Synaptic plasticity)是神經細胞學習、記憶功能的前提[1-4]。因此,基于電子器件實現(xiàn)類腦突觸功能是構造大規(guī)模人工神經形態(tài)網絡首先需要解決的問題。
電子類腦神經突觸,主要是依據(jù)器件導電狀態(tài)在物理信號刺激下的變化來模擬突觸權重的改變。利用CMOS、晶體管、電阻、電容等傳統(tǒng)基本元件,配合數(shù)模轉換、模數(shù)轉換等復雜電路系統(tǒng)模擬突觸功能亦有報道[5-7],但除了功能器件,往往需要復雜的電路系統(tǒng)和其他元件的配合,導致系統(tǒng)復雜,功耗高,與超低功耗的生物神經網絡系統(tǒng)相悖。憶阻器是一種新型電子器件,被認為是繼電阻、電容、電感后的第四種電子元件,相關理論由蔡少棠于1971年首次提出[8],并于2008年由惠普公司首次成功制備[9]。由于憶阻器具有可高密度集成、低功耗且高速開關等優(yōu)點,可以與傳統(tǒng)的CMOS工藝兼容,已被廣泛應用于數(shù)據(jù)存儲、邏輯運算等領域。同時因為憶阻器具有精確可調的電導,被認為是模擬神經突觸的最佳選擇。本文在比較憶阻器和神經突觸相似性的基礎上,就近些年基于憶阻器在類腦神經突觸應用方面的研究進展進行簡要綜述。
憶阻器是具有“三明治”結構的兩端器件,跟生物突觸的“突觸前膜-突觸間隙-突觸后膜”相似(圖1)。憶阻器具有非易失性,有“記憶”功能,其電阻或電導的變化取決于施加于器件的信號,即憶阻器的阻態(tài)與施加于器件的電激勵歷史有關,這與生物神經突觸的特征高度相似[1-2]。從憶阻器阻變特性的機理來看,其阻態(tài)變化主要基于介質內部離子(如氧空位、活性金屬離子等)在外部電激勵的作用下產生遷移所導致。這種離子遷移過程與生物神經突觸信號傳輸過程中的K+、Ca2+等離子遷移類似。表1比較了憶阻器和生物突觸在結構、性質等方面的差異。另外,憶阻器簡單的器件結構、納米級的介質層以及憶阻器與CMOS工藝的兼容性,使得構建類腦大規(guī)模集成電路成為可能。目前,憶阻器是構建電子神經突觸的最佳方案[1-3]。
圖1 憶阻器與生物神經突觸的比較[2]Figure 1 The comparison diagram of memristor and biological nerve synapse[2]
表1 憶阻器與生物神經突觸的比較Table 1 The comparison diagram of memristor and biological nerve synapse
突觸可塑性(Synaptic Plasticity)是神經突觸的基本屬性,是指在神經刺激信號作用下,突觸的形態(tài)和功能發(fā)生一定的改變,且可以維持一段時間的特性。這是大腦神經系統(tǒng)實現(xiàn)學習、記憶和維持其他生命功能的重要基礎。突觸的可塑性可以通過“突觸權重”(Synaptic Weight)進行衡量,以反映神經元之間的連接強度[4]。因此,神經突觸具有可塑性,是指突觸權重根據(jù)突觸前后神經元的活動發(fā)生改變。
根據(jù)神經刺激信號作用下突觸權重的變化,突觸可塑性表現(xiàn)為多種形式。權重變化的時間長和短分別對應于生物系統(tǒng)中的長時記憶和短時記憶,因此可塑性主要可分為長時程可塑性(Long-Term Plasticity,LTP)和短時程可塑性(Short-Term Plasticity,STP)。以上2種可塑性都具有興奮(Potentiation)和抑制(Depression)可塑性類型,分別對應于長時程增強(Long-Term Potentiation,LTP)和長時程抑制(Long-Term Depression,LTD)、雙脈沖易化 (Paired-Pulse Facilitation,PPF)和雙脈沖抑制(Paired-Pulse Depression,PPD)。神經刺激信號多為脈沖形式,根據(jù)突觸前后神經信號脈沖到達時間及脈沖速率產生的可塑性,分別稱為放電時間依賴可塑性 (Spiking-Timing-Dependent Plasticity,STDP)和放電速率依賴可塑性 (Spiking-Rate-Dependent Plasticity,SRDP)等。當然,除了基本的可塑性功能,神經突觸也具有高級學習功能,如:非聯(lián)想學習 (Nonassociative Learning)、聯(lián)想學習(Associative Learning)。大腦正是通過結構復雜的神經元和突觸神經網絡系統(tǒng),調節(jié)神經突觸可塑性以適應外界刺激,從而控制生命活動。
神經突觸STP指短暫性的突觸權重變化,對神經系統(tǒng)的瞬時記憶和短時程適應具有重要作用。STP的形式多樣,現(xiàn)有的文獻中主要研究PPF和PPD這2個重要的學習規(guī)則,對應突觸權重的增強和抑制[10-12]。
在PPF規(guī)則中,當?shù)诙€電壓脈沖緊跟在前一個脈沖之后,第二個脈沖將引起突觸權重的增加。MILANO等[12]基于ZnO納米線憶阻器,觀察了納米線表面Ag導電細絲在電壓脈沖作用下的形成/溶解轉變過程,并實現(xiàn)了神經突觸的STP功能。如圖2A所示,通過施加幅度2.5 V、脈沖寬度2 ms、脈沖間距2 ms的電壓信號,器件的響應電流逐漸提高,相應的電導也逐漸增加。通過對電導的歸一化處理發(fā)現(xiàn):器件的電導權重隨電壓脈沖的作用逐漸上升,這與PPF過程中的權重變化類似。PPF產生的權重會受脈沖間隔的影響,脈沖間隔越大,權重越小(圖2B)。類似的PPF功能在其他憶阻器上也得以實現(xiàn),如IZO憶阻器[13]、有機金屬鹵化物鈣鈦礦憶阻器[14]、Ag/Ag2S/SiO2/ITO憶阻器[15]。
圖2 ZnO憶阻器突觸的PPF功能[19]Figure 2 The PPF function of ZnO memristor synapse[19]
PPD規(guī)則與PPF相反,當?shù)诙€電壓脈沖緊跟在前一個脈沖之后,第二個脈沖引起的突觸電流減小,即2次脈沖刺激后器件的權重減小。許多文獻已對憶阻器模擬PPD規(guī)則進行了報道[16-18]。JOSEPH等[19]基于兩端生物分子憶阻器提出PPF和PPD規(guī)則的模擬方法,發(fā)現(xiàn)通過增大電壓脈沖的間隔,可以使響應電流的變化趨勢由隨脈沖數(shù)目逐漸上升轉變?yōu)橹饾u下降,分別對應神經突觸的PPF和PPD過程,成功模擬PPF向PPD的轉換。
神經突觸LTP由持續(xù)的、強度較大的刺激引起,造成長期性的突觸權重變化,可以保持幾個小時甚至更久[20]。LTP的持續(xù)時間比STP時間長,但也會隨時間衰減。LTP主要有2種形式,其中在神經刺激作用下突觸權重逐漸增加的稱為“長時程增強(LTP)”,相反,突觸權重逐漸減小的稱為“長時程抑制(LTD)”,兩者往往會成對出現(xiàn)。利用憶阻器的非易失特性,可以對LTP規(guī)則進行模擬[21-25]。ILYAS等[25]制備的Ag/SiOx∶Ag/TiOx/p++-Si憶阻器具有典型的雙極型阻變性質(Bipolar Resistive Switching),并且分別用幅度為+1.2 V和-1.2 V的電壓脈沖信號模擬神經突觸的興奮信號和抑制信號,成功模擬了LTP和LTD過程(圖3)。
圖3 Ag/SiOx:Ag/TiOx/p++-Si憶阻器模擬長程可塑性功能[25]Figure 3 Ag/SiOx:Ag/TiOx/p++-Si memristor simulates long-range plasticity function[25]
通過充分的訓練可以使STP向LTP轉換,這是記憶和學習的基本過程[26-27]。采用憶阻器模擬人工神經突觸可塑性的過程中,可以通過改變脈沖刺激數(shù)目[25,28]、脈沖時間參數(shù)[29]等實現(xiàn)STP向LTP的轉換。LI等[30]研究表明,在Au@Ag納米粒子憶阻器上施加的脈沖數(shù)在10~30范圍時(圖4),歸一化的權重電流在去除刺激后迅速下降,與記憶保持率相對應的突觸權重下降至近零。但當脈沖數(shù)增加到50時,突觸權重下降到大約30%的相對穩(wěn)定狀態(tài),并且沒有進一步衰減至初始狀態(tài)。通過增加脈沖刺激數(shù)目,可實現(xiàn)STP向LTP的轉換。YI等[29]基于ZnO光子憶阻器,通過減小電壓脈沖的間隔使STP轉換為LTP。
圖4 Au@Ag納米粒子阻器模擬神經突觸STP到LTP轉換過程[30]Figure 4 Au@Ag nanoparticle arrestor simulates the process of STP to LTP conversion of synapses[30]
SRDP是生物神經突觸的一項重要功能[2],反映了突觸權重對神經刺激頻率的依賴。通常,隨著脈沖刺激頻率的上升,突觸的權重會相應增加。已有較多基于憶阻器實現(xiàn)類腦神經突觸SRDP功能的報道,如MAPbI3鈣鈦礦憶阻器件[31]、CMOS/憶阻器混合器件[32]、硫族化物憶阻器[33]、Ag/AgInSbTe/Ag相變憶阻器[34]。XIAO等[31]實驗發(fā)現(xiàn),施加電壓脈沖刺激MAPbI3鈣鈦礦憶阻器,脈沖間隔較長時,即脈沖頻率較低,器件的電導經過短暫上升后很快恢復到初始狀態(tài),提高脈沖刺激的頻率可以提高器件的電導權重(圖5)。該研究結果表明:憶阻器的記憶特性可通過刺激信號頻率來調控,從而實現(xiàn)STP、LTP的變換。
圖5 憶阻器模擬神經突觸SRDP的過程[31]Figure 5 Memristor simulates the process of synaptic SRDP[31]
STDP是大腦神經突觸的一種高級學習功能,遵從Hebbian學習規(guī)則[35-38]:當突觸前膜的刺激先于突觸后膜刺激時,突觸的權重會增加;相反,當突觸后膜刺激先于突觸前膜刺激,突觸的權重會減弱。假定Δt為突觸后膜和突觸前膜刺激的時間差,Δω為突觸權重的變化,則STDP規(guī)則可以描述為:
(1)
其中,ω0代表權重,τ代表權重的變化速率。
在憶阻器模擬STDP的研究中,器件兩端脈沖代表神經突觸前后神經元傳遞的神經刺激,器件兩端的電壓為VM=Vpre-Vpost,脈沖序列施加在器件兩端的時間差Δt=tpre-tpost,器件的電導權重變化依賴于Δt[25,39-42]。
圖6A、B提供了2種模擬STDP的脈沖序列[25]。EPSC/IPSC[Excitatory Postsynaptic Current(EPSC)、Inhibitory Postsynaptic Current(IPSC)]變化代表脈沖序列施加后器件電導權重變化的歸一化數(shù)值。Δt>0時,若VM大于LTP的閾值Vth1,器件獲得有效的刺激,Δω>0且隨著|Δt|的增加而增加,出現(xiàn)LTP性質;相反,當Δt<0時,若VM小于LTP的閾值Vth2,Δω<0并且隨著|Δt|的增加而減小,出現(xiàn)LTD性質。圖6C、D是利用外電路構建神經網絡系統(tǒng)的STDP形式,在Δt>0和Δt<0時,突觸權重根據(jù)時間差的大小表現(xiàn)出3種不同的變化。當然,生物體不同部位或不同刺激下的STDP規(guī)則有所差異。
圖6 Ni/0.7Pb(Mg1/3Nb2/3)O3-0.3PbTiO3/Ni憶阻器模擬及簡化后神經突觸STDP過程[25]Figure 6 Ni/0.7Pb(Mg1/3Nb2/3)O3-0.3PbTiO3/Ni memristor simulates and the process of synaptic STDP[25]
根據(jù)神經回路中信息獲取和處理的方式不同,STDP可以分為以下4種[43-46]:
(1)反對稱型Hebbian 學習規(guī)則(Antisymmetric Hebbian learning rule)STDP,即Δt>0時突觸權重增加,Δt<0時突觸權重減少;
(2)反對稱反 Hebbian 學習規(guī)則(Antisymmetric anti-Hebbian learning rule) STDP,即Δt>0時突觸權重減少;Δt<0時突觸權重增加;
(3)對稱型 Hebbian 學習規(guī)則 (Symmetric Hebbian learning rule) STDP,這種規(guī)則不依賴于Δt的正負,只跟|Δt|大小有關;
(4)對稱反 Hebbian 學習規(guī)則 (Symmetric anti-Hebbian learning rule) STDP,無論Δt大小、極性如何,突觸權重都為抑制狀態(tài)。
KUZUM等[46]基于Ge2Sb2Te5相變型憶阻器(PCM)通過施加不同的脈沖序列實現(xiàn)了STDP的4種規(guī)則,如圖7所示。
圖7 Ge2Sb2Te5相變型憶阻器模擬神經突觸4種STDP功能[46]Figure 7 Ge2Sb2Te5 phase change memristor simulates four STDP functions of synapse[46]
再可塑性(Metaplasticity)指神經突觸可塑性能力受其活動歷史調節(jié)的現(xiàn)象,是突觸可塑性的高級形式,也稱為“突觸可塑性的可塑性”[47-48]。一般來說,前期刺激或經歷會影響突觸可塑性(如STP的閾值),且對后續(xù)的突觸可塑性的性質產生影響,從而對突觸可塑性進行再塑造。研究表明:通過改變前期的刺激,LTP、LTD的可塑性效果會相應地改變,這種調節(jié)作用可以維持至少2 h[49-51]。此外,再可塑性對生物個體學習記憶的調節(jié)起重要作用。例如:一定程度增加神經細胞的興奮性,有利于學習能力的提高[52-57]。
如圖8A所示,再可塑性的研究要求在獲得可塑性行為之后引入前期刺激,并觀察前期刺激對可塑性的性質影響(圖8A)。TAN等[56]利用具有遺忘特性的Pt/WO3-x/Pt憶阻器模擬了突觸再可塑性的功能(圖8B),脈沖刺激(1.7 V,10 μs)作為前期刺激不會引起電導變化,但施加前期刺激之后使當前刺激(2.1 V,10 μs)觸發(fā)更大的電導增加,體現(xiàn)了前期刺激對當前可塑性的影響。LEE等[57]利用Pt/KNbO3/TiN憶阻器實現(xiàn)了LTP、LTD和STDP功能,通過改變脈沖序列參數(shù),影響氧空位導電細絲的狀態(tài),從而對之后的LTP、LTD、STDP的可塑性進行調節(jié),可以實現(xiàn)對突觸可塑性的可塑性研究,即再可塑性。
圖8 生物神經突觸再可塑性示意圖及憶阻器模擬神經突觸再可塑性過程[56]Figure 8 The memristor mimics synaptic metaplasticity[56]
最近,本課題組[58]在Ag/HfOx/ITO憶阻器上發(fā)現(xiàn)了一種特殊的阻態(tài)依賴閾值開關(Stateful Threshold Switching)。憶阻器分別處于雙極性阻變的ON、OFF態(tài)時,在毫伏級的工作電壓區(qū)間,依然具有閾值開關特性 (TSON和TSOFF),且開關窗口依賴于ON、OFF態(tài)的電阻。這種特殊的電致阻變特性,可以簡化類腦學習-遺忘過程中再可塑性的實現(xiàn)過程(圖9):通過施加3個0.2 mV的增強脈沖進行學習,遺忘過程為0.01 mV響應電流的衰減,在ON和OFF狀態(tài)下的學習遺忘過程通過VReset或VSet脈沖作為前期刺激來調制。
圖9 憶阻器阻態(tài)依賴閾值開關特性模擬神經突觸學習-遺忘行為的突觸再可塑性[58]Figure 9 The metaplasticity of learning-forgetting based on “stateful” threshold switching of memristor[58]
生物體在形成觸覺、視覺、味覺等過程中,需要外部感知器、神經鏈路、神經中樞等共同作用,其中少不了神經突觸的參與。憶阻器突觸在構建仿生感知系統(tǒng)中可以起到非常重要的作用,可以使仿生系統(tǒng)更接近生物體性能。
最近,集成憶阻器和壓阻傳感器或其他類皮膚傳感器所構建人工觸覺神經系統(tǒng)備受關注[59-63],這對模擬皮膚的觸覺、痛覺等具有重要意義。
動物感知觸覺的過程(圖10):由觸覺感受器感知觸覺,再經過神經回路傳到大腦進行信息處理,該過程的信息傳遞離不開神經突觸的作用。ZHANG等[59]首次集成壓阻傳感器和憶阻器并組成了人工觸覺神經系統(tǒng)。壓阻傳感器和憶阻器制備簡單的結構及成分組成,其中憶阻器作為神經突觸傳遞觸覺信號,可穩(wěn)定模擬神經突觸的PPF、PPD、STDP等基本功能,提高了人工觸覺系統(tǒng)手寫識別過程的精確度。GE等[61]利用柔性憶阻器構成觸覺感知回路,對柔性電子皮膚的研究具有較大參考意義。YOON等[63]利用擴散型憶阻器構建了人工傷害感受器,經過憶阻器處理后的熱信號逐漸衰減至正常狀態(tài),模擬了受損組織(傷害感受器)的自愈過程(圖11)??傊?,利用憶阻器構建人工神經突觸,再將其運用于人工神經系統(tǒng)中,有利于搭建貼近生物體特性的仿生系統(tǒng)。
圖10 觸覺感知系統(tǒng)及其模擬過程[60]Figure 10 The tactile sensing system and its simulation process[60]
圖11 憶阻器模擬傷害感受器[63]Figure 11 The memristor mimics nociceptor[63]
非聯(lián)想學習(Nonassociative learning)反映動物面對單一刺激引起的適應過程,是人和動物具備的簡單的學習能力,是其他復雜學習行為的基礎,主要包括習慣化(Habituation)和敏感化(Sensitization)兩種類型[64-67]。習慣化是指當不產生傷害的刺激持續(xù)施加到個體上時,個體逐漸對這種刺激的自發(fā)反應減弱或消失的現(xiàn)象。習慣化會隨著時間而消退或被新的刺激所取代,該過程即去習慣化(Dishabituation)。
YANG等[61]制備了HfOx憶阻器和NMOSFET集成的突觸器件,模擬了突觸的習慣化和非習慣化過程,如圖12所示。首先對器件施加100個脈沖,幅度為-1 V,作為習慣化脈沖;之后施加幅度為0.45 V的脈沖,作為去習慣化脈沖(圖12A)。隨著刺激的增加,器件的響應電流在習慣化脈沖的作用下逐漸衰減,對應于神經突觸的長時程抑制(LTD)過程,表明器件在連續(xù)的脈沖作用下逐漸適應了這種弱刺激,減小了對習慣化脈沖的注意力;在去習慣化脈沖作用下器件的響應電流逐漸上升,代表新刺激的出現(xiàn)導致此前建立的習慣化現(xiàn)象被取代,模擬了去習慣化過程。器件模擬的習慣化和去習慣化過程與生物實驗中的非聯(lián)想學習過程對應(圖12B[64])。除了電脈沖,ZHAO等[68]基于ZnO納米線光敏憶阻器,利用UV光脈沖引起的非聯(lián)想學習過程,可以很好地模擬習慣化、敏感化過程:無UV光照射時器件響應電流逐漸衰減,對應于習慣化過程;UV光照射是器件響應電流逐漸增加,對應于敏感化過程。
圖12 憶阻器模擬神經突觸非聯(lián)想學習功能Figure 12 The memristor simulates non associative learning of synapse
聯(lián)想學習普遍存在于人和動物的神經系統(tǒng)中,是個體在復雜環(huán)境中生存的重要保障,具體指環(huán)境刺激與生物體自身反應之間形成聯(lián)系的過程,最早由PAVLOV提出。在經典的聯(lián)想學習實驗中,PAVLOV在給予狗食物的同時用鈴聲刺激狗,經過一段時間的訓練,狗在聽到鈴聲時就會分泌唾液,說明狗將食物和鈴聲建立了聯(lián)系。在這個實驗中,食物作為非條件刺激,任何情況都會使狗分泌唾液;鈴聲為條件刺激,在聯(lián)想學習訓練前不會引起狗分泌唾液,經過訓練后變成了條件刺激,可以在一定的時間內刺激狗分泌唾液,說明聯(lián)想學習成功建立。
目前報道的憶阻器聯(lián)想學習方案多采用憶阻器配合運算放大器、電阻等元件進行模擬,或通過仿真軟件建立復雜的電路系統(tǒng)實現(xiàn)。YURIY等[69]通過微處理器和數(shù)-模轉換電路,在實現(xiàn)憶阻器功能的基礎上,模擬了聯(lián)想學習的各項基本性能。MARTIN等[70]通過一個憶阻器配合加法器、比較器電路構建了基本的二輸入聯(lián)想學習系統(tǒng),通過憶阻器的非易失特性實現(xiàn)了聯(lián)想學習功能。BICHLER等[71]通過具有記憶特性的場效應晶體管配合同步時鐘信號,實現(xiàn)了聯(lián)想學習功能。WAN等[72]提出了一種氧化銦鋅基晶體管配合反相器的方案,可模擬聯(lián)想學習的部分功能。通常,聯(lián)想學習的過程包括新信息的學習、舊信息的消退、再恢復、泛化以及抑制性保護等基本過程。然而以往報道僅僅能夠模擬聯(lián)想學習的某部分功能,很少能夠實現(xiàn)聯(lián)想學習的整個過程。本課題組[58]利用Ag/HfOx/ITO憶阻器特殊的阻態(tài)依賴閾值開關(圖9),分別采用±0.4 mV和±0.75 V脈沖為非條件刺激和條件刺激信號,并設定閾值電流1 μA。研究表明:狗對鈴聲產生反應,并將食物和鈴聲建立了聯(lián)系。模擬巴普洛夫狗聯(lián)想學習建立過程模擬見圖13A,其消退、再恢復、泛化以及抑制性保護見圖13B。同時,由于器件特殊的阻變特性,聯(lián)想學習的全過程均可實現(xiàn)無極性操作。值得一提的是,Ag/HfOx/ITO突觸器件的功耗僅為5.71 pW,與生物突觸(約10 pW)相當,但遠低于此前報道的電子突觸,因此這對仿生人工神經網絡具有重要意義。
圖13 Ag/HfOx/ITO憶阻器模擬聯(lián)想學習過程及消退、再恢復、泛化以及抑制性保護[58]Figure 13 Ag/HfOx/ITO memristor simulates associative learning process,extinction,recovery,generalization and inhibitory protection[58]
人的視覺是通過視網膜接收外界圖像,再通過神經回路傳至大腦處理而形成的。對類腦智能而言,構建人工視覺神經網絡同樣具有重要意義。具有光電響應的憶阻器,利用器件的光電響應和非易失特性,可以模擬視覺神經對圖像信息的傳感及存儲。ZHONG等[74]利用受UV光控的聚(2-乙烯基萘)有機薄膜憶阻器模擬神經突觸的STP功能,利用UV光實現(xiàn)了對PPF和PPD功能的調控。HU等[75]報道了基于ZnO1-x/AlOy異質結的光電憶阻器,所制備的器件對UV光具有較好的響應特性和易失性阻變性質,施加UV光可以使憶阻器突觸的興奮性突觸后電流(Excitatory Postsynaptic Current,EPSC)逐漸上升,通過提高UV光的開關頻率或光功率可以實現(xiàn)從STP到LTP的轉換(圖14)。視覺信號的獲取、傳輸、處理是構建人工神經網絡的重要一環(huán),利用光電憶阻器構建神經突觸,模擬圖像的處理過程[76-78]是一種系統(tǒng)簡單、功耗低和操作簡易的方法。ZHOU等[79]利用光電憶阻器模擬了STP、LTP功能,同時利用憶阻器陣列應用到人工視網膜的圖像處理過程中,提高人工視覺神經網絡對圖像識別準確性(圖15)。
圖14 光電憶阻器光刺激頻率和功率模擬STP到LTP的轉換[75]Figure 14 The Photoelectric memristor simulates STP to LTP conversion[75]
圖15 光電憶阻器陣列的人工視網膜[79]Figure 15 The photoelectric memristor arrays for artificial retina[79]
除了探究UV光對光電神經突觸的權重影響,LI等[80]利用ZnO/PbS異質結器件在全光譜范圍內光電突觸的活動,其中短波長的紅外光可模擬突觸的抑制可塑性,長波長的UV光可誘導突觸興奮可塑性。同時還模擬了神經突觸的其他性能(如LTP、STP和SRDP等),該器件對光響應的波長范圍大,適用于多種環(huán)境中光電神經突觸的模擬。文獻[81]報道了一種對紅外光和可見光有響應的鈣鈦礦光電憶阻器,將該光電憶阻器用于光電神經突觸的模擬,采用紅外光作為憶阻器神經突觸的興奮刺激,采用紅光作為抑制刺激,分別使光電神經突觸的權重逐漸增加或減少。
在利用單一憶阻器模擬實現(xiàn)單個神經突觸的功能模擬之后,研究人員把研究重點放在如何構建高密度的人工神經網絡工作中。憶阻器結構簡單、體積微小,為構建大規(guī)模神經網絡奠定基礎。如圖16所示,憶阻器神經交叉陣列中每個交叉點的憶阻器都代表一個連接前后神經元的突觸結構,其中突觸的權重可以用憶阻器的電導來表示。通過規(guī)?;傻膽涀杵魃窠浘W絡已實現(xiàn)了稀疏編碼[82]、模式識別[83-84]、特征提取[85-86]、數(shù)據(jù)聚類[87]等研究。
稀疏編碼算法是一種無監(jiān)督學習方法,SHERIDAN等[82]利用32×32交叉憶阻器陣列在硬件上實現(xiàn)稀疏編碼算法,該算法可以提取圖像中的學習特征值進而提取隱藏特征,以較少的神經元重建圖像輸出,從而實現(xiàn)自然圖像的稀疏編碼(圖16)。PARK等[88]通過硬件,實現(xiàn)了基于憶阻器的神經網絡HNN( Hardware Neural Network),并用于腦電波(EEG)信號的識別。研究人員首先采集人在想象出和說出不同元音字母(a、i、u)時產生的不同EEG信號,接著在FPGA等設備的協(xié)助下,憶阻器HNN神經網絡對EEG信號進行處理,實現(xiàn)語音信號的識別(圖17)。此外,研究人員還利用憶阻器神經網絡實現(xiàn)了對圖像[89-90]、文字[91-92]等信息的識別和分類。
圖16 憶阻器神經交叉陣列及用于稀疏編碼[82]Figure 16 The memristor neural cross arrays towards sparse coding[82]
圖17 EEG模式識別憶阻器系統(tǒng)[88]Figure 17 The EEG pattern recognition memristor system[88]
憶阻器以其獨特的記憶電學性質,稱為模擬神經突觸的最佳選擇。本文首先總結了不同憶阻器模擬神經突觸的可塑性,包括短時程可塑性(STP)和長時程可塑性(LTP)及STP到LTP的轉換過程、SRDP、STDP,并著重介紹了可塑性的“可塑性”性質(即再可塑性)的模擬,并概述了憶阻器神經突觸的高級應用,如非聯(lián)想學習、聯(lián)想學習以及憶阻器突觸在感知神經系統(tǒng)中的應用;其次總結了憶阻器模擬神經突觸性能的研究情況;最后研究了憶阻器神經交叉網絡在稀疏編碼、模式識別等方面的應用。憶阻器可以很好地模擬神經突觸的各項功能,能和CMOS器件、電子線路、嵌入式系統(tǒng)等組成具有神經形態(tài)的電路系統(tǒng),未來在神經形態(tài)計算、圖像處理、類腦人工智能等方面存在很大的發(fā)展空間。盡管如此,憶阻器模擬神經突觸、構建類腦神經系統(tǒng)仍存在一些問題需要解決,可概括為以下幾個方面:
(1)憶阻器制備技術受限,影響器件的穩(wěn)定性和均一性,使大規(guī)模器件的集成應用受限制?;趹涀杵魃窠浲挥|的神經網絡要求器件陣列具有良好的性能,以提高系統(tǒng)的穩(wěn)定性,但大部分對于憶阻器性能的研究重點集中在單個器件上,對于憶阻器大規(guī)模交叉陣列的穩(wěn)定性、均一性的關注較少[93-94]。目前憶阻器的工作機理還不夠清楚,給憶阻器神經突觸性能增加了更多不確定性。另外,器件組成的神經網絡系統(tǒng)中,漏電流影響集成陣列中器件的性能,使器件之間產生串擾,限制了大規(guī)模集成陣列的應用。目前,解決憶阻器集成陣列中漏電流的方法主要是運用1T1M(One-transistor-one-memristor)結構代替單一憶阻器,或者運用憶阻器和CMOS電路進行集成,這在一定程度上可以解決串擾問題,但會限制系統(tǒng)的集成密度。
(2)憶阻器或憶阻器交叉系統(tǒng)工作功率相對較大,不利于低功耗類腦神經網絡的模擬。生物神經系統(tǒng)中單個突觸的工作能耗約為10 pW,這種超低功耗是神經系統(tǒng)高效工作的保障。通過文獻調研發(fā)現(xiàn),憶阻器神經突觸雖然可以模擬生物突觸的基本功能,但功耗遠大于生物突觸,這是限制憶阻器神經網絡發(fā)展的重要因素。因此制備具有超低工作電壓或電流的憶阻器突觸器件,進而構建超低功耗憶阻器神經網絡,是一項重要的研究方向。
總之,將憶阻器運用到神經突觸模擬進而構建大規(guī)模神經網絡中,還有巨大的開發(fā)空間,隨著憶阻器制備技術的提高和阻變機理研究的深入,憶阻器在仿生系統(tǒng)和類腦神經網絡中所起的作用會越來愈大。