李瑞 徐邦林 周建芳2)? 姜恩華2) 汪秉宏 袁五屆2)?
1) (淮北師范大學(xué)物理與電子信息學(xué)院,淮北 235000)
2) (淮北師范大學(xué),安徽省智能計(jì)算與應(yīng)用重點(diǎn)實(shí)驗(yàn)室,淮北 235000)
3) (中國(guó)科學(xué)技術(shù)大學(xué)近代物理系,合肥 230026)
行為學(xué)研究表明,長(zhǎng)時(shí)間保持覺醒會(huì)對(duì)人的學(xué)習(xí)和記憶產(chǎn)生負(fù)面影響,睡眠則有助于學(xué)習(xí)和記憶的恢復(fù)[1-5].基于一些腦區(qū)的突觸強(qiáng)度變化的實(shí)驗(yàn)結(jié)果[1,6,7],Tononi和Cirelli[5,7]提出了一種可能的“突觸穩(wěn)態(tài)假說”來解釋這種現(xiàn)象.這種假說指出,學(xué)習(xí)導(dǎo)致了覺醒時(shí)突觸強(qiáng)度的凈增加,增加大腦能量消耗的同時(shí)降低了學(xué)習(xí)和記憶的效率;睡眠會(huì)將突觸強(qiáng)度凈減弱到維持能量的基本水平,使學(xué)習(xí)和記憶能力恢復(fù).實(shí)驗(yàn)發(fā)現(xiàn),這種突觸強(qiáng)度變化通常伴隨著神經(jīng)動(dòng)力學(xué)的轉(zhuǎn)變[8-11].覺醒期間突觸強(qiáng)度凈增強(qiáng)伴隨著神經(jīng)電活動(dòng)從強(qiáng)直性(tonic: 有節(jié)奏的單次峰值)發(fā)放到陣發(fā)性(burst: 多次峰值的重復(fù)序列)發(fā)放的轉(zhuǎn)變,睡眠期間突觸強(qiáng)度凈減弱伴隨著從陣發(fā)性發(fā)放到強(qiáng)直性發(fā)放的轉(zhuǎn)變.另外,神經(jīng)元群在覺醒狀態(tài)下主要表現(xiàn)為不同步的強(qiáng)直性發(fā)放,在睡眠時(shí)則主要表現(xiàn)為具有陣發(fā)同步的陣發(fā)性發(fā)放,并進(jìn)而產(chǎn)生慢波活動(dòng)(slow-wave activity,SWA)[9,11,12].神經(jīng)元群的這兩種發(fā)放狀態(tài)并不是覺醒和睡眠的顯著區(qū)別.在覺醒狀態(tài)的后期,也就是疲憊或困倦時(shí),神經(jīng)元群也可以表現(xiàn)為同步的陣發(fā)性發(fā)放[10,12,13];在睡眠狀態(tài)的后期,也就是覺醒之前的淺睡階段或是快速眼動(dòng)睡眠期,一些腦電信號(hào)和功能核磁共振表明神經(jīng)元群也可能表現(xiàn)為不同步的強(qiáng)直性發(fā)放[14,15].因此,神經(jīng)元群在覺醒狀態(tài)下是一個(gè)趨向同步化的過程,由初始不同步的強(qiáng)直性發(fā)放向同步的陣發(fā)性發(fā)放逐漸過渡;睡眠則是一個(gè)去同步的過程,在將突觸強(qiáng)度降低到基準(zhǔn)水平的同時(shí),使具有陣發(fā)性同步的陣發(fā)性發(fā)放恢復(fù)到不同步的強(qiáng)直性發(fā)放.最新的理論研究表明,突觸強(qiáng)度的變化可以導(dǎo)致上述神經(jīng)動(dòng)力學(xué)的強(qiáng)直性和陣發(fā)性發(fā)放的轉(zhuǎn)變,這種動(dòng)力學(xué)的轉(zhuǎn)變?cè)从谕挥|電流的振蕩特性[12,16].
上述實(shí)驗(yàn)和理論上的發(fā)現(xiàn)為行為學(xué)“突觸穩(wěn)態(tài)假說”提供了動(dòng)力學(xué)機(jī)制上的基礎(chǔ),相應(yīng)的理論研究需要建立具體的突觸可塑性機(jī)制.然而,當(dāng)前的這些理論研究?jī)H使用簡(jiǎn)單的線性時(shí)變函數(shù)來模擬突觸強(qiáng)度的變化[12,16],沒有考慮產(chǎn)生這種變化的具體的突觸可塑性機(jī)制.本文旨在建立一種突觸可塑性模型,以實(shí)現(xiàn)覺醒-睡眠周期中自發(fā)調(diào)節(jié)突觸強(qiáng)度的變化,進(jìn)而引起相應(yīng)神經(jīng)動(dòng)力學(xué)的轉(zhuǎn)變.
在神經(jīng)系統(tǒng)中,突觸可塑性分為長(zhǎng)時(shí)程可塑性和短時(shí)程可塑性,每種可塑性都有多種不同的類型[17-19].一些研究者認(rèn)為,一種屬于長(zhǎng)時(shí)程可塑性的發(fā)放時(shí)序相關(guān)可塑性(spike-timing-dependent plasticity,STDP)負(fù)責(zé)大腦的學(xué)習(xí)和記憶功能[19-22],這種可塑性可以引起突觸強(qiáng)度的長(zhǎng)時(shí)程增強(qiáng)(long-term potentiation,LTP)和長(zhǎng)時(shí)程減弱(long-term depression,LTD).一些改進(jìn)的STDP模型也被提出,并用于模擬不同腦區(qū)或不同動(dòng)物物種的實(shí)驗(yàn)觀察結(jié)果[19,21,23,24].近年來,這些STDP模型受到了廣泛的理論關(guān)注,特別是模型引起的神經(jīng)網(wǎng)絡(luò)自組織的突觸權(quán)值(即突觸強(qiáng)度)分布,例如雙峰分布[21]、前向型網(wǎng)絡(luò)分布[22,25]、冪律分布[20,26]等.目前,這些模型及其研究的理論結(jié)果在實(shí)驗(yàn)中得到了廣泛的驗(yàn)證.相關(guān)實(shí)驗(yàn)表明,一些參與突觸可塑性的神經(jīng)遞質(zhì)和神經(jīng)調(diào)質(zhì)在覺醒和睡眠期間發(fā)生改變,包括乙酰膽堿、去甲腎上腺素、皮質(zhì)醇等[2,27].因此,STDP在覺醒和睡眠狀態(tài)下可能具有不同的特定屬性.綜合考慮“突觸穩(wěn)態(tài)假說”及其相關(guān)實(shí)驗(yàn)可以很自然地提出假設(shè): 在覺醒狀態(tài)下,突觸可塑性的LTP起主導(dǎo)作用并進(jìn)而導(dǎo)致突觸強(qiáng)度凈增強(qiáng);在睡眠狀態(tài)下,突觸可塑性的LTD起主導(dǎo)作用并進(jìn)而導(dǎo)致突觸強(qiáng)度凈減弱.本文基于一種突觸權(quán)值依賴的改進(jìn)STDP,提出一種覺醒和睡眠周期中的突觸可塑性模型,在覺醒-睡眠周期中交替改變模型的參數(shù),以實(shí)現(xiàn)覺醒-睡眠周期中突觸強(qiáng)度的變化并進(jìn)而引起相應(yīng)神經(jīng)動(dòng)力學(xué)的轉(zhuǎn)變.研究發(fā)現(xiàn)在長(zhǎng)時(shí)間的覺醒或睡眠后,網(wǎng)絡(luò)的平均突觸權(quán)值將達(dá)到穩(wěn)定值,并且穩(wěn)定后的突觸權(quán)值呈現(xiàn)出穩(wěn)定的真實(shí)神經(jīng)系統(tǒng)中觀察到的對(duì)數(shù)正態(tài)分布.特別地,通過數(shù)值模擬和理論分析,本文深入地研究了這種改進(jìn)的STDP的特定參數(shù)對(duì)穩(wěn)定的平均突觸權(quán)值及突觸權(quán)值分布的影響.
考慮N個(gè)Hindmarsh-Rose (HR)神經(jīng)元[28],這些神經(jīng)元之間以概率p通過興奮性化學(xué)突觸隨機(jī)相互連接,形成一個(gè)Erd?s-Rényi (ER)隨機(jī)網(wǎng)絡(luò)[29].網(wǎng)絡(luò)中,第i個(gè)神經(jīng)元的動(dòng)力學(xué)方程可以表示為
方程中,xi代表神經(jīng)元膜電位,yi和zi分別表示與快電流和慢電流相關(guān)的量,Iext是外部輸入電流.在方程(1)中,g是網(wǎng)絡(luò)的全局耦合強(qiáng)度;反轉(zhuǎn)電位Vs被設(shè)置為2,這意味著對(duì)于所有神經(jīng)元i,在任意時(shí)刻t都滿足Vs>xi,即所有突觸都是興奮性化學(xué)突觸[12].Aij(i≠j) 是網(wǎng)絡(luò)連接矩陣的一個(gè)元素: 如果神經(jīng)元j到神經(jīng)元i之間有突觸連接,則Aij=1,否則Aij=0;Wij(i≠j) 代表相應(yīng)的突觸權(quán)值(在Aij=1 時(shí)),其取值被限定在 [0,1] 之間.每個(gè)初始突觸權(quán)值都隨機(jī)且獨(dú)立地在0—1的范圍內(nèi)選擇,并且受到2.2節(jié)中改進(jìn)的STDP影響;Gj是來源于神經(jīng)元j的化學(xué)突觸耦合函數(shù),每當(dāng)神經(jīng)元j發(fā)放時(shí),Gj增加一個(gè)常量 ΔG,其余時(shí)間,Gj以時(shí)間常數(shù)τ 指數(shù)衰減,即 dGj/dt=-Gj/τ[12,30,31].上述神經(jīng)元?jiǎng)恿W(xué)方程(包括Gj的變化方程)的參數(shù)選擇如下:a=1,b=3,g=0.035,c=1,d=5,e=0.002,q=4,x0=-1.6,ΔG=1,τ=1.這些參數(shù)取值是很多經(jīng)典文獻(xiàn)中常用的,是依據(jù)實(shí)驗(yàn)并能夠很好地模擬出實(shí)驗(yàn)結(jié)果的參數(shù)值[12,13].ER網(wǎng)絡(luò)的參量取為N=100和p=0.2.需要指出的是,下面的結(jié)果并不依賴于N和p的具體取值,本文選擇的N值不太大,是為了減少數(shù)值計(jì)算量.在動(dòng)力學(xué)方程中,調(diào)節(jié)參數(shù)Iext可以使單個(gè)HR神經(jīng)元表現(xiàn)出強(qiáng)直性或陣發(fā)性發(fā)放(詳見文獻(xiàn)[12]中的圖1): 當(dāng)Iext>3.3 時(shí),出現(xiàn)強(qiáng)直性發(fā)放;當(dāng)1.27<Iext<3.3 時(shí),出現(xiàn)陣發(fā)性發(fā)放.本文取Iext=3.6,在該值時(shí)單個(gè)(或無耦合)神經(jīng)元表現(xiàn)出強(qiáng)直性發(fā)放.
原始的STDP模型中,突觸強(qiáng)度的變化由突觸前和突觸后神經(jīng)元發(fā)放的先后順序及其相應(yīng)的時(shí)間間隔值決定.當(dāng)突觸前神經(jīng)元早于突觸后神經(jīng)元發(fā)放時(shí),突觸強(qiáng)度增強(qiáng),反之則突觸強(qiáng)度減弱[32].突觸強(qiáng)度Wij的變化量 ΔWij由以下關(guān)系式給出:
其中,Δtij表示突觸后和突觸前神經(jīng)元發(fā)放的時(shí)間間隔,即突觸后神經(jīng)元發(fā)放的時(shí)刻值減去突觸前神經(jīng)元發(fā)放的時(shí)刻值[21].(4)式中,Δtij≥0 表示突觸前神經(jīng)元發(fā)放早于突觸后神經(jīng)元發(fā)放,表示突觸強(qiáng)度增強(qiáng)(LTP);Δtij<0表示突觸前神經(jīng)元發(fā)放落后于突觸后神經(jīng)元發(fā)放,表示突觸強(qiáng)度減弱(LTD).因?yàn)樯窠?jīng)網(wǎng)絡(luò)中的連接具有隨機(jī)性,使突觸前和突觸后神經(jīng)元的發(fā)放序列變得復(fù)雜.在進(jìn)行數(shù)值模擬時(shí),配對(duì)并計(jì)算所有突觸前和突觸后神經(jīng)元的發(fā)放時(shí)間間隔比較困難.為了解決這個(gè)問題,本文引入變量Pi(t)和Mi(t) 來綜合考慮所有突觸前和突觸后神經(jīng)元之間的影響[21,20].Pi(t)和Mi(t) 分別是以時(shí)間常數(shù)τ+和τ-指數(shù)衰減的函數(shù),滿足dPi(t)/dt=-Pi(t)/τ+,dMi(t)/dt=-Mi(t)/τ-.每當(dāng)神經(jīng)元i發(fā)放時(shí),Pi(t) 增加A+,Mi(t) 減少A-,所有與神經(jīng)元i相連的突觸權(quán)值Wij和Wji根據(jù)如下關(guān)系進(jìn)行更新:
根據(jù)表達(dá)式(5),如果權(quán)值更新使得Wij>1 (或Wji<0),則Wij(或Wji)被取為最大權(quán)值1(或最小權(quán)值0).有研究發(fā)現(xiàn),原始的STDP模型導(dǎo)致突觸權(quán)值呈現(xiàn)雙峰分布,即突觸權(quán)值會(huì)集中在最大權(quán)值1和最小權(quán)值0的附近[21].還有一些不同的實(shí)驗(yàn)結(jié)果表明,在部分腦區(qū)突觸權(quán)值呈現(xiàn)單峰分布.這種單峰分布常被認(rèn)為是更穩(wěn)定、更接近大腦真實(shí)情況的[33].因此,本文借鑒了一種突觸權(quán)值依賴的改進(jìn)STDP模型[33].避免了原始的STDP模型中突觸權(quán)值總是被增強(qiáng)到最大值或減少到最小值附近的問題,并且可以模擬實(shí)驗(yàn)觀察結(jié)果,即在強(qiáng)突觸權(quán)值時(shí)的增強(qiáng)作用較弱.加入這種改進(jìn)的STDP機(jī)制后,突觸權(quán)值的更新關(guān)系式從原來的表達(dá)式(5)變?yōu)?/p>
式中,Pj(t)(cp+νWij) 表示突觸強(qiáng)度的增加量,參量A+,τ+和cp反映突觸強(qiáng)度增強(qiáng)的LTP特性;Mj(t)(cdWji+νWji)表示突觸強(qiáng)度的減小量,參量A-,τ-和cd反映突觸強(qiáng)度減弱的LTD特性.ν是均值為零、標(biāo)準(zhǔn)差為σν的高斯噪聲.該更新關(guān)系式意味著,突觸權(quán)值每次更新量不僅與突觸前和突觸后神經(jīng)元發(fā)放的順序和時(shí)間間隔有關(guān),還受到當(dāng)前突觸強(qiáng)度和噪聲的約束.
基于上述突觸權(quán)值依賴的改進(jìn)STDP,本文提出一種覺醒和睡眠周期中的突觸可塑性模型,在覺醒-睡眠周期中交替改變模型的參數(shù)(包括A+,A-,τ+,τ-,cp和cd),使覺醒狀態(tài)下,突觸可塑性的LTP起主導(dǎo)作用;睡眠狀態(tài)下,突觸可塑性的LTD起主導(dǎo)作用.本文使用步長(zhǎng)為 0.01 的四階龍格-庫(kù)塔法對(duì)神經(jīng)網(wǎng)絡(luò)的動(dòng)力學(xué)方程組進(jìn)行數(shù)值計(jì)算.每個(gè)神經(jīng)元i的初始狀態(tài)值在其動(dòng)力學(xué)穩(wěn)定后的數(shù)值范圍內(nèi)獨(dú)立且隨機(jī)選取,其中xi取值范圍為 (-0.5,1.5),yi為 (-6,0.9),zi為 (3.1,4.2).
在STDP或改進(jìn)的STDP的理論研究中,參數(shù)A+和A-常用于調(diào)節(jié)LTP和LTD的變化量[19].有實(shí)驗(yàn)結(jié)果表明,參與突觸可塑性的一些神經(jīng)遞質(zhì)和神經(jīng)調(diào)質(zhì)的數(shù)量和活性在覺醒和睡眠期間存在明顯的變化,并且在覺醒時(shí)突觸強(qiáng)度變化的幅度很可能大于睡眠時(shí)的變化幅度[34,35].因此在覺醒和睡眠周期中,突觸可塑性模型中的參量值有很大可能也是有規(guī)律地變化,這種參量變化很難用明確的函數(shù)和數(shù)值進(jìn)行描述,模型中的參量A+在覺醒時(shí)很可能大于A-,睡眠時(shí)則相反.在數(shù)值模擬中,為了減少參量的數(shù)量,簡(jiǎn)單地用A+和A-在覺醒-睡眠周期中以較短的時(shí)間相互交換數(shù)值來滿足上述條件(見圖1(a)).值得一提的是,以下的結(jié)果不僅限于A+和A-數(shù)值交換這種方法,只要滿足上述A+和A-在覺醒和睡眠周期中的大小關(guān)系(即覺醒時(shí)A+>A-,睡眠時(shí)A+<A-)就可以得到相同的定性結(jié)果.由圖1(b)和圖1(c)可以看出,突觸可塑性可以誘導(dǎo)覺醒-睡眠周期中的突觸強(qiáng)度變化和神經(jīng)動(dòng)力學(xué)轉(zhuǎn)變: 在覺醒期間,突觸強(qiáng)度凈增強(qiáng),平均突觸權(quán)值增加,導(dǎo)致神經(jīng)電活動(dòng)從強(qiáng)直性發(fā)放轉(zhuǎn)變?yōu)殛嚢l(fā)性發(fā)放;相反,在睡眠期間,突觸強(qiáng)度凈減弱,減小,導(dǎo)致神經(jīng)元由陣發(fā)性發(fā)放恢復(fù)為強(qiáng)直性發(fā)放.
神經(jīng)活動(dòng)的轉(zhuǎn)變經(jīng)常伴隨著網(wǎng)絡(luò)同步性能的變化[12,16].為了探究上述過程中同步的演化,引入一種關(guān)于神經(jīng)元發(fā)放同步的度量方法[36].首先構(gòu)建如下的神經(jīng)元發(fā)放序列: 在當(dāng)前時(shí)刻向前取一個(gè)長(zhǎng)度為T的時(shí)間窗口,并把它分成m個(gè)長(zhǎng)度為ΔT的小時(shí)間段[37];神經(jīng)元i的發(fā)放序列用Bi(n)表 示,n=1,2,···,m(m=T/ΔT),如果神經(jīng)元i在第n個(gè)時(shí)間段內(nèi)有發(fā)放,則令Bi(n)=1,否則Bi(n)=0;在時(shí)間演化過程中,讓所取的時(shí)間窗口以時(shí)間步長(zhǎng) ΔT向后移動(dòng).然后用同步指數(shù)Syn(i,j)表示神經(jīng)元i和j之間的發(fā)放同步度,Syn(i,j)定義如下:
整個(gè)網(wǎng)絡(luò)的同步指數(shù)Syn定義為所有神經(jīng)元對(duì)(i,j) 的同步指數(shù)Syn(i,j) 的平均值.本文選擇參數(shù)T=400和ΔT=10.
接下來對(duì)覺醒-睡眠周期中的突觸強(qiáng)度變化進(jìn)行研究,并比較使用原始STDP ((5)式)和改進(jìn)STDP ((6)式)的模型之間的差異.結(jié)果如圖2(a)所示,在沒有使用權(quán)值依賴的情況下,突觸強(qiáng)度很容易達(dá)到Wmax=1 或Wmin=0 的飽和值.并且隨著覺醒或睡眠時(shí)間的延長(zhǎng),觀察到更多的突觸權(quán)值集中到飽和值附近(見圖2(b)).加入權(quán)值依賴后,突觸強(qiáng)度的變化受到限制,即使在長(zhǎng)時(shí)間的覺醒或睡眠后,突觸權(quán)值也可能遠(yuǎn)離飽和值(見圖2(c)和圖2(d)).并且在長(zhǎng)時(shí)間覺醒或睡眠后,權(quán)值依賴的改進(jìn)STDP會(huì)使網(wǎng)絡(luò)的平均突觸權(quán)值和突觸權(quán)值的分布都達(dá)到一個(gè)穩(wěn)定的狀態(tài)(見圖2(d)).雖然每個(gè)突觸的權(quán)值仍然隨著神經(jīng)元的發(fā)放進(jìn)行更新,但是整個(gè)網(wǎng)絡(luò)中突觸權(quán)值的平均值幾乎保持不變.我們將網(wǎng)絡(luò)達(dá)到穩(wěn)態(tài)時(shí)的平均突觸權(quán)值定義為穩(wěn)定的平均權(quán)值.下面詳細(xì)研究含有權(quán)值依賴的STDP對(duì)穩(wěn)定的平均權(quán)值(見3.2節(jié))以及突觸權(quán)值分布(見3.3節(jié))的影響.
圖2 在一個(gè)覺醒-睡眠周期內(nèi),突觸權(quán)值分布概率密度 P (W,t) 的灰度圖及網(wǎng)絡(luò)平均突觸權(quán)值的變化曲線(實(shí)線) (a),(b)不含有權(quán)值依賴的原始STDP情況;(c),(d)含有權(quán)值依賴的改進(jìn)STDP情況;覺醒睡眠周期設(shè)置為10000 (a),(c) 和40000 (b),(d);垂直虛線表示覺醒和睡眠的交替時(shí)刻Fig.2.Gray-scale plots of probability density P(W,t) for weight distribution and the average synaptic weight (solid line) in the absence of weight dependence (a),(b) and in the presence of weight dependence (c),(d),for the different periods of wakefulnesssleep cycle,10000 (a),(c) and 40000 (b),(d).The vertical dashed lines indicate the moments of exchange between wakefulness and sleep.
圖3 穩(wěn)定的平均突觸權(quán)值 與比值 A+/A- 的函數(shù)關(guān)系 (a) cp=cd=1 固定不變,τ+/τ- 取不同的比值;(b) τ+=τ-=25 固定不變,cp/cd 取不同的比值.參數(shù)選擇如下: A- 在 [0.002,0.01] 的范圍內(nèi)隨機(jī)取值,A+ 的值通過A-乘以相應(yīng)的比值得到;(a)中 τ-=25,τ+ 分別根據(jù)相應(yīng)的比值計(jì)算給出;(b) 中 cp=1,cd 分別根據(jù)相應(yīng)的比值計(jì)算給出.每個(gè)數(shù)據(jù)都是5次獨(dú)立數(shù)值計(jì)算的平均數(shù);為了對(duì)比,在圖(a),(b)中分別用實(shí)線表示=0.5A+/A-,=A+/A- 和=2A+/A- 的線性關(guān)系Fig.3.Stable average weight as a function of A+/A- : (a) At different ratio τ+/τ- and cp=cd=1;(b) at different ratio cp/cd and τ+=τ-=25.Here,A- is given randomly in the range of 0.002 to 0.01,A+ is calculated and given by using the ratio of the corresponding parameter.τ-=25,and τ+ is calculated and given by using the ratios of the corresponding parameter in panel (a).cp=1,and cd is calculated and given by using the ratio of the corresponding parameter in panel (b).Data are averaged over 5 independent realizations.For comparison,the solid lines indicating the linear relations =0.5A+/A-,=A+/A-and =2A+/A- are shown in panels (a) and (b).
圖4 穩(wěn)定的平均突觸權(quán)值 與比值 τ+/τ- 的函數(shù)關(guān)系 (a) cp=cd=1 固定不變,A+/A- 取不同的比值;(b) A+=A-=0.006 固定不變,cp/cd 取不同的比值.參數(shù)選擇如下: τ- 在 [10,75] 的范圍內(nèi)隨機(jī)取值,τ+的值通過 τ- 乘 以相應(yīng)的比值得到;(a)中 A-=0.004,A+ 分別根據(jù)相應(yīng)的比值計(jì)算給出;(b)中 cp=1,cd 分別根據(jù)相應(yīng)的比值計(jì)算給出.每個(gè)數(shù)據(jù)都是5次獨(dú)立數(shù)值計(jì)算的平均數(shù);為了對(duì)比,在圖(a),(b)中分別用實(shí)線表示=0.5τ+/τ-,=τ+/τ- 和=2τ+/τ- 的線性關(guān)系Fig.4.Stable average weight as a function of τ+/τ- : (a) At different ratio A+/A- with with cp=cd=1;(b) at different ratio cp/cd with A+=A-=0.006.τ- is given randomly in the range of 10 to 75,τ+ is calculated and given by using the ratio of the corresponding parameter.A-=0.004,and A+ is calculated and given by using the ratio of the corresponding parameter in panel (a).cp=1,and cd is calculated and given by using the ratio of the corresponding parameter in panel (b).Data are averaged over 5 independent realizations.For comparison,the solid lines indicating the linear relations =0.5τ+/τ-,=τ+/τ-and =2τ+/τ- are shown in panels (a) and (b).
圖5 穩(wěn)定的平均突觸權(quán)值 與比值 cp/cd 的函數(shù)關(guān)系 (a) τ+=τ-=25 固定不變,A+/A- 取不同的比值;(b) A+=A-=0.006 固定不變,τ+/τ- 取不同的比值.參數(shù)選擇如下: cd 在 [0.5,2.5] 的范圍內(nèi)隨機(jī)取值,cp 的值通過 cd 乘以相應(yīng)的比值得到;(a)中A-=0.004,A+ 分別根據(jù)相應(yīng)的比值計(jì)算給出;(b) 中 τ-=25,τ+ 分別根據(jù)相應(yīng)的比值計(jì)算給出.每個(gè)數(shù)據(jù)都是5次獨(dú)立數(shù)值計(jì)算的平均數(shù);為了對(duì)比,在圖(a),(b)中分別用 實(shí)線表示 =0.5cp/cd,=cp/cd 和=2cp/cd 的線性 關(guān)系Fig.5.Stable average weight as a function of cp/cd : (a) At different ratio A+/A- with τ+=τ-=25;(b) at different rations τ+/τ- with A+=A-=0.006.cd is given randomly in the range of 0.5 to 2.5,and cp is calculated and given by using the ratio of the corresponding parameter.A-=0.004,and A+ is calculated and given by using the ratio of the corresponding parameter in panel (a).τ-=25,and τ+ is calculated and given by using the ratio of the corresponding parameter in panel (b).Data are averaged over 5 independent realizations.For comparison,the solid lines indicating the linear relations =0.5cp/cd,=cp/cd and =2cp/cd are shown in panels (a) and (b).
下面對(duì)(8)式進(jìn)行理論分析.
當(dāng)網(wǎng)絡(luò)的平均突觸權(quán)值達(dá)到穩(wěn)定時(shí),意味著網(wǎng)絡(luò)中突觸強(qiáng)度的平均增加量與平均減小量相等.也就是說,表達(dá)式(6)中LTP和LTD部分在網(wǎng)絡(luò)中的平均值相等,即:
如圖1所示,當(dāng)突觸權(quán)值較小時(shí),神經(jīng)元表現(xiàn)出不同步的強(qiáng)直性發(fā)放.相反,當(dāng)存在較大的突觸權(quán)值時(shí),神經(jīng)元雖然表現(xiàn)出同步的陣發(fā)性發(fā)放,但是陣發(fā)性發(fā)放內(nèi)的峰值仍然不同步.因此,網(wǎng)絡(luò)在整個(gè)演化過程中任意的神經(jīng)元i和j的發(fā)放時(shí)間間隔Δtij和Δtji都可以近似地被看作從-∞到 +∞的均勻分布.根據(jù)(4)式可以得到
(10)式是對(duì)穩(wěn)定的平均突觸權(quán)值進(jìn)行理論分析的結(jié)果.當(dāng)A+τ+cp/A-τ-cd<Wmax=1 時(shí),的理論值與數(shù)值模擬得到的結(jié)果((8)式)一致.而當(dāng)A+τ+cp/A-τ-cd≥Wmax=1 時(shí),的模擬結(jié)果總是接近1,小于理論值.這是因?yàn)橥挥|強(qiáng)度Wij存在最大邊界,而在理論分析中未考慮邊界的影響.因此,本文的理論分析結(jié)果與數(shù)值模擬結(jié)果是一致的.
為了進(jìn)一步驗(yàn)證(8)式(或(10)式)是否具有普遍性,令參數(shù)A+,A-,τ+,τ-,cp和cd分別在一定范圍內(nèi)隨機(jī)取值,并進(jìn)行大量的數(shù)值模擬,這些隨機(jī)組合的比值A(chǔ)+τ+cp/A-τ-cd與相應(yīng)的函數(shù)關(guān)系如圖6所示.結(jié)果表明,數(shù)值模擬結(jié)果與(8)式(或(10)式)一致.
圖6 穩(wěn)定的平均突觸權(quán)值 與比值A(chǔ)+τ+cp/A-τ-cd的函數(shù)關(guān)系.其中A+和A- 在 [0.002,0.01]范圍內(nèi)隨機(jī)選取,τ+和τ- 在 [10,75] 范圍內(nèi)隨機(jī)選取,cp和cd 在[0.5,2.5]范圍內(nèi)隨機(jī)選取Fig.6.Stable average weight as a function of A+τ+cp/A-τ-cd.Here,A+ and A- are both chosen randomly in the range of 0.002 to 0.01,τ+ and τ- are both chosen randomly in the range of 10 to 75,and cp and cd are both chosen randomly in the range of 0.5 to 2.5.
一些實(shí)驗(yàn)結(jié)果表明,大腦中某些腦區(qū)的突觸權(quán)值表現(xiàn)為單峰分布[33].特別地,有些腦區(qū)還表現(xiàn)出對(duì)數(shù)正態(tài)分布[39,40].本文對(duì)平均突觸權(quán)值達(dá)到穩(wěn)定值后的突觸權(quán)值分布情況進(jìn)行了研究,結(jié)果如圖7(a)所示.當(dāng)平均突觸權(quán)值達(dá)到穩(wěn)定的時(shí),突觸權(quán)值的概率密度P(W) 呈現(xiàn)出單峰分布.并且對(duì)橫坐標(biāo)W取對(duì)數(shù)后,P(W) 服從一種類似的正態(tài)分布(見圖7(b)),這種分布就是所謂的對(duì)數(shù)正態(tài)分布.在這種分布中,概率密度函數(shù)P(W) 存在一個(gè)最大值(即峰值)Pp,相應(yīng)的突觸權(quán)值Wp可稱為最概然權(quán)值.從圖7可以看出,這種對(duì)數(shù)正態(tài)分布受到突觸可塑性模型中噪聲ν的影響.很顯然,隨著噪聲波動(dòng)(即標(biāo)準(zhǔn)差σν)的增加,權(quán)值分布的范圍變寬.下面詳細(xì)地研究噪聲波動(dòng)對(duì)分布的影響.
圖7 不同σν條件下突觸權(quán)值分布的概率密度P(W)(a) 在線性-線性坐標(biāo)中;(b) 在對(duì)數(shù)-線性坐標(biāo)中.縱向虛線表示不同 σν的相應(yīng)最概然權(quán)值Wp.參數(shù)選擇如下:A+=A-=0.004,τ+=τ-=25,cp=1和cd=2.結(jié)果是20次數(shù)值計(jì)算的平均Fig.7.Probability density P(W) for different σν in linear-linear space (a),and in log-linear space (b).The vertical dashed lines indicate the corresponding most probable weights Wp for different σν.Here,parameters A+=A-=0.004,τ+=τ-=25,cp=1 and cd=2 are given.Results are averaged over 20 realizations.
如圖8(a)和圖8(b)所示,隨著噪聲波動(dòng)(即標(biāo)準(zhǔn)差σν)的增加,權(quán)值分布的最概然權(quán)值Wp及相應(yīng)的最大概率密度Pp都減小.σν的值較小時(shí),穩(wěn)定的平均權(quán)值與(10)式給出的理論值(見圖8(a)中的水平虛線)非常一致.當(dāng)σν增加到一臨界值時(shí),逐漸小于理論值,此時(shí)Pp剛好減小到一個(gè)飽和值.圖8(c)顯示了權(quán)值分布的標(biāo)準(zhǔn)差σW及其變分系數(shù)CV(標(biāo)準(zhǔn)差除以平均值)的變化.結(jié)果發(fā)現(xiàn),σW和CV都隨著σν的增加而增加,表明噪聲波動(dòng)的增加導(dǎo)致了突觸權(quán)值波動(dòng)的增加(即分布范圍變寬).但是,當(dāng)σν增加到上述的臨界值時(shí),σW將增加到一個(gè)飽和值.很顯然,σν存在一個(gè)相同的臨界值(見圖8中σν=6 處的垂直虛線),當(dāng)σν超過該臨界值時(shí),小于理論值,Pp或σW也都減小或增加到一個(gè)飽和值.這是由于當(dāng)σν達(dá)到該臨界值時(shí),部分突觸權(quán)值增加到Wmax而被設(shè)置為最大值1導(dǎo)致的(見圖7中σν=6 時(shí)的曲線).也就是說,這種現(xiàn)象是由權(quán)值的最大邊界引起的.
圖8 穩(wěn)定的突觸權(quán)值分布的各特征量與 σν 的函數(shù)關(guān)系(a) 平均突觸權(quán)值和最概然權(quán)值 Wp;(b) 概率密度峰值 Pp;(c) 突觸權(quán)值的標(biāo)準(zhǔn)差σW和變差系數(shù) CV.為了比較,圖(a) 中水平虛線表示用(10)式計(jì)算的 的理論值;垂直虛線表示 σν 的臨界值.參數(shù)選擇如下:A+=A-=0.004,τ+=τ-=25,cp=1和cd=2.結(jié)果是20次 數(shù)值計(jì)算的平均Fig.8.Characteristic quantities of the stable synaptic weight distribution as a function of σν : (a) The average synaptic weight and the most probable weight Wp;(b) the most probability density Pp;(c) the standard deviation of weight σW and the coefficient of variation CV.For comparison,the theoretical value of in Eq.(10) is shown by using the horizontal dashed line in panel (a).The vertical dashed line denotes the critical σν.Here,parameters A+=A-=0.004,τ+=τ-=25,cp=1 and cd=2 are given.Results are averaged over 20 realizations.
綜上所述,基于權(quán)值依賴的改進(jìn)STDP,本文提出了一種覺醒和睡眠周期中的突觸可塑性模型,通過調(diào)節(jié)覺醒和睡眠周期中該模型參數(shù)A+,A-,τ+,τ-,cp和cd的數(shù)值,只要使覺醒時(shí)A+τ+cp/A-τ-cd的值比睡眠時(shí)大,就可以實(shí)現(xiàn): 覺醒時(shí)突觸強(qiáng)度凈增強(qiáng)及其導(dǎo)致的神經(jīng)動(dòng)力學(xué)從強(qiáng)直性發(fā)放到陣發(fā)性發(fā)放的轉(zhuǎn)變,睡眠時(shí)突觸強(qiáng)度凈減弱及其導(dǎo)致的神經(jīng)動(dòng)力學(xué)從陣發(fā)性發(fā)放到強(qiáng)直性發(fā)放的轉(zhuǎn)變.無論是在長(zhǎng)時(shí)間的覺醒還是睡眠后,本文提出的突觸可塑性所產(chǎn)生的平均突觸權(quán)值都能達(dá)到一個(gè)穩(wěn)定的.通過數(shù)值模擬和理論分析發(fā)現(xiàn),當(dāng)沒有達(dá)到最大的飽和值Wmax=1 時(shí),=A+τ+cp/A-τ-cd,即該值取決于模型中代表LTP和LTD的各參數(shù)乘積的比值.特別地,當(dāng)平均突觸權(quán)值達(dá)到穩(wěn)定的時(shí),突觸權(quán)值的分布呈現(xiàn)出穩(wěn)定的真實(shí)神經(jīng)系統(tǒng)中觀察到的對(duì)數(shù)正態(tài)分布.并且,這種分布受到突觸可塑性模型中噪聲波動(dòng)的影響: 隨著噪聲波動(dòng)的增加,權(quán)值分布的范圍變寬,分布的最概然權(quán)值以及相應(yīng)的最大概率密度均減小.值得一提的是,本文在ER網(wǎng)絡(luò)上得到的上述結(jié)果不依賴于網(wǎng)絡(luò)的類型,例如,在無標(biāo)度網(wǎng)絡(luò)或小世界網(wǎng)絡(luò)上也有相同的結(jié)果.本文的研究結(jié)果可為覺醒-睡眠周期中突觸可塑性及其神經(jīng)元發(fā)放的生理機(jī)制研究提供理論參考,并在睡眠障礙治療或干預(yù)措施的開發(fā)中具有潛在的應(yīng)用價(jià)值.