史庭祥 中興通訊公司核心網(wǎng)產(chǎn)品規(guī)劃工程師
?
博弈論在信令網(wǎng)路由管理的應用研究
史庭祥中興通訊公司核心網(wǎng)產(chǎn)品規(guī)劃工程師
摘要:7號信令網(wǎng)的消息傳輸層(MTP3)或Sigtran的MTP3適配層(M3UA)有著一套獨特的路由管理方法。然而,在由眾多網(wǎng)元組成的復雜網(wǎng)絡中,應用層消息(MAP、ISUP、BICC等)往往無法得到足夠可靠的傳遞,究其原因是MTP3/M3UA等消息傳輸控制不面向業(yè)務,而是按照固有的一套路由協(xié)議管理來實現(xiàn)。因此,本文試圖采用博弈論的決策方法解決在路由可靠未知情況下的路由選擇。
關鍵詞:信令網(wǎng);博弈論;路由管理
電信網(wǎng)經(jīng)過多年的發(fā)展,經(jīng)歷了從固定到移動、“集中分散控制”逐步到“軟交換”為核心的承載和控制分離模式的轉變,但基本的消息傳遞路由方式未變。這種路由方式不面向業(yè)務,而遵循網(wǎng)絡層路由協(xié)議控制信令路由。具體的說,只要沒有網(wǎng)絡層的路由更改信令或者沒有修改路由配置,網(wǎng)絡層就不會改變原有的路由選擇。
由此帶來危害的例子有,某年北京某HSTP局出現(xiàn)長時間攤局,和部分連接的網(wǎng)元之間的路由正常、MTP層無任何的路由錯誤,由于采用GT路由方式,連接的網(wǎng)元仍然繼續(xù)通過此H局轉發(fā)消息,而故障的H局無法正常處理,消息像被丟棄一樣,由此造成幾乎一半左右的通訊失敗,相關設備廠商不得不現(xiàn)場手工閉塞到故障H局的鏈路,才恢復信令網(wǎng)通訊。又如一例,某年上海移動,某設備和兩個T局的路由配置不一致,任一T局都不配置到另一T局的路由,部分呼叫響應信令無法返回目的T局,使得部分中繼電路狀態(tài)未知且無法提供服務。
2.1原因分析
上文兩例的表面原因都是信令系統(tǒng)無法動態(tài)調整路由,但是其深層原因或者說本質是什么呢?試想,故障一般是這樣發(fā)生的:若X號鏈路發(fā)送消息,對端處理有問題。當信令應用層發(fā)送消息按照負荷分擔原則選擇到X號鏈路,結果沒有響應回來。而信令傳輸層不面向業(yè)務,它的功能是把消息按照要求的X號鏈路發(fā)送出去,至于這條消息是否真的發(fā)送到了目的地,是否還有響應消息返回,它完全不關心。而應用層只知道沒有響應消息回來,如果有失敗消息機制,那也只能判斷到或者請求消息沒有發(fā)送目的地,或者響應消息沒有發(fā)回來,至于具體原因則無法確定。一次失敗不是大故障,而危害在于,當再次根據(jù)負荷分擔原則選擇到X號鏈路時,失敗或許將再次發(fā)生。
分析可知,深層原因有兩個方面:信令傳輸層只受基本的業(yè)務控制而業(yè)務層不知如何進一步控制傳輸。業(yè)務層(如7號信令ISUP)目前只能通過協(xié)議字段“鏈路選擇碼”(SLS)來控制傳輸,控制的方法是實現(xiàn)在話路和信令鏈路之間的負荷分擔控制,比如由CIC的后4位得到SLS(0~15),然后在消息目的信令點的動態(tài)路由表中尋找SLS對應的鏈路。鑒于動態(tài)變化的信令路由和復雜的信令網(wǎng)結構,僅僅通過SLS控制傳輸,業(yè)務層無法知道真正可靠的鏈路對應的SLS,傳輸層也不知道哪條鏈路傳輸業(yè)務消息可靠。
2.2問題歸納和深入
在業(yè)務層已知某次X號鏈路發(fā)送消息沒響應的前提下,該如何決策?具體說,當再次選擇到這條鏈路時還用嗎?如果不用,何時再啟用?如果用,該怎么用?
當然,首先對Y業(yè)務層(Y可以是ISUP、TCAP等)發(fā)送消息沒響應的X號鏈路進行記錄,在動態(tài)路由表中做標記,當再次有或沒有響應時要更新標記。然而,下一步該如何處理是不得不面對的難題。初次使用動態(tài)路由表時,可以認為每條鏈路都能可靠地傳遞消息到任何目的信令點,但是,當路由表中某條或某幾條鏈路對于某業(yè)務出現(xiàn)問題(沒響應)時,路由表該如何調整值得思考。
2.3博弈論和囚徒困境
某條鏈路發(fā)送某業(yè)務消息沒響應后,當按照原有路由規(guī)則再次選擇到這條鏈路時,容易陷入兩難境地,選擇的話再失敗怎么辦?下次也失敗了呢?如果不考慮失敗,就可能回到以前的故障,這顯然不能接受。不選擇又如何?畢竟信令網(wǎng)動態(tài)變化,前一次失敗不等于下一次仍然失敗,總有恢復的一天吧,如果不再選擇,不是在浪費網(wǎng)絡資源嗎?當然可以選擇一種調整辦法,比如停止選擇一次這條鏈路,但這是最佳的辦法嗎?顯然不是,然而這樣的困境,讓筆者恰恰想到博弈論的經(jīng)典案例“囚徒困境”,因為人們同樣無法預知未來。
“囚徒困境”說的是這樣的故事:有兩個合伙的囚犯,被分開且無法互通信息的接受審訊。如果兩人都不招供的話,都會被無罪釋放。但警察給的條件非?!敖苹?,如果招供同伙,會被無罪釋放,且得到一筆獎金,而同伙會重罪懲罰,且被罰款作為對告發(fā)者的獎金。而兩人都招供對方,則雙雙重罪,沒有獎賞??梢哉f,是選擇合作還是背叛,囚犯要做博弈游戲。之所以許多經(jīng)濟學問題都被化解為博弈模型,博弈中恰恰含有經(jīng)濟問題,囚犯何嘗考慮的不是涉及自身資源配置的經(jīng)濟問題呢?對單個囚犯而言,若選擇合作,可能的好處是獲得釋放,可能帶來的風險是重罪和一筆罰金;而選擇背叛,可能好處是獲得釋放和一筆獎賞,災難就是重罪、不會有罰金。只要稍有智商的囚犯,就會懂得兩利取其大、兩害取其小的道理,那么,選擇背叛簡直就是必然事件。在無法預知對方的情況下,兩個囚犯不得不選擇兩敗俱傷——對兩人而言,得到最壞的結果。
一遍這樣的游戲,和本文面對的難題關系不大,可當被美國的一位教授擴展到若干遍,成為“重復的囚徒困境”時,就和上述的問題很相似了,并有可能出現(xiàn)災難性結果。在同伙上次選擇合作或背叛后,這次囚犯該如何選擇?當這條鏈路上次有或沒有響應后,這次路由該如何調整?同樣,任何一次,囚犯都要選擇是合作還是背叛,而要選擇是使用某條鏈路還是放棄,問題的確非常類似。從兩者的目標看,無論一遍還是重復多次的“囚徒困境”游戲,其目標都是最大程度降低兩個同伙作為整體的損失,避免都判重罪,盡可能實現(xiàn)囚徒合作,這屬于整體目標;而本文面對的難題也是實現(xiàn)資源共享和最大化占用率,也就是盡可能的分擔負荷,不光考慮單條鏈路的使用,也屬于整個資源的目標。因此,兩者目標上也有相似性。于是,使用博弈論的研究成果作為本文的研究手段和方法,或許可以成為最佳決策。
3.1博弈論研究成果的應用
經(jīng)過若干次“重復囚徒困境”的計算機程序競賽,有一種策略總是取得勝利,那就是“一報還一報”。這樣的策略,總以合作開頭,永遠不首先背叛對方,當對方背叛自己,下輪將背叛對方,作為懲罰;而只要上輪對方合作的話,本輪就會以“合作”作為回報。簡單歸納是“好人”的策略:善意、寬容、強硬、簡單明了。這是一種合作機制在個體的體現(xiàn)。
回到本文的問題,剛開始可以認為通過SLS為某種業(yè)務選擇的任一鏈路都是可靠的,即首先是合作的態(tài)度。當某次X號鏈路承載Y業(yè)務沒響應時,可以認為X號鏈路背叛了Y業(yè)務,根據(jù)博弈論的結論,下次需要懲罰這條鏈路,也就是即使由SLS選擇X號鏈路,也不使用。但這里和“囚徒困境”不同的是,我們一旦不使用X號鏈路,就無法知道它以后是否還合作,因此,需要引入“置疑空間”概念,即不使用這條鏈路的時間或次數(shù),也是對“懲罰”的延伸。“一報還一報”策略下,對方背叛后,就會一直采取“背叛”,直到對方“合作”為止,而隨著失敗次數(shù)的增加,可不斷增加“置疑空間”,這算是強硬的,然而只要出現(xiàn)一次成功,就取消“置疑空間”,這算是善意的。
3.2具體應用介紹
如業(yè)務消息為ISUP消息,MTP3作為消息傳輸層。數(shù)據(jù)庫DB除一張動態(tài)路由表外,還要建立關于ISUP的信令動態(tài)路由表、并提供給ISUP每條鏈路的“置疑空間”初始值T。ISUP以時間為“置疑空間”量度,ISUP使用ISUP動態(tài)路由表,不是7號動態(tài)路由表。以3條鏈路的路由為例,鏈路號分別是X、Y、Z。起初ISUP動態(tài)路由表同于7號動態(tài)路由表,具體如下:
X Z Y Y Z X Z X Y Y X Z X Z Y Y
當X號鏈路沒響應時,ISUP通知DB修改ISUP動態(tài)路由表,刪除X號鏈路,更新ISUP動態(tài)路由表,此時ISUP動態(tài)路由表不同于7號動態(tài)路由表,具體如下:
Z Z Y Y Z Y Z Z Y Y Y Z Z Z Y Y
啟動關于X號鏈路的定時器,時長取DB保存的“置疑空間”初始值T,然后,更新DB的“置疑空間”累乘2,即T變成2T。當定時器超時后,恢復X號鏈路使用,根據(jù)7號動態(tài)路由表恢復ISUP動態(tài)路由表。當X號鏈路再次沒響應時,同樣刪除X號鏈路,更新ISUP動態(tài)路由表,啟動關于X號鏈路的定時器,時長取DB保存的2T,然后更新DB的“置疑空間”累乘2,即2T變成4T。當定時器第二次超時后,恢復X號鏈路使用,根據(jù)7號動態(tài)路由表恢復ISUP動態(tài)路由表。依次類推,直到X號鏈路有響應時,直接更新DB的“置疑空間”為T。
需要注意的是,ISUP的動態(tài)路由表要以7號動態(tài)路由表為基礎,即不僅要接受MTP3的更新要求,還要接受ISUP的更新請求。當然,實際操作時,“置疑空間”可針對鏈路組來設計、更新路由也針對鏈路組來進行可能更為合理。
系統(tǒng)實際工作時,當某條鏈路或某個鏈路組連接的局向出現(xiàn)“異?!睍r,無需經(jīng)過太多次的試探使用,相應的鏈路或鏈路組就會得到非常重的“懲罰”——非常長的時間才被再試探使用一次,幾乎不再被使用。
“置疑空間”的初始值大小,決定系統(tǒng)對“異常”的反應速度,結合設定合適的“置疑空間”上限值,可以提高對“異?!被謴偷捻憫俣?。
本文針對信令網(wǎng),尤其是7號信令網(wǎng)MTP3或Sigtran協(xié)議的M3UA,提出的面向業(yè)務、路由可靠未知情況下的路由選擇策略具有通用性,將有益于完善未來包括2/3/4G通信系統(tǒng)在內的信令路由策略。隨其不斷完善,可適當引入“自適應”思想,未來向動態(tài)路由自適應方向發(fā)展。
參考文獻
[1]唐武軍.計算機通信網(wǎng)中路由問題的博弈論解決方案[J].中國新通信,2014,08.
[2]史庭祥.一種應用層可控的七號信令動態(tài)路由選擇方法[P].中國: 200610167840,2006,12.
[3]王春永.博弈論的詭計第一版[M].中國發(fā)展出版社,2007,01.
[4]MoCain,R.博弈論概略[OL]. http://www.docin.com/app/p?id=105737847.
[5]Wiki.囚徒困境[OL]. http://wiki.mbalib.com/wiki/%E5% 9B%9A%E5%BE%92%E5%9B%B0%E5%A2%83.
[6]ITU-T Q.704E: Signaling Network Functions and Messages. [7]ITU-T Q.764: Signaling System No.7 - ISDN User Part Signaling Procedures.
Research on route management of signaling network by means of game theory
Shi Tingxiang
Abstract:There is unique mechanism of route management applied in SS7-MTP3 and Sigtran-M3UA protocol layer, but it's not enough to fully sustain reliable transmission through this layer for application protocol layer, such as MAP,ISUP, BICC and etc. It is known that message transfer function of MTP3, M3UA in signaling network is not applicationoriented,but compliant with a pre- defined route management protocol. Therefore, decision- making methodology by means of game theory is introduced on route selection in condition of indefinite reliability of signaling route.
Key words:signaling network; game theory; route management
收稿日期:(2016-12-24)