諶力 熊華明
隨著證券企業(yè)數(shù)字化轉(zhuǎn)型不斷向縱深推進(jìn),保障信息系統(tǒng)穩(wěn)定運行和數(shù)據(jù)安全成為各家券商數(shù)字化轉(zhuǎn)型是否成功的基礎(chǔ)。紅塔證券在進(jìn)行數(shù)據(jù)中心升級和改造時,精心設(shè)計技術(shù)方案來提升業(yè)務(wù)連續(xù)性,同時啟用了高價值的保險服務(wù),服務(wù)包含了財產(chǎn)險、數(shù)據(jù)丟失、業(yè)務(wù)停機(jī)和信息泄露保障。該公司率先使用全行業(yè)內(nèi)首款針對存儲設(shè)備和數(shù)據(jù)服務(wù)的正式保險服務(wù),不僅在技術(shù)層面獲得了更高層次的數(shù)據(jù)可靠性,更從資金和法律的角度,為公司的數(shù)據(jù)與系統(tǒng)安全獲得了更全面、更完善的保障。
作為一家上市券商,紅塔證券自成立以來始終秉承“誠信、創(chuàng)新、多元”的理念,在穩(wěn)健經(jīng)營的基礎(chǔ)上不斷開拓創(chuàng)新,取得了較好的經(jīng)營業(yè)績。目前,已逐漸發(fā)展成為制度體系完善、風(fēng)險管理嚴(yán)密、財務(wù)指標(biāo)健康、資產(chǎn)質(zhì)量良好的特色證券經(jīng)營機(jī)構(gòu),也是業(yè)內(nèi)為數(shù)不多的連續(xù)10多年實現(xiàn)盈利的券商之一。紅塔證券信息系統(tǒng)建設(shè)如何支撐業(yè)務(wù)增長?在數(shù)字化轉(zhuǎn)型方面有哪些優(yōu)秀實踐?記者采訪了紅塔證券股份有限公司的專責(zé)人士。
以提高業(yè)務(wù)連續(xù)性為目標(biāo)升級基礎(chǔ)架構(gòu)
紅塔證券經(jīng)營的業(yè)務(wù)品種齊全。公司早在2012年就選擇了虛擬化這種更加敏捷的部署方式,建立起了公司信息系統(tǒng)整個技術(shù)架構(gòu)。隨著業(yè)務(wù)越上越多,原有架構(gòu)難以滿足新的形勢任務(wù)需求,2019年公司對整個信息系統(tǒng)基礎(chǔ)架構(gòu)進(jìn)行了調(diào)整。
“證券行業(yè)相比于其他行業(yè)來說,對業(yè)務(wù)連續(xù)性的要求非常高,按中國證監(jiān)會的要求,券商的核心業(yè)務(wù)不得中斷超過五分鐘,一旦中斷必須在五分鐘之內(nèi)恢復(fù)?!奔t塔證券專業(yè)人士接受記者采訪時說,這是一個監(jiān)管上的強(qiáng)制性要求,也是他們進(jìn)行技術(shù)架構(gòu)升級、改造的出發(fā)點和目標(biāo)。
紅塔證券主動適應(yīng)嚴(yán)格的監(jiān)管要求,對原有的體系架構(gòu)進(jìn)行拆分,把原來單一的大計算資源池,按照多節(jié)點多活的方式,拆成了多個小型計算資源池,并采用多跑道設(shè)計,確保在任何一個節(jié)點出現(xiàn)問題的時候,可以迅速切換到多活的第二或者第三個節(jié)點上。為了安全起見,紅塔證券還在昆明建了一個災(zāi)備機(jī)房,以私有云和多活的方式,在主機(jī)房、災(zāi)備機(jī)房中做了同樣的兩個資源池,如果主機(jī)房發(fā)生異常情況,很短時間內(nèi)就可以切到災(zāi)備機(jī)房里面。除了數(shù)據(jù)庫之外,其他資源是靈活的方式,保證在任何一邊切換的時候,只要切掉數(shù)據(jù)庫,其他資源就自動接進(jìn)。
調(diào)整后的架構(gòu)都是基于監(jiān)管規(guī)則設(shè)計的,包括應(yīng)用中間件全部是多活方式,全部在集群里,運行環(huán)境相對簡單。紅塔證券一些最核心的生產(chǎn)系統(tǒng),比如滬深交易和融資融券,通過多活的方式將幾個集群搭起來,同時在災(zāi)備機(jī)房也建了一個相同的集群,以滿足隨時切換的需要。數(shù)據(jù)架構(gòu)同時配套基礎(chǔ)架構(gòu)調(diào)整做了新的設(shè)計,通過數(shù)據(jù)庫的多活機(jī)制產(chǎn)生了非常多的副本,任何一個地方一旦出問題,其他地方可以快速地響應(yīng)。為了提高切換效率,紅塔證券在主要的集群里都采用單機(jī)的方式,因為利用集群的時候,單一應(yīng)用跑在一個單機(jī)上其實效率更高。集群技術(shù)的單節(jié)點也在集群上跑,如果單機(jī)出現(xiàn)問題就能夠以最快的方式在集群上切換,因為單機(jī)最大的好處就是故障特別明確,出問題后立刻可以切到第二個集群或第三個集群,后面這兩個集群相當(dāng)于多應(yīng)用跑在上面。
紅塔證券在基礎(chǔ)架構(gòu)調(diào)整時沒有使用超融合技術(shù),而是選擇對虛擬化技術(shù)進(jìn)行升級優(yōu)化,專業(yè)人士表示一方面是基于性價比,這樣做避免了通過硬件采購方式重新構(gòu)建系統(tǒng),解決了效率不高、時間流程長的問題。從敏捷部署的角度講,他們更看中虛擬化或私有云,對公司業(yè)務(wù)拓展更有利。
運用保險增值服務(wù)對沖風(fēng)險
作為數(shù)據(jù)的承載者,核心存儲系統(tǒng)容易受到包括災(zāi)害事故、人為因素在內(nèi)多方面的可靠性挑戰(zhàn),面臨包括系統(tǒng)宕機(jī)、數(shù)據(jù)丟失和信息泄露等風(fēng)險。這些風(fēng)險一旦發(fā)生,將給企業(yè)帶來不可估量的經(jīng)濟(jì)損失。
“紫光旗下新華三集團(tuán)聯(lián)合誠泰保險及中國人保推出的IT保險產(chǎn)品,讓我們對新華三的存儲產(chǎn)品使用更放心?!痹搶I(yè)人士告訴記者,新華三的存儲設(shè)備有更多的增值服務(wù),堅定了他們的最終選擇。這款I(lǐng)T保險產(chǎn)品的產(chǎn)生過程,其實就是一個存儲產(chǎn)品風(fēng)險嚴(yán)格評估的過程。人保云南分公司創(chuàng)新實驗室為開發(fā)IT保險產(chǎn)品,與新華三展開合作,收集了大量存儲設(shè)備數(shù)據(jù),通過分析數(shù)據(jù)丟失、停機(jī)事故發(fā)生概率和平均故障率,經(jīng)過一系列評估后最終做了一個試點,推出了這款基于數(shù)據(jù)的保險產(chǎn)品,涵蓋的內(nèi)容主要包括:一是用戶發(fā)生停機(jī),超過一定時間就會給客戶相應(yīng)的補(bǔ)償;二是數(shù)據(jù)丟失,根據(jù)丟失數(shù)據(jù)的多少給用戶相應(yīng)的補(bǔ)償;三是信息泄密,也會給用戶相應(yīng)的補(bǔ)償;四是針對以上情形所帶來的部分附帶經(jīng)濟(jì)損失,如訴訟費、通知費、公告費等。
雖然紅塔證券調(diào)整后的整體架構(gòu)非常穩(wěn)定,切換也非??欤珡娜謥砜矗热缯f主機(jī)房要切災(zāi)備機(jī)房,中間依然還會有一個時間差,還是會產(chǎn)生比如數(shù)據(jù)上或者交易上某個時間點,即RPO和RTO概念的一點點丟失。公司通過科學(xué)測試得知,切換機(jī)房的情況下,任務(wù)切換時間是2分14秒,丟失的委托訂單在一個極限的情況下不超過10筆。如果出現(xiàn)這樣的情況,與這10筆交易相關(guān)聯(lián)的數(shù)據(jù)丟失可能產(chǎn)生的財務(wù)損失需要賠償,保險的價值就體現(xiàn)出來了。
損失賠償在證券行業(yè)是很少發(fā)生的個別情況,紅塔證券堅持用戶至上的服務(wù)理念,只要有發(fā)生的可能,就要把所有風(fēng)險都考慮周全,這也是該公司成為新華三集團(tuán)存儲設(shè)備保險產(chǎn)品第一個用戶的原因。
“有了這份保險托底,無論是對產(chǎn)品本身的信任,還是對客戶的保障,我們都更有信心?!?該專業(yè)人士說,完全依賴于簡單的設(shè)備或者一個數(shù)據(jù)的保險想把證券公司信息系統(tǒng)的風(fēng)險全部覆蓋掉也是不可能的,他們已通過體系架構(gòu)避免大規(guī)模風(fēng)險出現(xiàn)的可能,如果真有小概率的賠償發(fā)生,就可以用這個補(bǔ)償機(jī)制來對沖風(fēng)險。
借助智能平臺感知運維態(tài)勢
紅塔證券在原有技術(shù)架構(gòu)基礎(chǔ)上構(gòu)建新的系統(tǒng)架構(gòu),因為要考慮新舊各種因素,這個系統(tǒng)架構(gòu)也就變得非常復(fù)雜,單純依靠人工運維,不僅成本高昂,發(fā)生問題的風(fēng)險也會升高。公司一方面攜手新華三集團(tuán)研究開發(fā)態(tài)勢感知監(jiān)控系統(tǒng),對存儲設(shè)備、服務(wù)器和網(wǎng)絡(luò)、軟件運維狀態(tài)全部實現(xiàn)實時感知,一方面引進(jìn)新華三的Primera,將產(chǎn)品運行情況納入InfoSight智能管理平臺中,享受端到端的數(shù)字化服務(wù)。
“Primera的著眼點主要是兩方面,一是穩(wěn)定性比原來更高,我們現(xiàn)在可以保證提供100%的數(shù)據(jù)可靠性,二是適應(yīng)自動化運維的潮流,不必專門增加存儲管理人員?!?新華三集團(tuán)存儲產(chǎn)品總監(jiān)張穎向記者介紹,只要存儲系統(tǒng)開啟InfoSight智能管理平臺,就能實現(xiàn)自動化、智能化運維,即使用戶將來在存儲設(shè)備增加的情況下,也不用專門增加管理人員。
紅塔證券存儲系統(tǒng)搭載的這套智能管理平臺具有下面幾個功能:
第一,預(yù)防故障的發(fā)生。以往都是被動地響應(yīng)故障,故障發(fā)生以后,一線、二線、三線的工程師去解決這個問題。而InfoSight平臺通過人工智能的學(xué)習(xí),只要以往發(fā)生過這種情況,智能管理平臺就可以智能地預(yù)判會發(fā)生什么樣的故障,從而在故障發(fā)生之前幫助客戶把問題解決掉。
第二,可以預(yù)測容量和性能。很多時候用戶出現(xiàn)的問題,是他們對存儲容量和性能的整體預(yù)判不夠,存儲滿了會發(fā)生問題,系統(tǒng)性能不夠也會發(fā)生問題,通過人工智能的運算可以預(yù)判多長時間以后整個容量或者系統(tǒng)的性能達(dá)到飽和,提前提醒用戶去做相應(yīng)的調(diào)整,不管是采購還是平衡到其他機(jī)器上面去。
第三,可以做到感知應(yīng)用端。如果沒有應(yīng)用端感知的話,應(yīng)用端發(fā)生的問題存儲端往往是不知道的,但有人工智能端到端打通了以后,就可以更好地為應(yīng)用服務(wù),讓用戶能更好地去管理存儲,用更少的人去管理存儲。
“要確保系統(tǒng)架構(gòu)安全和數(shù)據(jù)的高度可靠,除了進(jìn)行人工智能運維外,我們還會及時升級軟件版本,積極改進(jìn)硬件設(shè)備,持續(xù)不斷為系統(tǒng)的可靠性做努力?!?該專業(yè)人士告訴記者,證券市場業(yè)務(wù)創(chuàng)新快、業(yè)務(wù)種類多、業(yè)務(wù)流程長,如果科技創(chuàng)新步伐跟不上業(yè)務(wù)創(chuàng)新的步伐,將會制約企業(yè)的進(jìn)一步發(fā)展。今后公司將積極適應(yīng)業(yè)務(wù)發(fā)展需要,不斷采購或升級一些穩(wěn)定性更高的產(chǎn)品,為公司業(yè)務(wù)創(chuàng)新提供技術(shù)支撐。同時,也會依據(jù)中國證監(jiān)會關(guān)于數(shù)據(jù)治理要求,形成數(shù)據(jù)治理和數(shù)字挖掘的公司標(biāo)準(zhǔn),合法合規(guī)地進(jìn)行大數(shù)據(jù)分析,了解客戶的交易偏好和交易風(fēng)險承受能力,滿足客戶的偏好一些條件,為客戶提供更準(zhǔn)確優(yōu)質(zhì)的服務(wù)。