摘要:在現(xiàn)如今的數(shù)字經(jīng)濟(jì)時代背景下,以互聯(lián)網(wǎng)金融為代表的金融服務(wù)渠道使得金融機(jī)構(gòu)為終端客戶所提供的服務(wù)場景以及服務(wù)模式得以大力開拓和有效創(chuàng)新。鑒于此,本文緊密圍繞農(nóng)信業(yè)務(wù),基于項目建設(shè)方視角,重點針對互聯(lián)網(wǎng)金融云平臺建設(shè)和同城容災(zāi)規(guī)劃進(jìn)行深入探討,從而為農(nóng)信社互聯(lián)網(wǎng)金融業(yè)務(wù)核心系統(tǒng)基礎(chǔ)架構(gòu)建設(shè)提供技術(shù)指引和實踐指導(dǎo),致力于加速推進(jìn)我國農(nóng)村金融機(jī)構(gòu)的互聯(lián)網(wǎng)金融轉(zhuǎn)型升級。
關(guān)鍵詞:農(nóng)信社;互聯(lián)網(wǎng)金融云平臺;同城容災(zāi)規(guī)劃
中圖分類號:F23文獻(xiàn)標(biāo)識碼:Adoi:10.19311/j.cnki.16723198.2024.20.051
依據(jù)中國人民銀行等十部委聯(lián)合發(fā)布的《關(guān)于促進(jìn)互聯(lián)網(wǎng)金融健康發(fā)展的指導(dǎo)意見》,廣東農(nóng)信、四川農(nóng)信和湖南農(nóng)信等農(nóng)村金融機(jī)構(gòu)紛紛與阿里巴巴等互聯(lián)網(wǎng)科技公司針對互聯(lián)網(wǎng)金融業(yè)務(wù)核心系統(tǒng)規(guī)劃與建設(shè)開展深度合作,為傳統(tǒng)農(nóng)信社向互聯(lián)網(wǎng)金融轉(zhuǎn)型升級樹立了標(biāo)桿與典范。互聯(lián)網(wǎng)金融業(yè)務(wù)核心系統(tǒng)屬于復(fù)雜信息系統(tǒng)項目,其特征主要表現(xiàn)為投資規(guī)模大、建設(shè)周期長且風(fēng)險大。云平臺規(guī)劃和同城容災(zāi)規(guī)劃是互聯(lián)網(wǎng)金融業(yè)務(wù)核心系統(tǒng)基礎(chǔ)架構(gòu)建設(shè)的重難點。
1云平臺規(guī)劃
互聯(lián)網(wǎng)金融云平臺,是指基于云技術(shù)與金融業(yè)務(wù)的全面整合,通過統(tǒng)一的數(shù)據(jù)存儲、數(shù)據(jù)計算和數(shù)據(jù)處理,為金融機(jī)構(gòu)和終端客戶提供金融服務(wù)解決方案。
1.1&LUNqs5e+ESZgdx+btFpAFA==nbsp;基礎(chǔ)架構(gòu)規(guī)劃
互聯(lián)網(wǎng)金融云平臺基礎(chǔ)架構(gòu)主要包括基礎(chǔ)云平臺服務(wù)、PaaS組件服務(wù)、分布式應(yīng)用管理、移動開發(fā)平臺、DevOPS平臺與云管平臺?;A(chǔ)云平臺服務(wù)分為云底座和IaaS服務(wù),云底座為云平臺提供編排管控,是云平臺的核心組件模塊,基于云底座的基礎(chǔ)組件能力,構(gòu)建IaaS層以提供多項基礎(chǔ)IaaS服務(wù);PaaS組件服務(wù)包含了各類分布式開發(fā)架構(gòu)的技術(shù)服務(wù)組件,用于支撐平臺設(shè)計與開發(fā)。運營平臺主要圍繞云產(chǎn)品能力構(gòu)建出一套運行管理機(jī)制和技術(shù)體系,云能力和運營技術(shù)為重點關(guān)注內(nèi)容。云管平臺為一站式管理中心,可支持多種不同業(yè)務(wù)類型的自助服務(wù),簡化了物理資源和虛擬資源的管理和部署,幫助農(nóng)信社快速建立簡潔高效的互聯(lián)網(wǎng)金融業(yè)務(wù)系統(tǒng),降低運維成本,構(gòu)建以云計算為基礎(chǔ)的全新生態(tài)鏈。
1.2部署架構(gòu)規(guī)劃
按照需求獨立兩朵云劃分可用區(qū),涵蓋開發(fā)測試云、生產(chǎn)環(huán)境以及同城數(shù)據(jù)庫3個可用區(qū),為金融業(yè)務(wù)上云提供完善的云計算基礎(chǔ)設(shè)施能力。開發(fā)測試云為各個研發(fā)測試團(tuán)隊提供基礎(chǔ)網(wǎng)絡(luò)資源和服務(wù);生產(chǎn)同城云用于部署和運行農(nóng)信業(yè)務(wù),以A數(shù)據(jù)中心為主節(jié)點規(guī)劃部署生產(chǎn)可用區(qū),在B數(shù)據(jù)中心規(guī)劃部署同城備可用區(qū),同時在B數(shù)據(jù)中心規(guī)劃部署分布式數(shù)據(jù)庫與RDS數(shù)據(jù)庫第三可用區(qū),由此形成一同城兩中心三可用區(qū)的生產(chǎn)云平臺。
1.3網(wǎng)絡(luò)架構(gòu)規(guī)劃
基于部署架構(gòu)規(guī)劃,將分布式云平臺劃分為若干個邏輯獨立的物理網(wǎng)絡(luò)集群,每個物理集群對應(yīng)一個AZ,多個集群間通過物理專線或邏輯專線連接組成多AZ或多region的大型云網(wǎng)絡(luò)架構(gòu)。采用CLOS方式構(gòu)建各個物理集群,依據(jù)實際網(wǎng)絡(luò)接入規(guī)模,自由定制網(wǎng)絡(luò)轉(zhuǎn)發(fā)平面數(shù)量并逐層迭代。將生產(chǎn)云平臺三個可用區(qū)進(jìn)行兩兩對接,通過波分設(shè)備或?qū)>€設(shè)備實現(xiàn)數(shù)據(jù)同步與管理互聯(lián),組建成統(tǒng)一的一朵云對外提供服務(wù),開發(fā)云獨立部署,業(yè)務(wù)在云內(nèi)互通,兩朵云通過邊界安全設(shè)備對接互聯(lián)網(wǎng)、外聯(lián)網(wǎng)和生產(chǎn)內(nèi)網(wǎng),為應(yīng)用業(yè)務(wù)互聯(lián)、運維管控、農(nóng)信社以及外聯(lián)單位接入提供互聯(lián)基礎(chǔ)條件。
1.4PoD設(shè)計規(guī)劃
通常情況下,數(shù)據(jù)中心建設(shè)以標(biāo)準(zhǔn)自定義的PoD(PointofDelivery)作為建設(shè)單元,PoD內(nèi)部的物理機(jī)、網(wǎng)絡(luò)虛擬化池與存儲集群節(jié)點無差別部署在不同機(jī)柜,以實現(xiàn)PoD內(nèi)供電—組件—鏈路—設(shè)備節(jié)點多級容錯。分布式專有云基于標(biāo)準(zhǔn)PoD架構(gòu)進(jìn)行進(jìn)一步強化,服務(wù)器可基于云平臺的系統(tǒng)規(guī)劃能力,在所有PoD節(jié)點實現(xiàn)無差別接入。
1.5高可用設(shè)計
高可用,是指通過保持業(yè)務(wù)連續(xù)性以及服務(wù)的高度可用性,以減少停工時間;采用層次化冗余實現(xiàn)高可用的具體內(nèi)容詳見表1。
專有云在同城數(shù)據(jù)中心可以提供原生的同步復(fù)制技術(shù),在異地提供異步復(fù)制技術(shù)實現(xiàn)容災(zāi)。
1.6資源池規(guī)劃
在云平臺建設(shè)完成投入生產(chǎn)前,如何以業(yè)務(wù)發(fā)展支撐為核心目標(biāo),科學(xué)、定量規(guī)劃,分配和使用云平臺,是數(shù)據(jù)中心資源池規(guī)劃的關(guān)鍵核心,“解耦化、模塊化、定量化、多元化”即為資源池規(guī)劃的“四化”目標(biāo)。解耦化,如服務(wù)器CPU硬件和傳統(tǒng)OS解耦后,即可實現(xiàn)多個物理服務(wù)器CPU的統(tǒng)一管理和虛擬分配,網(wǎng)絡(luò)轉(zhuǎn)發(fā)和數(shù)據(jù)平面解耦后,可構(gòu)建中央控制節(jié)點,并在底層網(wǎng)絡(luò)創(chuàng)建多個獨立的網(wǎng)絡(luò)轉(zhuǎn)發(fā)和數(shù)據(jù)平面,實現(xiàn)底層網(wǎng)絡(luò)透明化;通過組網(wǎng)、計算值以及存儲池整體模塊化,可有效避免后期持續(xù)擴(kuò)展時因容量上限有限導(dǎo)致資源間割裂,引發(fā)擴(kuò)展不連續(xù);通過云資源容量尤其是彈性能力的定量化,可實現(xiàn)云資源全面契合業(yè)務(wù)負(fù)載和相關(guān)需求,同時保證了機(jī)房PUE的可測量和可管理;多元化架構(gòu)能夠更好適應(yīng)多種類型的業(yè)務(wù)需求,有效平衡敏捷性和穩(wěn)定性,最終實現(xiàn)服務(wù)的綜合化。
2同城容災(zāi)規(guī)劃
容災(zāi)系統(tǒng)需要具備較為完善的數(shù)據(jù)保護(hù)功能與災(zāi)難恢復(fù)功能,保證生產(chǎn)中心出現(xiàn)意外時數(shù)據(jù)的完整性與業(yè)務(wù)的連續(xù)性,并在最短時間內(nèi)由災(zāi)備中心接替,恢復(fù)業(yè)務(wù)系統(tǒng)的正常運行,實現(xiàn)損失最小化。RPO和RTO是容災(zāi)系統(tǒng)設(shè)計的核心指標(biāo),數(shù)據(jù)恢復(fù)點目標(biāo)(RecoveryPointObjective,RPO),是指在災(zāi)難發(fā)生時系統(tǒng)和數(shù)據(jù)必須恢復(fù)的時間點要求,代表系統(tǒng)能夠容忍的最大數(shù)據(jù)丟失量;恢復(fù)時間目標(biāo)(RecoveryTimeObjective,RTO),是指災(zāi)難發(fā)生后,信息系統(tǒng)或業(yè)務(wù)功能從停止到必須恢復(fù)的時間要求,代表系統(tǒng)能夠容忍的服務(wù)停止最長時間。PRO和RTO須在風(fēng)險分析和業(yè)務(wù)影響分析之后,根據(jù)不同的業(yè)務(wù)需求進(jìn)行明確。較好的容災(zāi)系統(tǒng)需要盡量滿足用戶需求,容災(zāi)中心建設(shè)等級如圖2所示。
2.1設(shè)計思路
目前,很多金融機(jī)構(gòu)建立了部分?jǐn)?shù)據(jù)同城容災(zāi),而未實現(xiàn)應(yīng)用級容災(zāi)體系,暫無異地容災(zāi)體系,需要基于農(nóng)信業(yè)務(wù)發(fā)展需求和應(yīng)用系統(tǒng)的重要性評估,建立與之相匹配的容災(zāi)體系,秉承“同城保發(fā)展、異地保生存”原則,構(gòu)建云平臺“同城雙中心”以及“異地三中心”的災(zāi)備恢復(fù)能力。在容災(zāi)體系建設(shè)中,需要對應(yīng)用評級進(jìn)一步細(xì)化,制定與之相匹配的PRO和RTO建議,補充云平臺可用區(qū),在未來考慮跨多云的容災(zāi)結(jié)構(gòu),同時應(yīng)滿足架構(gòu)層次解耦,保證技術(shù)架構(gòu)的異構(gòu)性。在建設(shè)策略方面,補充應(yīng)用雙活規(guī)范,通過結(jié)合云原生復(fù)制技術(shù)和一鍵切換等,構(gòu)建容災(zāi)管理流程并進(jìn)行組織和培訓(xùn),不斷鞏固和持續(xù)提升數(shù)據(jù)中心的容災(zāi)管理能力。
2.2建設(shè)過程
容災(zāi)系統(tǒng)建設(shè)過程主要包括分析、策略制定、方案實施以及測試/演習(xí)/維護(hù)4個階段。在分析階段,需要收集業(yè)務(wù)過程信息、技術(shù)基礎(chǔ)架構(gòu)支撐環(huán)境以及災(zāi)難類型等方面內(nèi)容,之后進(jìn)行業(yè)務(wù)影響分析和風(fēng)險分析,明確因中斷或預(yù)期災(zāi)難造成的影響,分析結(jié)果用以確定業(yè)務(wù)關(guān)鍵級別、業(yè)務(wù)恢復(fù)時間以及可承受的數(shù)據(jù)損失程度。在策略制定階段,基于分析結(jié)果與容災(zāi)投入規(guī)劃,分別制定短期、長期容災(zāi)策略和容災(zāi)目標(biāo),經(jīng)評估組評審明確最為適用的容災(zāi)方案。在方案實施階段,基于容災(zāi)方案制定容災(zāi)體系架構(gòu)和災(zāi)難恢復(fù)計劃,通過技術(shù)手段和服務(wù)實現(xiàn)容災(zāi)目標(biāo)。在測試/演習(xí)/維護(hù)階段,通過定期修改和計劃修改,確保災(zāi)難恢復(fù)計劃的持續(xù)有效性。
2.3部署流程
專有云同城容災(zāi)集群屬于同一個Region下的兩個Azone,IDC獨立但互為備份,當(dāng)A(主)集群出現(xiàn)異常狀態(tài)時,通過ASR-ApsaraStackResilience(切換服務(wù))將B(備)集群切換到線上,部署方式為A→B→A′(將A集群升級為容災(zāi)配置)。
2.4IDC規(guī)劃
機(jī)房規(guī)劃主要包括機(jī)房標(biāo)準(zhǔn)參考、機(jī)房功能區(qū)設(shè)計、機(jī)房能耗(PUE)優(yōu)化建議以及機(jī)房管理4個方面,GB50174-2017《數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計規(guī)范》提出了機(jī)房基礎(chǔ)設(shè)施建設(shè)的核心要求,并將電子信息系統(tǒng)機(jī)房劃分為A、B、C三級,在機(jī)房設(shè)計的過程中,根據(jù)機(jī)房的使用性質(zhì)、管理要求及其在經(jīng)濟(jì)和社會中的重要性確定其所屬的相應(yīng)級別。在異地建立的備份機(jī)房,應(yīng)與主機(jī)房具有相同的等級,同一機(jī)房內(nèi)的不同部分可根據(jù)實際情況,按照不同的標(biāo)準(zhǔn)進(jìn)行設(shè)計。
2.5技術(shù)架構(gòu)
外部網(wǎng)絡(luò)采用GSLB或智能dns進(jìn)行負(fù)載和容災(zāi)切換;內(nèi)部網(wǎng)絡(luò)云產(chǎn)品通過slb進(jìn)行負(fù)載和自動化切換,云應(yīng)用通過dns進(jìn)行切換,應(yīng)用雙活部署,由中間件負(fù)責(zé)切換;分布式數(shù)據(jù)庫為三副本強一致同步;CPFS存儲主備同一集群為同步復(fù)制,其他存儲/數(shù)據(jù)庫為異步復(fù)制;云管平臺采用同城雙活部署;在線應(yīng)用采用雙活部署,應(yīng)用間調(diào)用支持http;批量應(yīng)用中,計劃內(nèi)場景能夠監(jiān)控批量執(zhí)行情況并一鍵調(diào)整批量執(zhí)行計劃,災(zāi)難場景能夠支持手工/自動方式斷點重提。
3結(jié)論
本文重點針對云平臺和同城容災(zāi)體系建設(shè)規(guī)劃重難點進(jìn)行了深入探討,能夠在對農(nóng)村金融機(jī)構(gòu)發(fā)展互聯(lián)網(wǎng)金融業(yè)務(wù)的過程中,對互聯(lián)網(wǎng)金融核心系統(tǒng)項目建設(shè)起到一定的指導(dǎo)性作用,避免項目建設(shè)的基礎(chǔ)架構(gòu)無法支撐業(yè)務(wù)快速發(fā)展的要求,充分考慮了金融行業(yè)自主可控數(shù)據(jù)庫的應(yīng)用,更加合理地規(guī)劃核心生產(chǎn)系統(tǒng)的容災(zāi),安全防護(hù)和網(wǎng)絡(luò),對我國金融行業(yè)具有較好的推廣價值和借鑒意義,加速推進(jìn)農(nóng)信社互聯(lián)網(wǎng)金融發(fā)展。
參考文獻(xiàn)
[1]晏祎.基于互聯(lián)網(wǎng)農(nóng)村金融發(fā)展問題及對策分析[J].農(nóng)業(yè)經(jīng)濟(jì),2022,(09):9092.
[2]李淑萍,徐英杰.互聯(lián)網(wǎng)金融、系統(tǒng)重要性與商業(yè)銀行風(fēng)險承擔(dān)[J].宏觀經(jīng)濟(jì)研究,2020,(12):3846+151.
[3]馬德輝,何興建,張志鵬,等.依托云平臺在互聯(lián)網(wǎng)金融時代乘風(fēng)破浪[J].中國農(nóng)村金融,2020,(22):1516.
[4]ManelM,JavierC,LuisI,etal.Towardshighavailabilitycyberphysicalsystemsusingamicroservicearchitecture[J].Computing,2023,105(8):17451768.
[5]杜軍龍,金俊平,周劍濤,等.具備完整性追溯的系統(tǒng)數(shù)據(jù)容災(zāi)機(jī)制[J].計算機(jī)工程,2019,45(07):170175.
[6]魏亮,薛牧遙,霍炬,等.基于ICP算法的非合作目標(biāo)特征點云配準(zhǔn)優(yōu)化[J].系統(tǒng)仿真學(xué)報,2020,32(12):23832387.
[7]呂韜,田峰,李征宇,等.分布式關(guān)系型數(shù)據(jù)庫恢復(fù)點目標(biāo)測試方法[J].工業(yè)技術(shù)創(chuàng)新,2020,07(03):3036+41.