張少欣
摘 要 文章提到的流化系統(tǒng),在不改造終端、不移植客戶端的情況下,解決了云媒體業(yè)務(wù)推廣過程中嚴重影響新業(yè)務(wù)、新技術(shù)拓展的大量瀏覽器終端配置較低、型號較老、標準不統(tǒng)一等問題,提升了互動電視業(yè)務(wù)在瀏覽器終端上的操作體驗。文章描述的負載均衡管理和故障檢測流程,能有效保證系統(tǒng)的安全性、穩(wěn)定性,進一步提升了用戶體驗。
關(guān)鍵詞 流化系統(tǒng);負載均衡;故障檢測
中圖分類號 G2 文獻標識碼 A 文章編號 2096-0360(2018)16-0034-02
江蘇有線在全省進行云媒體業(yè)務(wù)的推廣過程中,各地市和區(qū)縣存在的大量瀏覽器終端存在配置較低、型號較老、標準不統(tǒng)一、無法升級成云媒體版本等問題,使得大量具備盈利前景的業(yè)務(wù)無法在全省進行統(tǒng)一下發(fā),嚴重阻礙了互動電視新業(yè)務(wù)、新技術(shù)的拓展。
文章描述的流化系統(tǒng),采用了免移植方案,在不改造終端、不移植客戶端的情況下,可以提供快速部署、統(tǒng)一業(yè)務(wù)體驗的應(yīng)用服務(wù),帶給不同終端的非云媒體互動用戶統(tǒng)一、高質(zhì)量、低延時的用戶體驗。
1 系統(tǒng)組成
根據(jù)功能,流化系統(tǒng)主要包含接入網(wǎng)關(guān)型路由服務(wù)器、流化引擎服務(wù)器和管理服務(wù)器三種類型的服務(wù)器。
1)接入網(wǎng)關(guān)型路由服務(wù)器(CSR)。負責(zé)集成庫客戶端或者瀏覽器Javascript客戶端(免移植方式)的云端接入。實現(xiàn)HTTP協(xié)議和流化協(xié)議的轉(zhuǎn)換(免移植)。根據(jù)多種業(yè)務(wù)邏輯進行流化服務(wù)的業(yè)務(wù)路由,為每次請求選擇最適合的流化引擎來提供服務(wù):基于服務(wù)類型;基于地域位置;基于服務(wù)優(yōu)先級;基于負載均衡;基于機頂盒型號或用戶類型。會話管理和用戶歷史記錄的存取。
2)流化引擎服務(wù)器(CSE)。負責(zé)HTML5應(yīng)用在前端的運行和渲染,實時響應(yīng)終端的鍵值請求;對云端的渲染輸出進行實時捕獲、編碼和播出,支持IP ES的播出和QAM TS播出的雙模方式;無縫的跨服務(wù)器業(yè)務(wù)切換;會話管理;與IPQAM資源管理的集成。
3)管理服務(wù)器(CSM)。負責(zé)系統(tǒng)的整體配置、監(jiān)控和日志報表:服務(wù)器級別;業(yè)務(wù)級別;整體系統(tǒng)級別。通過模擬流化請求并監(jiān)測碼流的方式實現(xiàn)業(yè)務(wù)層面的設(shè)備監(jiān)控。統(tǒng)計分析:并發(fā)分析;帶寬分析;使用時長分析;PV/UV;系統(tǒng)故障率。
2 網(wǎng)絡(luò)架構(gòu)
流化引擎服務(wù)器:具有兩個電口,一個用于信令,一個用于推流。管理服務(wù)器、接入網(wǎng)關(guān)服務(wù)器均為2個業(yè)務(wù)口。
根據(jù)端口需求,各類設(shè)備先接入業(yè)務(wù)匯聚交換機,然后信令由業(yè)務(wù)匯聚交換機上聯(lián)至信令核心交換機;推流由業(yè)務(wù)匯聚交換機上聯(lián)至推流核心交換機。網(wǎng)絡(luò)架構(gòu)如圖1所示。
由于是直接面向電視用戶的系統(tǒng),系統(tǒng)必須充分保證7×24小時的安全播出,因此,需部署主前端系統(tǒng)和備份中心系統(tǒng)兩套互為備份的系統(tǒng),且兩套系統(tǒng)必須滿足數(shù)據(jù)一致性、業(yè)務(wù)可用性、操作可行性要求。
3 負載均衡管理
接入網(wǎng)關(guān)型路由服務(wù)器和管理服務(wù)器通過F5[1]的四層負載均衡、采用輪詢方式進行負載均衡管理,流化引擎服務(wù)器采用CSR自帶的七層負載管理。
1)接入服務(wù)器四層負載均衡管理。如圖2所示,所有CSR服務(wù)器以一個CSR組的方式工作,同一個組內(nèi)的CSR服務(wù)器間支持實時的Message Queue同步。管理系統(tǒng)下發(fā)的業(yè)務(wù)路由策略(含故障時移除服務(wù)器的修改)會通過四層交換發(fā)送至其中一臺CSR服務(wù)器上,在所有CSR服務(wù)器上即刻同步,并在每臺服務(wù)器上以配置文件方式保存下來。
在免移植方案中,CSR服務(wù)器用來實現(xiàn)終端和流化引擎服務(wù)器的中轉(zhuǎn)連接,并將基本會話信息存儲于共享的Oracle數(shù)據(jù)庫中。當某臺CSR服務(wù)器故障時,用戶請求重連至其他CSR服務(wù)器,通過查詢Oracle系統(tǒng)中關(guān)于該終端的會話信息,實現(xiàn)業(yè)務(wù)的無縫恢復(fù)。
一般情況下,用戶請求只向主前端系統(tǒng)的四臺接入服務(wù)器進行轉(zhuǎn)發(fā),當主前端系統(tǒng)整體故障時,切換至備份中心系統(tǒng)的接入服務(wù)器。
2)管理服務(wù)器四層負載均衡管理。如圖3所示,實時監(jiān)控信息和統(tǒng)計分析的日志數(shù)據(jù)通過四層交換負載均衡地發(fā)送至主前端系統(tǒng)的兩臺管理服務(wù)器上,任何一臺管理服務(wù)器出現(xiàn)故障,剩余的一臺都可以獨立完成工作。通過共享Oracle數(shù)據(jù)庫以及定期統(tǒng)計分析文件拷貝鏡像的方式,實現(xiàn)主前端系統(tǒng)和備份中心系統(tǒng)管理服務(wù)器的數(shù)據(jù)同步。
一般情況下,僅主前端系統(tǒng)的兩臺管理服務(wù)器提供服務(wù)。當主前端系統(tǒng)的管理服務(wù)器出現(xiàn)故障時,才通過四層交換切換至備份中心系統(tǒng)的管理服
務(wù)器。
4 故障檢測服務(wù)器檢測方式
為了提高系統(tǒng)的可用性,及時發(fā)現(xiàn)故障服務(wù)器,系統(tǒng)中部署了故障檢測服務(wù)器。由于故障檢測原理基于流化服務(wù)的軟硬件,所以實際部署中可抽取流化引擎服務(wù)器作為故障檢測服務(wù)器。檢測流程如圖4所示。
故障檢測的流程為:1)故障檢測服務(wù)器周期性檢測并校驗流化引擎服務(wù)器的圖像輸出內(nèi)容;2)如果被檢測的流化引擎服務(wù)器輸出內(nèi)容出現(xiàn)問題,包含畫面質(zhì)量等服務(wù)狀態(tài)問題,故障檢測服務(wù)器將故障服務(wù)器通知接入網(wǎng)關(guān)型路由服務(wù)器,接入網(wǎng)關(guān)型路由服務(wù)器將此臺服務(wù)器從路由表中去除;3)接入網(wǎng)關(guān)型路由服務(wù)器報告至管理服務(wù)器;4)管理服務(wù)器發(fā)出對應(yīng)告警信息。
當故障服務(wù)器問題解決后:1)故障檢測服務(wù)器將通知接入網(wǎng)關(guān)型路由服務(wù)器,接入網(wǎng)關(guān)型路由服務(wù)器將此臺服務(wù)器加入路由表中;2)接入網(wǎng)關(guān)型路由服務(wù)器通知管理服務(wù)器;3)管理服務(wù)器解除對應(yīng)告警信息。
5 總結(jié)
通過在流化系統(tǒng)的部署過程中充分考慮負載均衡策略和備份系統(tǒng)的建設(shè),并增設(shè)故障檢測服務(wù)器,滿足了系統(tǒng)的安全性、穩(wěn)定性要求,進一步保證了低延時、高質(zhì)量的用戶體驗要求,有利于加快云媒體業(yè)務(wù)在全省各類型終端上無差別地推廣。
參考文獻
[1]F5 Networks,F(xiàn)5 LTM配置指南[EB/OL].www.f5.com.cn,2011.