余文
“我相信很多人都在談‘去O,但是我覺得單純談‘去O就有點(diǎn)out?!北娝苤?,去IOE這個(gè)詞匯是阿里云提出來的,因此當(dāng)筆者在北京云棲大會(huì)上聽到阿里云數(shù)據(jù)庫產(chǎn)品專家、PostgreSQL中國社區(qū)主席蕭少聰說出上述這句話的時(shí)候,難免大吃一驚。
“我們更應(yīng)該從公司業(yè)務(wù)的角度,分清楚這些業(yè)務(wù)應(yīng)該有哪幾種模型,根據(jù)這樣的模型,把原來按照系統(tǒng)上線的數(shù)據(jù)庫重新打散、拆分;按照不同的模型選用不同的產(chǎn)品,去解決今天的新問題,形成一個(gè)新的架構(gòu)。”很明顯,蕭少聰?shù)谋疽馐菑男袠I(yè)應(yīng)用和DBA(數(shù)據(jù)庫管理員)未來發(fā)展的視角來看待”去O“這件事。
改變傳統(tǒng)商業(yè)模式
眾所周知,DBA是任何一家上線數(shù)據(jù)庫系統(tǒng)的企業(yè)的標(biāo)配。這是因?yàn)椋瑪?shù)據(jù)庫是企業(yè)的核心資產(chǎn),而且在交易型業(yè)務(wù)里,數(shù)據(jù)庫承載著一天24小時(shí),一年365天不間斷的關(guān)鍵業(yè)務(wù)的運(yùn)營。比如銀行交易系統(tǒng),或者企業(yè)的生產(chǎn)系統(tǒng),一旦宕機(jī),都會(huì)造成無法估量的損失。
打個(gè)比方,一個(gè)上線的交易型數(shù)據(jù)庫就好像空中飛行的飛機(jī)發(fā)動(dòng)機(jī),出現(xiàn)任何故障誰都承擔(dān)不起,更別說在飛行中更換發(fā)動(dòng)機(jī)了。
相對(duì)于硬件產(chǎn)業(yè)鏈上下游較為成熟的分工合作方式,軟件提供商由于沒有硬成本的壓力,因此絕大多數(shù)軟件都采用了迭代開發(fā)的模式,一個(gè)產(chǎn)品的成熟通常需要很長(zhǎng)的周期—即便是廣泛應(yīng)用到金融、電信等大行業(yè)的以“高可靠、高可用和高穩(wěn)定”自居的Oracle數(shù)據(jù)庫,往往在一個(gè)大版本的頭一兩個(gè)小版本,也會(huì)存在相當(dāng)多的bug。
也正因?yàn)榇?,目前全球市?chǎng)上較為成熟的大型商用關(guān)系型數(shù)據(jù)庫僅有 Oracle、IBM、Sybase、微軟SQL Server、Informix等五款,再加上新近受到市場(chǎng)熱捧的SAP混合交易分析型數(shù)據(jù)庫HANA,因此去“O”要遠(yuǎn)比去“I”或者去“E”難得多。其實(shí),“去O”或者去“IOE”并不是針對(duì)某一家或某幾家企業(yè),而是更多針對(duì)傳統(tǒng)的IT商業(yè)模式。
眾所周知,傳統(tǒng)的企業(yè)級(jí)商用軟件的商業(yè)模式,不僅在采購初期收取軟件許可的費(fèi)用和實(shí)施上線的費(fèi)用,還要在每一年再收取接近采購價(jià)格20%的服務(wù)費(fèi),用于產(chǎn)品升級(jí)和系統(tǒng)維護(hù)。
但如今,云計(jì)算真正顛覆了這一模式。這也是為什么Oracle創(chuàng)始人拉里埃里森近期一改幾年前對(duì)云計(jì)算的不屑,拼命轉(zhuǎn)型云計(jì)算的原因。
“去O”副產(chǎn)品—公云運(yùn)維自動(dòng)化
云數(shù)據(jù)庫的興起,源于大型電商如亞馬遜、阿里巴巴等出于自身大型數(shù)據(jù)中心中運(yùn)營的龐大數(shù)據(jù)庫所需支付的高額運(yùn)維成本的考量,不得不自行研發(fā)低成本的硬件基礎(chǔ)架構(gòu)和開源數(shù)據(jù)庫系統(tǒng)。也正因?yàn)榇?,誕生了公共云服務(wù)供應(yīng)商AWS、阿里云。
當(dāng)然,數(shù)據(jù)庫的研發(fā)不是一蹴而就的—無論是AWS還是阿里云,其背后都依托著亞馬遜、阿里巴巴這樣的巨型電商的各種資源的支持,并且經(jīng)歷了雙十一、圣誕節(jié)等時(shí)段交易量爆炸式增長(zhǎng)的考驗(yàn),才得以逐步成熟,并且開放提供商用云數(shù)據(jù)庫服務(wù)。
在這一從起步到成熟的成長(zhǎng)過程中,數(shù)據(jù)庫運(yùn)維服務(wù),也正在從人工修復(fù),到通過軟件定義的方式,形成自動(dòng)化運(yùn)維的體系,大大提高系統(tǒng)穩(wěn)定性的同時(shí),降低了手工操作的必要性。
“最初我們的DBA們一直在救火,后來我們逐漸有了能力不用到處救火了,因?yàn)椴糠窒到y(tǒng)已經(jīng)完成自動(dòng)化運(yùn)維的工作?!卑⒗镌脐P(guān)系數(shù)據(jù)庫服務(wù)內(nèi)核開發(fā)和運(yùn)維團(tuán)隊(duì)負(fù)責(zé)人丁奇坦承,“剛開始部署自動(dòng)化運(yùn)維的時(shí)候,大家到了雙十一的時(shí)候,坐在那里還是很慌。這種情況一直到去年底徹底改變。所以我們今年的目標(biāo)是雙十一不用再擔(dān)心系統(tǒng)運(yùn)維了,不用再通宵在七樓值班了?!?/p>
丁奇說的很務(wù)實(shí)。
事實(shí)上,如今阿里云內(nèi)部的ApsaraDB云數(shù)據(jù)庫大約運(yùn)行著三百多個(gè)業(yè)務(wù),已經(jīng)基本實(shí)現(xiàn)自動(dòng)化運(yùn)維,整個(gè)工作只有一個(gè)DBA在看管—IT運(yùn)維的絕大部分的工作已經(jīng)交由系統(tǒng)來完成。
阿里云關(guān)系數(shù)據(jù)庫服務(wù)內(nèi)核開發(fā)和運(yùn)維團(tuán)隊(duì)負(fù)責(zé)人丁奇(右)和阿里云緩存數(shù)據(jù)庫負(fù)責(zé)人、Redis中文社區(qū)的核心發(fā)起人子嘉(左)與筆者對(duì)話
據(jù)悉,為了達(dá)成今年雙十一自動(dòng)化運(yùn)維的目標(biāo),丁奇設(shè)立了全新的機(jī)制。“我們把系統(tǒng)集群當(dāng)成我們的客戶來對(duì)待,設(shè)立了健康指標(biāo)?!倍∑娼忉屨f,“我們每天都在進(jìn)行業(yè)務(wù)優(yōu)化,但我們要知道業(yè)務(wù)優(yōu)化的進(jìn)展,比如我們限定雙十一的時(shí)候,健康指標(biāo)要超過95分,那我們每個(gè)月一次去給這個(gè)集群打分,建立每個(gè)月的進(jìn)度任務(wù),就可以更容易地達(dá)成目標(biāo)。”
DBA的新追求
很明顯,核心數(shù)據(jù)庫運(yùn)維的自動(dòng)化,開始讓DBA這個(gè)職業(yè)變得可替代。
“如今底層的IT運(yùn)維服務(wù),已經(jīng)通過公共云或者軟件定義的方式,大大降低了手工操作的必要性,自動(dòng)化運(yùn)維逐步成為現(xiàn)實(shí),而DBA們未來的出路就在于對(duì)公司業(yè)務(wù)、行業(yè)知識(shí),與IT技術(shù)的結(jié)合。”蕭少聰表示。
據(jù)悉,阿里云內(nèi)部的DBA,尤其是那些對(duì)業(yè)務(wù)熟悉的DBA正在變得越來越搶手?!斑@些DBA并不是基礎(chǔ)做得好,并不是擴(kuò)容加機(jī)器加得特別快,而是他最了解業(yè)務(wù),他能夠去以一個(gè)數(shù)據(jù)架構(gòu)師的方案推動(dòng)業(yè)務(wù)的改造?!痹谑捝俾斂磥?,“這才是他們核心價(jià)值,也是DBA目前能夠持續(xù)增長(zhǎng)的價(jià)值。”
記得以前業(yè)界有個(gè)說法,就是阿里云的運(yùn)維靠人壘,而某云拿這個(gè)說事兒,說自己早已實(shí)現(xiàn)自動(dòng)化運(yùn)維。當(dāng)時(shí)筆者并沒有很在意,因?yàn)檎l都知道,雙十一的量級(jí)是多少?換誰也都得鋪人上去。
沒想到,如今阿里云不僅已經(jīng)可以基本實(shí)現(xiàn)自動(dòng)化運(yùn)維了,而且,DBA們正在轉(zhuǎn)型和升級(jí)。不僅如此,就連阿里云ApsaraDB也在轉(zhuǎn)型升級(jí)。這就是為什么本文開篇,蕭少聰所說的,單純談“去O”已經(jīng)out了的原因。
“阿里云正在數(shù)據(jù)庫的新領(lǐng)域投入研發(fā)并穩(wěn)步推進(jìn)—HTAP是我們現(xiàn)在攻關(guān)的一個(gè)大方向?!倍∑娼榻B,阿里云的分析型數(shù)據(jù)庫GreenPlum已經(jīng)在公測(cè),未來還會(huì)推出名為“小數(shù)倉”的相關(guān)產(chǎn)品,目的就是幫助傳統(tǒng)的OLTP用戶,在一個(gè)系統(tǒng)里面實(shí)現(xiàn)數(shù)據(jù)的讀寫和計(jì)算分析,實(shí)現(xiàn)數(shù)據(jù)在內(nèi)部系統(tǒng)之間實(shí)現(xiàn)平滑流轉(zhuǎn)。
實(shí)際上,對(duì)于業(yè)務(wù)應(yīng)用來說,云并不能解決傳統(tǒng)IT架構(gòu)應(yīng)用孤島的問題,而這個(gè)問題的關(guān)鍵其實(shí)就出在數(shù)據(jù)庫上。
眾所周知,系統(tǒng)的核心是數(shù)據(jù)庫,而每個(gè)業(yè)務(wù)系統(tǒng)都是獨(dú)立上線,不論業(yè)務(wù)系統(tǒng)是否上云,還是本地的,其數(shù)據(jù)庫之間都是割裂的。更重要的是,一家企業(yè)中最關(guān)心數(shù)據(jù)的各個(gè)老總,原先看到的報(bào)表,都是分析型數(shù)據(jù)庫中月結(jié)的靜態(tài)數(shù)據(jù),無法支持老總及時(shí)調(diào)整銷售戰(zhàn)術(shù)。
這樣的狀態(tài),是因?yàn)镠TAP(Hybrid Transactional/Analytical Processing),即混合交易/處理的模式長(zhǎng)期不為業(yè)界看好—因?yàn)橐獙?shí)現(xiàn)分析查詢足夠的速度,以防止分析工作負(fù)載,從中斷操作處理。為了實(shí)現(xiàn)分析查詢的足夠的速度,OLTP(在線事務(wù)處理)的數(shù)據(jù)通常從一個(gè)或多個(gè)操作系統(tǒng)復(fù)制到數(shù)據(jù)集市或數(shù)據(jù)倉庫,再進(jìn)行OLAP(聯(lián)機(jī)分析處理)。
而今,隨著硬件技術(shù)的不斷成熟,特別是HTAP的代表——SAP HANA得到廣泛成功應(yīng)用之后,數(shù)據(jù)庫的技術(shù)發(fā)生了重大改變。如果真正想讓數(shù)據(jù)活起來,就必須讓OLTP與OLAP統(tǒng)合起來,這樣,任何分析報(bào)表所抽取的數(shù)據(jù)都可以從實(shí)時(shí)變化的動(dòng)態(tài)的OLTP中來進(jìn)行分析展現(xiàn)。
這就是為什么,阿里云DBA們今天真正關(guān)心的是與業(yè)務(wù)掛鉤。
在筆者看來,云棲大會(huì)北京峰會(huì)上的亮點(diǎn),除了阿里云推出全新的品牌形象,表達(dá)“生于代碼”的本源和滿足海內(nèi)外市場(chǎng)的發(fā)展需要之外,對(duì)數(shù)據(jù)庫的一些新動(dòng)作,包括自動(dòng)化運(yùn)維、開源AliSQL、研發(fā)HTAP等,都將對(duì)數(shù)據(jù)庫行業(yè)、DBA職業(yè)的發(fā)展,以及軟件行業(yè)商業(yè)模式和企業(yè)用戶的管理模式產(chǎn)生重大影響。