邱峰
【摘 要】作為項(xiàng)目經(jīng)理主要負(fù)責(zé)醫(yī)院整體IT信息基礎(chǔ)平臺的設(shè)計(jì)、規(guī)劃和建設(shè)與整個(gè)項(xiàng)目的項(xiàng)目管理,該IT基礎(chǔ)平臺用于承載醫(yī)院的業(yè)務(wù)運(yùn)行和數(shù)據(jù)存儲,其安全性、可靠性和高可用性都是建設(shè)中要考慮的重點(diǎn)。整個(gè)項(xiàng)目質(zhì)量管理應(yīng)從一個(gè)完整質(zhì)量管理計(jì)劃開始,以人為本來抓質(zhì)量,以預(yù)防為主來抓質(zhì)量,用質(zhì)量數(shù)據(jù)來說話,才會(huì)交出一份合格答卷。
【關(guān)鍵詞】質(zhì)量管理;以人為本;預(yù)防為主;用數(shù)據(jù)說話
2016年5月,我作為項(xiàng)目經(jīng)理開始參與某醫(yī)院IT信息基礎(chǔ)平臺項(xiàng)目建設(shè),主要負(fù)責(zé)醫(yī)院整體IT信息基礎(chǔ)平臺設(shè)計(jì)、規(guī)劃和建設(shè)與整個(gè)項(xiàng)目的項(xiàng)目管理,整個(gè)IT信息基礎(chǔ)平臺主要由以下三個(gè)部分組成:
物理云部分
物理云采用高配置設(shè)備用于承載客戶核心數(shù)據(jù)庫系統(tǒng),核心業(yè)務(wù)特點(diǎn)是對計(jì)算能力、內(nèi)存空間、IO響應(yīng)速度要求高,能支撐大量并發(fā)客戶對數(shù)據(jù)庫的同時(shí)訪問,并且具有高度容錯(cuò)的高可用性,整個(gè)體系不能有單點(diǎn)故障。
虛擬化云部分
虛擬化云采用分布式超融合系統(tǒng),采用節(jié)點(diǎn)化設(shè)計(jì),每個(gè)節(jié)點(diǎn)單獨(dú)運(yùn)行同時(shí)又能通過分布式存儲共享數(shù)據(jù),虛擬化云被設(shè)計(jì)為同時(shí)承載幾十套甚至上百套小業(yè)務(wù)系統(tǒng)的基礎(chǔ)平臺,可用于客戶的中間件、非核心數(shù)據(jù)庫等業(yè)務(wù)系統(tǒng)。
存儲云部分
存儲云部分采用最新軟件定義存儲技術(shù),將不同廠家、不同品牌存儲組成統(tǒng)一管理和分配存儲池,可以根據(jù)存儲性能分為高速存儲池和低速大容量存儲池,在存儲池中所有數(shù)據(jù)都是雙份存放,任意存儲故障都不會(huì)影響整個(gè)存儲池正常使用,也不會(huì)造成數(shù)據(jù)丟失。
眾所周知,醫(yī)院的IT基礎(chǔ)平臺是承載醫(yī)院業(yè)務(wù)和數(shù)據(jù)的,其建設(shè)項(xiàng)目質(zhì)量要求也非常高,整個(gè)平臺要具有高可用性、高性能、一定的災(zāi)難故障防御能力,必須從基礎(chǔ)平臺設(shè)計(jì)開始就要對項(xiàng)目質(zhì)量進(jìn)行把控和管理,并且項(xiàng)目質(zhì)量管理要貫穿整個(gè)實(shí)施全過程,才能把控住IT基礎(chǔ)平臺質(zhì)量要求。本文主要結(jié)合自身實(shí)踐,探討項(xiàng)目中關(guān)于質(zhì)量管理方面的心得體會(huì)。
1 項(xiàng)目質(zhì)量控制計(jì)劃是指導(dǎo)和控制整個(gè)項(xiàng)目質(zhì)量的標(biāo)準(zhǔn)和依據(jù)
項(xiàng)目質(zhì)量控制計(jì)劃用來確認(rèn)本項(xiàng)目要達(dá)到的質(zhì)量標(biāo)準(zhǔn)和為達(dá)到這些質(zhì)量標(biāo)準(zhǔn)而制定一系列計(jì)劃和安排,首先,需要確認(rèn)本項(xiàng)目達(dá)到幾個(gè)主要質(zhì)量標(biāo)準(zhǔn):
上文已經(jīng)簡要闡述過,該平臺首要的質(zhì)量標(biāo)準(zhǔn)就是要具有高可用性,高可用性意味著整個(gè)平臺的設(shè)計(jì)要充分考慮到冗余,任何單點(diǎn)故障都能被冗余的配件或設(shè)備來消除,不會(huì)對業(yè)務(wù)正常運(yùn)行造成較大影響,在本項(xiàng)目中,我們定義單點(diǎn)故障對業(yè)務(wù)連續(xù)性造成影響小于5分鐘。除了高可用性,整個(gè)平臺從計(jì)算能力、吞吐量、IOPS、網(wǎng)絡(luò)帶寬都要具有高性能,我識別到即使本項(xiàng)目的硬件設(shè)備配置都比較高,但是影響平臺性能的還有各種操作系統(tǒng)、數(shù)據(jù)庫層面參數(shù)設(shè)置,甚至?xí)霈F(xiàn)一個(gè)參數(shù)設(shè)置不好導(dǎo)致整個(gè)平臺性能下降90%的情況。本項(xiàng)目質(zhì)量第三個(gè)標(biāo)準(zhǔn)就是對災(zāi)難防御能力,通過對高可用性要求標(biāo)準(zhǔn),能預(yù)防硬件單點(diǎn)故障,但是還有其他災(zāi)難發(fā)生的情況,比如人為誤刪除數(shù)據(jù)、機(jī)房機(jī)柜出現(xiàn)供電故障、存儲鏈路和網(wǎng)絡(luò)鏈路出現(xiàn)不穩(wěn)定情況等,這些都是災(zāi)難防御能力的質(zhì)量控制需要考慮的標(biāo)準(zhǔn)。
項(xiàng)目質(zhì)量管理計(jì)劃中還要識別和定義本項(xiàng)目質(zhì)量保證人員,公司高層管理人員作為本項(xiàng)目質(zhì)量管理支撐,定期聽取我對質(zhì)量的匯報(bào)和協(xié)調(diào)資源以保證質(zhì)量管理能順利進(jìn)行;質(zhì)量保證人員由實(shí)施工程師組成,采用互測質(zhì)量的方式進(jìn)行,也就是說物理云的實(shí)施工程師參與到虛擬化云的質(zhì)量檢查和測試中,反之亦然;作為項(xiàng)目經(jīng)理在本項(xiàng)目中起到承上啟下的作用,定期驅(qū)動(dòng)質(zhì)量管理活動(dòng)正常進(jìn)行,收集和整理質(zhì)量檢查和測試結(jié)果,與質(zhì)量保證人員一起協(xié)商質(zhì)量不符合項(xiàng)的糾正措施,定期向公司高層管理人員匯報(bào)項(xiàng)目質(zhì)量管理情況。
項(xiàng)目質(zhì)量管理計(jì)劃中還應(yīng)定義出質(zhì)量保證活動(dòng)如何執(zhí)行以及質(zhì)量測試的相關(guān)標(biāo)準(zhǔn)等。
2 質(zhì)量控制要從人抓起
人是建設(shè)的主要生產(chǎn)力,所有產(chǎn)出物的質(zhì)量都來源于參與建設(shè)的每個(gè)團(tuán)隊(duì)成員。因此,要控制好項(xiàng)目的質(zhì)量首先要從人入手。在項(xiàng)目實(shí)施中,考慮到項(xiàng)目組成員大部分都來自公司不同的部門,首要工作就是去了解每一位項(xiàng)目組成員并與他們進(jìn)行交流和溝通,了解項(xiàng)目組成員的技術(shù)能力。同時(shí),在向公司高層申請了相應(yīng)權(quán)限的情況下采取了一系列相關(guān)的的激勵(lì)政策,比如:薪酬激勵(lì),發(fā)展激勵(lì),文化激勵(lì),感情激勵(lì),約束激勵(lì),授權(quán)激勵(lì)等等。通過這些激勵(lì)政策的交叉使用,整個(gè)項(xiàng)目團(tuán)隊(duì)對項(xiàng)目參與的積極性被調(diào)動(dòng)起來,也提高了項(xiàng)目團(tuán)隊(duì)成員對項(xiàng)目的責(zé)任心。
為確保項(xiàng)目團(tuán)隊(duì)成員有一個(gè)良好的工作環(huán)境,就要求公司配備齊全的開發(fā)工具和開發(fā)平臺,包括提供合適的開發(fā)和測試工具,配置合適的新服務(wù)器,給開發(fā)人員配置相應(yīng)的筆記本電腦。同時(shí),讓團(tuán)隊(duì)成員認(rèn)識到他們的工作富有挑戰(zhàn)性,不讓他們按部就班地做一些重復(fù)很高的工作。再次,為了提高團(tuán)隊(duì)成員的參與感,常常一起來參與制定與工作相關(guān)的一些決策,聽取團(tuán)隊(duì)成員的意見。當(dāng)某個(gè)員工出色地完成任務(wù)時(shí),我通常都會(huì)當(dāng)面表揚(yáng),在需要的情況下也會(huì)開會(huì)慶祝鼓舞整個(gè)項(xiàng)目團(tuán)隊(duì)的士氣。平時(shí)也應(yīng)多了解團(tuán)隊(duì)成員的實(shí)際困難與個(gè)人需求,設(shè)法滿足,以調(diào)動(dòng)他們的工作的積極性。
通過對項(xiàng)目團(tuán)隊(duì)成員的積極性調(diào)動(dòng),提高團(tuán)隊(duì)成員對項(xiàng)目的責(zé)任心,從人的角度來提高項(xiàng)目的實(shí)施質(zhì)量。
3 項(xiàng)目的質(zhì)量管理要以預(yù)防為主
質(zhì)量管理重要的一點(diǎn)就是要以預(yù)防為主,提前識別到可能出現(xiàn)的質(zhì)量風(fēng)險(xiǎn),提前采取相應(yīng)的預(yù)防措施。如在OracleRAC的數(shù)據(jù)庫的安裝中,OracleRAC集群節(jié)點(diǎn)之間的私有網(wǎng)絡(luò)對于整個(gè)集群的高可用性是非常重要的,一旦私有網(wǎng)絡(luò)出現(xiàn)問題不但集群的高可用性無法保障而且還會(huì)出現(xiàn)節(jié)點(diǎn)被驅(qū)逐重啟這樣嚴(yán)重影響業(yè)務(wù)的情況。因此,在本項(xiàng)目OracleRAC的數(shù)據(jù)庫的安裝中,提前按照官方的最佳實(shí)踐配置穩(wěn)定性較好的光纖網(wǎng)絡(luò),并且采用多塊網(wǎng)卡使用主備模式,提前優(yōu)化操作系統(tǒng)部分和網(wǎng)絡(luò)延遲有關(guān)系的參數(shù),做好充足的準(zhǔn)備。在安裝完成后的高可用性測試中,沒有因?yàn)樗接芯W(wǎng)絡(luò)出現(xiàn)的質(zhì)量問題,順利通過驗(yàn)收。
同時(shí),項(xiàng)目中的質(zhì)量測試也是貫穿在整個(gè)施工過程中,安裝完成一步就測試一步,一旦發(fā)現(xiàn)質(zhì)量問題馬上進(jìn)行處理,最小化質(zhì)量問題對項(xiàng)目造成的影響。
4 質(zhì)量的標(biāo)準(zhǔn)要用數(shù)據(jù)說話
質(zhì)量的標(biāo)準(zhǔn)不能用人的主觀意識來判斷,人的主觀意識是會(huì)受到客觀環(huán)境的影響,從而會(huì)對項(xiàng)目質(zhì)量管理造成不統(tǒng)一的標(biāo)準(zhǔn)。
在本項(xiàng)目實(shí)施中,按照項(xiàng)目的質(zhì)量要求數(shù)字化質(zhì)量的標(biāo)準(zhǔn),對于質(zhì)量標(biāo)準(zhǔn)能用數(shù)字描述的就不用文字描述,能定義清楚數(shù)值的就不要含糊不清。如對于FC光纖的延遲,我們定義是≤5ms,對于SSD存儲池的IOPS,我們定義是≥22000。整個(gè)項(xiàng)目從質(zhì)量計(jì)劃到質(zhì)量測試方案,都盡量采用數(shù)值來制定質(zhì)量的標(biāo)準(zhǔn),不用人為的主觀(好、不好)的描述來定義質(zhì)量,只有這樣做才能把整個(gè)項(xiàng)目的質(zhì)量控制好。
本項(xiàng)目的IT基礎(chǔ)平臺已于2016年12月底正式上線遠(yuǎn)行,整個(gè)平臺的質(zhì)量標(biāo)準(zhǔn)達(dá)到甚至部分超過客戶要求,受到客戶和有關(guān)部門的一致好評,項(xiàng)目滿意度高。重新回顧整個(gè)項(xiàng)目的質(zhì)量管理過程,我認(rèn)為整個(gè)項(xiàng)目的質(zhì)量管理從一個(gè)完整的質(zhì)量管理計(jì)劃開始,以人為本來抓質(zhì)量,以預(yù)防為主來抓質(zhì)量,用質(zhì)量的數(shù)據(jù)來說話,才會(huì)交出一份合格的答卷。項(xiàng)目質(zhì)量管理是一門深?yuàn)W的學(xué)問,它有待于我們?nèi)ネ诰?,研究和探索?/p>
【參考文獻(xiàn)】
[1]柳純錄信息系統(tǒng)項(xiàng)目管理教程.2008.01.
[2]美國項(xiàng)目管理協(xié)會(huì)項(xiàng)目管理知識體系指南.2008.3.
[3]杰克·吉多成功的項(xiàng)目管理-項(xiàng)目管理資源庫(英文版)(第3版)2008.3.
[4](美)伯克溫(Berkun,S.)項(xiàng)目管理藝術(shù).2008.9.
[責(zé)任編輯:田吉捷]endprint