(資料圖片)
數(shù)字化時(shí)代,業(yè)務(wù)“在線”是每個(gè)企業(yè)的常態(tài)。作為企業(yè)經(jīng)營(yíng)管理軟件中最關(guān)鍵的應(yīng)用系統(tǒng),ERP承載著企業(yè)所有的業(yè)務(wù)流程和數(shù)據(jù)資產(chǎn),是企業(yè)日常運(yùn)行的重要依托。因此業(yè)務(wù)7*24小時(shí)“在線”的“可靠性”成為衡量ERP的一大關(guān)鍵指標(biāo)。
日前,華為宣布實(shí)現(xiàn)自主創(chuàng)新的MetaERP研發(fā),完成對(duì)舊ERP系統(tǒng)的替換,經(jīng)歷了月結(jié)、季結(jié)和年結(jié)的考驗(yàn),交出“零故障、零延時(shí)、零調(diào)賬”的滿意答卷,證明了MetaERP系統(tǒng)的“可靠性”。這背后離不開(kāi)華為云GaussDB數(shù)據(jù)庫(kù)的支撐。
華為舊ERP系統(tǒng)隨華為業(yè)務(wù)發(fā)展運(yùn)行了20多年,支撐著每年數(shù)千億產(chǎn)值的業(yè)務(wù)和全球170多個(gè)國(guó)家業(yè)務(wù)的高效經(jīng)營(yíng),具備“強(qiáng)一致性”的典型特征:不僅承載華為250多個(gè)會(huì)計(jì)核算場(chǎng)景、140多個(gè)核算模板、3000多個(gè)核算規(guī)則, 還需要完成海外100多個(gè)子公司的多準(zhǔn)則適配,靈活編排業(yè)務(wù)規(guī)則,當(dāng)國(guó)家會(huì)計(jì)準(zhǔn)則發(fā)生變化,不用IT改程序就可以直接調(diào)整,對(duì)賬本的準(zhǔn)確性、靈活性和一致性要求極高。
這讓MetaERP的替換從一開(kāi)始就面臨著一個(gè)“極致要求”:絕對(duì)的強(qiáng)一致和高可用,確保單單、單帳、賬實(shí)一致性,達(dá)到金融級(jí)的可靠性。如何在替換舊有數(shù)據(jù)庫(kù)的同時(shí),達(dá)到這樣的要求,成為GaussDB團(tuán)隊(duì)從一開(kāi)始就擺在首位的工作。
什么樣的數(shù)據(jù)庫(kù)才有這樣的能力?當(dāng)時(shí),團(tuán)隊(duì)面臨兩個(gè)選擇,一是繼續(xù)沿用馬來(lái)西亞子公司此前使用的業(yè)界開(kāi)源友好的PG數(shù)據(jù)庫(kù),二是使用華為自主創(chuàng)新的華為云GaussDB數(shù)據(jù)庫(kù)。最終,GaussDB依托自身的優(yōu)勢(shì),提供同城AZ內(nèi)、跨AZ、異地跨Region的兩地三中心容災(zāi)方案,很好地滿足了華為業(yè)務(wù)對(duì)MetaERP永久在線的需求。
為了實(shí)現(xiàn)數(shù)據(jù)的強(qiáng)一致性,GaussDB通過(guò)DCF(分布式共識(shí)框架)模式提升了容災(zāi)能力的規(guī)格,支持一致性日志復(fù)制,在任意節(jié)點(diǎn)故障、主備切換情況下保障日志不分叉,并且支持一致性選主,確保任何故障下都不會(huì)發(fā)生腦裂雙主,SLA服務(wù)達(dá)到了99.99%。
在保證數(shù)據(jù)一致性的前提下,團(tuán)隊(duì)圍繞容災(zāi)也展開(kāi)很多研究,支持了流式容災(zāi),突破了基于物理日志的并行復(fù)制技術(shù),支撐MetaERP高效完成同城3AZ高可用部署,并且通過(guò)異地跨云容災(zāi)集群的搭建,實(shí)現(xiàn)了異地1700多公里的城市級(jí)容災(zāi)能力,當(dāng)一個(gè)地方發(fā)生故障,另一個(gè)地方快速完成容災(zāi)集群的切換,保障業(yè)務(wù)正常運(yùn)行;6小時(shí)以上的閃回能力,避免了人為失誤操作導(dǎo)致的數(shù)據(jù)丟失,同時(shí)閃回查詢對(duì)系統(tǒng)性能的影響極低;
通過(guò)三副本數(shù)據(jù)強(qiáng)一致技術(shù),實(shí)現(xiàn)RPO等于零,數(shù)據(jù)不丟失,安全守護(hù)每一筆存貨交易的準(zhǔn)確記錄,交易成功率100%,截至目前,系統(tǒng)運(yùn)行實(shí)現(xiàn)了做到了“數(shù)據(jù)零丟失、業(yè)務(wù)永在線”。
為了確保系統(tǒng)足夠穩(wěn)定可靠,整個(gè)上線過(guò)程中,GaussDB團(tuán)隊(duì)進(jìn)行了多次真實(shí)場(chǎng)景的故障演練,比如對(duì)準(zhǔn)歷史故障異常場(chǎng)景,選定了斷網(wǎng)和斷電演練。對(duì)斷網(wǎng)場(chǎng)景進(jìn)行了單機(jī)柜斷網(wǎng)、整排機(jī)柜斷網(wǎng)和AZ級(jí)斷網(wǎng)演練,對(duì)斷電場(chǎng)景進(jìn)行了單機(jī)柜斷電、整排機(jī)柜斷電和市電掉電演練。做單機(jī)柜斷電時(shí)對(duì)西安機(jī)柜進(jìn)行了誤下電演練,做整排機(jī)柜斷電時(shí)對(duì)貴陽(yáng)小母線進(jìn)行了誤下電演練,而針對(duì)市電掉電對(duì)東莞EDCM9模塊進(jìn)行了掉電演練。最后結(jié)果顯示,無(wú)論是在哪種情況下,系統(tǒng)端到端故障都能保證在5分鐘之內(nèi)快速恢復(fù),達(dá)到了預(yù)期目標(biāo)。在充分的故障場(chǎng)景測(cè)試下,MetaERP的高可用和高可靠能力得到了全面的驗(yàn)證。
可靠性是ERP系統(tǒng)的“生命線”。實(shí)踐證明,華為云GaussDB完全經(jīng)受住了這場(chǎng)世界級(jí)的攻堅(jiān)考驗(yàn),也完全具備支撐大型一體機(jī)系統(tǒng)遷移上云的能力,并積累了豐富的經(jīng)驗(yàn)。未來(lái),華為云GaussDB將一如既往地持續(xù)聚焦真實(shí)業(yè)務(wù)場(chǎng)景,潛心研磨數(shù)據(jù)庫(kù)根技術(shù),為企業(yè)數(shù)智化轉(zhuǎn)型保駕護(hù)航。
標(biāo)簽: