再也不用被廠商「卡脖子」,誼品生鮮全站上阿里雲

數據庫技術達摩院 發佈 2020-05-06T03:58:19+00:00

所有做網際網路、做電商核心業務系統的技術人員都知道,訪問量容量巨增,這對於後台系統會帶來各種不可預知的問題:性能卡頓,網站、APP、小程序等入口不能訪問,訂單出錯,支付不了…

本文轉載自中國軟體網,作者:曹開彬


疫情之下,生鮮電商的訂單突然暴漲。

社區生鮮龍頭企業誼品生鮮就是一個典型代表。它的在線交易量激增,日訂單量超過10萬單。

對電商企業而言,這對業務是個巨大的好消息;但對於IT、對於誼品生鮮的核心業務系統則是一個巨大的挑戰!

所有做網際網路、做電商核心業務系統的技術人員都知道,訪問量容量巨增,這對於後台系統會帶來各種不可預知的問題:性能卡頓,網站、APP、小程序等入口不能訪問,訂單出錯,支付不了……

要命的是,出現其中的任何一個問題,都會對業務、對用戶體驗、對品牌造成巨大傷害。

更進一步,萬一出現了某個問題(說實話,這世界誰也不能保證100%不會出現),而IT卻不能快速解決,將會是災難性的後果。

作為誼品生鮮IT基礎架構的負責人,楊航深知其中滋味。

但幸運的是,他告訴中國軟體網,這次他闖過來了。

而記者也發現,他的闖關經歷,或許是電商企業、甚至是網際網路公司應對業務量暴增的、實現可控、健康運營的「最佳實踐」


01、傳統ERP被廠商卡脖子


為應對業務的快速擴張,2018年年底,誼品生鮮成立了研發團隊。同時,開始大量採購第三方系統,例如ERP、倉儲、供應鏈等。

這些系統都基本上是本地部署,自己買伺服器,資料庫基本都採用Oracle。

這些第三方業務系統往往有一個共同的特點,即核心業務邏輯往往都寫在Oracle資料庫里。

這就帶來了一個巨大的風險:一旦系統出了問題,誼品生鮮自己的技術人員往往無法解決,必須要有系統研發廠商的DBA等相關技術人員協助才能解決。

阿里雲資料庫資深技術專家、資料庫自治服務DAS產品線負責人李廣望介紹,這其實是很多電商企業面臨的一個典型場景。

這種傳統的資料庫架構,最怕系統出問題。因為一出問題時,自己沒法解決,必須依靠廠商的技術人員才能解決。

但由於廠商的技術人員不可能馬上響應,也不可能立即到現場解決,這種情況下解決一個問題需要花費很長時間。

這對於每分鐘都有巨大業務量的網際網路企業而言,這絕對是不能忍受的。

例如,誼品生鮮有次進行門店盤點,卻出現沒辦法提交盤點成果的現象。誼品技術人員很快排查發現,原因是系統的Oracle資料庫阻塞了。

「這涉及到第三方系統,我們自己的技術人員無法解決。必須要找ERP廠商,讓他們的DBA來處理。」

當時解決這個問題,花了很長時間。這給誼品生鮮帶來了極大的損失。

對於電商企業而言,這種情況其實是「被廠商卡住了脖子」。自己有技術人員,卻無法衝上去解決問題。

這個問題必須解決。否則,電商業務系統的可靠性與穩定運行將有巨大的不可控風險。


02、採用雲原生架構自研系統


從阿里巴巴、京東、百度、美團等網際網路企業的實踐來看,中國軟體網發現,解決這個問題的根本途徑就是——自已研發核心業務系統。

如果採用第三方系統,永遠存在不可控的風險。

而對於網際網路企業,核心業務系統是自己的命根子。它必須絕對可控,容不得有半點閃失。

要絕對可控,就必須自己研發系統。

另外,每個網際網路或電商企業,其實都有獨特的供應鏈模式、運營模式。市場上很難找到一個第三方系統能夠很好地支撐他們的運營。

就像誼品生鮮,在開始的三年,由於需求無法滿足的原因曾經換過幾個系統。

每次換系統都是一個非常痛苦的過程。這也是誼品生鮮決定成立自己的研發中心,自己的研發系統的關鍵原因。

因此,誼品生鮮下定決心自己組建專門的IT研發團隊,自已研發核心業務系統。楊航甚至還向中國軟體網透露,未來所有系統都要由誼品生鮮自研,包括財務軟體。

在雲時代,自研系統必須採用雲原生技術,這樣才能有效解決傳統ERP等業務系統的架構不合理,同時又能研發完全符合自己需求的系統。


03、資料庫上雲、去Oracle


資深架構師都知道,保證業務系統可控的核心在於資料庫。

自研系統要絕對可控,資料庫用什麼呢?

大家的第一個共識是,不能再用Oracle。

原因主要有兩個。一是Oracle在技術上不可控;二是Oracle成本太高,Oracle的雲資料庫版本也較少,與之對應的雲上運維與管理工具也比較少。

第二個共識是,資料庫要上雲,要用雲資料庫。權威市場研究機構Gartner指出,雲資料庫將是未來。到2021年,雲資料庫在整個資料庫市場中的占比將首次達到50%;而到2023年,75%的資料庫要跑在雲平台之上。

最核心的原因是,傳統資料庫產品存在擴展速度慢、效率低等問題,根本無法滿足業務系統對實時性、穩定性、快速擴容的需求。

就像誼品生鮮因疫情而突然在線交易量激增,日訂單量超過10萬單。本地部署的傳統資料庫很難應對這種爆髮式的增長,實現彈性擴縮容。

但這是雲資料庫的強項。

雲原生資料庫往往採用利用分布式共享存儲,並且存儲和計算分離、解耦,以方便在存儲和計算分別進行彈性擴容,做到極致的彈性。在彈性、高可用、負載均衡等方面,雲資料庫基本都是明顯優於本地部署的資料庫。

並且,雲資料庫可以做到「按需按量使用,同時按需按量計費」。這對於網際網路企業而言極具吸引力。

如果用本地資料庫,要做到和雲資料庫一樣的高可用性,成本就會非常高。

對於誼品生鮮而言,由於其伺服器等硬體基礎設施已全面上雲。系統上雲、資料庫上雲也是一個必然趨勢。

最初誼品生鮮的業務系統採購自第三方廠商,並且部署在線下IDC機房內。一旦出了問題就只能等廠商的人來解決問題。

但現在,通過將全部業務遷移到阿里雲之上,並且深度使用雲資料庫,楊航帶領的基礎架構團隊才終於感覺有了控制權。


04、自治化與智能化


對於網際網路和電商企業而言,隨著自研系統的增多,資料庫運維與管理的挑戰將會越來越大。

對於誼品生鮮同樣如此。楊航下一步的解決方案是,誼品生鮮自己的技術運維團隊會更側重於內部運維效率平台的研發,以此逐步減少DBA人員,降低運維成本、控制安全風險。

同時,DBA的傳統職能會被淡化掉,他們主要用於研發效率工具、自治服務工具,做更高價值的工作。自研系統疊代速度非常快,如果沒有資料庫的自治服務,不能實現自動化、智能化運維,還需要大量人工運維介入,會大大增加線上系統出故障的幾率。

巧合的是,這也正是阿里雲資料庫自治服務DAS產品的發展目標。

DAS產品最早源於2014年的CloudDBA,是一個服務於內部的研發人員工具。2016年,阿里雲對它進行了升級和產品化,作為雲服務推向了市場。從2017年開始阿里雲在其中加入自治功能,並利用阿里巴巴的場景和技術不斷驗證和完善,一直持續到2019年年底,正式更名為DAS。

作為阿里雲資料庫DAS產品線負責人李廣望深有感觸,阿里雲資料庫自治服務DAS基於阿里巴巴自身資料庫規模化運維的專家經驗,結合人工智慧和機器學習技術,已實現了自感知、自診斷、自修復和自安全的資料庫自動駕駛能力。

正是這個資料庫自治服務產品打動了楊航。

據楊航介紹,誼品生鮮的所有自研系統都基於雲服務,所有的雲服務都和阿里雲深度合作。

誼品生鮮選擇阿里雲的原因有兩個。第一個是誼品生鮮已經是阿里雲IaaS用戶。所有的硬體基礎設施都在阿里雲上,雲資料庫也能使用阿里雲是最好的選擇。

第二個原因更為重要。他們是看上了阿里雲在雲資料庫方面的生態完整性

楊航認為,資料庫運維與管理的便捷性、總體擁有成本是選擇哪個廠商的雲資料庫時必須要考慮的重要因素。

對於網際網路公司或電商企業而言,他們不能在資料庫運維方面投入太多人員,否則成本太高,也特別容易出問題。

楊航團隊曾對國內市場上的資料庫運維與管理工具做過詳細比較,相對而言,阿里雲DAS具有比較明顯的優勢。例如,其功能全面性比其他國內廠商好,控制台及帳單功能比國外廠商好。

並且在合作的過程中,阿里雲資料庫對誼品反饋問題的處理效率非常高,並且產品質量非常有保障。誼品生鮮對阿里雲的服務支持非常滿意。

對於誼品生鮮這樣的電商企業來說,資料庫運維效率工具要能完全地將運維團隊的工作流程和研發團隊的開發流程結合起來。也即是說,阿里雲DAS要和誼品生鮮內部效率平台結合起來,賦能給研發人員。例如,雲上資料庫出現了告警,DAS未來要能把問題直接轉給相應的研發人員,從而提升效率。

按這種模式,以前他們處理一個故障平均需要10-20分鐘,要人肉排查故障,應用了阿里雲DAS之後,只需幾分鐘,問題就能得到定位和解決,效率提升非常明顯。

正是藉助資料庫自治服務DAS,誼品生鮮自研系統的運維只需要幾個人就能搞定。通過上雲和深度使用雲資料庫,誼品生鮮總體資料庫使用成本降低了40%~50%

在中國軟體網看來,誼品生鮮利用雲原生技術、採用雲資料庫自研系統的實踐意義還不僅如此。它最重要的是為同行們提供了在數字世界裡應對未知性、掌握可控性的一個方法。

關鍵字: