撤離 AWS:3 年省下 27.5 億元

雲頭條 發佈 2024-03-29T23:11:54.497159+00:00

作者:Efim Mirochnik是新加坡搜尋引擎優化工具廠商Ahrefs的數據中心運營主管之一。雲非常流行,以至於遷移到雲已儼然成為了一股趨勢。IaaS雲具有諸多優勢:靈活性、部署時間短、易於擴展、立即覆蓋到全球許多地區等等。雲服務提供商通常提供易於使用的便捷服務。

作者:Efim Mirochnik是新加坡搜尋引擎優化工具廠商Ahrefs的數據中心運營主管之一。

雲非常流行,以至於遷移到雲已儼然成為了一股趨勢。IaaS雲具有諸多優勢:靈活性、部署時間短、易於擴展、立即覆蓋到全球許多地區等等。

雲服務提供商通常提供易於使用的便捷服務。憑藉營銷、會議、認證及其他方面精挑細選的使用場景,人們很容易認為雲是現代企業IT的唯一合理的出路。

但獲得這些雲服務好處的同時也需要高昂的成本。

成本如此之高,以至於我們擔心:如果自己的基礎設施百分之百放在雲端,我們公司能不能存活。這促使我們基於事實進行了一番實際比較。結果如下。

Ahrefs的自有硬體概況

Ahrefs在新加坡租用了一個託管數據中心,其基礎設施相當同質化。因此,我們決定合算花在該數據中心上的所有成本,除以伺服器數量,然後將其與AWS雲端的類似安裝環境的成本進行比較(這裡將AWS列為主要的IaaS提供商)。

Ahrefs伺服器


我們的硬體比較新。託管合同是從2020年年中開始訂的,當時正值新冠疫情封鎖高峰期。所有安裝的設備都是那時購買的。

我們在這個數據中心的伺服器有類似的配置。唯一的區別是使用兩代CPU,但核心數量一樣多。我們的每台伺服器使用多核CPU、2TB RAM和2x 100Gbps。伺服器平均有大約16個15TB硬碟。

計算每月的成本時,我們假設所有的硬體將只使用五年。我們決定把任何超過五年的硬體資源都視為「免費」。在此基礎上,每月的初始設備成本為原價除以60個月(5*12)。

所有目前的成本(比如租金和電費)都是自2022年10月算起。儘管通貨膨脹也會影響我們,但試圖計入通脹因素會讓成本計算變得極為困難,於是我們暫時忽略這個因素。

我們的託管費用包括兩大塊:租金和實際消耗的電錶電量。自2022年初以來,電價大幅上漲。但我們按照最新的、更高的電費來計算每月電費,而不是按照整段租賃期的平均電費來計算,後者電費會更低。因此,這讓AWS更有優勢。

此外,我們還為數據中心與我們的入網點(POP)之間的IP Transit和暗光纖支付費用。

下表顯示了我們每台伺服器的每月支出。伺服器硬體占每月總支出的三分之二,而數據中心租金電費(DC)、網際網路服務提供商(ISP)IP Transit、暗光纖(DF)和內部網絡硬體(Network HW)占剩餘的三分之一。

我們自己的內部硬體成本結構:

AWS成本結構

由於我們的託管地點在新加坡,於是我們使用AWS亞太(新加坡)地區的價格進行比較。

AWS的成本結構與託管方案不一樣。遺憾的是,AWS並不提供CPU核心數量與我們使用的一樣的EC2實例。於是我們找到了擁有一半核心數量和1TB RAM的EC2配置。然後,我們將一台Ahrefs伺服器的成本與兩個這樣的EC2實例的成本進行比較。

此外,我們還考慮了EC2的長期使用。因此,我們比較了3年預留EC2實例的最低價格與5年本地伺服器的最低價格。

除了EC2實例外,我們還添加了彈性塊存儲(EBS)。它不是直接連接存儲(DAS)的準確替代品,因為我們在伺服器中使用容量大、速度快的NVMe驅動器。為了簡單起見,我們選擇了更便宜的gp3 EBS(不過速度比我們的慢得多)。其成本包括兩部分:存儲容量和IOPS費用。

我們將數據塊的兩個副本放在伺服器上,但是我們只訂購EBS中用於複製的可用空間,因此gp3存儲大小的價格相當於我們的驅動器大小除以2:(1*1TB + 16*15TB)/2≈120TB每台伺服器。

我們沒有加上更高IOPS的成本,我們還忽略了EBS gp3的種種限制。比如說,gp3最大吞吐量/實例為10GB/s。與此同時,單個PCIe Gen 4 NVMe驅動器的性能為6-7GB /s,而我們有16個這樣的驅動器並行工作。因此,這不是完全同類的比較,但這種方法可以顯著降低AWS的存儲成本,從而使其具有進一步的優勢。

與託管方案不同的是,AWS按下載的GB收費,而不是按帶寬收費。因此,我們粗略估算了每台伺服器的平均下載量,並將其用於計算AWS網絡流量費用。

將所有這三個部分結合在一起,我們得出了AWS的如下成本分布。

自有硬體 vs AWS

合併上面的表格後,我們可以看到假想的AWS支出要高得多。

自有硬體與AWS EC2每月支出:

AWS中擁有類似可用SSD空間的替代EC2實例的成本與託管數據中心中11.3台伺服器的成本大致相同。因此,這意味著我們的20台伺服器機架僅相當於AWS中的大約2台伺服器。

20台Ahrefs伺服器的成本相當於AWS中的2台伺服器:

假設我們在數據中心實際使用的兩年半時間內運行850台伺服器。一旦我們計算出這些數字,就會發現巨大的差異。

AWS與內部方案在30個月內850台伺服器的成本:

可以說,自2020年以來,我們需要向AWS支付高達4億美元(27.5 億人民幣)的費用,才能保持我們在新加坡的基礎設施順利運行。

有人可能會想:「也許Ahrefs掏得起這筆費用?」

沒錯,Ahrefs是一家盈利的、可持續發展的公司,所以不妨看看其收入,然後計算一番。

話雖如此,我們是一家私營公司,沒有義務公布財務數據。但你們可以在《海峽時報》關於2022年和2023年新加坡增長最快的公司的文章中找到有關Ahrefs收入的一些信息。這些文章提供了Ahrefs在2020年和2021年的收入數據。

我們也可以大致推斷出2022年的收入。這是粗略的估計,但足以讓我們得出一些結論。

Ahrefs的2020年-2022年收入估計:

我們從上表中可以看到,Ahrefs在過去三年的總收入約為2.57億美元。但我們也計算出,若用AWS服務來替換這樣一個數據中心,成本將達到約4.48億美元。因此,公司收入甚至不夠支付兩年半的AWS使用成本。

多麼驚人的結果!

這麼一來,我們還有什麼利潤可言?

正如LJ Hart-Smith在20年前為波音公司撰寫的報告所述:「如果主要製造商或系統集成商無法通過把所有工作外包出去來賺錢,那麼誰能從中受益?當然是分包商。」

有必要記住的是,我們為託管數據中心使用高於平均水平的電力成本,只計算EBS的存儲部分,忽略了EBS存儲的速度有多慢,這實際上已經給了AWS幾個優勢。此外,這個數據中心並不是我們唯一的成本中心。我們在其他數據中心、伺服器、服務、人員、辦公室和營銷活動等方面投入資金。

因此,如果雲是我們基礎設施的主要出路,Ahrefs恐怕難以生存。

其他考慮因素

這篇文章沒有考慮到會使成本比較更錯綜複雜的其他方面,包括人際技能、財務控制、現金流量和根據負載類型進行的容量規劃等。

結論

在過去的兩年半時間裡,Ahrefs通過確保其基礎設施不是百分之百在IaaS雲端,省下了約4億美元。這個數字在增加,因為目前我們正在啟動另一個使用新硬體的大型託管數據中心。

雖然Ahrefs利用AWS的優勢在全球不同地方託管前端,但Ahrefs的絕大多數基礎設施仍部署在使用自有硬體的託管環境中。如果Ahrefs的產品百分之百都放在AWS上,公司就不會盈利,甚至不會存在。

如果我們完全使用雲,基礎設施成本將高出10倍以上。但是由於我們沒有這麼做,我們可以把省下來的錢花在實際的產品改進和開發上。因此,獲得更快更好的結果意味著我們的伺服器比雲所能提供的快得多(考慮到雲局限性)。我們的報告也生成得更快速更全面,因為每個報告所需的時間更短。

在這一點上,我建議對可持續增長感興趣的財務長、執行長和企業所有者考慮並定期重新評估雲計算的收益與實際成本。雖然雲計算是早期初創公司的不二選擇,但當公司及基礎設施不斷發展時,將龐大的基礎設施百分之百放在雲端可能會使公司陷入困境。

這就出現了兩難境地。

一旦你上了雲再離開雲有點棘手。雲計算很方便,但容易被鎖定。此外,因更高的成本而放棄雲基礎設施可能不是工程團隊想要的。他們可能認為,與老式的實體數據中心和物理伺服器相比,雲計算是一種極其簡單、極其靈活的環境,這有其道理。

對於一家較成熟的公司來說,從雲遷移到自己的基礎設施很困難。在遷移過程中保持公司的生存也頗具挑戰性。但這種痛苦的舉措可能會拯救公司,因為這可以避免將收入中越來越多的部分支付給雲服務提供商。

大公司(尤其是FAANG)多年來一直在搶占就業市場。它們一直在僱傭工程師來運營龐大的數據中心和基礎設施,留給小公司的人才所剩無幾。但隨著最近幾個月大型科技公司大規模裁員,眼下可能是重新評估雲計算方法的機會,不妨考慮從雲計算遷回到本地,聘請數據中心界經驗豐富的專業人士。

如果你開辦一家新公司,可以考慮買一個機架和伺服器,把它們放在地下室里。這也許一開始就能提高公司的可持續發展性。

關鍵字: