連續八年霸榜雲資料庫「領導者」,揭秘亞馬遜雲科技背後的統治力

申斯基 發佈 2024-05-01T05:23:35.010266+00:00

如在支持資料庫方面,亞馬遜雲科技從MySQL開始,陸續為Amazon RDS添加了 MariaDB、Oracle、SQL Server 或 PostgreSQL 等;

日前,全球市場分析機構 Gartner發布《2022 雲資料庫管理系統魔力象限》報告。其中,在Gartner本次魔力象限報告評估的20家供應商中,亞馬遜雲科技在縱軸「執行能力」和橫軸「願景完整性」兩個維度分別處於最高、最右位置,這也是亞馬遜雲科技連續八年在Gartner雲資料庫管理系統魔力象限報告中被評為「領導者」。

Gartner雲資料庫管理系統魔力象限報告,無疑是業內最嚴苛的廠商綜合能力評估之一,評估對象包括亞馬遜雲科技、微軟、阿里雲、谷歌、甲骨文等全球領先的廠商,其涵蓋了前瞻性和執行力兩大維度共15個核心指標以及200多項細則,可以說是全球各大資料庫廠商的必爭之地。

資料來源:Gartner(2022年12月)

從這個角度來說,入選Gartner雲資料庫魔力象限報告本身就是一種實力的體現,更何況是連續八年入選「領導者」象限,亞馬遜雲科技的雲資料庫產品的技術和戰略在全球市場的競爭力和領導力可見一斑。

那麼,亞馬遜雲科技為何連續八年「霸榜」Gartner雲資料庫領導者?在這背後,它究竟有何與眾不同的優勢和競爭力?更為關鍵的是,在數據已成為生產要素的今天,亞馬遜雲科技能否繼續把其優勢轉換為勝勢,並將全球雲資料庫市場的發展帶到一個全新的高度呢?

軟硬體融合創新實現引領

作為全球最大的雲資料庫服務提供商,亞馬遜雲科技在推出第一項雲資料庫服務不到10年的時間裡,就實現了對市場的全面引領,背後的重要原因究竟是什麼呢?其實在Gartner雲資料庫魔力象限報告中,就點出了關鍵——那就是「亞馬遜雲科技擁有支持其領先地位的底層基礎設施,以及業內最大的生產用戶群體。」

換句話說,亞馬遜雲科技基於其強大的底層基礎設施的集成和優化,奠定了其雲資料庫軟硬體的融合創新,由此不僅提升了雲資料庫的高性能,更引領了全球雲資料庫的未來發展之路。

確實如此,不是隨便一個資料庫從物理機搬到雲環境裡,做一些資源調度的接口,通過雲平台能夠向外提供資料庫服務,就可以稱之為雲資料庫,真正的雲資料庫需要和其底層的基礎設施,或者「雲底座」能力實現有機融合,才是雲資料庫區別於其他資料庫最為重要的特徵。

在這方面,亞馬遜雲科技為了增強其雲資料庫的極致性能,就做了大量的軟硬體融合的創新,而自研晶片就是亞馬遜雲科技高度重視硬體底層技術創新的證明。自2013年推出Amazon Nitro系統以來,亞馬遜雲科技已經推出了多款自研晶片,包括五代Nitro系統、致力於為各種工作負載提升性能和優化成本的三代Graviton晶片、用於加速機器學習推理的兩代Inferentia晶片,以及用於加速機器學習訓練的Trainium晶片。

以虛擬化晶片Nitro為例,其最早可追溯到2012年,歷經十年的發展其目前已演進到第五代Nitro 5,其電晶體數量是上一代Nitro的兩倍,整個數據包的轉發能力提升了60%,延遲減少了30%,每瓦特的性能提升了40%,而其強大的性能優勢可以說又為雲資料庫釋放其能力夯實了底座的能力。

在此基礎上,亞馬遜雲科技又持續的對雲資料庫做疊代和優化。以Amazon RDS為例,作為全球雲資料庫託管服務的「標杆」,在推出Amazon RDS for MySQL 後,亞馬遜雲科技也持續不斷的對該服務在不同維度上進行著不斷的創新。如在支持資料庫方面,亞馬遜雲科技從MySQL開始,陸續為Amazon RDS添加了 MariaDB、Oracle、SQL Server 或 PostgreSQL 等;而在性能方面,去年12月,亞馬遜雲科技也引入了Amazon RDS Optimized Writes(優化寫入)及 Amazon RDS Optimized Reads(優化讀取)兩個功能,將用戶最為關注的資料庫寫入性能及讀取性能全面地進行了大幅提升。

其中,Amazon RDS Optimized Writes功能,就可以幫助用戶在不收取額外費用的情況下將寫入事務吞吐量提高多達兩倍,且能保持相同的預調配的IOPS 水平。具體來說,亞馬遜雲科技通過底層EC2上引入 Nitro卡,讓EC2 能夠自動處理16KiB 的頁面刷新,從而無需再將16KiB 的數據切分到4KiB 再進行寫入,從而能夠顯著降低 IO,提升寫入的性能。也就是說,通過Amazon RDS Optimized Writes,用戶可以使用統一的16KiB 資料庫頁面、文件系統塊和作業系統頁面,並以原子方式將它們寫入存儲(全部成功或全部失敗),從而最高可以將性能提高至未開啟的 Optimized Writes 的兩倍。

而Amazon RDS Optimized Reads功能,同樣可以幫助用戶更加有效地利用實例本地高速 SSD 緩存臨時表空間,以更低延遲和更高吞吐量對臨時表空間進行高效訪問,從而能夠最高提升資料庫50%的讀取性能。也正因此,Amazon RDS Optimized Reads的引入,將在用戶的以下場景中起到更多的作用,包括括複雜表表達式、派生表和分組操作的分析查詢;處理未優化的應用程式查詢的只讀副本;具有複雜操作的按需或動態報告查詢,無法始終使用適當的索引等等。

值得一提的是,Amazon RDS Optimized Writes和Amazon RDS Optimized Reads的加入,結合MySQL 8.0版本優勢能夠為使用者提供更極致性價比的 RDS 服務。MySQL 8.0在性能方面本身也實現了極大的提升,其速度本身將比 MySQL 5.7快2倍,官方測試數據也顯示,MySQL 8.0 全內存訪問可以輕鬆跑到200W QPS,I/O 極端高負載場景可以跑到16W QPS,無論是在讀/寫工作負載、IO 密集型工作負載、以及「hot spot」工作負載場景面,MySQL 8.0都有其顯著的優勢。

也正因此,藉助Amazon RDS Optimized Writes和Amazon RDS Optimized Reads中的關鍵特性,同樣也能更好地釋放MySQL 8.0的性能優勢,讓用戶在任何工作負載場景下都能實現「快人一步」。同時MySQL自1995年發布以來,歷經多個版本疊代至MySQL 8.0,已成為MySQL社區體系內的主流版本和事實標準。

由此可見,亞馬遜雲科技領跑雲資料庫市場的背後,正是其長期以來堅持軟硬體集成優化和融合創新的結果,由此實現了雲資料庫的高性能,這不僅是其競爭力的關鍵體現,更為亞馬遜雲科技連續八年入選Gartner魔力象限「領導者」的堅實基礎。

極致高可用性的獨特秘密

眾所周知,雲資料庫在運行過程中總會遇到各種各樣的問題,例如程序BUG、設備故障、機房斷電等,因此理想的容災架構和機制,就是要在這些問題發生時,能夠保證數據的一致性和高可用性。

在這方面,亞馬遜雲科技的雲資料庫也始終以「極致高可用」作為第一考量,而其構建的Region(區域)內的跨可用區(Multi Availability Zone,Multi-AZ)的高可用能力,正是其獨特的優勢所在,而這種「全球架構,一鍵部署」的能力,不僅讓用戶真正無需擔心災難恢復等問題,同時更為用戶構築了一道雲資料庫高可用能力的「護城河」。

目前,亞馬遜雲科技所有的雲資料庫都具備 Multi-AZ 高可用特性。還是以Amazon RDS Multi-AZ為例,目前Amazon RDS 就為用戶提供了豐富的多可用區部署選項,用戶可以選擇一個備用或兩個備用資料庫實例。

具體來看,Amazon RDS多可用區部署讓RDS資料庫實例的可用性和持久性得到提升,使其成為生產系統資料庫工作負載的「天然搭檔」。當用戶預置多可用區資料庫實例時,Amazon RDS 會自動創建主資料庫實例,並將數據同步複製到不同可用區(AZ)中的備用實例。這樣,每個可用區在其獨立的、不同的基礎設施中運行,並具備高可靠性。而如果基礎設施出現故障停機,Amazon RDS 會自動執行故障轉移到備用設備,以便在故障轉移完成後立即恢復資料庫操作。由於資料庫實例的終端節點在故障轉移後保持一致,所以應用程式無需手動管理干預即可恢復資料庫操作。

在此過程中,當用戶部署有一個備用資料庫實例時,稱為「多可用區資料庫實例部署」,多可用區資料庫實例部署有一個備用資料庫實例,可提供故障轉移支持,但不提供讀取流量。當部署有兩個備用資料庫實例時,稱為「多可用區資料庫集群部署」,而多可用區資料庫集群部署具有備用資料庫實例,可提供故障轉移支持,還可以提供讀取流量。

數據顯示,使用 Amazon RDS Multi-AZ 在三個可用區中部署具有高可用性和持久性的 MySQL 或 PostgreSQL 資料庫,並提供兩個可讀備用實例。通常在不到 35 秒的時間內實現自動故障轉移,與帶一個備用實例的 Amazon RDS Multi-AZ 多可用區資料庫實例部署相比,事務提交延遲快2倍,並擁有額外的讀取容量。

截止目前,Amazon RDS 多可用區可用於 Amazon RDS for MariaDB、Amazon RDS for MySQL、Amazon RDS for PostgreSQL、Amazon RDS for Oracle 和 Amazon RDS for SQL Server。此外,帶兩個可讀備用實例的 Amazon RDS 多可用區可用於 RDS for MySQL 和 RDS for PostgreSQL。

除了Multi-AZ 高可用特性之外,近期亞馬遜雲科技還推出了Amazon RDS Blue/Green Deployments (藍/綠部署)功能,藍/綠部署創建了一個完全託管的暫存環境,用戶可以在其中部署和測試生產更改,從而確保當前生產資料庫的安全,這樣就可以更好地幫助用戶更安全、更簡單、更快速地更新 Amazon Aurora 和 Amazon RDS 資料庫。

不難看出,亞馬遜雲科技這種Multi-AZ 高可用特性的優勢給用戶帶來的價值體現在——用戶能夠最多跨三個可用區(AZ)部署高可用性、高耐用性雲資料庫,從而真正保證業務的一致性和穩定性,這種極致高可用的獨特能力無疑是當下的其他雲服務商所不具備的,也讓亞馬遜雲科技的雲資料庫真正能夠在企業關鍵業務中扮演「核心角色」的秘訣和關鍵所在。

引領時代更創造時代背後

事實上,無論是基於軟硬體集成優化實現雲資料庫的高性能,還是基於Multi-AZ部署實現雲數據的高可用性,都是亞馬遜雲科技在雲資料庫領域堅持技術創新的「縮影」,而今天其在創新的廣度和深度方面,同樣也在全球「首屈一指」。

一方面,從創新的「廣度」來看,亞馬遜雲科技從用戶的需求入手,目前已構建出雲原生端到端的數據戰略,讓用戶可以更便捷、安全地獲取數據洞察,而這種端到端的雲數據產品的組合創新,也讓亞馬遜雲科技在資料庫市場日益受到用戶的信賴和歡迎。

可以看到,早在2007年,亞馬遜雲科技就發布了首個資料庫服務,隨後在2009年推出了首個完全託管的MySQL資料庫服務——關係型資料庫Amazon RDS。2012年,亞馬遜雲科技推出了首個無伺服器資料庫Amazon DynamoDB,並推出了分析資料庫Amazon Redshift,繼續擴大其雲資料庫產品的「陣容」;之後,亞馬遜雲科技在2014年推出了雲原生關係資料庫Amazon Aurora,與 MySQL 和 PostgreSQL 兼容,性能與商業資料庫相同,但成本只有商業資料庫的十分之一,而且可以滿足用戶最苛刻的工作負載需求。

歷經16年的發展,今天亞馬遜雲科技雲數據產品線的「廣度」是前所未有的。其中,針對運營場景的服務有Amazon RDS(託管式關係資料庫)、Amazon Aurora(雲原生關係資料庫)、Amazon DynamoDB(鍵值資料庫)、Amazon Neptune(圖資料庫)、Amazon DocumentDB(文檔資料庫)、Amazon Keyspaces(適用於Apache Cassandra)和Amazon MemoryDB(內存資料庫);針對分析場景的服務有Amazon Redshift(數據倉庫)、Amazon Athena(交互式數據查詢服務)和Amazon EMR(大數據處理服務)。在此基礎上,亞馬遜雲科技還提供專門構建的資料庫服務Amazon Timestream(時序資料庫)和Amazon Quantum Ledger Database(分類帳資料庫)等,以及兼容Redis和Memcached的資料庫緩存服務Amazon ElastiCache等等,這也是亞馬遜雲科技在雲資料庫領域建立起強大「統治力」的關鍵。

另一方面,從創新的「深度」來看,亞馬遜雲科技也取得了重要的突破。其中,針對ETL(數據的提取、轉換和加載過程),亞馬遜雲科技在去年也發布了兩項全新的集成功能,幫助用戶實現「Zero-ETL」。過去,企業業務數據往往需要通過ETL才能進行分析從而提供洞察,但這一過程往往耗時且枯燥。現在,用戶可以使用Amazon Redshift近乎實時地分析Amazon Aurora中的數據,無需在不同服務之間進行ETL。用戶還可以使用亞馬遜雲科技的分析和機器學習服務在Amazon Redshift的數據上輕鬆運行 Apache Spark應用程式。(深入閱讀:《亞馬遜雲科技:「Zero ETL」邁出關鍵一步,數據由此實現「無感知」流動)

此外,數據服務Serverless化領域,Amazon OpenSearch也推出了Serverless無伺服器功能,可幫助企業在無需配置、擴展或管理底層基礎設施的情況下運行搜索和分析工作負載,這一更新也標誌著亞馬遜雲科技數據分析服務的全面無伺服器化。

到此為止,亞馬遜雲科技所有的數據分析服務都實現了Serverless化——除了Amazon OpenSearch Serverless之外,目前亞馬遜雲科技的「無伺服器」數據分析服務已經涵蓋了交互式查詢服務Amazon Athena、大數據處理服務Amazon EMR、實時數據分析服務Amazon Kinesis和Amazon MSK、數據倉庫服務Amazon Redshift、數據集成服務Amazon Glue以及業務智能(BI)服務Amazon QuickSight,而這一系列的產品矩陣,真正做到了讓「無伺服器」數據分析服務的體驗「觸手可及」,真正持續引領了Serverless技術創新的範式。

全文總結,連續八年入選Gartner雲資料庫領導者魔力象限,不僅證明了亞馬遜雲科技在雲資料庫領域的技術創新力和前瞻洞察力,以及作為市場領導者和顛覆者的強勁實力。尤為重要的是,通過更大力度的技術創新和落地實踐,亞馬遜雲科技的雲資料庫也將為全球的企業實現更好的數位化轉型構築基石,而這也是其引領時代更創造時代的真實寫照。




關鍵字: