150萬企業離「數據自由」更近了一步

虎嗅app 發佈 2022-12-04T18:43:29.420896+00:00

上個月,《英雄聯盟》全球總決賽S12落下帷幕,據Esports Charts報導,至少有510萬名觀眾通過直播平台同時觀看了《英雄聯盟》S12總決賽,穩居2022 年排行榜第一。

許多企業繼續在加深數位化和智能化的路上狂奔。


上個月,《英雄聯盟》全球總決賽S12落下帷幕,據Esports Charts報導,至少有510萬名觀眾通過直播平台同時觀看了《英雄聯盟》S12總決賽(甚至這一數據,還不包含國內的觀眾數),穩居2022 年排行榜第一。


作為全球最受歡迎、運營最成熟的多端遊戲,《英雄聯盟》2022年上半年峰值月活躍用戶數一度突破2億。龐大的用戶量生成了巨量的數據,每天20個大區、玩家們每秒貢獻的50萬次事件,都會轉化為20TB記錄數據,塞到拳頭遊戲(英雄聯盟的開發商)手裡。


這些聽起來就很多的數據,包括了使用什麼英雄與皮膚、購物籃中的物品(皮膚、回城特效),為各種產品提供支持,包括配對、個性化、分析、安全、反作弊和玩家行為等,是拳頭遊戲運營英雄聯盟的核心數據。


例如每次《英雄聯盟》發布了新英雄與新版本之後,後端數據分析師需要重點關注遊戲玩家使用新版本後的反饋,比如:遊戲時長是否有變化、防禦塔是否更早地被摧毀等等。這些都和遊戲對局的平衡性有關,分析師們需要通過這些數據來評估新版本的體驗,以及未來的優化方向。


但在以前,這些對遊戲日常運維極端重要的數據,即便已經生成,卻不能馬上查詢,複雜的數據提取分析過程有些時候足足要6個小時。如此慢的反應速度,顯然不可能最大程度保證遊戲穩定運行,以及用戶優秀的遊戲體驗。


在多番考察和比較之後,拳頭遊戲最終選擇了和亞馬遜雲科技達成合作,通過採用亞馬遜雲科技提供的服務,轉變遊戲設計和內容部署方式,反過來對遊戲體驗進行升級。


通過使用事件驅動的無伺服器數據集成工具Amazon Glue作為元數據存儲,幫助數據工程師、數據科學家來進行數據查看與檢索,並且藉助流數據服務Amazon MSK Serverless,拳頭遊戲成功地將6小時一下子縮短到5分鐘,節省下來的時間和人力可以聚焦在提升實際的遊戲體驗之上。


除了整體運維的數據分析之外,拳頭遊戲在亞馬遜雲科技的幫助下,還重點解決了遊戲內部的惡意聊天信息檢測,提升客服查詢效率,對每個用戶評估授予個性化的獎勵。



在前陣子的S12全球總決賽中,雙方還合作構建了一整套全新的決賽數據架構,在實現穩定的畫面轉播的同時,還首次在如此規模的電競轉播中引入了「由亞馬遜雲科技提供支持的統計數據」,這些數據將在拳頭遊戲面向全球的電競轉播之前、期間和之後呈現,向粉絲展現決定團隊能夠獲勝的關鍵數據點。


徹底無伺服器,雲化的新時代到來


作為雲計算領域的開路者、探路者,亞馬遜雲科技一直在行業內推動著無伺服器技術的創新與發展。在前天召開的亞馬遜re:Invent 2022大會上,亞馬遜雲科技就再次集中展現了它們雲端能力的更新,其中無伺服器服務就是重中之重。


回歸到本質上,無伺服器(Serverless)架構的出現,旨在讓開發人員從基礎設施資源的日常管理中抽身出來,從而能夠將注意力集中到業務邏輯之上,最終通過更直接的應用和業務來實現運行。



早在2014年,亞馬遜雲科技就推出了整個行業內首款Serverless函數計算服務Amazon Lambda。發展至今,亞馬遜雲科技已累計發布了超過100款新的Serverless功能,覆蓋了計算、存儲、網絡、容器、資料庫等方方面面。


豐富的無伺服器產品和服務,以及數年來持續的更新優化,讓亞馬遜雲科技在為用戶提供端到端數據服務能力的同時,也標誌著無伺服器技術徹底迎來成熟,雲計算的無伺服器時代全面到來。



最好的證明來自眾多用戶的採納,根據亞馬遜雲科技官方的統計,全球超過100萬客戶都在使用亞馬遜雲科技的Lambda服務,每個月發出的服務請求次數就超過10萬億次。


針對Lambda這樣一款成熟的產品,亞馬遜雲科技也沒有停下優化的步伐,以這次發布會上再次升級的冷啟動(Cold Start)能力為例,全新的Amazon Lambda SnapStart,可將Lambda函數冷啟動持續時間降低至不到200毫秒,延遲率降低90%,使得冷啟動跟非冷啟動(緩存命中)幾乎沒有區別。


這就好比你冬天的時候發動汽車發動機,燃油車往往需要幾分鐘來「熱車」,發動機才能達到平穩工作的狀態;過去亞馬遜雲科技已經對這個發動機做過了很多的優化調校,縮短了「熱車」所需的時間,但這一次他們利用全新的思路,直接給車的燃油發動機換成了「電機和電池」,只要插上鑰匙就直接能走,再次實現了自我的大幅超越。


亞馬遜雲科技高級副總裁Peter DeSantis在現場演講中還特別提到:這套已經幫很多用戶降低了90%以上延遲的全新服務,無需變更代碼或架構,也讓眾多用戶能夠更快捷地通過Amazon Lambda的Serverless能力面對業務峰值的挑戰。


亞馬遜雲科技此次還重點推進了數據分析服務的全面Serverless化。在別人還在埋頭猛追的時候,先一步實現了全覆蓋。


在過去的幾年裡,亞馬遜雲科技已經打造了一整套豐富而強大的Serverless資料庫服務,用戶不需要就資料庫技術本身支付費用,更不用擔心容量不足,整套服務會隨著數據量自動縮放,並按照使用量收費。



而在本次re:Invent 2022大會上,亞馬遜雲科技CEO Adam Selipsky宣布了Amazon OpenSearch Service Serverless的推出,用戶將不再需要管理自己的OpenSearch集群,從而更輕鬆地運行大規模搜索和分析工作負載。這同時也宣告了亞馬遜雲科技所有數據分析服務全部具備Serverless特性,目前全球雲計算行業中僅此一家。


數據驅動,助力用戶高速發展


隨著企業雲上的數據的類型和規模正在不斷增長,數據旅程的各個階段都需要由雲原生數據基礎設施來實現賦能,以提升系統的效率、可用性和可擴展性,並降低成本。


而在數據這一塊,亞馬遜雲科技也有著清晰的發展邏輯,亞馬遜雲科技數據產品掌門人Swami Sivasubramanian將其概括為3點:


1,需要有能夠應對所有未來情況的雲原生數據基礎設施;


2,需要有能力將數據連接起來,打破壁壘,實現數據一體化融合;


3,需要有好的工具與措施來實現數據的普惠。


對於第一點,亞馬遜雲科技通過十多年來的持續創新,已經形成了一套完整的端到端數據戰略方案。從雲原生資料庫到數據集成工具,再到雲原生數據分析工具,再到深層次的機器學習,用戶不僅能夠充分利用自身的數據資產實現優勢整合與成本效益最大化,同時還能縮短企業提取數據價值的創新周期。


關於成本效益最大化,亞馬遜雲科技已經提供了一系列的專門構建的數據服務,讓客戶可以在任意場景下獲得極致性能的同時保證性價比。比如雲上首款專門構建的資料庫Amazon DynamoDB,首個雲上數據倉庫Amazon Redshift,雲上首個機器學習IDE Amazon SageMaker。本次新發布的Amazon DocumentDB Elastic Clusters也是這方面的創新,它可以在幾分鐘內自動上行拓展存儲,用戶完全不用擔心運維或者遷移的複雜度,直接幫助用戶減少相關維護成本。



而關於縮短企業提取數據價值的創新周期,則需要打破數據孤島,實現數據一體化融合分析,但實現起來尤其困難的有三個部分。一個是企業不同類型的數據源在融合之前,需要確保數據質量,全新升級的Amazon Glue Data Quality旨在解決數據質量管理的問題。現在挖掘數據價值的手段很多,但假如用戶不注重、謹慎處理數據質量的話,很快數據會像沼澤一樣把價值淹沒。過往只能投入更多的人力去提升管理水平,管理成本也隨之水漲船高。



Amazon Glue Data Quality則能將這些手動的數據質量工作從幾天縮短到幾小時。它可以自動計算統計數據、推薦質量規則、監控並在檢測到質量下降時向用戶發出警報。並且能夠在數據影響業務之前,操作極簡地識別丟失、陳舊或不良數據。


第二,為了數據融合分析,就不得不把大量的資源投入到數據的整合工作,比較典型的就是ETL工作,來實現數據的集中分析,亞馬遜雲科技此次則提出了Zero ETL的理念,尤其是重磅產品Amazon Aurora zero-ETL to Amazon Redshift,允許企業將PB級事務數據上使用Amazon Redshift實現近乎實時的分析和機器學習,而不必構建和維護複雜的數據管道來執行提取、轉換和加載(ETL)操作。這將使得企業可以節省大量的不必要的冗餘投入,專注於數據分析本身。


不僅如此,亞馬遜雲科技各種數據集、資料庫、數據湖中的信息,都能夠通過Zero ETL工具快速流動,進而用不同的工具挖取數據其中的價值。原本用來管理複雜數據的時間,就能夠用來拓展數據價值的潛力,並且最終轉化為企業實際的業務策略更新。同時,對於一些第三方數據,亞馬遜雲科技數據服務已經可以連接超過100種外部數據源,像Adobe,Salesforce等各類SaaS應用,讓企業可以能更全面地利用所有數據的力量。



另外一個難點就是企業跨部門的數據共享和數據治理。一個好的數據治理可以促進數據的共享,然而過去企業往往缺乏一個有效管理數據在企業內部共享的工具。亞馬遜雲科技此次推出的Amazon DataZone服務,重點就在於解決跨組織邊界的大規模共享、搜索和發現數據。這一全新的數據分析門戶,不僅可以幫助企業利用數據生成個性化視圖,同時執行治理和合規的相關策略,並隨之視情況開放給企業中的任一成員查看。



企業內部數據應用的工作流程隨之得到了優化:跨團隊可以無縫協作,並以自助服務方式訪問數據和分析工具,大幅提高效率;整個過程中使用基於Web的應用程式實現數據個性化視圖,輕量化且快捷;企業管理者還能夠根據相應的法規以及公司內部的規章,一站式管理數據和各種訪問權限。


企業內廣泛的數據孤島現象進一步打破,讓數據的價值能夠被真正發掘、生產出來。


今天,全世界有超過150萬家公司來亞馬遜雲科技尋求數據服務上的幫助,包括資料庫、數據分析和機器學習服務。像Toyota(豐田)、Coca-Cola(可口可樂)、Capital One等等,這些知名公司都在採用亞馬遜雲科技的服務來建立完整的數據戰略。比如,知名生物醫藥公司Bristol Myers Squibb通過亞馬遜雲科技的數據服務,把單細胞數據應用在他們的診斷和開發裡面。此外,Hyundai(現代)也在採用亞馬遜雲科技的數據分析他們的機器學習模型,極大地降低了他們的機器學習時間。


寫在最後


作為全球雲計算的先行者和開拓者,亞馬遜雲科技再次兌現了大家對於re:Invent大會,這個雲計算行業「春晚」的期待。多年來在雲計算賽道中的持續發展,才是如今其能夠實現多種雲應用和服務「全Serverless」、數據一體化融合對分析與價值萃取能力的提升。這些完全基於行業發展需要、企業業務拓展需要的能力,是客戶最終選擇亞馬遜雲科技的關鍵。


很顯然,在現實世界之外、由比特組成的虛擬世界之中,亞馬遜雲科技這個龍頭還在引領著整個行業發展前進。憑藉其所構築的數字能力,數量龐大的企業減輕了身上的負擔,以更靈活的姿態繼續前行。可以預見,亞馬遜雲科技的前行和超越,遠沒有到終點。

關鍵字: