DPU生態趨於完善,誰會是最早的受益者?

比特財經 發佈 2022-10-18T22:33:28.611492+00:00

VMware近年來一直致力於基礎架構現代化方向的研發,通過與NVIDIA BlueField DPU、AI Enterprise 軟體結合,vSphere 8企業工作負載平台就可以把一些功能卸載、加速和隔離到NVIDIA BlueField DPU,從而釋放 CPU 周期。

  儘管DPU一經問世就走入了一個「CPU+GPU+DPU」的三U並存的時代,但從始於兩年前的Project Monterey的演化過程中,卻還是可以看出其中的周折。而近日,NVIDIA公司CEO 黃仁勛和VMware公司CEO Rangarajan Raghuram聯手展示了Project Monterey的商業成果。DPU生態走向成熟之際,一個新問題成了業界的新關注點:誰會是DPU的第一批受益者?

  DPU的禮物

  用戶端的問題必須從用戶的業務難題中找答案,當前用戶的數據中心中一直面臨著四大挑戰。首先,由於人工智慧、科學計算等應用的發展,現代應用程式持續產生海量的數據,這對數據中心的性能和處理能力提出了巨大的挑戰。其次,雲原生讓很多應用程式都變成了以分布式微服務的方式給用戶提供相應的服務,所以這些程序可能並不是運行在數據中心的某一台伺服器上,而可能是運行在多台伺服器上,在邊緣應用和多雲架構越來越普遍的情況下,數據中心的基礎設施運營同樣面臨著較大的挑戰。

  而從CPU的角度來看,CPU的性能提升速度有限,但原本應該用於應用的CPU服務資源,卻可能先要消耗在基礎設施上。最後,挑戰的不僅是性能,還有因東西流量不斷增加而造成的安全攻擊威脅。由於微服務程序之間會產生相應的數據流交互,跨伺服器或數據中心內部的橫向攻擊威脅在增加。同時,用戶將網絡上的應用程式下載到數據中心裡應用時,也可能會將潛在的安全風險帶入到數據中心之中。

  從用戶數據中心面臨的四大挑戰來看,DPU可謂是一場及時雨。NVIDIA 網絡技術專家崔岩介紹說:「應對用戶數據中心的挑戰,NVIDIA BlueField DPU提供了三方面的功能:簡化基礎設施和工作負載管理;在性能和功能上補強,從而提升基礎設施運行效率;最後是藉助零信任安全模式加強了基礎設施的安全性。」

  如果沒有軟體的支持,那麼晶片不過是一堆價格昂貴的沙子,DPU也不能例外,要讓它發揮作用,軟體的作用同樣一可忽視,而這就是兩年前Project Monterey被啟動的目的。

  VMware近年來一直致力於基礎架構現代化方向的研發,通過與NVIDIA BlueField DPU、AI Enterprise 軟體結合,vSphere 8企業工作負載平台就可以把一些功能卸載、加速和隔離到NVIDIA BlueField DPU,從而釋放 CPU 周期。而 Dell PowerEdge 伺服器成了承載這個軟硬體結合創新成果的平台。

  通過創新,企業可以將工作負載卸載到DPU,從而通過節省CPU 資源密集型工作來加速網絡和安全服務。此外,在 NVIDIA BlueField DPU上託管 VMware 的 NSX 軟體定義平台,事實上為用戶提供了應用程式處理域和基礎架構處理域之間的新隔離層。通過一系列聯合創新,這個技術組合確實提升了數據中心、邊緣、雲和混合環境的性能和效率。

  目前,企業可以通過NVIDIA LaunchPad使用該系統。這個創新組合也帶來了性能和功能上一系列變化。崔岩展示了一系列變化的數據:「NVIDIA BlueField DPU在非SQL資料庫基準測試中,可以減少12個內核,相當於節省了20%的CPU內核。在實現了零CPU內核占用的同時,還把性能提升了36%。而把vSphere放在NVIDIA BlueField DPU上運行時,伺服器的效率提升了22%。」

  成長的生態

  從整體IT架構來看,晶片居於最底端,因此晶片的創新需要來自龐大生態的支持。而對於DPU來說,僅僅有來自vSphere的支持還是不夠的,要讓NVIDIA DPU發揮作用,還需要DOCA軟體棧的配合。藉助於DOCA,開發人員能夠利用行業標準的API在NVIDIA BlueField DPU之上快速創建網絡,存儲,安全和 管理服務,以及AI/HPC的一系列應用程式和服務。因此,圍繞著DOCA的生態之戰,同樣決定著NVIDIA DPU到底能走多遠。

  在NVIDIA BlueField DPU發布以來,不僅DOCA從1.0版本更新到了1.4版本,DOCA社區也不斷壯大中。目前國內DOCA社區內的DOCA開發者,註冊量已占據全球註冊量的一半以上。

  以此為基礎,2022 秋季 NVIDIA DPU 中國虛擬黑客松將於2022 年 10 月 22 日至 23 日舉辦。

  崔岩對此介紹說:「和上次的黑客松不同,本次我們聚焦了一個題目,需要開發者使用NVIDIA BlueField DPU和NVIDIA DOCA軟體框架實現一個RDMA加速的存儲與AI解決方案。這是基於InfiniBand上實現的RDMA技術,能夠很容易地通過NVIDIA BlueField DPU去訪問CPU和GPU的內存,而不需要CPU和作業系統的干預,這會極大地提高整個數據移動的效率,能夠更好地支撐未來的科學計算、人工智慧、機器學習等需要大規模數據搬運和計算的工作負載。」

  通過黑客松比賽,廣大開發者可以在賽前參與訓練營,從而獲取關於NVIDIA BlueField DPU、NVIDIA DOCA軟體框架的最新進展和基礎開發知識,同時掌握相應的開發技術。

  崔岩表示:「學生對於黑客松比賽的參與熱情很高,在上一屆黑客松比賽中,就湧現了很多基於NVIDIA BlueField DPU和DOCA構建創新應用的學生團隊,他們不但掌握基礎開發技能,而且還有創新的想法,最終構建出自己的加速應用或者框架實現。賽後甚至有學生聯繫我們購買NVIDIA BlueField DPU,在他們自己的實驗室里構建相應的開發環境。」

  據此,我們可以看出,NVIDIA BlueField DPU的成熟並不僅僅表現在技術和產品層面。通過與VMware、Palo Alto Networks、紅帽等全球供應商和合作夥伴展開合作,共同整合併擴展了基於NVIDIA BlueField DPU及DOCA軟體架構在平台、基礎設施、存儲、網絡安全、5G和邊緣計算等應用場景的解決方案,還讓DPU進一步成長的基石——DOCA生態體系不斷壯大。不僅將廣大開發者納入生態,還不斷招攬學生群體,為行業未來的技術人才需求做儲備。

  早期的受益者

  當DPU走向成熟之後,誰會成為它的最先受益者呢?這還要從Project Monterey談起。

  雖然Project Monterey已揭開了它神秘的面紗,但這並不意味著Project Monterey已經終結。相反 ,它還會繼續在安全、存儲、管理方面演進,接下來我們馬上就能看到它基於裸金屬的新功能。因此,DPU在未來還會有更為廣闊的前景,各類不同的DPU新品也會源源不斷地湧現出來。

  基於此,NVIDIA網絡市場總監孟慶認為:「採用DPU與選擇交通工具頗為類似,DPU已經有很多型號,包括25G型號、100G型號、200G型號,明年會有包括400G在內的更多型號推出來。這就象交通工具包括了自行車、摩托車、汽車,未來還會有高鐵和飛機。而選擇什麼樣的DPU,取決於用戶的應用場景,DPU不僅可以卸載CPU的應用負載,還可以提供IPSEC等加密通信功能,有的還會有帶外管理模塊。我們在晶片層面可以提供很多功能,但具體做產品時會根據用戶需求,劃定不同的價位提供給用戶。」

  此外,要讓DPU發揮出效力,應用規模也有一定的限制。孟慶介紹說:「企業級採購很理性,並不會看單個產品的價格,而是會考量一整套方案中伺服器、網絡節點的數量,整套方案需要占據多少機房空間,甚至製冷的電費也需要進行綜合計算。從這個角度考量,就會發現要讓DPU發揮作用,就至少需要形成一定規模的伺服器數量。這樣在空間上,比如原來需要1000台伺服器的數據中心,就變成了只需要800台。但是也會出現人員培訓成本、DPU工程師的額外成本,所以節省出的節點成本要能覆蓋這些新增加的成本支出。」

  崔岩則從應用層面談了DPU的選擇:「許多公司在數據中心裡大批量採用DPU,主要是為了做公有雲相應的雲服務,這些公司的規模普遍比較大,通過DPU去提升他們數據中心基礎設施的性能,從而能夠更好地釋放CPU的資源,給客戶提供更好的公有雲服務。此外還有一些元宇宙等領域的網際網路公司,因為AI識別等應用在數據中心內需要處理大量的數據,也需要DPU從基礎設施的角度做卸載、隔離和加速。相信其他類型的網際網路公司也會逐漸在數據中心中部署DPU,因為隨著越來越多的企業處於多雲環境,在自身的私有雲和混合體系下部署和採用DPU,將是行業的大勢所趨。

  而說起DPU的應用前景,孟慶表示:「數據中心在今天正在演變成A.I.工廠,不管是後台的訓練,還是前台軟體中的關鍵詞搜索,都會把圖形識別 、語義分析、推薦購物等數據導流到後台,在數據中心裡推演。因此,數據中心事實上正在成為一個AI工廠,而與業務相接關聯的APP在打開與關閉的瞬間,造就出越來越大的峰值,數據中心因此而面臨前所未有的挑戰。因此,大流量的數據需要DPU,包括BAT、京東、字節跳動、微軟等公司已經在實驗和採用DPU幫助他們分擔數據流量,保障安全。未來從應用前景來看,DPU有著更廣闊的應用場景。」

  面向雲計算商業化應用,對接入帶寬、可靠性、災備、彈性擴展提出了更高的要求,這同時也讓異構計算成為了未來重要發展趨勢。因此,因數據中心而生的「第三顆主力晶片」DPU,顯然有著巨大的潛在市場。更有人預計,未來用於數據中心的 DPU 數量將達到和數據中心伺服器同等量級。

  DPU及其生態的成熟,會引來第一批受益者。而前邊成功者的榜樣力量,又將使得更多應用者投入其中。或許,DPU的大戲,到現在才真正開場。

關鍵字: