DPU是國產晶片的下一個突破口?

雷科技 發佈 2022-10-04T17:54:25.491810+00:00

近些年來,隨著大數據、數字經濟不斷發展,全球各地數據中心正在加速落地,算力正在成為新時代的核心生產力。不斷增加的應用場景、不斷提升的算力需求,也讓DPU這個全新的科技概念以驚人的速度崛起,成為整個行業甚至整個社會的關注重點。

近些年來,隨著大數據、數字經濟不斷發展,全球各地數據中心正在加速落地,算力正在成為新時代的核心生產力。不斷增加的應用場景、不斷提升的算力需求,也讓DPU這個全新的科技概念以驚人的速度崛起,成為整個行業甚至整個社會的關注重點。


進入九月,在美國發出對中國出口高性能數據中心GPU的限制後,加速計算核心技術國產化的趨勢日漸明朗,這也順勢帶動了國產AI晶片、DPU、GPU市場熱度。在資本市場上,中國相關概念股應聲上漲、同時相關企業融資成功的消息更是層出不窮,國內晶片企業正在趁勢快速發展著。


9月20日訊,根據國內媒體報導,國產DPU晶片公司中科馭數今天宣布完成數億元B輪融資,融資規模遠超以往輪次。據悉,本次融資主要由金融街資本領投,建設銀行旗下建信資本跟投,老股東靈均投資、光環資本、泉宗資本追投,中科馭數希望藉此加速自研DPU晶片的疊代與產業布局。

(圖源:馭數科技)


問題來了,如今火爆全網的DPU到底是什麼?它和我們這些普通消費者所熟知的CPU、GPU到底有什麼不同之處?比起混合CPU+GPU的傳統異構計算架構,DPU在計算領域裡究竟擁有著怎樣的優勢?在這場圍繞數位化時代的異構計算大亂鬥中,國產DPU的發展前景如何?讓我們來好好探討一下。


什麼是DPU?


所謂DPU,指的是數據處理器(Data Processing Unit),理論上是繼CPU、GPU之後,設置在數據中心內部的第三顆主力晶片。


根據維基顯示,DPU的概念最早是由美國初創公司Fungible提出的。在Fungible的定義中,DPU是一種運行Linux作業系統的SoC,其主要目標是通過承擔原本由CPU承擔的網絡、存儲和安全的加速處理任務,滿足網絡側的專用計算需求,以此優化和提升數據中心效能。

(圖源:Fungible)


事實上,由於製程接近邊際效益、摩爾定律逐漸失效的緣故,如今CPU晶片的性能增長正在逐年放緩,CPU的性能從5-10年前每年30%的增幅,到三年前大概只有每年不到3%的性能增幅。


作為對比,由於雲端應用的豐富、數據中心規模的擴大、數位化進展的驅動,近些年來網絡帶寬正在飛速上漲,這也導致了目標算力、網絡帶寬與計算性能的失調,進一步加劇了伺服器節點上CPU的計算負擔,CPU的算力幾乎已經無法應對大量雲計算帶來的負擔。

(帶寬性能增速比 (RBP) 失調,圖源:《專用數據處理器 (DPU) 技術白皮書》)


在這種背景下,DPU自然應運而生。


不同於為了高效管理本地資源而生的傳統CPU架構,DPU可以說是一種為了管理大量網絡資源而生的架構。舉個例子,為了實現大量數據傳輸,數據中心的主機每天都要進行海量的⽹絡協議處理,這會大量占用算力,而DPU則可以承擔起網絡協議處理的工作,以此分擔CPU的負載,幫助CPU釋放算力負擔。


除了網絡協議外,DPU還能承載數據中心所需的存儲、安全和虛擬化等工作負載。舉個例子,傳統的數據中心要遠程讀取存儲數據,還需經過CPU的編譯和轉發,而DPU則可以通過RDMA(遠程直接數據存取)直接讀取主機存儲數據,而AWS推出的Nitro Hypervisor更是宣稱可以通過DPU承擔虛擬化負載,讓CPU免去執行虛擬化所需的算力損耗。

(RDNA原理,圖源:CSDN)


綜上所述,大家應該也看明白了,DPU的作用本質就是給CPU「減負」。將原本CPU要承擔的網絡、存儲、虛擬化等功能卸載到自己身上,並利用自己的算力特長,對這些工作進行加速運算。


事實上,DPU已經不是第一個為彌補CPU能力不足而發揚光大的產品,多年前GPU的大熱也是為了彌補CPU在圖形處理能力方面的短板,近年逐漸興起的AI晶片本質也是為了彌補CPU在人工智慧算法方面的不足。至於普通消費者,只要知道DPU是為了數據中心這種大規模算力場景而生的,與我們的台式機、筆記本電腦基本無關就行了。


百家爭鳴,誰能笑到最後?


雖說最早提出DPU概念的是Fungible,但是將DPU這一概念重新推向時代潮頭的無疑是英偉達。2020年4月,英偉達以69億美元完成對以色列網絡晶片商邁絡思(Mellanox)的收購,英偉達CEO黃仁勛更是將DPU定義為和CPU、GPU並肩的數據中心的「三大支柱」之一。


自此,DPU正式成為了晶片領域裡的香饃饃,巨大的市場需求推動越來越多的玩家進入DPU賽道。除了國外主流晶片廠商外,如今不少國產公司已在這條百億美元賽道上嶄露頭角,其中不乏阿里雲、百度雲等網際網路巨頭,也有中科馭數、芯啟源、大禹智芯等初創公司。


先看看國外企業,去年6月,英特爾發布了其可編程網絡設備IPU(基礎設施處理器),用於加速存儲虛擬化、網絡虛擬化和安全等功能,並釋放CPU核心。今年9月,AMD以19億美元的價格收購DPU晶片廠商Pensando Systems,以此補齊「雲戰略」最後一塊拼圖。


在今年4月的GTC大會上,英偉達發布了新一代數據處理器 —— BlueField-3 DPU。這是首款為 AI 和加速計算而設計的 DPU ,專門針對多租戶、雲原生環境進行了優化,據悉一個BlueField-3 DPU所提供的數據中心服務,可相當於多達300個x86主核才能實現的服務。

(圖源:NVIDIA)


國產廠商這邊,今年6月,阿里雲在三代神龍卡的基礎上正式推出其自主研發的雲基礎設施處理器(CIPU),號稱將替代CPU成為雲時代IDC的處理核心,可以綜合調度CPU、GPU、存儲硬碟、交換機等硬體。事實上,這枚晶片除了名字之外,與 DPU的功能和作用幾乎無異。


(圖源:阿里雲)


成立於2018年的中科馭數,在自研敏捷異構KPU晶片架構以及DPU軟體開發平台HADOS的基礎上,自主研發了業界首顆融合高性能網絡與資料庫一體化加速功能的DPU晶片和標準加速卡系列產品,目前已經和金證股份、中移物聯網等企業達成戰略合作。

(圖源:中科馭數)


此外,成立於2015的芯啟源和成立於2020年的大禹智芯也是目前國內DPU賽道的主流玩家,其中芯啟推出了基於SoC架構的DPU完整解決方案,並於今年6月完成了數億元Pre-A3輪融資,大禹智芯則是一家由英特爾、思科核心研發人員組成的初創企業,於今年7月宣布完成數千萬元Pre-A輪融資。


作為晶片新物種,DPU市場空間正在快速擴張。賽迪顧問預測,全球DPU市場將在2023-2024年迎來爆發式增長,預計至2025年,中國DPU產業市場規模將超過565.9億元,全球DPU產業市場規模將超過245.3億美元,複合增速分別為 51.73%、170.60%。


(圖源:賽迪顧問)


目前看來,比起國內新興廠商,國外晶片廠商的主要競爭力在於完整的雲計算體系。不論是英特爾、英偉達還是AMD,他們都能夠為用戶提供涵蓋CPU、GPU、FPGA和DPU在內的整個雲計算體系,而國內的DPU廠商只能夠儘量去配合英特爾/AMD的服務站CPU進行優化。


值得慶幸的是,與CPU和GPU不同,DPU目前在技術標準和生態方面都處於早期階段,並未出現絕對的領先者。正因如此,國產廠商相對也有了更多的機會。個人認為,未來的DPU市場絕對不會像CPU市場那麼集中,也有很大概率比GPU市場更加多元化。


數據中心市場發展至今,各種晶片和核心系統一直都是國外產品的天下,國產產品與之相比則一直處於弱勢地位。然而,隨著數字經濟時代的到來,國家將網絡安全建設提到了前所未有的高度,核心技術國產化成為了繞不開的話題。作為一個新賽道的探索者,國產DPU企業們切實承擔著創新加碼國產化進程的重要任務。

關鍵字: