DPU行業專題報告:ChatGPT推高算力需求,DPU支撐算力效率提升

未來智庫 發佈 2024-04-27T20:59:02.888049+00:00

根據摩天輪數據,Amazon 的 AWS 早在 2013 年研發了 Nitro 產品,將數據 中心開銷全 部放到專用加速器上執行。

(報告出品方/作者:民生證券,呂偉、郭新宇)

1 DPU 有望成為「第三顆主力晶片」

1.1 算力提升與數據增幅呈現剪刀差,DPU 需求凸顯

算力提升與數據增幅呈現剪刀差,DPU 可有效減少算力損耗。在當前數據增 幅大幅提升的大背景下,CPU 性能的增速減緩,成本大幅增加,算力供給與需求 形成剪刀差,CPU 性能提升的難題亟待解決,以 DPU 為代表的異構計算具備將部 分通用功能場景化、平台化的特點,實現算法加速並減少 CPU 功耗,有助於運營 商、雲計算廠商和網際網路廠商對數據中心的升級改造,減少高達 30%的數據中心 算力稅。

DPU(數據處理晶片 Data Process Unit)被認為是繼 CPU 和 GPU 之後的 「第三顆主力晶片」。DPU(Data Processing Unit)是新近發展起來的一種專用 處理器。2020 年 Nvidia 公司發布的 DPU 產品戰略中將其定位為數據中心繼 CPU 和 GPU 之後的「第三顆主力晶片」。隨著晶片業製造工藝的不斷精進,以及 數位化技術如 AI 的發展,晶片行業不斷推陳出新。DPU 作為新型晶片的一種,它 的出現是異構計算的一個階段性標誌。


DPU 是以數據處理為核心的專用數據處理單元,是對傳統計算資源的網絡、 安全和存儲的卸載平台。傳統數據中心以 CPU 為主要數據處理單元,通常龐大的 基礎架構的運行已占據相當一部分 CPU 核,給數據處理任務帶來非常大的挑戰。

發展背景:2013 年雛形已現,2020 年迎來行業認可

DPU 其實在行業內已經孕育已久,從早期的網絡協議處理卸載,到後續的網 絡、存儲、虛擬化卸載。 根據摩天輪數據,Amazon 的 AWS 早在 2013 年研發了 Nitro 產品,將數據 中心開銷(為虛機提供遠程資源、加密解密、故障跟蹤、安全策略等服務程序)全 部放到專用加速器上執行。Nitro 架構採用輕量化 Hypervisor 配合定製化的硬體, 將虛擬機的計算(主要是 CPU 和內存)和 I/O(主要是網絡和存儲)子系統分離 開來,通過 PCIe 總線連接,節省了 30%的 CPU 資源。 2016-2017 年,阿里雲就提出 X-Dragon 系統架構,其核心是 MOC 卡,且 有比較豐富的對外接口,也包括了計算資源、存儲資源和網絡資源。MOC 卡的核 心 X-Dragon SoC,統一支持網絡,I/O、存儲和外設的虛擬化,為虛擬機、裸金 屬、容器雲提供統一的資源池。

根據網易、芯東西數據,2019 年,美國一家初創公司 Fungible 推出產品 F1 DPU,第一次提出了 DPU 的概念。 2020 年 10 月,英偉達將基於 Mellanox 方案的 Smart NIC 命名為 DPU, 重新定義了 DPU 的概念。2020 年,英偉達公司發布的 DPU 產品戰略中將其定位 為繼 CPU 和 GPU 之後數據中心的「第三顆主力晶片」,掀起了行業熱潮。

1.2 以降本增效為目標,DPU 直擊行業痛點

DPU 要解決的核心問題是基礎設施的「降本增效」,即將「CPU 處理效率低 下、GPU 處理不了」的負載卸載到專用 DPU,提升整個計算系統的效率,降低整 體系統的總體擁有成本(TCO)。 CPU 資源負載過大為行業痛點,智能網卡(Smart NIC)為 DPU 前身。在通信領域,伴隨著 5G、雲網融合時代的到來,以及虛擬交換等技術的引入,基於 伺服器的網絡數據平面的複雜性急劇增加。海量的數據搬運工作被 CPU 承擔,導 致網絡接口帶寬急劇增加,CPU 資源負載過大,大大影響了 CPU 將計算能力釋放 到應用程式中,為了提高主機 CPU 的處理性能,Smart NIC(智能網卡)將部分 CPU 的網絡功能(如 IP 分片、TCP 分段等)轉移到網卡硬體中,起到了加速運算 的目的,其可視為 DPU 的前身。新一代的 DPU 的優勢在於不僅可以作為運算的 加速引擎,還具備控制平面的功能,可以更高效的完成網絡虛擬化、I/O 虛擬化、 存儲虛擬化等任務,並徹底將 CPU 的算力釋放給應用程式。

功能方面,DPU 具備集成基礎業務、網絡數據加速、零信任保護、算存分離等 多種功能。可有效解決當前 CPU 算力無法完全作用到應用程式,數據處理速度慢, 授信導致的數據泄露,存儲方案兼容性差等諸多問題。具體來說: 1.DPU 實現了業務與基礎設施的操作分離。DPU 將基礎設施任務從 CPU 轉 移至 DPU,釋放 CPU 的資源,使更多的伺服器 CPU 核可用於運行應用程式,完 成業務計算,從而提高伺服器和數據中心的效率。 2.DPU 卸載網絡數據,實現性能提升。DPU 針對雲原生環境進行了優化,提 供數據中心級的軟體定義和硬體加速的網絡、存儲、安全和管理等服務。根據程序 員客棧數據,紅帽 Red Hat 的容器化雲平台即服務(PaaS)0penShift 上,藉助 DPU 優化數據中心資源利用率,將網絡相關的數據處理(如 VxLan 和 IPSec 等)卸載 到 DPU 加速執行,在 25Gb/s 網絡條件下,Open Shift 部署 DPU 用來加速,可 以只用 1/3 的 CPU 占用率來達到 25Gb/s 性能,而在 100Gb/s 網絡條件下,未 部署 DPU 的場景將達不到 100Gb/s 網絡線速,DPU 可以帶來 10 倍的性能優勢。 3.DPU 可以提供零信任安全保護,零信任(Zero Trust)是一種以安全性為中 心的模型,其基於以下思想︰企業不應對其內外的任何事物授予默認信任選項。零 信任可以減少數據泄露、拒絕未授權的訪問,因此在數據安全方面價值很大。

方式:DPU 通過將控制平面由主機下放到了 DPU,來為企業提供零信任保 護,實現主機業務和控制平面的完全隔離,數據將無法進行穿透,保證安全性。 DPU 的出現相當於為每個伺服器配備了一台「計算機前的計算機」,以提供獨立、 安全的基礎設施服務,並與伺服器應用域安全隔離。如果主機遭受入侵,安全控制 代理與被入侵主機之間的 DPU 隔離層可防止攻擊擴散至整個數據中心。這樣 DPU 就解決了企業不願直接在計算平台上部署安全代理的情況。通過在完全隔離於應 用程序域的DPU 上部署安全代理,企業不僅能獲得對應用程式工作負載的可見性,還能在其基礎設施中執行一致的安全策略。

4.DPU 助力實現「算存分離」,BlueField SNAP 技術方案通過在伺服器系 統的數據入口處引入計算資源,在 DPU 上獨立實現面對應用需求的存儲方案,幫 助存儲廠商在數據中心中低成本地靈活部署、升級高級存儲協議,而完全不需要對 現有軟體棧進行任何更改。存儲廠商可以把自家團隊為各行業應用開發的開放系 統的直連式存儲(DAS)、縱向擴展(Scale-up)、橫向擴展(Scale-out)、超融合架構 (Hyperconverged)等存儲解決方案,零開銷地推廣到各個應用領域的現有業務處 理平台和數據中心基礎架構中,而所有的安全加密、數據壓縮、負載均衡等複雜又 必須的功能則完全由 DPU 透明地卸載。存儲行業的革新算法和實現,可以在 DPU 架構中,獨立於伺服器作業系統進行部署。DPU 技術幫助存儲廠商實現真正的「算 存分離」,完全發揮自家產品的技術優勢,打通最高效服務應用需求的通路。

1.3 依託智能網卡化繭成蝶,FPGA 及混合架構路線為主流

Smart NIC 可以被看作 DPU 的前身,包含基於多個 CPU 內核的 ASIC 和基 於 FPGA 的智能網卡等類型。 隨著技術的發展,FPGA、ASIC 和 SoC 也在相互融合,它們之間的界限越來 越模糊。例如,隨著 FPGA 的發展,現在很多 FPGA 內部集成了硬核,這種硬核 就是傳統意義上的 ASIC;從硬體可編程的角度來看,SoC 與 FPGA 相反,它可以 看作 ASIC,這裡的 ASIC 主要指硬體不可編程,而不是單指特定功能晶片。 NIC 代表網絡接口卡。實際上,NIC 是一種插入伺服器或存儲盒以連接到以 太網網絡的 PCIe 卡。基於 DPU 的 Smart NIC 超越了簡單的連接,在基礎 NIC 的 情況下,在 NIC 上實現了 CPU 必須執行的網絡流量處理。 基於 DPU 的 Smart NIC 可以是基於 ASIC、FPGA 和 SoC 的。在這些不同 的路線之間,在成本、編程的易用性和靈活性方面存在各種權衡。1)ASIC 具有 成本效益,可能提供最佳性價比,但靈活性有限。

基於 ASIC 的 NIC,如 NVIDIA ConnectX-5,可以具有相對簡單的可編程數據路徑。最終,該功能基於 ASIC 中 定義的功能而受到限制,這可能會阻止支持某些工作負載。2)相比之下,FPGA NIC(如 NVIDIA Innova-2 Flex)具有高度可編程性。只要有足夠的時間和精 力,就可以在可用門的約束範圍內相對高效地支持幾乎任何功能。然而,眾所周知, FPGA 編程困難且價格昂貴。3)對於更複雜的用例,SOC(如 Mellanox Blue Field DPU–可編程智能網卡)提供了似乎是最好的基於 DPU 的 Smart NIC 實現 選項:良好的性價比、易於編程和高度靈活。


1.4 DPU 核心價值在於算力的卸載釋放與擴展,異構算力 互聯推動 DPU 多領域高速發展

DPU 的核心價值在於算力的卸載、釋放與擴展。

1.算力卸載:即利用 DPU 集成一部分數據處理的基本功能,然後將這些功能 從 CPU 中卸載下來,以提升 CPU 針對部分應用的算力。DPU 的部分價值體現在 節省這部分算力的成本-DPU 自身的成本。因此 DPU 節省的算力越多,或 DPU 的 成本越低,其帶來的價值越高。與此同時,由於 DPU 的專用化,DPU 將部分涉及 網絡、存儲、安全、管理相關的控制功能卸載之後,還將使得業務性能得以提升, 因此 DPU 的另一部分價值在於其可為業務節省的時間與使用體驗。 根據技術鄰數據,在大型數據中心的場景之中,DPU 的算力卸載功能可用於 減少數據中心稅。由於在數據中心流量處理占了計算 30%的資源,AWS 將這些還 未運行業務程序,先接入網絡數據就要占去的計算資源稱為「數據中心稅(Datacenter Tax)」。 在數據安全場景中,DPU 由於其獨立、安全的架構,可將部分加密、解密算 法固化在 DPU硬體之中,以物理隔離的方式解決用戶在海量數據的數據安全問題, 為外部網絡業務租戶之間提供額外的安全層。


2. 根據中國信通院數據,算力釋放:算力釋放無需 CPU 介入多次訪問內存 和外設,避免不必要的數據搬運,拷貝和上下文的切換,直接在網卡硬體上對數據 完成處理並交付給最終消費數據的應用。傳統以 CPU 為中心的計算機體系結構在 處理數據的過程中需要多次在內核和應用之間拷貝和訪問數據,帶來的是極大的 性能損耗。以數據為中心的 DPU 架構則可以有效改善 CPU 過度參與數據處理的 問題,在數據處理的過程中不需要 CPU 參與,直接將數據送達應用、相關的 GPU 或者存儲設備,能夠有效避免性能瓶頸和由於 CPU 負載過大而引發的異常。 DPU 架構和技術,使伺服器上運行的業務應用和作業系統內核,用簡單的本 地存儲訪問 API,就能實現對分布式、超融合或軟體定義存儲系統的高效透明訪 問。存儲廠商可以把為各行業應用開發的直連式存儲(DAS)、縱向擴展(Scale-up)、 橫向擴展(Scale-out)、超融合架構(Hyperconverged)等存儲解決方案,零開銷地 推廣到各個應用領域的現有業務處理平台和數據中心基礎架構中,而所有的安全 加密、數據壓縮、負載均衡等複雜又必須的功能則完全由 DPU 透明地卸載。存儲 行業的革新算法和實現,可以在 DPU 架構中,獨立於伺服器作業系統進行部署。 DPU 技術幫助存儲廠商實現真正的「算存分離」,完全發揮自家產品的技術優勢, 打通最高效服務應用需求的通路。

3.算力擴展:算力擴展即通過有效避免擁塞消除跨節點的網絡通信瓶頸,顯著 降低分布式應用任務周期中的通信耗時占比,在大規模的集群維度提升計算集群 的整體算力。為了提升算力,業界在多條路徑上持續演進。通用 CPU 已很難繼續 通過提升單核單線程的性能和擴展片內多核的方式來大幅提升算力。單核晶片的工藝提升至 3nm 後,發展放緩;通過疊加多核提升算力,隨著核數的增加,單位 算力功耗也會顯著增長,當 128 核增至 256 核時,總算力水平無法線性提升。在 計算單元的工藝演進已經逼近基線,為了滿足大算力的需求,通過分布式系統,擴 大計算集群規模,提升網絡帶寬,降低網絡延遲成為提升數據中心集群算力的主要 手段。 隨著計算機視覺,自然語言處理,自動駕駛等場景人工智慧應用的落地和快速 增長,應用對海量算力的需求以指數級別增長,這對基礎設施提出了大規模、分布 式、高性能的挑戰。計算網絡,典型代表為 HPC+等高性能業務,低時延是其的極 致追求,之前採用 InfiniBand 專網。但隨著 RoCE 技術的深入發展,Ethernet 在 計算網絡中的應用也逐漸普遍。RDMA 技術通過消除多 GPU 跨節點通信的網絡 瓶頸,顯著降低了訓練任務整個周期中的通信耗時占比,提高了 GPU 集群計算資 源利用率和訓練效率,也為集群橫向擴展到更大規模時的線性加速比提供了保證。

1.5 DPU 帶動異構算力互聯,應用市場涵蓋高新技術產業 多領域

異構算力互聯即為 GPU、FPGA、ASIC 或其它加速卡與 CPU 之間的數據連 接。在 CPU 與加速卡之間,以及加速卡之間形成的晶片互聯技術被更多的採用, 雖然 PCIe 有著非常通用的標準化設計,但帶寬有限將會產生瓶頸。以 CXL 和 GenZ 為代表的等下一代互聯技術取得快速發展,DPU 作為各種高速互聯協議融合的 沙盒,最適合成為靈活的高速互聯載體,通過採用和擴展「以內存為中心」的互聯 協議,將帶來在單個機箱外部擴展亞微秒級延遲技術的機會,為下一代計算架構創 新創造可能性。

伴隨信息化建設與應用的而深入,市場持續高漲,DPU 產業在電信、網際網路、 智能駕駛、AI 伺服器及其他行業應用需求不斷增長。1)在電信領域,三大運營商 均積極布局,推動產品驗證,並提出與產業鏈上的廠商推動 DPU 產業發展的合作 意願。2)在網際網路領域,隨著雲計算、雲原生等業務場景的發展需求,DPU 作為 數據中心演進的焦點,受到各大雲廠商的廣泛關注。頭部廠商紛紛投入資源嘗試自 研或者戰略合作,降本增效,實現效益的最大化。3)在智能駕駛領域,國內外芯 片廠商加速布局智能駕駛,不斷提升研發效率,為 DPU 的市場發展奠定基礎。4) 針對 AI 伺服器及其他領域層面,在數字經濟和「東數西算」等政策影響下,中國 AI 伺服器、金融、終端政企及其他領域持續高速發展,對算力的需求不斷增加,傳統 的技術已無法滿足當前業務的發展需求,DPU 能夠提供成熟的硬體加速方案,提 升整個系統的效率,為 AI 伺服器、金融及其他領域的發展提供技術支撐,全面推進 DPU 產業未來的發展進程。

2 DPU 行業格局:海外巨頭暫時領先,國產廠商蓄 勢待發

DPU 行業市場集中度較高。根據頭豹研究院數據,2020 年國內 DPU 市場中, 國際三大巨頭英偉達,博通,Intel 的份額分別達到 55%、36%、9%。


國際上,Nvidia, Intel, Xilinx,Marvell, Broadcom, Pensando, Fungible, Amazon, Microsoft 等多家廠商在近 2-5 年內均有 DPU 或相似架構產品生產, 較國內相對較早。國內廠商中,華為,阿里,百度,騰訊也在近幾年針對自身服務 器進行自研與外購 DPU,針對的主要功能在於數據,存儲與安全方面。

2.1 英偉達:具備先發優勢,其 BlueField 系列晶片已到達 第三代

BlueField 2 搭載 8 顆 64 bit 的 ARM A72 CPU 內核,2VLIM 加速器和 ConnectX6Dx 智能網卡,可以提供雙埠最高 100Gbps 和單埠 200Gbps 的 網絡連接。Blue Field 可以快速有效地捕獲、分析、分類、管理和存儲海量數據, 實現 RDMA/RoCE、DPU Direct、彈性存儲、分塊存儲加密和惡意外部應用自動 檢測等功能,從而實現單顆 DPU 晶片對 125 個 CPU 內核的釋放。BlueField2X 在此基礎上集成了 2021 年 5 月發布的 7nm 級 Ampere 架構。 GPU 和第三代 Tensor 內核,可通過 AI 加速數據中心的安全、網絡連接、數 據存儲等任務。此外,英偉達還發布了面向開發者的平台 DOCA SDK,通過集成 Ampere GPU 和 BlueField2 DPU 優化 EGXAI 平台,向流媒體、智能駕駛、醫療 等終端場景擴展。BlueField 3 已在 2022 年發布。

根據深科技數據,英偉達預計 BlueField4 將於 2023 年發布,預計性能可提 升 600 倍,達到 75/400TOPS,400Gbps,吞吐量有望較 BlueField2 提升 600 倍。英偉達希望憑藉 GPU 和 Mellanox 智能網卡技術壁壘的協同效應,再輔以 Arm 處理器整合協同後的性能提升,有望進一步抗衡英特爾/AMD 的 x86CPU 體 系。


2.2 星雲智聯:首款 DPU 產品 NebulaX D1055AS 於 2021 年發布

根據《2021-2022 年中國人工智慧創投數據報告》數據,星雲智聯創立於 2021 年 3 月,匯聚了來自矽谷、以色列、加拿大等地 ICT 領域頂尖專家,專注於數據 中心基礎互聯通信架構和 DPU 晶片研發,致力於構建數字世界算力的智能連接和 開放生態,讓雲計算和數據中心成為構建未來數字社會的堅實基礎。 根據星雲智聯官方數據,星雲智聯首款 DPU 產品 NebulaX D1055AS 已於 2021 年 7 月發布,該產品是國內首款全硬加速、超強轉發、極簡運維的 DPU 產 品。NebulaX D1055AS 聚焦雲計算的裸金屬、虛機、容器等場景,實現網絡與 存儲卸載與加速,提升業務性能,節省主機 CPU,簡化 IaaS 運維。可廣泛用於互 聯網、公有雲、運營商、政企與行業的雲基礎設施。產品為 PCIe 插卡形態,安裝 於標準伺服器內運行,產品功能包括數據面和管控面兩部分。

根據星雲智聯官方數據,管控面採用通用的 CPU+Linux 架構,其中 DPU OS 上運行了 OVS 控制面、彈性塊存儲客戶端 EBS-Client、管理監控等軟體,支持帶 外管理網口,通過管理網絡對接雲平台。這個架構擁有極好的軟體生態兼容性,用 戶可按需安裝部署相應的管理和應用軟體,比如 OpenStack Agent,K8S Kubelet 等 IaaS/PaaS 應用,也可移植現有雲基礎設施中的軟體到 DPU OS 上運行。這種 開放的管控面架構,簡化了 DPU 與用戶雲管控平台集成,加速定製化 DPU 新功 能開發上線。

2.3 大禹智芯:Paratus 2.0 具備強大的軟體開放性

根據《未來網絡白皮書》數據,大禹智芯成立於 2020 年,其創始及核心團隊 由國內外網際網路、雲計算頭部公司以及傳統網絡、晶片、安全頭部廠商的資深專家 組成,擁有 DPU 設計與研發及 DPU 大型商業化部署的成功經驗。 Paratus 1.0 作為大禹智芯 DPU 的第一條產品線產品,採用 ARM SoC 作為 主處理單元,提供多個 10Gbps/25Gbps 的業務網絡接口,同時為了方便用戶管 理,單獨設置了 RJ45 管理口。 Paratus 2.0 作為大禹智芯 DPU 的第二條產品線產品,已於 2022 年 10 月發 布,採用 ARM SoC + FPGA 的硬體架構,在 Paratus 1.0 產品基礎上,利用 FPGA 對可固化邏輯的數據包實現高性能轉發,提供多個 10G/25G、100G 的業務網絡 接口。

大禹智芯 DPU 產品 Paratus 2.0 具備強大的軟體開放性,支持 VirtIO 來增強 虛擬化環境下的適配性,能夠靈活呈現大規模主機側功能,可以實現包括 OVS 全 卸載、存儲客戶端(Storage Initiator)的全卸載及 NVMe 模擬等多種功能,還 能為存儲服務端(Storage Target)提供數據處理服務加速。此外,Paratus 2.0 的自研高性能網絡傳輸協議可進一步支持 RDMA 應用;大禹智芯充分考慮了用戶 使用管理需求,在 Paratus 2.0 系統產品中還提供了雲管平台對接的插件、獨立的 BMC 模塊,使用戶能方便地實現雲環境下業務的自動化部署、帶外管理能力及與 伺服器更好的聯動,達到 Paratus 2.0 在實際使用中與用戶管控平台的有機結合。

2.4 雲脈芯聯:打造自主研發多場景 RDMA DPU 產品

根據騰訊開發者社區數據,雲脈芯聯創立於 2021 年 5 月,是一家專注於雲數 據中心網絡晶片產品研發與技術創新的高科技創新企業。2022 年 5 月 31 日,雲 脈芯聯正式發布自主研發的國內首款多場景 RDMA 智能網卡(DPU)產品—— xFusion50。xFusion50 是雲脈芯聯成功自主研發的第一款產品,也是國內首款實 現包括支持端到端擁塞控制完整 RDMA 功能的 DPU 產品,xFusion50 基於硬體 實現的可編程擁塞控制算法能夠有效避免網絡擁塞,充分發揮 RDMA 技術的低延 遲和高性能,支持雲計算、高性能計算、AI、存儲集群全場景部署。xFusion50 產 品具有以下核心亮點: 第一,支持可編程擁塞控制算法,可編程擁塞控制算法是實現端到端無損網絡 的關鍵技術;還可以通過開放可編程的底層網絡接口,可根據客戶的組網特點和上 層業務的需求,靈活支持多種擁塞控制算法,最大化業務的流量吞吐。

第二,通過自主研發 HyperDirect 技術支持 GPU Direct RDMA 為跨計算節 點的 GPU 實現遠程內存直接訪問,跳過 CPU 以降低時延、提升帶寬,提升分布 式異構算力集群的整體效能。第三,支持網絡/存儲全場景卸載加速,支持 vSwitch 全卸載,實現雲上 VPC 網絡全功能;支持存儲卸載,對接分布式存儲 NVMe-oF(TCP/RDMA),充分釋 放宿主機 CPU 資源。並通過支持 VirtIO 實現彈性網絡和彈性存儲,滿足雲上用戶 無縫遷移和快速恢復的業務訴求。

2.5 芯啟源:自主智慧財產權,可擴展 Chiplet 等方向

根據《未來網絡白皮書》數據,芯啟源成立於 2015 年,聚焦網絡通訊、5G 和雲數據中心等眾多先進領域,客戶包括且不限於運營商及二級運營商、路由器交 換機設備商、OTT 及網際網路廠商、網絡安全廠商、5G/6G 設備商等。 芯啟源具有完全自主智慧財產權的 DPU 晶片。芯啟源 DPU 較傳統智能網卡提 供了更大的處理能力、更強的靈活性、可編程數據包處理、可擴展 Chiplet(小晶片) 結構等特性。採用 NP-SoC 模式進行晶片設計,通用 ARM 架構結合高度優化面 向數據包的 NP 晶片(RISC-V 內核)、多線程的處理模式,使其可以達到 ASIC 固 化晶片的數據處理能力,同時考慮到了全量可編程、靈活可擴展的屬性,用以支持 400Gbps 及以上的性能目標、低功率且具有成本效益等。

2.6 中科馭數:目前已開始第三代 DPU 晶片研發

根據搜狐數據,中科馭數成立於 2018 年,聚焦專用數據處理器的研發設計, 基於自研敏捷異構 KPU 晶片架構以及 DPU 軟體開發平台 HADOS,公司自主研 發了業界首顆融合高性能網絡與資料庫一體化加速功能的 DPU晶片和標準加速卡 系列產品,可廣泛應用於超低延遲網絡、大數據處理、5G 邊緣計算、高速存儲等 場景,助力算力成為數字時代的新生產力。 在 DPU 產品的研發疊代方面,中科馭數於 2019 年流片了第一代 DPU 晶片 K1,第二代 DPU 晶片 K2 也於 2022 年初成功投片,目前已開始第三代 DPU 芯 片 K2 Pro 的研發工作;2021 年 9 月,中科馭數首發 DPU 加速卡產品,其時延達 到業界領先的 1.2 微秒。另外也有 DPU 存儲加速卡、DPU 數據計算加速卡等產品 和解決方案在研發進程中。在產品核心技術特色方面,中科馭數的 DPU 晶片創新 性地採用軟體定義加速器技術路線,實現了軟硬協同的 DPU 設計方案。

高效的異構眾核 DPU 架構,基於軟體定義加速器路線,研發了異構眾核 DPU 晶片設計方法,解決了多核互聯、計算調度、指令控制等核心問題。 超高帶寬網絡協議處理,研發專用網絡協議處理核和大數據分析處理核,解決 了軟體解析網絡包協議解析和數據處理的瓶頸,大大提升伺服器間通信效率, 提升數據中心水平擴展能力。統一的虛擬化硬體平台,針對數據中心網絡、計 算、存儲融合的虛擬化需求,研究統一高效的硬體設備虛擬化架構,解決現有方案 單一虛擬化功能的窘境(僅支持網絡虛擬化),充分釋放 DPU 各類資源能力,更 高效支撐複雜上層應用。統一的 DPU 軟體開發框架 HADOS,解決現有編程框架 碎片化的問題,使得應用部署更加簡單高效。

3 行業市場空間測算—預計 2025 年全球 DPU 市 場空間有望超 260 億美金,CAGR 高達 54%

提供兩種市場空間測算方式:

方法一: 數據中心稅:根據中國科學報數據,雲計算巨頭亞馬遜雲服務(AWS)形象 地稱之為「數據中心稅」——還未運行業務程序,先接入網絡數據就要占去許多計 算資源。據《DPU 技術白皮書》顯示,2013 年,AWS 研發了 Nitro 產品,將為 虛擬機提供遠程資源、加密解密、故障跟蹤、安全策略等服務程序的資源開銷,全 部放到專用加速器上執行,「輕量化 Hypervisor+定製化硬體」的上場一舉節省 30%CPU 資源。因此數據中心稅(即伺服器算力稅率)可以近似看成是節約的 CPU 資源率 30%。因此,我們假設數據中心稅為 30%,進而可以假設,DPU 的潛在價 值量是 CPU 的三分之一(因為 DPU 能節省 CPU 三分之一資源)。 存量伺服器數量、市場規模:根據同花順財經,騰訊開發者社區,海光信息招 股說明書數據,一般伺服器生命周期為 5 年(參考紫光股份投資者問答,以及騰 訊雲計算官方論壇相關內容),因此,16-20 年這五年的伺服器總出貨量就是 21 年的伺服器存量。根據《海光信息招股說明書》數據,我們看到 16-20 年全球服 務器總出貨量為 5540.7 萬台,對應總市場規模為 3913.2 億美元。

CPU 占伺服器成本:因為伺服器其他環節成本相對固定,技術壁壘低,因此 隨著量的增加成本有逐步下降趨勢;但 CPU 屬於高技術壁壘的產品,且隨著產業 發展其複雜度將越來越高,進而在伺服器成本的比重有望逐步提升。假設隨著晶片 製程先進性的提高,高端 CPU 占伺服器的成本會從 30%逐漸提高到 36%。 測算思路:1)增量市場:按照數據中心稅當前為 30%計算,當前 DPU 市場 潛在規模為 CPU 在伺服器市場中市場規模的 30%。根據這一思路,測算出 DPU 的潛在市場規模。2)存量市場:由於伺服器生命周期為 3-5 年,按照原有伺服器 假設 21-25 年仍以 10%的複合增速保持增長,則 21-25 年全球改造比例為 25% 分四年改造完成。根據海光信息招股說明書,16-20 年五年一個周期,全球伺服器 存量市場規模為 3913.2 億美元。3)整體來看:總體 DPU 市場規模(億美元)= (伺服器市場規模+存量伺服器市場規模*改造比例)*CPU 占伺服器的成本*服務 器算力稅率;計算得出 2025 年全球 DPU 市場空間為 264 億美元。根據賽迪顧問數據,2020 年全球 DPU 產業市場規模達 30.5 億美元,據方法一測算,至 2025 年,市場空間將有望達到約 264 億美元,期間 CAGR 為 54.0%。

方法二: 單個伺服器配置:1 個 DPU(目前 DPU 還處於發展初期,還沒有被客戶大范 圍接受,我們假設每台設備僅搭載一個 DPU)。 DPU 單價:由於 DPU 目前還屬於新生事物,市面上難以找到其量產價格, 但我們可以根據 CPU 價格來簡易預測 DPU 價格。根據《海光信息招股說明書》 數據,伺服器 CPU 單價約為 7000-8000 元人民幣,對應約 1000 美元(參考最 新匯率)。由於 DPU 承擔了 CPU 三分之一的工作,所以價值量也應該是其三分 之一;但是考慮到 DPU 技術壁壘高、新生事物,因此價格可以假設為 5000 元人 民幣左右,對應 700 美元/片。 測算思路:根據《海光信息招股說明書》數據,16-20 年五年一個周期,全球 伺服器存量市場規模為 5540.7 萬台,【未來潛在市場規模=(新增伺服器數量+ 存量伺服器改造數量)*伺服器單價*DPU 數量。】計算得出 2025 年 DPU 市場空 間約為 234 億美元。根據賽迪顧問數據,2020 年全球 DPU 產業市場規模達 30.5 億美元,據方法二測算,至 2025 年,市場空間將有望達到約 234 億美元,期間 CAGR 為 50.3%。


4 DPU 市場空間及核心環節:市場高景氣延續,受 益領域有望多點開花

4.1 DPU 產業鏈分析

DPU 技術方案與主流廠商:當前業界 DPU 的實現技術方案主要分為兩種— —FPGA 和 ASIC/SoC(systemofchip,系統級晶片)。國外主流廠商有 Fungible、 Mellanox(2020 年 4 月被英偉達收購)、英偉達、英特爾等。 DPU 產業鏈分析: 上游:EDA、IP 核、製造、封測;中游:雲廠商、晶片廠商;下游:雲廠商、 電信領域。

4.2 全球、國內市場均有望保持高增,行業高景氣度有望延 續

全球 DPU 產業發展趨勢:得益於智能網卡方案的逐步成熟,疊加全球通用服 務器出貨量的穩定增長、L3 以上級別智能駕駛汽車的技術落地、工業控制領域的 需求增加、邊緣計算技術和物聯網技術的迅速發展,全球 DPU 產業市場規模呈現 逐年增長的趨勢,並隨著 Intel、NVIDIA 等廠商的 DPU 大規模量產,預計 DPU 市場將迎來快速增長。根據賽迪顧問數據,2020 年全球 DPU 產業市場規模達 30.5 億美元,預計到 2025 年全球 DPU 產業市場規模將超過 245.3 億美元,期 間 CAGR 高達 51.73%。


中國 DPU 產業發展趨勢:得益於數據中心升級和邊緣計算、新能源汽車、IoT、 工業物聯網等產業的發展所帶來的需求增長,中國 DPU 產業市場規模呈現逐年增 長的趨勢,預計中國 DPU 市場將迎來快速增長。根據賽迪顧問數據,2020 年中 國 DPU 產業市場規模達 3.9 億元,預計到 2025 年中國 DPU 產業市場規模將超 過 565.9 億元,期間 CAGR 高達 170.6%。

4.3 DPU 行業上游分析:EDA、IP 等上游環節均為研發重 要基礎

4.3.1 DPU 行業上游分析-EDA——DPU 研發之基

EDA 是集成電路上游的設計基礎工具,對 DPU 研發與生產中的生產效率、 產品技術水平有重要影響。 EDA 行業可撬動數千億集成電路市場規模。根據 ESDAlliance、21ic 電子網 數據,2021 年 EDA 全球市場規模 132.75 億美元,卻撬動了千億美元級別的半導 體市場和數萬億美元的電子產品市場,乃至數十萬億美元規模的數字經濟。中國擁 有全球規模最大、增速最快的集成電路市場,EDA 槓桿效應更大,一旦 EDA 產業 鏈基礎出現問題,整個集成電路產業乃至上層運行的數字經濟產業都會受到影響。

全球 EDA 市場規模:EDA 行業占整個集成電路行業市場規模的比例雖然較 小,但以百億美元左右規模體量,支撐和影響著數千億美元的集成電路行業。受益 於先進工藝的技術疊代和眾多下游領域需求的驅動,全球 EDA 市場規模呈現出穩 定增長態勢,行業持續高景氣。根據華經產業研究院數據,全球 EDA 市場規模從 2012 年的 65.36 億美元持續增長至 2021 年的 132.75 億美元,年複合增速為 8.2%。

國內 EDA 市場規模:在集成電路產業穩定向好、設計環節較快增長的發展態 勢下;疊加 EDA 軟體重要性凸顯,占集成電路規模比重提升;EDA 工具市場規模 保持穩定上漲態勢。根據華經產業研究院數據,2016-2020 年,我國 EDA 市場 規模由 57.4 億元增長至 93.1 億元,期間 CAGR 為 12.85%。


國內 EDA 市場長期由國際三大巨頭占據,未來有望迎來突破。目前,根據華 經產業研究院數據,Cadence、Synopsys 和西門子 EDA 三家公司仍占據了國內 EDA 行業的主導地位,2021 年的合計市場份額為 77.7%,三巨頭的技術水平、產 品完成度和豐富度仍舊大幅領先國內相關企業。但在政策支持、人才湧現、企業大 力投入研發的背景下,國產 EDA 企業已經嶄露頭角,國內 EDA 企業龍頭華大九天在面板電路 EDA 工具領域的技術已經達到了國際領先水平,在模擬電路 EDA 工 具領域實現了全流程覆蓋,在數字電路 EDA 工具領域實現的點工具的突破,2021 年,其在國內 EDA 市場市占率已經達到 6%,超過 Ansys 和 Keysight。概倫電 子也初步打入市場,占據國內市場 1.9%的份額。

EDA 在 DPU 晶片設計環節對提高成功率和降低費用至關重要

在晶片設計方面,設計人員需使用 EDA 工具來設計幾十萬到數十億電晶體的 複雜集成電路,以減少偏差、提高成功率和降低費用; 1)模擬設計類 EDA 工具,主要用於模擬晶片設計中電路圖編輯、版圖設計和仿真驗證等; 2)數字設計類工具,用於數字晶片設計中,負責功能定義、架構設計、邏輯 綜合、電路仿真及功能驗證等;

4.3.2 DPU 行業上游分析-IP 核——DPU 大廈的鋼筋與混凝土

IP 核是 DPU 研發生產中必不可少的一部分,以英偉達 DPU 為例,其由內核, 網絡連接部分,AI 加速器,加速器引擎,PCIe 接口,內存等架構組成。其需要外 購 CPU 晶片 IP,接口晶片 IP,存儲 IP 等。因此 DPU 的研發生產過程中,IP 核 是必不可少的一部分。 IP(Intellectual Property)核是晶片設計環節中逐步分離出來的、經過驗 證的、可重複使用的設計模塊,其作用是在晶片設計環節中降低冗餘設計成本,降 低錯誤發生的風險,提高晶片設計效率。IP 核本身是產業鏈不斷專業化的產物, 是晶片設計智慧財產權的重要體現,也是半導體設計行業下一步升級的重要方向。

供需合力孕育 IP 核產業,未來需求打開新增通道,晶片用量增長和品類的持 續擴張對晶片設計效率和成本的要求不斷提升,同時製程工藝的改進也增加了芯 片設計的難度,經過反覆驗證的、可重複使用的 IP 核逐漸受到系統廠商、IDM、 晶片設計公司的歡迎。同時,半導體產業專業化孕育了 IP 核供應,IDM、晶片設 計公司自身在多年晶片設計過程中通過設計復用以降低冗餘研發所產生的一些經 過驗證的、可重複利用的指令集、代碼、功能描述和具體物理模塊,最終逐步形成 IP 核。ARM 公司在這個浪潮中逐步成長為全球龍頭,牢牢占據著超 40%的 IP 核 行業份額。同時,由於 IP 核的特殊性,行業形成了較為獨特的以「授權+版稅」為 主的商業模式。 從市場總體來看,IP 市場規模穩步提升,市場增速上行。根據 IPnest 數據, 2021 年全球半導體 IP 核市場規模為 54.5 億美元,同比增速從 2018 年的 6.0% 上升至 2021 年的 19.4%。預計未來幾年市場規模將持續穩步擴張,根據 IBS 數 據,全球半導體 IP 核市場規模有望在 2027 年達到 101 億美元,IBS 口徑下 2018~2027 年 CAGR 達 9%,其中處理器 IP 市場增長較快,增速達 10%。

半導體 IP 市場發展概況:隨著先進位程的演進,線寬的縮小使得晶片中晶體 管數量大幅提升,使得單顆晶片中可集成的 IP 數量也大幅增加。根據芯原股份招 股說明書,以 28nm 工藝節點為例,單顆晶片中已可集成的 IP 數量為 87 個。當 工藝節點演進至 7nm 時,可集成的 IP 數量達到 178 個。單顆晶片可集成 IP 數量 增多為更多 IP 在 SoC 中實現可復用提供新的空間,從而推動半導體 IP 市場進一 步發展。


芯原股份招股說明書數據顯示,半導體 IP 市場將從 2018 年的 46 億美元增 長至 2027 年的 101 億美元,年均複合增長率為 9.13%。其中處理器 IP 市場預 計在 2027 年達到 62.55 億美元,2018 年為 26.20 億美元,年均複合增長率為 10.15%;數模混合 IP 市場預計在 2027 年達到 13.32 億美元,2018 年為 7.25 億 美元,年均複合增長率為 6.99%;射頻 IP 市場預計在 2027 年達到 11.24 億美元, 2018 年為 5.42 億美元,年均複合增長率為 8.44%。

市場規模:根據 CSDN 數據,就全球和中國 EDA 市場規模現狀而言,隨著下 游半導體產業規模持續擴張,但國內整體 EDA 相較國際先進水平無論技術還是整 體規模仍有較大差距,政策持續推進背景下國內規模增速遠超全球規模增速,預計 占比全球份額持續提高。根據華經產業研究院數據顯示,2018-2020 年,全球 EDA 市場規模從 62.2 億美元增長至 72.3 億美元,國內 EDA 市場規模從 6.67 億美元 增長至 9.83 億美元。

4.4 DPU 製造中的能工巧匠

DPU 廠商多為 Fabless 模式,需要尋找代工廠來進行晶片的製造,封裝,測 試等過程。追尋摩爾定律能讓消費者享受更便宜的算力,晶圓代工是推動摩爾定律 最重要的環節。根據 21ic 電子網數據,1965 年,英特爾(Intel)創始人之一戈 登·摩爾提出,當價格不變時,集成電路上可容納的元器件的數目,約每隔 18-24 個月便會增加一倍,性能也將提升一倍,這也是全球電子產品整體性能不斷進化的 核心驅動力,以上定律就是著名的摩爾定律。換而言之,每一美元所能買到的電腦 性能,將每隔 18-24 個月翻一倍以上。


4.5 核心環節之二:下游應用多點開花,未來前景廣闊

4.5.1 行業的下游應用——數據中心—DPU 當前的核心應用場景

數據中心作為數據產生、匯聚、融合、傳輸的重要場所,是承載算力的物理實 體,是傳統產業數位化轉型的催化劑,是數字產業快速發展的動力引擎,是我國新 基建的核心組成部分。我國正在加快引導數據中心高質量發展,2021 年工業和信 息化部印發的《新型數據中心發展三年行動計劃(2021-2023 年)》指出,用三 年時間,基本形成布局合理、技術先進、綠色低碳、算力規模與數字經濟增長相適 應的新型數據中心發展格局。

全球伺服器景氣度回升,DPU 廠商有望受益。受益於大數據、雲計算、物聯 網等下游應用場景的不斷發展,數據運算和存儲的需求快速增長,伺服器迎來快速 放量。根據 Counterpoint、國際電子商情數據,2022 年全球伺服器市場的收入 將同比增長 17%,達到 1117 億美元。根據 IDC、立鼎產業研究網,晶片成本在 基礎型伺服器中約占 32%,在更高性能的伺服器中,晶片相關成本占比高達 50%- 83%。因此,提供有利於伺服器提高性能,降低成本的解決方案的 DPU 廠商將在 成本日益提升的伺服器晶片市場中得到廠商更多的青睞。 根據中國信通院的數據,全球數據中心新增相對穩定。按照全球伺服器年增加 量統計,2015 年-2021 年全球年新增投入使用伺服器規模相對穩定,淨增加值也 相對穩定,預計未來幾年數據中心規模仍將保持平穩增長。

根據中國信通院數據,近年來,我國數據中心機架規模穩步增長。按照標準機 架 2.5kW 統計,截止到 2021 年年底,我國在用數據中心機架規模達到 520 萬架, 近五年年均複合增速超過 30%。其中,大型以上數據中心機架規模增長更為迅速, 按照標準機架 2.5kW 統計,機架規模 420 萬架,占比達到 80%。


根據中國信通院數據,受新基建、數位化轉型及數字中國遠景目標等國家政策 促進及企業降本增效需求的驅動,我國數據中心業務收入持續高速增長。2021 年, 我國數據中心行業市場收入達到 1500 億元左右,近三年年均複合增長率達到 30.69%,隨著我國各地區、各行業數位化轉型的深入推進,我國數據中心市場收 入將保持持續增長態勢。

需求方面,新興市場需求強勁,我國應用場景多樣

從全球範圍來看,受全球數字經濟加速發展促進,印度、南非等新興市場逐步 加強對數據中心的政策支持和產業投入,成為拉動全球數據中心需求增長的重要 增長極。2015 年啟動的「數字印度」計劃為印度的數位化發展提供持續助力,大 數據中心建設是該計劃的重要內容之一。2021 南非通訊和數字科技部發布了《國 家數據和雲政策草案》,該草案對國家高性能計算和數據處理中心的建設作出了指 引,高性能計算和數據處理中心主要由現有的 Sentech 和 Broadband Infraco 兩 個數據中心合併而成,上述數據中心將為各級政府、企業及高校提供雲服務。以政 府力量為主導的數據中心建設,將為南非數字經濟發展打下堅實基礎。 國內運營商布局較早,擁有網絡和土地資源等 IDC 行業優勢。基礎運營商具 備我國 IDC 行業先發優勢,不同於北美市場以第三方 IDC 為主,當前我國 IDC 市 場仍由三大運營商主導,形成了基礎電信運營商及眾多第三方 IDC 廠商共同提供 數據中心服務的市場格局。三大基礎運營商自身業務需要數據中心支撐發展,在數 據中心行業領域具有先天優勢,在客戶資源、網絡及土地資源等方面具有更多的資 源掌握權和行業話語權。

發展趨勢:三大運營商未來發展策略各不相同,將逐步差異化布局 IDC 業務。 中國電信圍繞核心城市規模部署 IDC,同時著力發展政企市場中IDC和專線業務。 中國移動持續優化「4+3+X」資源布局,促進 IDC 業務強基提質。中國聯通將著 力提高服務滿足客戶定製化需求。 發展現狀:第三方 IDC 廠商運維能力強,增值服務多樣。相對於基礎運營商, 第三方 IDC 廠商響應速度快,通過模塊化、標準化機房設計縮短建設周期,可以 更快速地滿足企業需求。憑藉多年運維經驗,第三方 IDC 廠商還能有效降低機房 能耗,保證機房穩定運行,整合基礎運營商的網絡資源,為客戶提供更多選擇。此 外,第三方 IDC 廠商可為客戶提供豐富的增值服務,除了智能 DNS、智能災備、 CDN 等,第三方 IDC 廠商還積極與雲廠商合作打造雲網生態系統,為企業提供一 站式雲服務。

第三方 IDC 廠商具有較深的資源背景,有望憑藉能耗控制能力在碳中和背景 下實現快速擴張。我國 IDC 行業正處於高速發展階段,在一線商圈土地、電力資 源緊缺,政策縮緊的大環境下,提前布局核心區域,優先獲取資源的企業將擁有更 大競爭力。我國頭部 IDC 第三方廠商積極圍繞核心城市展開布局,在核心區域自 建大規模數據中心,擁有十分可觀的機櫃存量及儲備機櫃規模,憑藉其在一線城市 內積累的強大的客戶資源、充足的項目儲備,逐漸築起行業壁壘。 新進入者紛紛湧入快速發展的 IDC 行業,鋼鐵企業和房地產企業為主要來源。 在 5G 高速發展的背景下,IDC 建設規模不斷擴大,然而 IDC 受限於土地、電力、 網絡等資源,導致 IDC 市場供給增速跟不上需求增長。近年來我國數據流量更是 呈現快速增長,導致 IDC 供需缺口遠大於發達國家;就網民規模而言,我國互聯 網用戶數量位居全球首位,然而我國 IDC 儲備量與美國尚存差距。在供需失衡疊 加 5G 高速發展的背景下,我國 IDC 行業迎來發展黃金時期。除三大運營商、第 三方 IDC 服務商以及雲服務廠商外,最近湧現出了一批以鋼鐵和房地產企業為代 表的行業新進入者。


4.5.2 行業的下游應用——網際網路行業:數據中心下遊客戶之一,大 型企業為 DPU 潛在用戶

不同規模、不同類型網際網路企業對 IDC 的需求存在很大差異。大型網際網路企 業偏好定製型交付模式,而中小型企業多採用伺服器租賃或 TKF 模式。大型互聯 網企業對 IDC 需求規模較大,多採用定製型的交付模式,與 IDC 運營商簽訂長期 合約;而中小型網際網路客戶 IDC 需求規模較小,多以伺服器租賃和 TKF 模式(一 站式服務)與 IDC 運營商達成合作,簽訂的合約期限較短,有些運營商會根據客 戶體量採用差異化結算方式。中小型網際網路企業對價格的敏感性尤其高,對 IDC 運營商來說,這部分客戶是經濟下行時最容易退租、風險最高且最難保證盈利的群 體。

對於 DPU 行業來說,大型網際網路用戶價格敏感度低,部分領域時延敏感度高, 體量大,替換成本高,是優質的潛在下游群體。DPU 廠商可與網際網路企業進行深 度合作,獲得先發優勢,輔助其開發適用於自身業務狀況的專用 DPU,並使其在 定製 IDC 過程中提出融入 DPU 需求,以獲得訂單。

4.5.3 行業的下游應用——金融政府電力用戶:數據中心的潛在大客 戶,DPU 需求的增長極

DPU 在金融、政府和電力用戶領域將更多發揮安全性的優勢。除性能提升之 外,DPU 還可為這三類用戶提供零信任保護,實現主機業務和控制平面的完全隔 離,以達到減少數據泄露,拒絕未授權訪問的目的。因此 DPU 與這三類用戶共同 合作,協同效應明顯,數據安全價值很大。 發展現狀:金融、政府和電力用戶為數據中心下游三大用戶,需求量僅次於雲 計算和網際網路用戶。金融機構業務的數據量激增及出於安全穩定的考慮促使其對 數據中心需求增加。數字政府和智慧城市等建設是政府成為數據中心用戶的主要 原因。電力行業數位化轉型催生其對數據中心的需求。

金融機構對數據中心需求將進一步擴大,證券和基金業務需求增速加快。數據 中心在金融市場將保持良好增長勢頭。隨著金融業務數據量的急劇增加,金融機構 亟需數據中心優化 IT 能力、提升效率,數據中心肩負協助金融機構完成數位化轉 型的使命。數字政府市場擴大,加速政府用戶對數據中心的需求。2021 年年初, 國務院提出未來需加快建設數字政府,將數位技術廣泛應用於政府管理服務,不斷 提高決策科學性和服務效率,預計 2025 年數字政府行業市場規模還將增長。數字 化轉型在電力行業不斷深入,對數據中心的需求將不斷增長。隨著網際網路信息技術、 可再生能源技術的發展,電力數位化改革進程的加快,開展綜合能源服務已成為提 升能源效率、降低用能成本、促進競爭與合作的重要發展方向。用電網絡正在由原 來的單向電能量採集向雙向互動轉變,電力行業的新應用新業務也需要更多的雙 向互動,電力能源部門對數據中心未來的需求也將進一步擴大。

4.5.4 行業的下游應用——雲計算:數據中心的需求來源,DPU 當 前最核心的場景

雲計算市場是數據中心核心的需求來源,也是對 DPU 行業最先應用的場景。 數據中心雲計算用戶主要分為公有雲、私有雲和獨立第三方雲計算廠商。公有雲廠 商代表為阿里雲和騰訊雲。阿里雲對外助力企業數位化轉型,對內承載龐大業務體 系 IT 資源需求,對 IDC 的需求量龐大且多元。華為雲業務以私有云為強項,產品 強調私密性、安全性,近年來大力建設自有數據中心。優刻得(UCloud)是中立 第三方公有雲廠商,IDC 採購以零售型為主。


根據中國信通院數據,全球雲計算市場逐步回暖,增速實現觸底反彈。隨著經 濟回暖,全球雲計算市場所受影響逐步減弱,至 2021 年已基本恢復到疫情前增長 水平。根據 Gartner 統計,2021 年以 IaaS、PaaS、SaaS 為代表的全球公有雲市 場規模達到 3,307 億美元,增速 32.5%。 我國雲計算市場持續高速增長。根據信通院數據,2021 年中國雲計算總體處 於快速發展階段,市場規模達 3,229 億元,較 2020 年增長 54.4%。其中,公有 雲市場繼續高歌猛進,規模增長 70.8%至 2,181 億元,有望成為未來幾年中國雲 計算市場增長的主要動力;與此同時,私有雲市場突破千億元大關,同比增長 28.7% 至 1,048 億元。

4.5.5 行業的下游應用——伺服器:DPU 的硬體載體,有望受益行業發展大趨勢

根據《中國算力發展指數白皮書 2022》數據,訓練數據規模和模型複雜度的 不斷增大,推動 AI 伺服器需求快速增長。整機方面,據 IDC 統計數據,2021 年, 全球 AI 伺服器市場規模達 156 億美元,同比增長 39.1%,超過全球 AI 整體市場 (含硬體、軟體及服務)增長率 22.5%,成為 AI 整體市場增長的驅動力量。 在 2021 年全球 AI 伺服器市場中,浪潮、戴爾、HPE 分別以 20.9%、13.0%、 9.2%的市占率位列前三,三家廠商總市場份額占比達 43.1%,華為(5.8%)和 IBM (4.1%)位列第四和第五。 晶片方面,傳統芯巨頭加速完善 AI 晶片產品體系,不斷推進全能力建設,搶 占多樣性算力生態主導權。英特爾發布新一代高性能深度學習 AI 訓練處理器 HabanaGaudi2,運算速度是上一代的 2 倍。AMD 在完成賽靈思的收購後,計劃 在 CPU 中融入賽靈思的 FPGAAI 引擎。英偉達推全新架構 GPU,採用台積電 4nm 工藝,集成 800 億個電晶體,大幅提升了 AI 計算速度。E 級超算時代已經來臨, 超算設備廠商紛紛加快產業化步伐。

晶片方面,CPU 仍以英特爾和 AMD 為主。TOP500 榜單上使用英特爾 CPU 的超算高達 388 台,占比 77.6%,93 台使用 AMD 處理器。此外異構計算晶片在 超級計算機中應用越來越多,TOP500 榜單上共有 168 台超級計算機使用了加速 器/協同處理器技術,其中 154 台使用了英偉達晶片,8 台採用 AMD 晶片。 計算晶片加快突破,在 CPU、GPU 等通用晶片性能持續升級的同時,計算芯 片專用化發展仍在延續。人工智慧晶片邁入商業落地階段,業內已形成覆蓋全場景 的晶片解決方案,雲端訓練側英偉達 GPU 占據主要市場份額,雲端推理側高效能 晶片架構多樣化發展;端側場景高度碎片化,已在自動駕駛、視頻監控、智能家居 等領域形成一批商用落地產品。數據處理單元(DPU)晶片成為行業追逐新熱點, 數據密集型需求的快速增長對雲端現有計算體系架構提出了新要求,專注數據加 速處理以及雲端各類資源管理的 DPU 晶片創新活躍,成為提升系統效能的重要推 手。目前,英偉達、英特爾、美滿等晶片廠商,亞馬遜、阿里雲等雲服務商,星雲 智聯、雲豹科技等新銳企業均已形成自研 DPU 產品。

根據《海光信息招股說明書》數據,國內市場規模:人工智慧領域的應用目前 處於技術和需求融合的高速發展階段,在運算加速方面逐漸形成了以 GPGPU 解 決方案為主的局面。根據前瞻產業研究院的數據,未來幾年內,中國人工智慧晶片 市場規模將保持年均 40%至 50%的增長速度,到 2024 年,市場規模將達到 785 億元。而隨著人工智慧相關技術的進步,應用場景將更加多元化,GPGPU 通用性 好和軟體生態系統完善的優勢會進一步展現出來,成為該領域的主流解決方案。 GPGPU 在我國人工智慧晶片領域也將占據較大比例的市場份額。從 2019 年至 2024 年,CAGR 達 45.11%。


(本文僅供參考,不代表我們的任何投資建議。如需使用相關信息,請參閱報告原文。)

精選報告來源:【未來智庫】。「連結」

關鍵字: