人工智慧伺服器:高算力核心底座,龍頭全梳理

樂晴行業觀察 發佈 2024-01-10T19:40:40.919144+00:00

據IDC預測,2023年AI伺服器訓練需求占比達41.5%,隨著大模型的應用,該比例在2025年將降低至39.2%。

隨著大數據、雲計算、人工智慧等技術的成熟與在各行各業的應用,AI伺服器價值凸顯。

AI伺服器專為人工智慧訓練和推理應用而設計,大模型帶來算力的巨量需求,有望進一步推動AI伺服器市場的增長。

據IDC預測,2023年AI伺服器訓練需求占比達41.5%,隨著大模型的應用,該比例在2025年將降低至39.2%。將GPT-4的推算結果作為訓練需求,進一步推算2023/2025年推理需求最高達44081/48502 PFlop/s-day。

IDC預計2025年全球人工智慧伺服器市場規模將達到266億美元,五年複合增長率為18.9%。

人工智慧伺服器行業概覽

伺服器一般可分為通用伺服器、雲計算伺服器、邊緣伺服器、AI伺服器等類型。

AI大模型對算力的需求分別來自訓練和推理兩個環節。

1)訓練環節:通過標記過的數據來訓練出一個複雜的神經網絡模型,使其能夠適應特定的功能,模型具有一定的通用性,以便完成各種各樣的學習任務。該環節需要處理海量的數據,注重絕對的計算能力。

2)推理環節:利用訓練好的模型,使用新數據推理出各種結論。藉助神經網絡模型進行運算,利用輸入的新數據來一次性獲得正確結論的過程。該環節對算力要求比訓練環節略低,但注重綜合指標,單位能耗算力、時延、成本等都要考慮。

AI伺服器相較於高性能伺服器、基礎伺服器在晶片組的價格往往更高,AI伺服器(訓練)晶片組的成本占比高達83%、AI伺服器(推理)晶片組占比為50%,遠遠高於通用伺服器晶片組的占比。

AI大模型對於算力(伺服器)的需求:

AI伺服器分類方式有兩種:

1)按應用場景:AI伺服器按照應用場景可以分為深度學習訓練型和智能應用推理型。

訓練任務對伺服器算力要求較高,需要訓練型伺服器提供高密度算力支持,典型產品有中科曙光X785-G30和華為昇騰Atlas 800(型號9000、型號9010)。

推理任務則是利用訓練後的模型提供服務,對算力無較高要求,典型產品有中科曙光X785-G40和華為昇騰Atlas 800(型號3000、型號3010)。

2)按晶片類型:AI伺服器為異構伺服器,可以根據應用範圍調整計算模塊結構,可採用CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC或CPU+多種加速卡等組合形式。

以前,AI計算基礎設施主要都使用的是X86伺服器。但是,隨著AI算法和晶片的發展,GPU、FPGA以及ASIC晶片為核心計算單元的AI專用基礎設施增多。

目前,產品中最常見的是CPU+多塊GPU的方式。

常見的AI伺服器分為四路、八路、十六路。

一般來說,通用伺服器主要採用以CPU為主導的串行架構,更擅長邏輯運算;而AI伺服器主要採用加速卡為主導的異構形式,更擅長做大吞吐量的並行計算。按CPU數量,通用伺服器可分為雙路、四路和八路等。

雖然AI伺服器一般僅搭載1-2塊CPU,但GPU數量顯著占優。按GPU數量,AI伺服器可以分為四路、八路和十六路伺服器,其中搭載8塊GPU的八路AI伺服器最常見。

GPU伺服器超強的計算功能可應用於海量數據處理方面的運算,如搜索、大數據推薦、智能輸入法等,相較於通用伺服器,在數據量和計算量方面具有成倍的效率優勢。

此外,GPU可作為深度學習的訓練平台,優勢在於:1、GPU 伺服器可直接加速計算服務,亦可直接與外界連接通信;2、GPU伺服器和雲伺服器搭配使用,雲伺服器為主,GPU伺服器負責提供計算平台;3、對象存儲COS 可以為GPU 伺服器提供大數據量的雲存儲服務。

當前各行業與人工智慧技術的深度結合及應用場景的不斷成熟與落地,使人工智慧晶片朝著多元化的方向發展,為了迎合晶片的多元化,伺服器的類型也將越來越豐富,並適用越來越多的行業應用場景。

人工智慧伺服器市場格局

根據國際數據公司IDC發布的2021H2《全球人工智慧市場半年度追蹤報告》,2021H1全球AI伺服器市場規模156億美元,浪潮信息在世界AI伺服器市場占有率達20.9%,份額同比提升3.6pct,銷售額同比增長68.3%,蟬聯全球第一。

另外,據IDC發布的《2021年下半年度(H2)中國加速計算伺服器市場報告》,在中國市場,浪潮AI伺服器占有率達52.5%,連續5年保持中國AI伺服器市場份額超過50%。

2021H1全球AI伺服器市場份額比例:

行行查 | 行業研究資料庫 資料顯示,國內人工智慧伺服器代表廠商中,浪潮信息是全球領先的伺服器生產商,擁有全面的AI 計算產品陣列以及性能領先的Transformer訓練伺服器,具備從晶片、板卡、整機到平台軟體的全棧AI計算方案提供能力;2022年MLPerf基準評測中浪潮AI伺服器獲超半數賽道的冠軍;浪潮NF5688M6是目前公司算力最強的AI伺服器之一,主要用於超大規模數據中心。

中科曙光是國內高性能計算領域的領軍企業,亞洲第一大高性能計算機廠商,大力發展雲計算、大數據、人工智慧、邊緣計算等先進計算業務,構建了完整的AI計算服務體系,參建國內多家超算中心和智算中心。

中科曙光目前AI伺服器分為訓練和推理兩種,主要採用海光/寒武紀晶片,目前已和百度「文心一言」展開合作,為其產業化應用提供算力支持。

拓維信息是華為昇騰AI戰略合作夥伴、華為全方位戰略合作夥伴,在「鴻蒙+鯤鵬+昇騰」基礎軟硬體領域和華為構建全面合作;其中兆瀚系列AI伺服器是基於華為達文西架構3D Cube技術的昇騰AI處理器;兆瀚AI伺服器涵蓋訓練、推理等領域,目前廣泛應用於智慧城市、運營商等行業的數據中心、算力中心相關場景。

神州數碼擁有國內領先的雲計算產業相關服務技術優勢和國內最大的To B銷售網絡渠道,雲管理服務已經覆蓋全球五大公有雲,形成了全面的雲和數位化生態整合能力;並率先提出「數雲融合」理念,並將「數雲融合」作為企業數位化轉型的方法框架;神州鯤泰系列AI伺服器覆蓋訓練、推理和邊緣三種類型,均採用鯤鵬920處理器,成為鯤鵬產業生態的重要實踐者,積極布局基於「鯤鵬+昇騰」的自有品牌體系。

工業富聯在雲計算伺服器出貨量持續全球第一,並推出新一代雲計算基礎設施解決方案(模塊化伺服器、高效運算HPC)以解決AIGC算力井噴需求;其客戶布及全球,覆蓋微軟、谷歌、英偉達、英特爾等海外頭部大廠;工業富聯雲計算產品涉及雲伺服器、高性能伺服器、AI伺服器、邊緣伺服器及雲儲存設備等。

紫光股份致力於打造「雲—網」產業鏈,向雲計算、移動網際網路和大數據處理等信息技術的行業應用領域全面深入,目前核心業務基本覆蓋IT服務的重要領域;紫光股份對子公司新華三剩餘49%的股權收購有望能在今年內完成,正持續推進;新華三是目前國內前三、全球前十的AI伺服器廠商,其相關產品包括UniServer AI一體機和一系列AI伺服器等,新華三AI伺服器在MLPerf訓練及推理測試中共斬獲86項世界第一,具備深厚技術積澱和領先實力。

2017年開始,隨著邊緣計算、「物聯網+」的興起,疊加AI等需求,伺服器市場開始火熱。

根據IDC數據,十五個重點國家的計算力指數平均每提高1點,國家的數字經濟和GDP將分別增長3.5‰和1.8‰,預計該趨勢在2021-2025年將繼續保持。

此外,當一個國家的計算力指數達到40分以上時,國家的計算力指數每提升1點,其對於GDP增長的推動力將增加到1.5倍,而當計算力指數達到60分以上時,國家的計算力指數每提升1點,其對於GDP增長的推動力將提高到3.0倍,對經濟的拉動作用變得更加顯著。

AI伺服器專精於海量數據處理和運算方面,其可以為人工智慧、深度學習、神經網絡、大模型等場景提供廣闊的動力源泉,並廣泛應用於醫學、材料、金融、科技等千行百業。在迎新一輪人工智慧的浪潮下,AI伺服器有望同步高增長,迎來廣闊的市場空間。

關注樂晴智庫,洞悉產業格局!

關鍵字: