數據中心行業專題報告:數字經濟+AI浪潮下IDC或迎投資機遇

未來智庫 發佈 2024-04-10T09:16:48.971215+00:00

OpenAI 於 2020 年 5 月發表 GPT-3 的論文,微軟在 2020 年 9 月 22 日宣布取得了 GPT-3 的獨家授權。

(報告出品方/作者:天風證券,唐海清,王奕紅)

1.什麼是ChatGPT?

ChatGPT 近期獲得較高的關注度,人們可以與其聊天對話,進行文本互動,那麼什麼是 ChatGPT 呢? ChatGPT 是美國人工智慧研究實驗室 OpenAI 開發的一種全新聊天機器人模型,它能夠通 過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,並協助人類完成 一系列任務。

其中 GPT 指代的是一種模型,其是「Generative Pre-trained Transformer」生成型預訓練 變換模型的縮寫,目的是為了使用深度學習生成人類可以理解的自然語言。目前我們討論 的 GPT 一般指的是 GPT-3,顯而易見,在之前還有 GPT-2 和 GPT。 GPT-3是由人工智慧公司OpenAl訓練與開發,該模型設計基於谷歌開發的變換語言模型。 GPT-3 的神經網絡包含 1750 億個參數,為有史以來參數最多的神經網絡模型。OpenAI 於 2020 年 5 月發表 GPT-3 的論文,微軟在 2020 年 9 月 22 日宣布取得了 GPT-3 的獨家授權。

回顧 GPT 的發展,GPT 家族與 BERT 模型都是知名的 NLP 模型,都基於 Transformer 技術。 GPT,是一種生成式的預訓練模型,由 OpenAI 團隊最早發布於 2018 年,GPT-1 只有 12 個 Transformer 層,而到了 GPT-3,則增加到 96 層。其中,GPT-1 使用無監督預訓練與有 監督微調相結合的方式,GPT-2 與 GPT-3 則都是純無監督預訓練的方式,GPT-3 相比 GPT-2 的進化主要是數據量、參數量的數量級提升。

而 InstructGPT/GPT3.5(ChatGPT 的前身)與 GPT-3 的主要區別在於,新加入了 RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學習),其增強了人類對 模型輸出結果的調節,並且對結果進行了更具理解性的排序。應用 Tamer 框架,ChatGPT 可 以比 GPT-3 更好的理解和完成人類語言或指令,模仿人類,提供連貫的有邏輯的文本信 息的能力。ChatGPT 算法成功的原因:強大的基座模型能力(InstructGPT)、大參數語言模型(GPT3.5)、 高質量的真實數據(精標的多輪對話數據和比較排序數據),以及性能穩定的強化學習算 法(PPO 算法)。

2.ChatGPT的運行機制

OpenAI 利用 RLHF 來訓練模型(該方法在訓練中使用人類反饋,以最小化無益、失真或偏 見的輸出),使用與InstructGPT相同的方法,但數據收集設置略有不同。通過使用supervised fine-tuning 來訓練初始模型,將這個新的對話數據集與 InstructGPT 數據集混合,並將其 轉換為對話格式。

方法總體上包括三個不同步驟: 1、有監督的調優:預訓練的語言模型在少量已標註的數據上進行調優,以學習從給定的 prompt 列表生成輸出的有監督的策略(即 SFT 模型); 2、模擬人類偏好:標註者們對相對大量的 SFT 模型輸出進行投票,這就創建了一個由比 較數據組成的新數據集。在此數據集上訓練新模型,被稱為訓練回報模型(Reward Model, RM); 3、近端策略優化(PPO):RM 模型用於進一步調優和改進 SFT 模型,PPO 輸出結果是 的策略模式。 第一步是收集數據,以訓練有監督的策略模型。為了創建像 ChatGPT 這樣的通用聊天機 器人,開發人員是在「代碼模型」而不是純文本模型之上進行調優。第二步是訓練回報模 型,這一步的目標是直接從數據中學習目標函數。第三步是使用 PPO模型微調 SFT 模型, 這一步里強化學習被應用於通過優化 RM 模型來調優 SFT 模型。

3.ChatGPT會提升多少算力?

中國算力發展持續快速增長。根據城市大腦研究院,IDC 預測,中國智能算力規模將持續 高速增長,預計到 2026 年中國智能算力規模將達到 1271.4EFLOPS,22-26 年複合增長率 達 52.3%,同期通用算力規模的複合增長率為 18.5%。

ChatGPT 將需要大量算力和計算資源。根據通信世界數據,ChatGPT 的總算力消耗約為 3640PF-days (即假如每秒計算一千萬億次,需要計算 3640 天) ,需要 7-8 個投資規模 30 億、算力 500P 的數據中心才能支撐運行。ChatGPT 需要 TB 級的運算訓練庫,甚至是 P-Flops 級的算力。ChatGPT 包括研發(訓練)和應用(推理),其都需要大量智能計算資源和數 據存儲及傳輸資源。

現階段的 ChatGPT 是在擁有 3000 億個單詞的語料基礎上預訓練擁有 1750 億參數的模 型,GPT-4 將是一個擁有超過 100 萬億級別參數的大模型。根據學術界的既有研究可知, 深度神經網絡的學習能力和模型的參數規模呈正相關。人類大腦皮層有 140 多億個神經細胞,每個神經細胞有 3 萬餘個突觸,因此,大腦皮層的突觸總數超過 100 萬億個,神 經細胞通過突觸相互建立聯繫。一旦 GPT-4 實現 100 萬億參數規模,就可以堪比人的大 腦,意味著它將達到與人類大腦神經觸點規模的同等水平。

下游應用場景有望持續拓展。目前 ChatGPT 的主要應用場景包括但不限於無代碼編程、小 說生成、對話類搜尋引擎、語音陪伴、語音工作助手、對話虛擬人、人工智慧客服、機器 翻譯、晶片設計等。隨著算法技術和算力技術的不斷進步,ChatGPT 也有望進一步走向更 先進功能更強的版本,在越來越多的領域進行應用,為人類生成更多更美好的對話和內容。

4.對數據中心的影響

未來異構計算或成為主流。在 CPU+GPU 的異構計算架構中,GPU 與 CPU 通過 PCle 總線連接協同工作,CPU 所在位 置稱為為主機端 (host),而 GPU 所在位置稱為設備端(device)。基於 CPU+GPU 的異構計 算平台可以優勢互補,CPU 負責處理邏輯複雜的串行程序,而 GPU 重點處理數據密集型 的並行計算程序,從而發揮最大功效。A100 伺服器系統功耗明顯提升。以 NVIDIA 的 DGX A100 640GB 為例,其配置了 8 片 A100 GPU,系統功耗達到最大 6.5 千瓦,未來隨著 A100 伺服器的應用增多,我們認為或將顯著 提升數據中心機櫃的功耗。

機櫃功率或將迎來大幅提升。通常 19 英寸機櫃和 42U 機櫃是標準機櫃,參考高度 1U=4.445 厘米,寬度 19 英寸約為 48.26 厘米,英偉達 DGX A100 640GB 寬度上基本約為 19 英寸, 高度上大約為 5.94U,以標準機櫃 42U 為參考,最大限度可以放下約 7 台 DGX A100 640GB 伺服器(實際需要預留散熱、挪動、走線等的空間),最大功率可達到約 45.5KW。ChatGPT 訓練將帶來較大的碳排放。ChatGPT 是基於 GPT-3 的一個升級版本,在 GPT-3 的模型架構基礎上進行了優化並在訓練時期增加了強化學習。訓練一個 GPT-3 約消耗 1287 MWh(兆瓦時)的電,相當於排放了 552 噸碳,由於強化學習需要額外消耗的電力,ChatGPT 在模型訓練階段所產生的碳排放將大於 552 噸。

東數西算下 PUE 指標嚴格。隨著東數西算的實施,其推出針對上架率、能效指標作出規範 要求,同時如北京、上海等核心區域出台能耗管控指標,有望助力行業有序發展,也突顯 出一線地區機櫃資源的稀缺性。21 年 11 月,《貫徹落實碳達峰碳中和目標要求推動數據中 心和 5G 等新型基礎設施綠色高質量發展實施方案》提出,全國新建大型、超大型數據中 心平均用電效率降至 1.3 以下,全國中心節點進一步降至 1.25 以下,綠色低碳水平達到 4A 以上。數據中心基礎設施根據冷卻方式不同可分為風冷數據中心基礎設施和液冷數據中心基礎 設施。風冷方式起步較早,技術相對成熟;液冷方式是近幾年因數據中心散熱需求提升而 出現的一種新方式,技術尚處於發展階段。液冷方式分為冷板液冷和浸沒式液冷,浸沒式 液冷方式又可分為相變浸沒式液冷和非相變浸沒式液冷。

製冷散熱主要方式:目前發展的散熱冷卻技術主要有風冷和液冷兩大類,其中風冷包括自 然風冷和強制風冷,適用的機櫃功率密度較低;液冷分為單相液冷和相變液冷。散熱冷卻 系統所採用的冷卻介質、冷卻方式不同,移熱速率差距大。傳統風冷最高可冷卻 30 kW/r 的機櫃,對於 30 kW/r 以上功率密度的機櫃無法做到產熱與移熱速率匹配,會使機櫃溫度 不斷升高導致算力下降甚至損害設備。 可以看到,採用 A100 後伺服器功率大幅提升,參考上文若採用英偉達 DGX A100 640GB 伺服器,單機櫃的功率或將超過 30kW,此時更適宜應用液冷的冷卻方案。液冷分為間接液冷、直接單相液冷和直接兩相液冷,主要根據液體與 IT 設備接觸狀態來區 分。

目前而言,普遍應用的是冷板冷卻的方式,使用的是液冷和風冷相結合的方法,對晶片采 用液冷,對硬碟等其他電器元件採用風冷,並非嚴格意義上的單純液冷。屬於間接液冷的 一種方式,冷板能冷卻小於 45 kW/r 的機櫃更節能且噪音小,不需要昂貴的水冷機組,與 純液冷對比也有一定優勢。單相浸沒式液冷製冷效果更強,但難度較高。單相浸沒式液冷需要對液冷材料進行篩選(滿 足絕緣性強、黏度低、閃點高或不燃,腐蝕性小,熱穩定性高,生物毒性小等性能要求) 和 IT 設備進行設計,但該方式可以實現冷卻的傳熱係數範圍更廣。

5.重點企業分析

5.1.潤澤科技:

國內領先的數據中心整體解決方案提供商。潤澤科技發展有限公司於 2009 年 9 月在廊坊 經濟技術開發區註冊成立。自成立以來,公司始終專注於開發及運營超大規模、高等級、 高效高性能數據中心集群。目前潤澤科技在廊坊建設運營的潤澤(廊坊)國際信息港數據 中心集群,規模位居全國前列,2009 年成立以來陸續啟動廊坊 A 區工程建設,布局長三 角、大灣區、成渝經濟圈、西北地區數據中心建設,建設超大規模數據中心產業園區;並 與中國電信、中國聯通等電信運營商通過長期合作建立了良好的業務關係,為其提供數據 中心整體解決方案。

公司近年收入與利潤增速較快,營收有望保持高速增長。營業收入來看,公司營收全部為 數據中心業務收入,2019-2021 年營收複合增長率達到 43.89%,整體營業收入不斷增長。 2022 年 Q3 實現營收 7.18 億元,同比增長 35.90%。我們認為,隨著數據中心行業的快速 發展和公司品牌運營建設能力的不斷增強,公司收入有望持續快速增長。淨利潤來看,公 司 2022 年 Q3 淨利潤為 3.46 億元,同比增長 103.42%。營業利潤為公司利潤的主要來源, 主營業務突出,具有良好的盈利能力。我們認為,隨著下遊客戶行業需求的不斷增長和公 司數據中心產能的不斷提高,公司盈利有望持續提升。

具體來看,潤澤科技盈利能力的持續提升主要驅動因素如下:1)數位化驅動下遊行業需 求快速增長,市場規模不斷擴大。一方面,網際網路行業客戶由於自身業務發展的需要,對 數據中心資源需求旺盛;另一方面,5G、雲計算、大數據等網絡架構的迅速演進和網絡應 用的不斷豐富也產生了大量的數據中心機房和帶寬需求,我國 IDC 業務市場規模連續高速 增長。2)機櫃數量增加產能提高,數據中心上電率快速爬升。公司投入使用的數據中心 共有 8 棟,高標準機櫃約有 46,000 個(根據 A 棟完成情況推算)。公司產能的不斷提高, 適時的滿足了下遊客戶需求的增長,為企業的盈利能力提供了堅實的基礎。同時截止 2020 年底,公司整體機柜上電率超過 75%,高於同業萬國數據、世紀互聯和秦淮數據等公司, 具有較強競爭優勢,上電率抬升帶動 IDC 收入增加。

3)積極拓展優質客戶,客戶需求不 斷增長。2018 年-2021 年 10 月,潤澤科技前五大終端客戶的營收占比分別為 92.12%、92.39%、 92.50%和 94.21%,其中最大終端客戶字節跳動業務占比較高超 60%,主要由於其近幾年業 務發展較快,導致其對數據中心需求持續增加。同時與第一大客戶中國電信及第二大客戶 中國聯通保持穩定良好合作關係。

優質機櫃布局為「核心資產」,機櫃規模行業領先。潤澤(廊坊)國際信息港於 2010 年正 式投資建設,潤澤國際信息港位於廊坊國家經濟技術開發區,地處京津冀經濟圈、環渤海 經濟圈的中心。項目規劃建設 22 棟、約 100 萬平方米高等級數據中心,可容納約 13 萬架 機櫃。目前已建成投產的機櫃數量約 4.5 萬架,正在建設中 5 棟數據中心共計約 3 萬架機 櫃,潤澤(廊坊)國際信息港 A 區全面建成後,總建築面積 55 萬平米,容納近 7 萬架機 櫃運營,單園區規模位居全國前列。該數據中心布局較早,擴容空間充足,可供終端客戶 根據自身業務的迅速發展直接在本地數據中心擴容,承載更多的數據量,為客戶提供優質 的服務。

複製潤澤(廊坊)國際信息港成熟發展模式,全國布局建設五大新數據中心。2020 年開 始潤澤科技在長三角、粵港澳大灣區和成渝經濟圈布局大數據中心產業集群。目前長三角•平湖潤澤國際信息港項目、潤澤(佛山)國際信息港、潤澤(惠州)國際信息港、潤澤 (西南)國際信息港和潤澤(蘭州)國際信息港均已動工建設。潤澤科技數據中心項目布 局均位於大數據中心國家樞紐節點,符合國家數據中心建設布局,依託廊坊的開發經驗在 全國複製推廣,區域優勢與規模效應顯著。

自建電站、自建綜合管廊,提供穩定強勁電力引擎。電力供應作為公司數據中心建設的三 個必要條件之一,潤澤科技已在全國布局項目電力供應保障。廊坊地區除了政府配套的多 路市政供電,2021 年公司已投產一座用戶自用 110KV 變電站,2022 年開始投建一座 220KV 變電站。長三角平湖園區 2022 年 7 月已投產一座用戶自用 110KV 變電站。

液冷機櫃已有布局。公司已經做了浸沒式液冷和冷板式液冷實驗機房,其中浸沒式液冷, PUE 指標非常好,但是結合用戶側的需求,大規模商用還需要時間來培養。冷板式液冷是 公司未來的一個主流技術方向,客戶對此接受程度較好,已經開始準備批量交付液冷機房。

5.2.奧飛數據:

持續快速發展的 IDC 領先廠商。奧飛數據成立於 2004 年 9 月,是專業的數據中心業務運營商和通信綜合運營企業,已在數據中心領域深耕十數年。近年來,公司屢獲榮譽,並連 續兩年獲得中國電信年度 IDC 優秀合作夥伴。2018 年 1 月,公司在 A 股創業板上市。公 司持續深耕 IDC 領域,目前已成為行業領先企業之一,核心機房資產保障發展基礎,綁定 大客戶快速成長。

公司是多家網際網路巨頭的 IDC 服務提供商,客戶包括搜狐、網易、阿里巴巴、快手等巨頭 公司。奧飛數據具有較強的客戶群體,根據奧飛數據招股說明書,公司 2014 年開始與 UC 開展業務關係,同時前五大客戶還包括風行、網宿科技、樂視網,而後 2015 年搜狐成為 前五大客戶之一,同時 2015 年首先與廣州市百果園網絡科技有限公司達成合作,後續又 與其關聯企業開展了合作,2016 年廣州百果園成為公司前五大客戶之一。2019 與 2020 年 公司繼續拓展強大客戶,與快手和阿里巴巴等簽訂合作協議。目前公司客戶陣容強大,持 續增長的網際網路數據存儲需求將助力公司業務發展。

公司與阿里巴巴、快手以及百度建立了合作關係。公司持續拓展 IDC 批發業務,2019 年 與快手關聯公司北京達佳簽訂了《數據中心模塊合同》,合同金額約 3.3 億元,之後 2020年公司與阿里巴巴建立合作關係,簽訂合作備忘錄,並於 2021 年簽訂合同,金額為 5 億 元。21 年 9 月與 22 年 2 月,公司與百度先後簽署兩項合作意向書,就公司廊坊固安數據 中心/廣州南沙數據中心項目合作達成意向,兩項合同預計總共貢獻收入 9.5/10 億元。上 述合同的簽訂讓公司成功與網際網路巨頭建立了合作關係,保障了公司未來數年的收入。

公司在全國數據中心布局熱點地區具有眾多機櫃資源,截止 2021 年末公司在全國各地接 入了數十個高標準數據中心,機房總使用面積達到 125000+平方米,可提供 19900 機櫃資 源。區域布局涵蓋海南自貿區、粵港澳大灣區、長三角地區、京津冀地區等核心區域。該 類區域機房資源已成稀有資產,公司坐擁核心區域機房資源具有先發優勢與行業核心競爭 能力。截至 22 年 5 月,公司在廣州、深圳、北京、海口等核心地段均布局了自建與非自建機房, 提升公司 IDC 服務能力,未來公司仍將大力推動 IDC 數據中心的建設,完善機房布局,推 動業績不斷增長。

5.3.科華數據

科華數據股份有限公司前身創立於 1988 年,2010 年深圳 A 股上市(股票代碼 002335), 31 年來專注電力電子技術研發與設備製造,是行業首批「國家認定企業技術中心」、「國家 火炬計劃重點項目」承擔單位、國家重點高新技術企業、國家技術創新示範企業和全國首 批「兩化融合管理體系」貫標企業。公司作為中國極具影響力的高安全數據中心提供商,擁有 10 年以上 IDC 行業運營管理經 驗,主要客戶包括三大運營商、騰訊等大型網際網路企業、各大金融機構、政府機關等。在 金融領域,公司全線入圍 UPS、微模塊總行級選型,護航國有六大銀行及興業銀行、交通 銀行、招商銀行等商業銀行,證券、保險等金融機構的 100 多個省級數據中心機房,打造 中國金融業首個模塊數據中心、高壓直流供電數據中心、貨櫃數據中心,及全球首個軌 道機器人巡檢數據中心。

同時,公司產品方案入駐騰訊、百度、優酷、科大訊飛等國內大型網際網路企業,中科院超 級計算青島分中心、國家測繪局、國家工商總局、中國航天二院、清華大學、中國科學院、 中國商飛、平安集團、中冶集團等項目,全面支撐通信、網際網路、政府、金融、教育等行 業信息化與數位化建設。根據計世資訊數據顯示,科華數據在 2019-2020 年中國微模塊 數據中心市場份額排名第一。

公司目前數據中心相關收入主要包含:雲計算業務、數據中心產品銷售,以及承接數據中 心 EPC 等。 公司為用戶提供高安全數據中心雲基礎服務,支撐金融、網際網路、運營商、政府、教育、 醫療等行業信息化建設,幫助企業實現雲端遷移。公司憑藉專業團隊為客戶提供從規劃、 採購、建設、維護、運維多個維度分析,從而實現全面且合理的成本控制。 隨著公司自建數據中心建設規模的擴大,公司數據中心機櫃規模穩步上升,截至 2022 年 半年報,在北、上、廣等地擁有 8 大數據中心,自持機櫃數量 3 萬多個;在全國 10 多 個城市運營 20 多個數據中心。

公司新能源業務包括儲能、光伏等可再生能源應用領域,主要產品包含光伏逆變器、光伏 離網控制器、儲能變流器、離網逆變器等產品及相應配套系統解決方案服務。目前,公司 儲能裝機量超過 1.1GW,連續六年入選全球新能源企業。儲能作為綜合能源系統的樞紐,是公司新能源業務未來的發展重點,公司已在發電側、電網側、用電側以及微網儲能等領 域進行布局,滿足客戶及市場對於穩定、高效、綠色電能的需求。

公司在新能源領域進行市場細分,推出針對性解決方案。光伏發電領域,公司擁有領跑者 解決方案、智慧「光伏+」綜合解決方案、光伏扶貧電站系統解決方案等五種方案,和不 同場景、不同規模下光伏發電需求實現對接。以領跑者方案為例,公司針對水面、平坦地 形、複雜地形三種環境場景推出不同的搭配方案,緩解地形缺陷對發電效果的不良影響; 在儲能領域,公司立足於用戶側儲能、發電側儲能和微電網系統,覆蓋戶級、村級、鄉鎮 級、城市級、海島級各個規模,具有較好的市場適應能力。

5.4.英維克

溫控設備領先廠商,技術積累賦能產品/客戶拓展。公司下遊行業布局豐富,產品與服務 廣泛應用於數據中心、通信、智能電網、儲能電站,新能源車、軌道交通、冷鏈運輸,智 慧教育、家居、醫療等行業,服務如三大運營商、Sprint、軟銀等運營商以及騰訊、阿里 巴巴、秦淮數據等客戶。豐富的下游應用領域布局助力公司業務持續增長動力強勁。公司產品布局廣泛,圍繞溫控拓展不同應用系列。英維克產品圍繞精密溫控節能產品拓展, 應用領域包含數據中心機房、儲能、機櫃、冷鏈等。目前公司已基本構建了從熱源到冷源的設備散熱全鏈條的技術平台,並逐漸完善健康環境的多維度空氣品質管理的技術平台, 具備針對不同下游細分市場及行業大客戶快速提供個性化需求的產品和方案的能力。

推出 XGlacier 液冷系列產品。公司推出 XGlacier 全鏈條冷板式液冷系統,採用集成冷板式 液冷技術、高效變頻水泵、溫水冷卻技術達到高效製冷效果,同時充分利用自然冷源,做 到極致節能,CLF 低至 0.03。該方案適用於集中式和分布式液冷系統,在 2021 年實現單 機櫃 200kW 超高功率密度算力伺服器全液冷批量交付,並榮獲「數據中心科技成果一等 獎」。推出六大製冷方案,賦能東數西算建設。英維克高效製冷產品和解決方案在「東數西算」 多個集群中已成熟應用,根據各區域樞紐數據中心對 PUE 的不同需求,在系列數據中心冷 卻方案中,精選出 6 種高效節能方案。六大高效製冷方案因地制宜,助力機櫃能耗的降低, 賦能東數西算的建設打造。我們認為英維克憑藉全方位高效率的製冷解決方案,有望在「東 數西算」未來落地建設中廣泛應用進一步提高品牌知名度,提升市場份額。

已有豐富的項目經驗。英維克的製冷解決方案已在多個節點有項目經驗,XFlex 間接蒸發 冷卻機組產品已批量應用在河北、山西、北京、張北、深圳等多個數據中心中;此外寧夏 中衛的美利雲項目採用 XFlex 蒸發冷卻系統及 XStorm 風牆系統,實現節能減耗,顯著提高 能源利用率。

(本文僅供參考,不代表我們的任何投資建議。如需使用相關信息,請參閱報告原文。)

精選報告來源:【未來智庫】

關鍵字: