攜手NVIDIA等40餘家國內外夥伴,飛槳硬體生態狂飆

機器之心pro 發佈 2023-03-26T03:09:48.419371+00:00

備受關注的 NVIDIA GTC 2023 大會已經結束,NVIDIA CEO 黃仁勛依然給所有人帶來了震撼,搬出了為 ChatGPT 準備的晶片,向世人展示了 GPU 持續在算力上賦能大模型乃至整個深度學習領域的巨大潛力。

機器之心原創

作者:杜偉

深度學習框架與 AI 硬體廠商,相輔相成、共同發展。百度飛槳與 NVIDIA 等 40 多家硬體夥伴正在踐行這一理念。

備受關注的 NVIDIA GTC 2023 大會已經結束,NVIDIA CEO 黃仁勛依然給所有人帶來了震撼,搬出了為 ChatGPT 準備的晶片,向世人展示了 GPU 持續在算力上賦能大模型乃至整個深度學習領域的巨大潛力。

大會期間,黃仁勛還與 OpenAI 聯合創始人、首席科學家 Ilya Sutskever 進行了一場深度對話,他們一致認為深度學習的強大能力已經改變了世界,真正推動了技術的進步。

的確,近年來,深度學習技術正在推動整個 AI 行業進入到一個全新的階段。AI 領域的技術創新和產業發展離不開深度學習框架和平台,它聯動了 AI 產業鏈上下游眾多企業和用戶,通過持續降低應用門檻將 AI 技術傳遞給千行百業,推動 AI 應用大規模落地。

作為國內 AI 領頭雁的百度,其飛槳產業級深度學習開源開放平台集核心框架、產業級模型庫、開發套件與工具組件於一體,其中百度生成式 AI 產品文心一言正是孕育自產業級知識增強大模型文心。截止 2022 年 11 月,飛槳已經凝聚了 535 萬開發者,服務了 20 萬家企事業單位,創建了 67 萬個 AI 模型。

百度依託飛槳平台,圍繞著技術、生態和產業構建了全方位、多層次的深度學習發展格局。生態建設則是聯動各方實現技術融合和落地的關鍵步驟,而作為生態建設重要的一環,硬體生態正是聯合硬體廠商搞好 AI 晶片的適配與優化,最終達成合作共贏。

作為全球 GPU 巨頭的 NVIDIA,成為了百度飛槳天然的合作夥伴。NVIDIA 自身也非常重視中國市場尤其中國的生態夥伴,飛槳成為其在世界上支持的三大深度學習框架之一,更有專門的工程團隊來賦能飛槳生態。

過去數年,飛槳與 NVIDIA 在硬體生態建設上一直保持著全面深度的合作,做了大量的開發與優化工作,並通過技術共研開拓了眾多軟硬體協同產品與功能。尤其在 2022 年,雙方的合作邁入了新的階段。

樹立硬體生態標杆

飛槳與 NVIDIA 深拓合作夥伴關係

我們知道,隨著深度學習的快速發展尤其是大規模機器學習模型的湧現,AI 算力需求的增長達到了新的高度。這無疑給硬體廠商帶來巨大挑戰,要求他們生產出非常強大的 AI 晶片。同時,AI 晶片與深度學習框架的融合優化,才能帶來前所未有的加速,將性能發揮到極致。

不過,就拿 PyTorch 等常用開源深度學習框架來說,開發團隊不接受硬體廠商的代碼進入主幹。這就導致硬體廠商支持新版本框架的成本高昂,只能有選擇地支持重點版本。這樣一來,硬體廠商的 AI 晶片與深度學習框架之間存在適配問題,AI 基礎軟硬體產業鏈上下游也就無法實現高效的協同發展。

飛槳則不然,從 2020 年開始致力於 AI 晶片的適配,與國內外硬體廠商展開深度合作,共同開發更加便捷的核心框架,構建統一的硬體接入方案。通過與廣大硬體廠商構建合作生態,真正發揮出 AI 晶片的算力。以 NVIDIA 為例,它早在 2020 年 5 月就加入了「飛槳硬體生態圈」計劃,後續更與飛槳展開了一系列深度合作。

具體到硬體適配上,飛槳與 NVIDIA 主要在四個方面進行合作。在數據處理上幫助飛槳集成 DALI,在大規模訓練上支持各類數據格式以及 ASP、CUDA 等算子函數 API,在優化推理上開發 Paddle-TRT、Deep Learning Examples,在規模部署上集成了 NCCL、開發了 Triton PaddlePaddle Backend。多樣化適配使得飛槳開發者的高性能推理訓練成為可能,也為其與飛槳的進一步合作打下了基礎

2022 年,飛槳開啟與硬體生態夥伴全面共創的一年。在 5 月 20 日的 Wave Summit 2022 深度學習開發者峰會上,飛槳攜手 NVIDIA 在內等十餘家國內外硬體廠商發布了「飛槳硬體生態共創計劃」,通過共享共創打造繁榮的 AI 生態。在此次峰會上,飛槳發布了其與 NVIDIA 的共研共創合作方案。

具體地,針對硬體適配依然存在的高門檻以及用戶的多層次需求,雙方在已有合作的基礎上開發了三大主要產品,包括了 NVIDIA NGC PaddlePaddle Container —— NGC 飛槳容器NVIDIA Deep Learning Examples—— 飛槳深度學習模型示例、以及 NVIDIA DLI (Deep Learning Institute)—— 飛槳共建課程。對於使用 NVIDIA GPU 平台的飛槳用戶,這些舉措可以使他們獲得絕佳用戶體驗與極致性能。

首先針對開發者用戶的一些痛點需求,比如使用 NVIDIA 最新軟體棧開發、訓練、部署時需要大量手動配置工作,工程挑戰巨大。因此飛槳聯合 NVIDIA 開發了 NGC 飛槳容器,針對 NVIDIA GPU 加速進行優化,最大程度釋放飛槳框架在 NVIDIA 最新硬體上的算力

NGC 飛槳容器還包含了用於加速 ETL (DALI、RAPIDS)、訓練(cuDNN、NCCL)以及推理(TensorRT)工作負載的軟體,實現了飛槳與 NVIDIA 軟體棧的無縫集成與性能優化。

有了 NGC 飛槳容器,用戶在快速開啟 AI 應用的同時,還能在 AI 訓練和推理任務上享受飛槳 +NVIDIA 帶來的飛速體驗。此外通過 NVIDIA NGC 完善的開發體系、質量管理、測試流程、文檔規範、安全掃描等,雙方開發了基於 NVIDIA GPU 平台最好的飛槳開發環境。

作為 NVIDIA 優化的工業級模型庫,NVIDIA Deep Learning Examples 涵蓋了機器人、數字孿生、金融等不同行業的模型,目標是讓使用 NVIDIA GPU 平台的開發者復現 NLP 和 CV 等領域擁有極致性能的經典模型。

2022 年 10 月,NVIDIA Deep Learning Examples 倉庫上線了基於飛槳實現的 ResNet50 模型,相關示例全面適配各類 NVIDIA GPU 以及單機單卡、單機多卡等各種硬體拓撲,實現了性能極致優化。值得一提的是,飛槳 ResNet50 模型的訓練速度超過了 PyTorch 版 ResNet50。之後還支持了 BERT 模型,後續將陸續支持 PP-YOLOE 等模型。

為了更好地提高推訓性能並簡化代碼,NVIDIA 深度學習培訓中心(DLI)不僅準備了系列免費課程,還聯名飛槳推出 DLI 課程證書,為開發者的能力和職業發展提供了權威證明。例如飛槳與 NVIDIA 聯合打造了《使用 PaddlePaddle 與 TensorRT 完成深度學習優化與部署》課程,讓開發者感受基於 PaddlePaddle 與 TensorRT 的優化部署最佳體驗。

2022 年 11 月 30 日,在 WAVE SUMMIT+2022 深度學習開發者峰會上,飛槳又攜手 NVIDIA 等 12 家硬體夥伴發布了飛槳生態發行版。對於用戶而言,當在 NVIDIA GPU 平台上跑飛槳時,會提供專門的軟體版本,使開發者享受更好的軟硬一體化體驗。至此飛槳與 NVIDIA 的硬體生態合作又進了一步。

在飛槳著力打造繁榮共贏生態、促進軟硬體協同發展的過程中,NVIDIA 是重要的參與者和見證者,並成為飛槳合作生態中最為深入和標杆性的案例。隨著雙方合作內容的不斷豐富,滿足了 AI 開發者的多層次需求。同時,飛槳與 NVIDIA 的深度合作也為國內其他硬體廠商提供了一種可參照的合作模式。

共聚、共研、共創

飛槳探索與硬體廠商共贏之路

從飛槳與 NVIDIA 的合作中可以看到,硬體生態建設這一環做得好不好,會深刻地影響到深度學習框架自身的通用性、硬體廠商 AI 晶片的效率以及在 AI 領域的廣泛應用。正是這種雙方的痛點需求為飛槳與硬體廠商的生態合作做好了鋪墊

作為國內市場綜合份額第一的深度學習平台,飛槳一直以來非常注重與國內外硬體廠商的合作,通過與他們的緊密聯繫持續拓展硬體生態。截至目前,與飛槳深度融合優化的國內外硬體廠商數量已經超過了 40 家

對於飛槳來說,其與硬體生態夥伴的合作是在摸索中前進,不斷地創新合作模式,經歷了 2020 年的「共聚」、2021 年的「共研」、2022 年的「共創」三個階段。每個階段的側重點不同,合作夥伴數量逐年增多,合作內容也更加廣泛和深入。

首先回到 2020 年,飛槳率先對接了國內外領先的 CPU、GPU、ASIC、伺服器等硬體廠商,並於 5 月聯合 Intel、NVIDIA、寒武紀、浪潮等 13 家國內外頂級硬體廠商發布了「飛槳硬體生態圈」計劃,為後來的廣泛硬體生態合作打好了基礎

當時,飛槳除了持續增強硬體廠商對飛槳平台投入的信心,還通過金融、能源等行業的最終用戶來驅動硬體廠商與飛槳適配,建立起與他們的規範流程、專門團隊等。這些舉措釋放出了飛槳攜手硬體廠商共建硬體生態的決心,並啟動了與重點廠商的硬體適配和技術優化工作。

在接下來的 2021 年,飛槳開始與硬體夥伴的軟硬一體聯合優化,進入到了「共研」階段。不過,在執行硬體適配與技術優化過程中,雙方也遇到了挑戰。一是硬體廠商軟體棧接入方式多樣(算子庫、圖接入、編譯器等),適配技術方案複雜。國內廠商的 AI 軟體棧建設起步晚,給實際適配帶來新的挑戰;二是如何使得硬體廠商以較低的成本接入飛槳。

針對這些挑戰,飛槳結合對硬體廠商軟體棧的理解設計了飛槳硬體對接方案,包括自定義算子庫接入、自定義通信庫等多項基礎軟體改造,極大降低了硬體廠商適配成本。在該階段,飛槳支持的國產硬體數量實現了第一

進入到 2022 年,飛槳在 2021 年技術適配成果的基礎上進一步拓展與硬體夥伴的合作。飛槳希望更多的硬體開發者使用飛槳進行 AI 應用創新,硬體廠商也希望引入定製版的飛槳框架、模型庫來豐富自身 AI 軟體棧,因此雙方的合作進入到全面的「共創」階段

首先是上文提到的「飛槳硬體生態共創計劃」,旨在與飛槳硬體生態夥伴在聯合研發、資源共享、聯合授權、培訓賦能等四個維度全面合作,更好地服務開發者,加速 AI 產業落地,實現生態繁榮共贏。

在聯合研發環節,飛槳與硬體夥伴成立技術研發虛擬聯合團隊,共同打磨基礎軟體棧,推進硬體與飛槳的適配與性能優化工作。尤其針對國產 AI 硬體與深度學習框架持續適配與升級成本較高的問題,飛槳推出算子接入、子圖接入、編譯器接入等多種方案,與廠商共建持續集成基礎設施,接收廠商適配的代碼。在全球前三大框架中,飛槳是唯一對所有硬體廠商開放合作、接受所有硬體廠商提交代碼的框架

此外,飛槳還聯合硬體夥伴共同推出飛槳生態發行版(針對特定AI硬體,定製優化的飛槳框架和飛槳模型庫),大大提升飛槳模型在各類 AI 硬體上的訓練推理性能,為開發者提供更多更好選擇。

在資源共享環節,飛槳與硬體生態共創計劃夥伴共享推廣宣傳資源,包括共同撰寫技術稿件,通過博客、論壇等社交媒體資源聯動推廣。飛槳還對生態夥伴聯合授權,將與硬體夥伴聯合優化好的方案優先推薦給生態夥伴,並基於硬體平台聯合開發飛槳一體機,提供功能全面、便捷高效、穩定可靠的一站式 AI 服務。

在培訓賦能環節,飛槳聯合生態夥伴開發飛槳 + 硬體使用開發教程,與硬體廠商在雙方的學習與實訓社區提供系列課程及聯名認證證書,如上文與 NVIDIA 聯合開發的飛槳共建課程。飛槳還與硬體夥伴在 AI Studio 中開設廠商專區,為國內深度學習開發者提供體驗更多 AI 硬體的機會。目前飛槳 AI Studio 是國內最大的人工智慧學習與實訓社區,註冊用戶超過了 300 萬。

從共聚、共研到共創,一路走來,飛槳在硬體生態建設上持續深化與硬體夥伴的合作方式與內容,結合他們的實際需求,通過技術創新持續降低適配飛槳的成本,並利用產品共建、生態運營等途徑保持適配後的商業價值。對於國內硬體廠商而言,已經具備相當規模的飛槳生態是其快速拓展硬體市場的契機,因此應勇於擁抱並創新自身與飛槳的生態合作,實現雙贏。

作為整個 AI 產業鏈的重要一環,飛槳一直以來的開放合作態度是其硬體生態持續取得成果的重要前提,接入 AI 晶片時聯合硬體夥伴優化 AI 軟體工具鏈設計,充分滿足開發者在應用時對算力、模型和算力等各個層面的需求,降低開發、訓練和部署的負擔,帶來低門檻、簡易的使用體驗。

飛槳深度學習框架和硬體廠商這兩個主體的高效協作還增強了整個 AI 行業的活力,產生真正的商業價值,在不斷健全、良性的硬體生態環境中推動 AI 應用規模化落地。未來飛槳將持續開源開放,找准與硬體廠商利益契合點,在更廣泛和深入的軟硬協同探索中更好地服務開發者。

關鍵字: