計算機深度報告：ChatGPT引發的大模型時代變革

由金融界發佈 2024-04-29T17:16:10.970566+00:00

華安證券：尹沿技王奇珏胡楊張天金榮ChatGPT引發的大模型時代變革，數據要素重要性提升ChatGPT是由OpenAI研發的一種語言AI模型，其特點在於使用海量語料庫來生成與人類相似的反應。初代GPT模型參數1.

華安證券：尹沿技王奇珏胡楊張天金榮

ChatGPT引發的大模型時代變革，數據要素重要性提升

ChatGPT是由OpenAI研發的一種語言AI模型，其特點在於使用海量語料庫來生成與人類相似的反應。初代GPT模型參數1.17億，GPT2模型、GPT3模型參數分別達到15億、1750億。不斷提升的參數量級，使得ChatGPT3當前已經能夠應用在商業、研究和開發活動中。

當前此類參數體量龐大的模型，成為各大科技廠商研發的重點。大模型的基礎為高質量大數據。ChatGPT的前身GPT-3就使用了3,000億單詞、超過40T的數據。此類大數據基礎的前提為三部分1）有效場景下的採集數據；2）大數據的存儲、清洗和標註；3）數據質量檢驗。

大模型發展之下，算力與網絡設施建設成為剛需

算力：隨著參數量和語料庫指數級的擴容，ChatGPT類人工智慧需要更充足的算力支持其處理數據，同時需要投入更多高性能的算力晶片來處理千億級別參數量。英偉達的研究表示，GPT-3模型需要使用512顆V100顯卡訓練7個月時間，或者使用1024顆A100晶片訓練長達一個月的時間。2012 年以來，人工智慧訓練任務中的算力增長（所需算力每3.5月翻一倍）已經超越晶片產業長期存在摩爾定律（電晶體數量每18月翻一倍）。

網絡設施：以目前獨家開放了ChatGPT調用能力的微軟Azure為例，其AI基礎設施由互聯的英偉達 Ampere A100 Tensor Core GPU組成，並由Quantum infiniBand交換機提供強大的橫向擴展能力。根據微軟宣布，每台GPU伺服器網絡連接能力為400Gbps。伺服器節點多、跨伺服器通信需求巨大，網絡帶寬性能成為GPU集群系統的瓶頸，解決的方式包括增加單節點通信帶寬與降低網絡收斂比。由此帶來光模塊、交換機等網絡設施需求。

下游應用場景豐富，多行業落地可期

1）「生成式AI （generative AI）」在網際網路及元宇宙領域市場化空間較為廣闊。基於現行的NLP算法發展程度及數據集規模，在不久的將來，生成式AI有較大可能在「智能客服」和「搜尋引擎」進行增值，並有希望以「插件」的形式賦能現有的「生產力工具鏈（工程軟體/音視頻製作工具等）」。

2）人工智慧在製造業的應用可分為三方面：a）智能裝備：指具有感知、分析、推理、決策、控制功能的製造裝備，典型代表有工業機器人、協作機器人、數控工具機等；b）智能工廠：利用各種現代化的技術，實現工廠的辦公、管理及生產自動化，典型的代表場景有協作機器人、智能倉儲物流系統等；c）智能服務：指個性化定製、遠程運維及預測性維護等，典型代表有工業網際網路等。

3）人工智慧在智能汽車領域的應用包括：a）智能駕駛依託人工智慧技術，將從駕駛輔助發展至自動駕駛；b）智能座艙在人工智慧技術的支持下，從出行工具演變為出行管家。

風險提示

國內大模型不及預期風險；行業競爭加劇風險；AI應用的倫理道德風險；晶片及晶片技術供應風險；商業模式變現與落地不及預期風險。

本文源自券商研報精選