計算機深度報告:ChatGPT引發的大模型時代變革

金融界 發佈 2024-04-29T17:16:10.970566+00:00

華安證券:尹沿技 王奇珏 胡楊 張天 金榮ChatGPT引發的大模型時代變革,數據要素重要性提升ChatGPT是由OpenAI研發的一種語言AI模型,其特點在於使用海量語料庫來生成與人類相似的反應。初代GPT模型參數1.

華安證券:尹沿技 王奇珏 胡楊 張天 金榮

ChatGPT引發的大模型時代變革,數據要素重要性提升

ChatGPT是由OpenAI研發的一種語言AI模型,其特點在於使用海量語料庫來生成與人類相似的反應。初代GPT模型參數1.17億,GPT2模型、GPT3模型參數分別達到15億、1750億。不斷提升的參數量級,使得ChatGPT3當前已經能夠應用在商業、研究和開發活動中。

當前此類參數體量龐大的模型,成為各大科技廠商研發的重點。大模型的基礎為高質量大數據。ChatGPT的前身GPT-3就使用了3,000億單詞、超過40T的數據。此類大數據基礎的前提為三部分1)有效場景下的採集數據;2)大數據的存儲、清洗和標註;3)數據質量檢驗。

大模型發展之下,算力與網絡設施建設成為剛需

算力:隨著參數量和語料庫指數級的擴容,ChatGPT類人工智慧需要更充足的算力支持其處理數據,同時需要投入更多高性能的算力晶片來處理千億級別參數量。英偉達的研究表示,GPT-3模型需要使用512顆V100顯卡訓練7個月時間,或者使用1024顆A100晶片訓練長達一個月的時間。2012 年以來,人工智慧訓練任務中的算力增長(所需算力每3.5月翻一倍)已經超越晶片產業長期存在摩爾定律(電晶體數量每18月翻一倍)。

網絡設施:以目前獨家開放了ChatGPT調用能力的微軟Azure為例,其AI基礎設施由互聯的英偉達 Ampere A100 Tensor Core GPU組成,並由Quantum infiniBand交換機提供強大的橫向擴展能力。根據微軟宣布,每台GPU伺服器網絡連接能力為400Gbps。伺服器節點多、跨伺服器通信需求巨大,網絡帶寬性能成為GPU集群系統的瓶頸,解決的方式包括增加單節點通信帶寬與降低網絡收斂比。由此帶來光模塊、交換機等網絡設施需求。

下游應用場景豐富,多行業落地可期

1)「生成式AI (generative AI)」在網際網路及元宇宙領域市場化空間較為廣闊。基於現行的NLP算法發展程度及數據集規模,在不久的將來,生成式AI有較大可能在「智能客服」和「搜尋引擎」進行增值,並有希望以「插件」的形式賦能現有的「生產力工具鏈(工程軟體/音視頻製作工具等)」。

2)人工智慧在製造業的應用可分為三方面:a)智能裝備:指具有感知、分析、推理、決策、控制功能的製造裝備,典型代表有工業機器人、協作機器人、數控工具機等;b)智能工廠:利用各種現代化的技術,實現工廠的辦公、管理及生產自動化,典型的代表場景有協作機器人、智能倉儲物流系統等;c)智能服務:指個性化定製、遠程運維及預測性維護等,典型代表有工業網際網路等。

3)人工智慧在智能汽車領域的應用包括:a)智能駕駛依託人工智慧技術,將從駕駛輔助發展至自動駕駛;b)智能座艙在人工智慧技術的支持下,從出行工具演變為出行管家。

風險提示

國內大模型不及預期風險;行業競爭加劇風險;AI應用的倫理道德風險;晶片及晶片技術供應風險;商業模式變現與落地不及預期風險。

本文源自券商研報精選

關鍵字: