特稿|AI大模型熱潮下算力需求爆發:臨港欲建百億產業,商湯當「鏈主」

澎湃新聞 發佈 2023-06-05T19:07:56.101987+00:00

2022年1月24日,商湯科技在上海自貿區臨港新片區布局的人工智慧計算中心AIDC正式啟動運營。當時這家人工智慧公司未必能精準預測,2022年即成為了所謂的AIGC(AI Generated Content)元年。

2022年1月24日,商湯科技在上海自貿區臨港新片區布局的人工智慧計算中心AIDC正式啟動運營。當時這家人工智慧公司未必能精準預測,2022年即成為了所謂的AIGC(AI Generated Content)元年。

「今天,我們的臨港AIDC已經有接近3萬塊的GPU(圖形處理器),我們目前的算力已經達到5000 PetaFLOPS(1 PetaFLOPS等於每秒1千萬億次浮點運算),在這之上我們相信未來可以有更好的開發者效率,並且都能夠支持更多千億規模的大模型算力訓練。」在6月2日的「AI引領時代,算力驅動未來」——臨港新片區智算大會上,商湯科技董事長兼CEO 徐立如是表示。

據澎湃新聞(www.thepaper.cn)記者從商湯方面了解,「目前還有大量的需求在路上排著隊」。而在商湯科技聯合創始人、大裝置事業群總裁楊帆看來,人工智慧對於更大數據、更大規模、更大算力的追求並不是「始於今天」,「整個人工智慧技術疊代、進步的歷史,我們可以把它看成是一個對於『暴力美學』的追求,以及算法、算力、數據三要素由量變產生質變的一個技術疊代的過程。」

聚焦前沿產業的臨港新片區對這種新的熱潮迅速做出了響應。6月2日當天,臨港新片區黨工委副書記吳曉華在上述大會上發布了《臨港新片區加快構建算力產業生態行動方案》。該《方案》的藍圖之下,至2025年,臨港將成為具有全國影響力的算力產業集聚區,含相關硬體、軟體、應用、服務等的算力產業總體規模將突破100億元。

臨港新片區黨工委副書記吳曉華發布《臨港新片區加快構建算力產業生態行動方案》。

「我們看到AI大爆發的時代已經來臨了,AI進入到我們生產和生活的各個領域,那麼隨著 AI應用的大爆發,它其實也驅動了算力需求的大爆發。」對於上述《方案》的出台,臨港新片區管委會高科處處長陸瑜對澎湃新聞(www.thepaper.cn)在內的媒體表示,臨港前期已具備了很好的優勢,「就是我們的算力資源非常豐富。」

更為重要的是,在人工智慧公司選擇是否落地臨港時,算力資源已經成為尤為重要的決策因素。

算力是新時代的能源,而成功又不僅僅在於「暴力美學」

何謂算力?徐立認為,算力其實是整個模型能力的表達,「算力等於算法或者說大模型的參數,去乘上它所處理的數據量。大模型時代參數越大,乘上的數據量越大,所需要的算力就越大。」算力已然成為新時代的能源,「某種程度上,算力決定了市場的競爭力。」

楊帆也談到,從去年到今年整個人工智慧領域非常火的一個概念叫內容生成,同時大家都熟悉了一個名詞即大模型。簡單來看,這是一種「暴力美學」,例如,GPT-3模型使用了超過1750億個參數,需要高性能的處理器來支持訓練,使用V100訓練耗卡量為10000張卡訓練14.8天,整體算力需求約625 PetaFLOPS。

楊帆認為,這種「暴力美學」也可以理解為量變產生質變,「其實人工智慧從它誕生的第一天起到今天,一直都在追求通過規模化帶來更強的智能化。」他提到,實際上就人工智慧領域來說,在過去的5-6年時間裡,業內最頂級的人工智慧模型對算力的消耗量,「每4-6個月就要翻一番,也就是說過去的這幾年時間裡翻了近30萬倍。」

當然,「暴力」和「智能」並不是完全成正比,「擁有更大的資源、更大的規模,它僅僅是一個必要而非充分的條件。」楊帆強調,真正在「暴力美學」背後支撐產生重大的技術創新和成果的,恰恰又是在於對每一個環節的持續性的優化和改進。

以數據為例,「GPT-4所用的數據其實只是OpenAI收集到的所有數據的1%,因為他發現當把更多的數據去灌給機器人的時候,有可能反而不那麼聰明,應該把更加有效、更加高價值的數據提供給這個算法,然後才能去創造出一個更加聰明的大腦。」

其認為,至少在今天,數據的有效性遠比數據的總量更加重要。而如何定義有效的數據,「這其實就需要數據科學家大量的努力,OpenAI其實讓他們最優秀的科學家去做數據了,並非大家覺得的去搞算法了。」

這種每個環節的優化同樣包括算力,在英偉達缺貨的情況下,為什麼沒人在用國產晶片做商業化的大規模訓練?為什麼最新這波浪潮到來後,第一時間錢都被英偉達掙走了?這些問句背後的解釋是,「並不是我們把算力量堆到一個數值就能夠產生最終的價值,1000張卡100台伺服器放在一起跑同一個任務,這中間還需要大量的配套軟體、通信網絡,它是一系列軟硬體聯合調優的過程,這樣的工作積累我們過去沒有做,我們今天就需要去補課。」

順勢而為,臨港加快形成多元算力供給體系

據吳曉華介紹,臨港新片區算力產業已在上游軟硬體、中游的數據中心、調度平台,下游應用進行了相應布局,目前臨港總算力超過3EFLOPS(FP32,1 EFLOPS等於每秒1百億億次浮點運算),其中智能算力占比近80%,總算力規模約占上海市近20%。

前述《方案》提出,目標到2025年,新片區將形成以智算算力為主、基礎算力和超算算力協同的多元算力供給體系,總算力超過5EFLOPS(FP32),AI算力占比達到80%,算力產業總體規模(含相關硬體、軟體、應用、服務等)突破100億元,建成公共算力服務平台,規範算力交易機制,實現區域算力調度,打造具有全國影響力的算力產業集聚區,建設一批算力示範應用標杆場景。

「智能算力也就是當下最為火熱的AI企業所需要的,我們也發現,AI企業落地到臨港來,他們不再是僅僅關注給他他多少政策支持,給他多少補貼,他會關注落地在這邊,能不能解決他的算力需求,因為現在市場上算力是非常緊缺的。」陸瑜提到了這一顯著變化。

據商湯方面介紹,截至今年5月,商湯大裝置已累計服務超40個核心客戶。「特別是在大模型的浪潮之下,我們現在支撐了10家以上的單位機構在臨港的智能計算中心中去訓練他們的大模型。」楊帆也提及。

成立於2018年的深勢科技是算力需求方之一。該公司核心團隊由中國科學院院士鄂維南等人領銜,是「AI+Science」科學研究範式的先行者,其首創的「多尺度建模+機器學習+高性能計算」範式,突破性地實現了多尺度分子模擬中精度與效率的統一。

據澎湃新聞(www.thepaper.cn)記者此前報導,深勢科技已推出Lebesgue科學計算平台、Hermite藥物設計平台以及Bohrium微觀計算與設計平台等。例如在醫藥領域,深勢科技與多家客戶攜手,將物理建模+AI的計算範式與臨床前藥物研發更廣泛的結合,通過Hermite Uni-FEP、Uni-Fold、RiD等模塊,將自由能微擾理論、分子動力學、增強採樣算法與高性能計算相結合,精準預測蛋白質結構及構象變化,並以化學精度高效評估蛋白與配體的結合自由能,為藥物研發人員提供高效精準的理論指導,提升藥物設計與優化效率。

去年12月29日,總部位於北京的深勢科技在臨港註冊成立了深度勢能生物科技(上海)有限公司。深勢科技政企事務副總裁劉會師在接受澎湃新聞(www.thepaper.cn)記者採訪時表示,公司在臨港布局新一代分子模擬算法研發中心和AI輔助藥物設計業務中心,主要也是因為看到臨港正在大力發展算力,「我們在訓練模型過程中,對算力是有需求的,另外臨港尤其是要大力發展國產化算力,我們也想為這方面添磚加瓦。」

從業務層面來說,「我們在臨港主要是布局我們的藥物研發業務,包括我們自有管線的研發。」劉會師提到,深勢科技的業務和臨港甚至上海的人工智慧、生物醫藥這樣的先導產業有正相關的直接合作關係,「我們願意把我們的研發以及產品納入到臨港的大的生態圈裡來。」

上述《方案》同時提及,臨港新片區也制定了一系列保障措施,包括加強人才保障、完善支持政策、推動開放合作等。據陸瑜介紹,如果AI企業到臨港來,將優先提供臨港的智能算力,同時通過發放算力券等形式,讓企業優惠使用算力,「甚至對重點的AI企業,政府對它的算力成本直接可以給予不超過30%的補貼,這些政策我們都會出來。」

值得關注的是,在此次大會現場,中國電信臨港公共智算服務平台暨國產GPU聯合創新基地也正式發布。中國電信成立臨港算力(上海)科技有限公司,將開展臨港算力園區建設,並將分批次投放4萬個適用於智算、超算的高功率機架。

上海市經濟和信息化委員會副主任湯文侃當天表示,當前,以「網絡為基礎、數據為核心、算力為關鍵、安全為底線」的新一代信息基礎設施已成為建設現代化產業的重要基礎支撐。上海已提出構建「2+(3+6)+(4+5)」的現代化產業架構,這對以算力為代表的新型信息基礎設施建設提出了更高需求。

而就在5月16日,上海市經濟和信息化委員會公布了通過 《上海市數據中心建設導則》符合性評估的數據中心項目名單,共支持了16個項目,其中位於臨港的項目有2個。「截至目前,我委共支持新片區包括,商湯AIDC、有孚網絡、信息飛魚等8個項目,合計2.8萬個6kW標準機櫃,占全市已批機櫃數量近1/5。」

湯文侃同時提出建議之一,即利用臨港充沛算力資源構建公共算力服務。「目前,臨港的商湯AIDC已經接入了公共算力服務平台。在此也希望今天參會的各單位,特別是電信運營商,結合臨港的網絡特點,積極在臨港建設極速算力承載網,助力實現網絡無所不達、算力無所不在、智能無所不及,推動算力成為與水電一樣的公共服務。」

成立智算產業聯盟,商湯當產業鏈鏈主

基於現有優勢及未來需求,臨港希望構建的是一個上中下游一體化的算力產業聯盟,進行協同式、體系化發展。

陸瑜將臨港的算力供給視作整條產業鏈的「中間一段」,一端為落地到臨港的AI企業提供算力保障,另一端則涉及到對算力來說極為關鍵的「晶片、軟體、系統」,「我們希望有了需求端,也有了這樣一個平台端,那麼我們把計算的晶片企業、軟體企業、系統企業集聚在這裡,讓他們深度地參與到這樣一個系統的建設過程當中。」

楊帆也強調,「今天看到的大模型所有的成績的發展,它既是暴力出奇蹟,通過人工智慧三要素的持續規模上升帶來的技術價值的提升,同時也是基礎的研發能力和系統的工程化能力之間的深度結合,算法優化、數據的整理和選取、平台性算力的優化提供,這三者往往是互相連通的,很難把它變成割裂的環節獨自去做。」

他表示,智能算力產業鏈的重要價值在於,「只有鏈上有更多的企業,大家去促進彼此的交流思考,更深度地去進行一些合作,才能夠在這樣新的關鍵性的重大技術浪潮中,去做到更好的技術進步和支持。」

大會現場,新片區智算產業聯盟也正式成立,聯通作為聯盟首任輪值理事長單位。據悉,未來聯通將在新片區成立長三角創新研究院,進一步助力新片區智算產業發展。

新片區智算產業聯盟成員代表由智算算力、基礎算力和超算算力中心等算力提供企業,GPU、FPGA、ASIC等算力晶片企業,以及大模型、AI for science等算力需求企業,共計25家企業,以及中國信通院華東分院、西安電子科技大學、電子科技大學共計3所高校與科研院所共同組成,後續將開展資源共享、技術交流和項目合作。商湯科技則被授予「新片區智算產業鏈鏈主」。

GPU晶片廠商沐曦當天即表示,分別滿足AI推理計算、AI訓練/通用計算、高性能渲染功能的三類GPU產品,應用於AI推理、AI訓練、數據中心、元宇宙、雲遊戲等領域,將賦能各領域轉型發展。

湯文侃也對臨港新片區此次智算產業聯盟的成立寄予厚望,「依託商湯科技這樣的鏈主企業,結合自身優勢,探索產業鏈上下游全要素協同,形成數字經濟新的爆發點。」

在當天的大會現場,有12家企業共同簽署了新片區智算產業上下游企業協同採購協議。陸瑜提到,新片區也將出台協同採購正面清單,「如果企業在建設國產化算力平台的過程當中,購買國產GPU等上游產品,我們就會給予補貼,這樣也是鼓勵上下游企業去更好地合作。」

關鍵字: