ChatGPT火了,算力不夠怎麼辦?

it時報 發佈 2024-02-29T14:31:33.099685+00:00

如果說去年的網際網路熱詞是元宇宙,那麼今年的科技熱詞一定是GPT。作為科技圈的新寵,ChatGPT一經推出,兩個月內便吸引了1億用戶註冊,成為用戶增長最快的應用。

AI向東,算力向西

作者/ IT時報記者 范昕茹

編輯/ 潘少穎 孫妍

如果說去年的網際網路熱詞是元宇宙,那麼今年的科技熱詞一定是GPT。

作為科技圈的新寵,ChatGPT一經推出,兩個月內便吸引了1億用戶註冊,成為用戶增長最快的應用。GPT-4接入Office之後的一系列演示,更是讓人見識到AI大模型的威力。ChatGPT的成功,也讓AI大模型成為新的資本追逐對象。

3月20日,百度推出基於大模型的AI聊天機器人「文心一言」,成為國內首個衝進GPT賽道的網際網路企業;緊接著,創新工場董事長兼CEO李開復高調宣布創建AI2.0公司,華為CEO任正非也將算力建設視為未來的方向之一。

華西證券預測,全球AI軟體市場規模將在2025年達到1260億美元,2021年到2025年複合增長率為41.02%。隨著各大公司爭相進入AI大模型領域,一個所有企業都必將面臨的問題是:算力從何而來?

ChatGPT催化

AI算力平台發展

眾所周知,一個大模型的建立背後需要投入大量的算力。公開數據顯示,ChatGPT的訓練參數達到了1750億、訓練數據45TB,每天生成45億字的內容,支撐其算力至少需要上萬顆英偉達的GPUA100,單次模型訓練成本超過1200萬美元。

儘管GPT-4發布後,研發團隊並未公布GPT-4參數規模的具體數字,OpenAI CEO山姆·阿爾特曼還否認了100萬億這一數字,但業內人士猜測,GPT-4的參數規模將達到萬億級別,這意味著其訓練需要更高效、更強勁的算力來支撐。

隨著算力需求的急速增長,我國跨平台、跨區域的算力一體化平台也隨之出現。

2月24日,寧夏電信、北數所、中科曙光支撐數字寧夏公司率先推出國內首個東數西算一體化算力服務平台。該平台是支持算力交易調度的應用系統,為智算、超算、通用算力等各類算力產品,提供算力發現、供需撮合、交易購買、調度使用等綜合服務。3月3日,北京市通信管理局、中國信息通信研究院、中國科學院計算機網絡信息中心與天翼雲共同發布北京算力互聯互通驗證平台。此後,貴州、上海等地也紛紛將算力平台的建設納入到城市數位化建設進程之中。

在傳統的算力交易過程中,用戶購買算力服務時,需要諮詢多個算力企業,企業也是各自為戰,缺乏統一的資源調配,效率無法最大化,算力資源存在一定程度的浪費。但現有的算力平台大多實現了多家服務商接入。例如北京算力平台已經接入天翼雲、商湯等服務商,寧夏算力平台也已經和華為、阿里、亞馬遜、微軟、天翼雲等算力服務商達成了戰略合作協議。

算力平台更像是一個淘寶,算力服務商可以在平台上進行算力產品的展示銷售,算力需求方可以根據自己的需求購買算力產品。

相比於一對一的供需方式,融入了多個算力服務商,算力商品更豐富的算力平台將為算力需求方提供更多的選擇。隨著智能算力需求的急速增長,相比於單個算力服務商,跨平台、跨區域的算力一體化平台將為企業提供新的選擇。

算力向西

普惠算力成為可能

當ChatGPT取代元宇宙成為未來科技發展方向時,另一個不可忽略的事實是,儘管ChatGPT已經讓行業看到了商業化的希望,但截至目前,OpenAI仍未實現盈利。對於一些中小企業或研究團隊來說,算力的成本問題將進一步凸顯。

2月20日,復旦大學自然語言處理實驗室面向公眾推出國內第一個對話式大型語言模型MOSS,然而當天,MOSS便因伺服器流量過載,陷入癱瘓。受限於伺服器規模和資金,復旦大學計算機科學技術學院教授邱錫鵬和他的MOSS團隊最終隨機挑選了近千名報名用戶發送了內測邀請碼。目前,MOSS伺服器的最大容納人數在幾萬左右。

當成本要素成為算力中的關鍵考量因素,計算需求將進一步尋找價格窪地,這也將促使算力網絡進一步向西部延伸。

2022年,我國開始實施「東數西算」戰略,通過構建數據中心、雲計算、大數據一體化的新型算力網絡體系,將東部算力需求有序引導到西部,優化數據中心建設布局,促進東西部協同聯動。

但一直以來,「東數西算」面臨的一個問題是,「東數」並不願意「西算」。寧夏電信副總經理白冰告訴《IT時報》記者,過去幾年,算力企業之間的競爭大多集中在通用計算領域。由於數據和計算需求大多集中在東部,加上西部算力基礎相對較弱,考慮到網絡時延和運算效率的問題,儘管東部運算成本更高,但東數東算仍有盈利空間。另一方面,隨著通用算力需求的飽和,服務商之間的競爭也進入「白熱化」,服務商紛紛打起了價格戰,西部的價格優勢並不明顯。

這一情況或將隨著運營商「網絡骨幹直連」的建設和智算需求的增長而產生變化。天翼雲的一份數據表明,隨著電信算力網絡的落地,從貴州到北京的網絡時延已經可以控制在20ms之內。國家發改委制定的《全國一體化大數據中心協同創新體系算力樞紐實施方案》顯示,樞紐節點數據中心端到端單向網絡時延原則上在20ms範圍內,而城區內的數據中心作為算力「邊緣」端,數據中心端到端單向網絡時延原則上在10ms範圍內,低於20ms的時延已經能夠滿足除了金融交易、車聯網等熱門業務之外的其他業務需求。而如今大熱的AI大模型對時延的敏感度更低,其平均網絡時延可以在100ms以上。

「時延將不再成為東數西算的阻礙。」在白冰看來,算力平台的出現,能夠打破東西部算力需求不平衡的現狀,實現東西部之間的算力流動,做到真正意義上的東數西算。而另一方面,由於西部資源更為豐富,算力基礎建設的成本更低,算力平台的出現,也讓為中小企業提供更加普惠的算力成為可能。

計算平台的下一站:

生態競爭

算力平台建設的初衷,在於打通平台、東西部的節點,互聯互通,實現跨平台、跨地域的算力交易。儘管現有的算力平台將「互聯互通」作為平台主打,但想要實現完全意義上的「互聯互通」仍有難度,其中一個難題便在於實現跨平台的算力調度。

白冰告訴《IT時報》記者,由於行業內對算力的計算還未有統一的換算標準,各個服務商平台的架構也各不相同,這就導致想要跨平台進行算力調度十分困難。

所謂算力調度,指的是平台在將複雜的計算任務分解後,根據平台自身的算力分布情況,對各個節點的算力進行調配,從而提供更合理的計算方式,達到提升計算效率、降低計算成本的效果。現階段,幾乎所有的算力服務商都擁有自己的算力調度平台。華為相關數據顯示,通過平台的算力調度系統,能夠使算力效率提升30%。

目前,寧夏算力平台已經實現了與不同算力服務商調度系統的互通,平台內部的多雲管理系統也能對多個算力調度系統進行管理,但跨服務商的算力調度仍需要時間。

圖源:東方IC

不過,隨著區塊鏈在算力平台上的應用,跨服務商的算力調度將成為可能。白冰告訴《IT時報》記者,新技術可以繞開服務商的底層架構,將各個服務商平台的算力原子化,從而實現統一定價,統一調度。他透露,這一功能將於2023年底前實現。

「當算力具有了金融屬性,才真正能夠像水電一樣可交易、可流轉。」白冰說,「屆時,算力互聯平台拼的將不僅僅是成本,還有算力的質量和服務能力。」也就是說,當跨平台的算力調度和交易成為可能,算力互聯互通平台的競爭也將進入下一站:生態競爭。

如今,依託國家「東數西算」戰略,處於西部計算節點上的城市正依託自身優勢,積極建立打造新的智算生態鏈。寧夏正積極發揮產業鏈核心企業科技引領和帶動作用,打造產業鏈互利共贏的生態圈,促進大中小企業創新鏈、產業鏈、供應鏈、資金鍊、服務鏈、人才鏈的全面融通。

排版/ 季嘉穎

圖片/ MOSS 東方IC

來源/《IT時報》公眾號vittimes

E N D

請加「星標」不錯過我們

關鍵字: