計算的藝術:算網調度難在哪?

通信產業報 發佈 2022-11-30T04:33:13.971696+00:00

目前算力的調度和網絡的調度是兩個分離的體系。算力網作為新型基礎設施的技術底座,在信息通信技術演進、賦能數字經濟發展中發揮重要作用。隨著東數西算的加快落地,以及三大運營商將算力網絡建設提升至公司戰略高度,算力網進入發展元年。但算力網的一體化調度、商業模式等仍在探索中。

目前算力的調度和網絡的調度是兩個分離的體系。

算力網作為新型基礎設施的技術底座,在信息通信技術演進、賦能數字經濟發展中發揮重要作用。隨著東數西算的加快落地,以及三大運營商將算力網絡建設提升至公司戰略高度,算力網進入發展元年。但算力網的一體化調度、商業模式等仍在探索中。

目前算力的調度和網絡的調度是兩個分離的體系。」 中國聯通研究院副院長、首席科學家唐雄燕近日在世界計算大會「算網融合和數字經濟」主題論壇上表示,算力網終究是要提供算網融合服務的,要構建雲網邊一體化的智能調度和能力開放體系,將來能夠形成網絡和計算深度融合的格局,這是一個總的思路。

運營商推動算力網絡的底層邏輯是希望通過網絡來調度算力,獲取算力需求的用戶入口。正如唐雄燕所言,通過我們的通信網絡可以把所有的算力集合起來,彌補單點算力能力不足的問題,這也是發展算力網絡的初衷。

調動哪些算力

在算力產業鏈上,包括算力生產者、算力調度者、算力服務商以及算力消費者,運營商作為網絡基礎設施建設和運營者,如何調動算力,調動哪些算力 ?

據公開數據顯示,國內近一半的算力為雲計算廠商所有,32%的算力為政府、金融、電信、製造等行業企業私有,能夠納入算力網絡體系下並對外提供服務的算力規模相對有限。運營商在網絡連接中處於關鍵角色,但在算力體系中處於配角的地位。亞信科技算力網絡首席科學家王淑玲表示,當前算力更多的是集中在雲商的手裡,從國外的演進路線來看,整體的馬太效應是越來越明顯。

但東數西算的推進以及國家對大數據中心的全國布局將加快算力網絡的落地。因為算力依賴電力,所以電力充沛的地區布局算力中心,成為國家層面推動的基礎設施的建設,對運營商調動算力以及「雙碳」目標的實現具有積極意義。

在供給側,算力供給將多樣化,算力可能來自於核心雲、邊緣雲、高智能的終端(如智能汽車)。算力或可以用共享經濟的模式出現。

在此背景下,運營商在算力產業鏈中希望能夠成為全社會的算力中介。全社會的算力除了公有雲的服務之外,有88%的算力是分散的。唐雄燕表示,如何把這些分散的算力吸納和集合起來,變成一個平台化的服務,這是運營商所希望做的。

對於運營商扮演算力中介的角色,亞信科技算力網絡首席科學家王淑玲表示,算力網絡的引進把網絡更加中立的角色放到了算力供需對接的市場上,對於算力多樣化起到了促進的作用。

拿什麼調

算力的核心問題是運營和調度問題,要讓用戶的各種需求找到合適的資源,實行自動化的需求匹配和調度。不同業務場景,需要不同的算力匹配,同一客戶可能需要多種類型的算力。從協同類型看,包括多雲之間、雲和數據中心、雲和網之間的資源調度,跨行業、跨地區、跨層級的算力資源調度。

打造基於算網融合設計的服務型算力網絡,構建雲網邊一體化智能調度和能力開放體系,成為運營商的選擇。依託網絡構建多樣化的算力資源調度和服務的體系需要底層技術的支撐。

底層的技術包括IPV6+和全光網絡。增強網絡內生的算力是算力網絡發展的重要方向,網絡原來沒有很強的計算能力,把計算的能力融入到網絡裡面去,這是算力網絡演進的一個重要方向。以中國聯通為例,其構建「ROADM+OTN」光電雙平面立體架構,為算力提供超強運力的智能開放的全光底座;SRv6作為」IPv6+」技術基礎,面向5G、雲業務、物聯網和人工智慧等新興業務需求,使能網絡編程能力。

有了完善的算網基礎設施之後,如何從全局上統籌好算力資源的使用,實現算力的供給和需求之間的對接,並且在這個過程中實現資源效能的最大化,需要算網大腦去支撐和實現。

算網大腦作為算力網絡的核心,實現算網感知、算網統一編排、調度與算網智能決策等。算網一體化編排調度技術實現按需分配和智能調度算網資源,滿足不同計算場景對算網資源需求,提供隨需可調、場景多樣、質量感知的算網一體差異化產品,提升數字內生能力,研發算力交易、隱私計算等新型算網服務。

算網一體化編排調度平台,實現對公有雲、私有雲、自有算力及網絡資源的統一調度,具備在雲、網、邊之間按需分配和智能調度算網資源的能力,滿足不同計算場景的算網需求。

技術與路線已然明確,運營商與產業鏈也在實踐中做了諸多嘗試。例如,中國電信8月在全國首次發布了科技創新產品「息壤」算力調度平台,無論業務對算力的需求是多少,息壤都可以規劃出滿足需求的算力和網絡資源,並且有效調度,實現業務性能和成本的最優。通過算力調度引擎靈活的自定義調度策略能力,滿足不同業務需求,如「東數西算」、雲渲染、跨雲調度、性能壓測、混合雲AI計算等多種應用場景。

還有哪些挑戰

但算力調度仍然面臨諸多挑戰,如算力資源的感知、度量與開放共享問題,計算與網絡融合的技術標準和產業協同問題,以及算網一體的服務和商業模式問題等。

"算力網絡未來的商業模式和參與的主體變得更多樣化之後,整體商業的閉環怎麼樣去打通。這是整個算力網絡裡面非常重要的一環。"王淑玲表示。

算力網絡中吸引較多關注的算力併網和交易面臨度量、計費、交易模式方面的困擾,同時各方資源池接口缺乏標準的技術性問題也阻礙併網與交易的實現。

異構算力資源能否採用相同的度量模式,缺乏標準讓上層業務不用感知底層資源差異;感知算力是泛在算力的增強,跨域跨網需要標準化體系支撐。

由於算力資源並不像電力那樣,能夠用「度/千瓦時」這樣的單位簡單地進行量化,尤其考慮到CPU、GPU、FPGA、ASIC等不同晶片的類型,更是難以進行統一的衡量。目前,計算資源的衡量缺少一個統一且簡單的度量單位,如何評估不同類型算力資源的大小成為一個亟需解決的難題。

因此,需要一種共識,在標準規範的基礎上,量化異構算力資源和多樣化業務需求,建立統一的描述語言,給算力資源賦予可度量、可計費的標準單位。目前,業界研究機構、產業聯盟、標準組織等已經認識到這個問題,紛紛從不同角度展開了研究工作,但尚未形成統一的結論。

中興通訊副總裁尤琰在中國算力大會演講時表示,交易系統分工方面,在企業完成自有算力調度基礎上,市場驅動實現跨企業的算力調度和交易。政府相關部門首先做好數據中心PUE、上架率等關鍵指標的監控,未來政府監管平台是否發展為全國算力交易調度中心,需要在實踐中探索。

采寫:趙妍

編輯:趙妍

指導:新文

誰是算力伺服器頭部:從第二批集采看格局

算力服務如何賣出好價錢?

關鍵字: