數據中心進化史:從本地機房到IDC到雲再到智算中心

羅超頻道 發佈 2020-04-13T00:35:17+00:00

彈指一揮間,短短几十年數據中心已有幾代變遷,雲計算商用才20年不到,在中國普及更是不到10年時間,如今面臨被智算中心取代的命運,科技可謂是日新月異,正是因為此,我們很難斷言智算中心最終會進化成什麼樣子,浪潮如今給出的定義只是一個開始。

疫情將我們的生活從線下搬到了線上:從線上教育、線上辦公、在線問診,到疫情期間行程追蹤、智能工廠的快速復工,社會的智慧進化在加速。

4月9日,由浪潮主辦的IPF2020大會以在線的形式如期舉行,浪潮集團執行總裁、浪潮集團首席科學家王恩東首次提出的「智算中心」概念,引發行業高度關注。王恩東指出,「智算中心」將成為智慧時代經濟社會運行所必須的重要基礎設施,成為AI計算力的主要生產中心。

2016年的IPF大會上,浪潮首次確立「智慧計算」戰略,在後來的IPF大會上又陸續提出「計算力是生產力」、「產業AI化」等預判,均在後來被證實,這一次王恩東提出的「智算中心」會再一次被計算產業接納,並最終被驗證成為行業趨勢嗎?

什麼是智算中心?

在2016年AlphaGo戰勝李世石後,各行各業都逐步意識到AI技術的價值,AI應用越來越多,從手機解鎖支付到工廠生產線的質檢,AI在人們的生活與生產中扮演日益重要的角色,特別是隨著2019年AI產業化的加速,AI也已成為各行各業的基礎能力。

馬化騰說算力是AI應用的四大要素之一,李彥宏則認為:「由數據、算力、算法』三位一體』共同驅動的人工智慧或將成為推動經濟增長與時代進步的新引擎。」AI產業爆發催生了龐大的AI計算需求,傳統數據中心已經越來越難以承載這樣的需求。

2020年是一個分水嶺。在2016年IPF大會上,王恩東就曾預計到2020年智慧計算在整個計算中的占比,將從2015年的四分之一左右增長到超過一半。當智慧計算占比已經過半時,對新形態數據中心的需求就變得日益強勁。

從AI伺服器這一新興伺服器類目的崛起,也能看到AI計算需求的蓬勃,IDC報告顯示2019年上半年中國人工智慧基礎設施市場銷售額達到8.37億美元,同比增長54.1%。IDC另一份報告則顯示,未來五年中國人工智慧伺服器市場複合增長率將超過30%,增速是伺服器市場整體增速的三倍。

AI伺服器是因為AI計算需求而生的一種伺服器形態,其採取異構形式,支持CPU+GPU、CPU+TPU、CPU+其他的加速卡等不同組合,在存儲上針對AI計算的大數據場景設計,更好地滿足訓練、推理等各種AI計算場景。不過,伺服器的進化已經遠遠不能滿足爆髮式的智慧計算算力需求。浪潮認為,未來人工智慧計算需求占比將在80%以上,專門面向AI計算的計算中心呼之欲出,這就是「智算中心」,即AI算力中心。

智算中心,有望化解AI計算需求爆發與傳統算力不足的矛盾。

用王恩東的原話來解釋就是「智算中心」將以融合架構計算系統為平台,以數據為資源,以強大的計算力驅動AI模型對數據進行深度加工,源源不斷產生各種智慧計算服務,並通過網絡以雲服務的形式,向組織及個人進行供應。智算中心將是智慧時代計算力的生產與供給中心,是新「電廠」。

數據中心4.0時代

不論是外賣、電商、視頻、直播還是搜索,一切跟網際網路有關的應用背後,都有數據中心在發揮基礎作用,伺服器在數據中心日夜不眠地響應需求、運行代碼、運算數據、給出結果。2015年,谷歌公布過一組圖片引發外界震撼,當時它已擁有以太級別的數據,遍布全球的36個數據中心:美國19個、歐洲12個、俄羅斯1個、南美1個和亞洲3個(北京-Google.cn、香港-Google.com.hk和東京各1個),驅動著這個全球最大的搜尋引擎,谷歌將數據中心成為「網際網路實體」,即唯一能夠讓你肉眼可見的「網際網路」。

傳統數據中心已經有多年發展歷史,跟網絡的出現幾乎同齡。

第一階段的數據中心就是物理數據中心,基本上就是電信企業面向大型企業提供的機房,包括場地、電源、網絡、通信設備等基礎電信資源和設施的託管和線路維護服務。

第二階段的數據中心就是後來的IDC即網際網路數據中心,90年代網際網路走向民用,網站數量激增,伺服器、主機、出口帶寬等設備與資源集中放置與維護需求激增,主機託管、網站託管等商業模式出現,再到後來IDC服務商出現,他們圍繞主機託管提供數據存儲管理、安全管理、網絡互連、出口帶寬網絡服務等等,這一階段的數據中心由網際網路企業自行搭建或者租賃,存在建設與維護成本高、難以隨業務發展而靈活擴展諸多問題,雲計算應運而生。

第三階段是數據中心就是如今普遍應用的雲化數據中心。早在1961年就有人預料到計算會成為公共服務,1990年代網格計算(Grid Computing)與雲計算(Cloud Computing)等概念就已先後出現,不過直到本世紀初亞馬遜AWS才真正拉開雲計算的序幕,計算真正成為所見即所得的公共服務,數據中心從分散在各地的「小電站」逐步走向集中式的「大電廠」,一般都是科技巨頭搭建的大型化、虛擬化、綜合化數據中心,通過對存儲與計算能力虛擬化,變為一種按需使用的計算力,對於使用者來說,集中規模化降低了成本,同時具備了靈活拓展能力。

雲化數據中心本質上依然是在數據中心的物理基礎設施上,採用虛擬化等雲計算技術,提供傳統的數據中心業務和各種新型網絡應用服務,數據中心本質形態沒有發生什麼變化。

如今由浪潮提出來的智算中心,可以說是數據中心演進的第四階段。智算中心不再是類似於傳統數據中心這樣的有一棟樓承載的物理中心,而是對數據中心的虛擬化,它可能是多個雲數據中心協作起來提供算力,也有可能只是雲數據中心中的部分機組構成。

數據中心給數字社會提供算力,智算中心給智慧計算提供算力,不同的是,智慧計算使用者面對的可能不會再是一個個伺服器,一個個IP,而是按需使用AI計算能力。如何理解這樣的差異?我們可以看看雲計算行業的變化:2018年11月底阿里雲升級成阿里雲智能,2018年底百度將ABC智能雲事業部升級成智能雲事業群組,2019年4月「百度雲」品牌全面升級為「百度智能雲」……所有雲計算巨頭都強調智能,體現出雲計算與AI結合的大勢所趨,說得更直接一點:雲計算未來要給客戶提供的計算都是智能計算。

去年我跟立白集團數智中心總經理阮群錕交流時,他的一個看法讓我印象深刻:對於立白來說,把系統上雲不是上雲的目的,而是所有業務要在雲上有一個更有效的協作,否則的話只會帶來一個企業數據中心建設成本的節約,意義不大。

企業都要上雲,然而今天上雲跟十年前以節省計算成本的上雲已截然不同,今天上雲的目的是數字化和智能化。企業需要智慧計算,而不只是計算。既然如此,傳統的雲數據中心已經不能滿足智慧時代的計算需求,唯有進化才能適應AI計算的需求。基於此,智算中心的出現可謂是正逢其時。

數據中心新物種

智算中心究竟會是什麼樣子?王恩東認為「智算中心」需要滿足三個基本要求:「開放標準」、「集約高效」、「普適普惠」,他的原話是這樣說的:

從硬體到軟體、從晶片到架構、從建設模式到應用服務,智算中心都應該是標準化、開放的,開放計算的發展為智算中心提供堅實的產業基礎;集約高效,要求智算中心的建設要有超大規模,要採用領先的技術,以保障自身的先進性;必須做到普適普惠,讓計算力易用、可用和低成本,智慧計算像水電一樣成為社會基本公共服務,融入生產生活全部場景。

智算中心的三大特質不難理解:

1、為什麼要開放標準?AI時代的計算變得更加複雜,在語音、圖像、大數據、邊緣、IoT、自動駕駛等場景呈現出截然不同的計算需求,基於此計算基礎設施本身會變得碎片化,比如AI伺服器都是異構模式,往往要支持CPU+GPU、CPU+TPU、CPU+其他的加速卡等不同組合,同樣,智算中心本身也會變得「異構」,軟硬體、晶片、架構、網絡、機房等等都會變得複雜,唯有標準化且開放才能整合碎片化的計算資源,就像安卓做到的一樣。

2、為什麼要集約高效?最核心的原因是AI時代計算量會出現指數級增長,一方面,AI核心是對數據進行處理計算,數據正在爆髮式增長,AI計算力會膨脹。另一方面,AI時代計算場景遠超網際網路時代,網際網路時代計算需求來自在線應用以及網際網路+教育等少數行業,AI應用則將無處不在,在網際網路產業外,交通、工業、農業、城市等傳統實體產業都會與AI結合……都會帶來海量AI計算需求,IDC數據顯示目前網際網路是AI伺服器最大市場,但能源、服務、建築、通信、公共事業等傳統行業增速已超過或接近200%。傳統雲計算的成本,對AI計算來說已日益奢侈,智算中心一定要集約高效,自身應用AI、大數據、IoT、機器人等降本增效的數字科技,大幅降低計算成本。

3、為什麼要普適普惠?雲計算做到了傳統通用計算的普惠,智算中心不只是要讓計算本身變得普惠,同時要讓AI這一高門檻的應用變得跟網際網路一樣人人可得,讓智慧計算像水電一樣惠及到各行各業,讓每個企業/組織/個人都能按需使用。成本降低是普惠的前提,其外在技術架構、服務模式、輸出形式和收費形式等維度都要有配套的變革才行。

第一代數據中心讓計算變得前所未有的普惠,一個數據中心的計算量超過了數千年人類計算量的總和,智算中心不只是在計算力上提高了一個數量級,同時變得更加開放標準、集約高效和普適普惠,也將是數據中心發展的趨勢。

智算中心有望成為新基建的重點。3月4日,中央在一次會議上強調要加快數據中心、5G、AI和工業網際網路等新型基礎設施建設進度,「新基建」將助力疫後經濟復甦,成為我國經濟增長的新引擎。跟「老基建」是「鐵公基」為代表不同,新基建則更強調數字科技對傳統產業的拉動作用,這將對智慧計算提出更強的需求,作為「新基建」重點領域的數據中心將不再以傳統的雲數據中心為主,而是會朝著智算中心發展,數據中心將全面進入AI時代。

智算中心怎麼建?

最早的數據中心由運營商主導建設,IDC數據中心由IDC巨頭建設,雲數據中心由雲計算巨頭建設,智算中心建設的主導者會是誰?答案可能是:沒有明確的主導者。有AI核心技術、有智慧計算能力,有雲服務能力,有AI應用場景的玩家,以及運營商、IDC服務商均可參與智算中心建設,就像前面說到的那樣:智算中心不是一個實體的數據中心,而是數據中心的虛擬化,不同數據中心組合在一起來提供智慧計算所需的計算力。

AI不等於深度學習技術,應用層面AI更像是多種技術的融合,浪潮智慧計算以CBD(Cloud Computing、Big Data、Deep Learning)為核心,網際網路行業都在說ABC或者AIoT,均體現出AI技術與大數據、雲計算、IoT、5G以及區塊鏈等技術融合的趨勢。智算中心建設一定是基於開放計算的融合建設模式,擁有不同核心技術的玩家都將參與其中,一起建設智慧計算時代的基礎設施。

如今ICT產業的分工正在被重構。硬體開放設計與軟體開源,讓不同玩家間的邊界在變得模糊,大有「你中有我,我中有你」的趨勢,比如阿里雲可以做晶片,百度可以做伺服器,浪潮可以做深度學習框架,而且都在開放,都在建自己的生態,看上去大家都在向彼此領域滲透,實際上卻是一種開放融合,所有玩家都在突破自有邊界,去探索智慧計算的全新可能。

但不可否認的是,作為智慧計算和開放計算的先行者、智算中心提出者的浪潮,在智算中心建設中依然會發揮不可替代的作用。

首先,浪潮具有全棧AI計算能力,有能力成為智算中心核心建設者。

浪潮是智慧計算的提出者,在AI伺服器上已經穩居行業第一多年,IDC報告顯示,2019年上半年,浪潮AI伺服器銷售額4.2億美元,市場份額50.2%,自2017年以來,浪潮AI伺服器就一直占據超過50%的市場份額,穩居市場第一。浪潮在生產AI算力後,基於AI計算平台、框架和算法聚合算力,基於AIStation管理平台對AI計算進行「流水式生產」與一站式交付,精細調度算力;基於自動機器學習平台AutoML Suite,降低AI應用門檻,快速釋放AI算力,加速AI落地。

浪潮已經完成從AI計算力生產、聚合、調度到釋放四大作業階段的布局,是專業的AI計算力提供商,業務覆蓋晶片、平台、管理和框架等領域的全棧AI領域,勢必會是智算中心的核心建設者。不過,浪潮的野心,不只是提供AI伺服器這樣的基礎計算設施,而是要做標準與建生態。

其次,開放計算戰略的成功讓浪潮成為智算中心的搭台者。

浪潮在2016年提出「智慧計算」戰略時,就對開放計算這一路線很篤定,其以CBD為核心,構建「硬體重構+軟體定義」的融合架構技術體系和開放創新的計算生態,為客戶提供可精確按需擴展、滿足多樣化應用場景的智慧計算。早在2014年,浪潮基於前期定製模式就形成了獨家的JDM(聯合定製模式)模式,通過與客戶「共創」的機制,浪潮抓住了雲時代複雜的伺服器需求,成功抓住AI伺服器這一波機會,也為後來的開放計算布局創造了有利條件。

如今浪潮開放計算已涵蓋計算、存儲、網絡、管理等全領域,硬體支持OCP、ODCC、Open19等三大硬體開放社區標準,雲海OS全面轉向OpenStack,在整機櫃、伺服器等領域的開放設計上扮演關鍵角色。在IPF大會上浪潮發布全球首款AI開放加速計算系統MX1,基於OCP社區OAM開放標準設計,在網絡帶寬、供電系統上可以適配多種不同規模的AI加速器,從而極大提升了用戶的AI基礎架構部署效率,體現出其在智慧開放計算領域的技術實力。

基於開放計算髮展智慧計算,讓浪潮事實上成為智慧計算標準參與者,有能力成為「搭台者」,讓不同環節的玩家可以在開放計算體系內共建智算中心。

最後,基於AI伺服器的領先地位構建元腦生態,浪潮給智算中心添磚加瓦。

AI產業化過程中,客戶的AI計算需求是非常龐雜的,不可能靠一個公司的技術或者能力實現,因此每家AI服務商都在做自己的生態。浪潮2019年提出了元腦生態計劃,左手連接像百度、阿里這樣的具備AI技術開發能力的科技公司,右手連接具備實施AI整體解決方案能力的SI、ISV夥伴,共同為客戶提供端到端的Al模型和方案,加速AI產業化進程。

要做開放生態,關鍵是要有號召力,在智算中心伺服器這一環,浪潮擁有最高行業話語權,基於AI伺服器的市場地位,只用半年時間浪潮的元腦生態就已初步成型,目前,已經有50多家左手夥伴和120多家右手夥伴加入了浪潮元腦生態,在金融、鐵路、電力、交通、智慧城市、石油石化及泛行業,落地了一系列的解決方案。

聚集了夥伴的能力後,元腦下一階段重點就是實打實地落地。在IPF2020大會上,浪潮宣布將投入億級資金成立「E基金」發展元腦生態,在聯合技術創新、市場推廣、AI人才培養等維度對生態夥伴提供支持,聯合左右手夥伴打造100+應用場景解決方案,並推動400+行業AI項目落地。

這些合作夥伴理論上都是智算中心的建設者,浪潮作為平台方則負責添磚加瓦。浪潮集團高級副總裁彭震對羅超頻道表示:「某種程度來說,浪潮是一個做平台的公司,在做智算中心的磚和瓦,真正搭建一個為各行各業提供一個完整服務的智算中心,需要我們的合作夥伴,把他的應用能力、軟體能力、服務能力糅合在一起,才能真正變成一個面向最終客戶完整的端到端的解決方案。」

具體來說,伺服器和AI產品、分布式存儲等存儲產品和網絡產品三件套,以及相關軟體如數據中心間的雲服務、雲管異化容器,雲邊作業系統、邊緣計算產品,是浪潮提供的磚與瓦,這些是合作夥伴構建智算中心不可或缺且不可能自主研發的基礎設施——建房子的公司一般都不會制磚瓦,正是因為此,彭震認為,「浪潮是基建里的基建。

因此在IPF2020大會上,我們可以清晰地看到數據中心正在變革的關鍵時期。智慧計算占社會計算已過半且未來有望達到八成,傳統數據中心已無法滿足社會算力需求。下一代數據中心或者說數據中心4.0一定是具有開放標準、集約高效和普適普惠三大特質的智算中心,AI計算、開放計算將是智算中心建設的主要方向,浪潮在其中會扮演關鍵角色。

彈指一揮間,短短几十年數據中心已有幾代變遷,雲計算商用才20年不到,在中國普及更是不到10年時間,如今面臨被智算中心取代的命運,科技可謂是日新月異,正是因為此,我們很難斷言智算中心最終會進化成什麼樣子,浪潮如今給出的定義只是一個開始。可以確定的是,智算中心將是計算基礎設施發展的方向,浪潮給計算與AI行業打開了未來計算世界的一扇大門。

關鍵字: