張勇的阿里雲首秀:脫下西裝,擁抱AI

字母榜 發佈 2024-01-17T23:37:46.384127+00:00

以一己之力開啟「AIGC元年」的OpenAI,提前給後來者敲響了算力警鐘。進入4月份,ChatGPT付費版本——ChatGPT Plus——被爆暫停付費,OpenAI給出的理由是「需求量過大」,導致算力資源出現缺口。


以一己之力開啟「AIGC元年」的OpenAI,提前給後來者敲響了算力警鐘。


進入4月份,ChatGPT付費版本——ChatGPT Plus——被爆暫停付費,OpenAI給出的理由是「需求量過大」,導致算力資源出現缺口。


付費通道恢復正常後,OpenAI再次收緊GPT-4的互動次數,從每4小時100條消息降為每3小時25條消息。


儘管OpenAI尚未披露具體的付費用戶規模,但從上述宕機事件不難看出,以當前的用戶量,疊加每月20美元的訂閱費,很可能已經無法支持OpenAI繼續採購微軟雲服務資源,來加大對ChatGPT產品的擴張力度。


頂級風投機構a16z在近期報告中指出,頭部雲廠商,有望成為AIGC浪潮中的最大贏家。作為全球第二大算力需求市場,在各路創業者、科技大廠紛紛盯上AI大模型之際,中國雲廠商正在迎來一個潛力巨大的新市場。


4月11日的阿里雲峰會上,首次以阿里雲智能集團CEO身份對外亮相的張勇,不再以慣常的西裝示人,休閒夾克顯現出一副極客范兒,他帶來了一個更加極客感的判斷:全新的AI時代即將開啟,所有產品都值得用大模型重新做一遍。


阿里雲成為對AI大模型反應最快、最徹底的雲廠商。大會現場,伴隨著「阿里巴巴所有產品未來將接入通義大模型全面升級」的宣布,張勇講述了阿里雲未來的核心兩件事:讓算力更普惠、讓AI更普及。



據張勇介紹,過去十年,阿里雲提供的算力成本下降了八成,存儲成本下降了近九成。「未來,我們希望在阿里雲上訓練一個模型的成本,能夠降低到現在的十分之一,甚至是百分之一。即使是中小企業,也能通過雲平台獲得AI大模型的能力和服務。」


也就是說,在AIGC浪潮劈面而來之際,阿里雲要兩手抓,一手推出自己的大模型,另一手則致力於幫助其他企業研究和獲得大模型,既淘金又賣鏟子。一位接近阿里雲的人士表示,阿里雲「甚至可以只賣鏟子」。


除了依賴「普惠」政策大力出奇蹟外,在推出AI大模型上落後一步的阿里雲,則將新一輪比拼投向了業務應用層面。這一領域,作為初創公司的OpenAI,暫時缺少能直接落地的成熟商業產品;其餘已經發布的大模型產品,則都停留在技術能力向業務應用邁進的打磨階段。


在黃仁勛喊出ChatGPT是「人工智慧的iPhone時刻」後,張勇同樣表達了所有產品都值得用大模型重新升級的觀點。升級的第一步,首先從阿里內部開始。據張勇介紹,阿里旗下釘釘、天貓精靈等,就成為首批接入大模型的業務。


釘釘、天貓精靈之外,諸如淘寶、天貓等阿里系應用會何時接入大模型,阿里雲智能集團CTO周靖人在接受採訪時表示,暫時不能公開具體時間表。



QuestMobile數據顯示,AIGC憑藉在效率、成本等方面優勢,有望成為繼PGC、UGC之後的新一代業態模式。


一場圍繞AI大模型的競賽正在全面打響。僅以國內來說,除了阿里雲的「通義千問」,科技大廠中百度也推出了「文心一言」,騰訊混元大模型也在加緊內測,字節跳動也被爆出組建起大模型公關小組,有望年內發布產品。


在爭奪AGI時代新船票的路上,所有人都不希望掉隊。「10年以後、20年以後回過頭來看這段時間,其實我們所有的企業都在同一條起跑線上,如何抓住未來的機會是我們大家共同的願望,也是我們共同的暢想。」張勇說道。


A


過去十年,人工智慧發展在追逐算力上,一路狂飆。


2012年由史丹福大學李飛飛教授主辦的ImageNet競賽中,Alex koshevsky、Elias suskaver和Jeff Hinton三人小組,藉助2塊英偉達GTX580 GPU訓練出來的AlexNet計算機視覺模型,以壓倒性優勢擊敗谷歌、微軟等一眾科技巨頭,拿下挑戰賽冠軍,由此開啟了深度學習的大爆發時代。


通過這次全球性賽事,相比提供通用算力的CPU,側重AI算力的GPU在並行計算上的碾壓優勢真正引發外界重視。黃仁勛更是將這一年稱之為「人工智慧發展標誌性的一年」,並表示:「利用GPU的大規模處理能力來學習人工智慧算法是一種全新的計算模式。」


ImageNet這套由李飛飛一手構建的大規模物體識別和檢測數據集,一開始並不被學界和業界重視。


2007年項目啟動之初,李飛飛導師的導師Jitendra Malik,曾如此告誡李飛飛,「你要做的事情是一項浩大的工程,但百萬級別的圖像並不是這個領域所關注的。」業內也對李飛飛通過規模提升識別度存疑,認為「ImageNet數據集是捨本逐末」。



到2017年,靠著堆砌算力等資源,在識別度提升上觸達瓶頸的ImageNet競賽,正式宣告終結。此時,OpenAI聯合創始人Ilya Sutskever則接過了李飛飛的指揮棒,努力尋找進一步擴展規模的正確路徑。


憑藉著對Bigger is better的信仰,當谷歌在2016年推出Transformer框架後,Sutskever找到了打開算力堆砌的鑰匙,帶領OpenAI將模型規模從十億級、百億級,一路升級到千億級,從而製造出了引爆全球的大型語言模型ChatGPT。


來自OpenAI的數據顯示,從2012年AlexNet在圖像領域的成功,到2018年DeepMind做出AlphaGo Zero,AI對計算量的需求增長了約 30萬倍,而同時期的晶片性能僅提高了30倍左右。


在Sutskever忙著疊代GPT時,以阿里云為代表的國內廠商也在大模型領域進展不斷。


從2019年投入大模型的研發開始,阿里雲在過去幾年祭出了多款業界領先的大模型。2021年,阿里發布270億參數語言大模型PLUG,被外界稱為中文版「GPT-3」。阿里還推出了全球首個10萬億參數大模型M6後,此前OpenAI前政策主管Jack Clark曾公開點評M6,認為其「規模和設計都非常驚人。這看起來像是眾多中國的AI研究組織逐漸發展壯大的一種表現。」


隨著越來越多大模型逐一問世,當科技大廠將大模型競賽從產品轉移向應用後,可以預見的是,在國內大部分軟體都需要被AI大模型重新再做一遍的過程中,其背後訓練及推理所帶來的算力消耗,勢必將呈現幾何級數增長。


更為激烈的競爭將在維持大模型體驗穩定上展開。屆時,普惠能力的構建,無疑將成為評判AI大模型能力上限的決定性因素。


B


原本作為深度學習崛起源動力的晶片算力,如今卻受困於昂貴的算力投入和運維成本,低下的AI生產效率等問題,成了企業提升智能化水平的阻力。


在解決上述阻礙中,大規模的雲基礎設施成為推動AI浪潮前涌的勝負手。頂尖風投機構 a16z更是將頭部雲廠商,視為新一輪人工智慧浪潮中的最大贏家,認為這些雲計算公司會分走AIGC產品收入的10%—20%。


一個明顯的例子是,OpenAI獲得的數十億美元投資和用戶訂閱費,基本流向了微軟雲服務。


為了進一步解決越來越多創業公司在大模型方面的算力需求,黃仁勛將英偉達類比為台積電,希望通過「NVIDIA AI Foundations(英偉達AI基礎大模型)」,聯合谷歌、甲骨文等夥伴,讓那些需要構建、改進和操作大型語言模型和生成AI的客戶,通過一個Web瀏覽器就能訓練、訪問大模型產品。


阿里雲的解決方案則顯得更為接地氣,在算力普及和優惠兩端同時發力。


阿里雲在通過通用大模型「通義千問」將AI普及到外部用戶之餘,還允許企業基於阿里雲資源訓練自己的大模型,讓整個算力被更普及、更友好、更普遍地使用。


在周靖人看來,「未來所有軟體都值得接入大模型升級改造。」阿里雲將開放通義千問的能力,為每一家企業打造自己的專屬GPT,「歡迎所有人用阿里雲開發自己的大模型。」



這也意味著,未來每一個企業不僅可以通過調用通義千問來實現大模型能力,而且可以結合企業自己的行業知識和應用場景,訓練自己的企業大模型。「比如,每個企業都可以有自己的智能客服、智能導購、智能語音助手、文案助手、AI設計師、自動駕駛模型等。」周靖人表示。


為了企業和開發者的使用成本,阿里雲還推出了三項計劃,包括將ECS企業級通用算力型U實例價格最高下降40%,推出最多可降70%的對象存儲預留空間產品,向開發者推出「飛天免費試用計劃」,開放全棧雲產品體驗,時長最多達3個月。


對主售產品實行大幅降價的背後,阿里雲則寄希望於通過提高計算資源利用率,帶動算力成本不斷降低,從而推動規模擴大和價格下降的正循環,這樣的正循環未來也勢必會在智能算力上復現。


「未來,我們希望在阿里雲上訓練一個模型的成本,能夠降低到現在的十分之一,甚至是百分之一。即使是中小企業,也能通過雲平台獲得AI大模型的能力和服務。」張勇預測道。


支撐張勇定下「普惠」策略的底氣之一,得益於阿里雲對軟硬一體技術整合的大力投入。


大模型是一場「AI+雲計算」的全方位競爭,不僅僅牽涉算法問題,更是囊括了底層龐大算力、網絡、大數據、機器學習等諸多領域的複雜系統性工程,需要有超大規模AI基礎設施的支撐。


作為全球第三、亞太第一的雲廠商,阿里雲在雲基礎設施能力上的布局,和大模型技術上的積澱,讓阿里成為這場AI大模型競賽的最有力參與者。


C


全球範圍內的AI大模型競賽,無一例外都被視為公司的「1號工程」。


目前已經推出相關產品的公司中,微軟新必應直接由微軟CEO納德拉牽頭;谷歌Bard全程由谷歌CEO皮查伊站台;百度文心一言被李彥宏全程監督;阿里通義千問同樣受到張勇的重點關注。


即便那些尚未推出產品的公司,也都給予了足夠的重視度。3月底的財報會上,騰訊總裁劉熾平表態騰訊正在加速推進大模型混元;字節跳動創始人張一鳴則被爆料稱開始看人工智慧論文,時不時對內分享論文學習心得和對ChatGPT的思考。


據《中國企業家》爆料,字節跳動版ChatGPT已在內測,預計在9月上線,也有可能提前。值得注意的是,就在阿里雲通義千問宣布接入釘釘的同一天晚上,飛書對外上線了類同大模型技術的產品MyAI智能助手。


對AI大模型過度重視的背後,體現著科技大廠高層對新變革到來的興奮,但機遇與挑戰並存:機遇在於,之前難以突破的市場有了可以進攻的裂縫,如微軟憑藉新必應,搜索日活用戶首次突破1億;挑戰則在於,所有企業幾乎處於同一起跑線,誰將引領這個時代,需要等待時間的檢驗。



在張勇看來,AI大模型的出現是一個劃時代的里程碑,人類將進入到一個全新的智能化時代,「就像工業革命一樣,大模型將會被各行各業廣泛應用,帶來生產力的巨大提升,並深刻改變我們的生活方式。」


每一次生產力變革的背後,都是一次行業重新洗牌的機會。對於科技大廠而言,AI大模型,將是他們通往AGI時代的一張新船票。


從這個角度來審視,帶領阿里成功轉型多次的張勇,或許已經為這場新船票爭奪戰做好了充足的準備。


PC時代,時任淘寶商城總經理的張勇,參與設計淘寶商業模式,並一手策劃了雙11購物節,幫助淘寶在2009年年底實現盈利,使之成為阿里現金牛。


步入移動網際網路時代,時任阿里COO的張勇再次臨危受命,在騰訊手握微信,率先拿到移動網際網路船票後,集中火力做手淘,從「all in無線」戰略聚焦為「all in手淘」,最終手機淘寶實現無線化轉型,幫助阿里搭乘上了移動網際網路這艘大船。


過去十幾年,阿里雲已經取得了令世界矚目的成績,並成為國內第一家盈利的雲廠商,但這家公司的想像空間並不止於此。


現在,到了張勇帶領阿里雲拿下AGI時代新船票的時刻。

關鍵字: