做大模型時代的「Linux」, ChatGPT 僅是開端

ai科技評論 發佈 2024-04-28T14:44:58.225126+00:00

大模型只是中間狀態,開源的大模型技術生態才是未來。作者 | 李梅編輯 | 岑峰一代人的時間裡總會有幾次這樣的時刻:一種產品的出現將一項技術從昏暗的工程系地下室、臭氣熏天的書呆子們的臥室和業餘愛好者們孤獨的洞穴中彈射出來,變成了連你的祖母都知道如何使用的東西。

大模型只是中間狀態,開源的大模型技術生態才是未來。

作者 | 李梅

編輯 | 岑峰

一代人的時間裡總會有幾次這樣的時刻:一種產品的出現將一項技術從昏暗的工程系地下室、臭氣熏天的書呆子們的臥室和業餘愛好者們孤獨的洞穴中彈射出來,變成了連你的祖母都知道如何使用的東西。

《財富》雜誌的這段話,捕捉了1994年網景瀏覽器和2007年iPhone的歷史意義,也描述了今天ChatGPT為人工智慧領域帶來的變化。

它們都是一個生態體系的開端。ChatGPT的背後是AI大模型,但智能時代的未來不會僅僅是大模型本身,而將是大模型生態體系。

北京智源人工智慧研究院院長黃鐵軍認為,過去的「煉」大模型並非一種正常的狀態,AI一定是通過作為公共產品的智力而非個別的大模型來提供服務的。在未來,大模型會有很多,但大模型生態體系不會超過3個。

而要建立提供數據、訓練、治理等全套服務的大模型生態體系,並非哪一家企業能為之,需要更多機構一起合作。在黃鐵軍看來,智能時代需要真開源,不是某一家企業控制下的開源,而是像Linux和Risc-V 那樣的開源。

如果不想在這一波AI大模型熱潮中被卡脖子,我們只有開源一條路。

為了加快這一步伐,智源研究院在2月28日發布了FlagOpen(飛智)大模型技術開源體系,大模型領域的「Linux」正在誕生。

智源研究院院長 黃鐵軍

1 ChatGPT 水面之下:

回歸技術理性

愛迪生曾在曼哈頓的一個街區鋪設電網,點亮了那個街區,OpenAI推出ChatGPT也具有同樣的局部驗證性作用。在大呼驚奇過後,國內各家紛紛趕製中國版ChatGPT,相當於各自建立一個小型電網、為一部分用戶服務。

但這距離大模型作為一種產品服務進入到千家萬戶還有很長一段距離。

我們亟需從ChatGPT的商業化狂潮中回歸到技術理性。要看到的是,ChatGPT作為一個產品只是水面上的冰山一角,水面之下是大模型的底層技術體系。

一方面,商業模式尚未清晰,大模型的戰略「占位」意圖更加明顯,僅少數玩家具備技術基礎的相對充分累積。而總資源有限,算力稀缺,資本驅動的模式可能會導致重複性浪費,影響潛在的技術進步可能性。

另一方面,如今的大模型雖然已經足夠大,但將來要走什麼樣的技術路線還是一個開放的問題,有許多問題尚待解決,比如是否會有新的架構和算法、如何解釋大模型的湧現能力、怎麼提高大模型的高級認知能力等等。

不僅僅是科學問題,在大模型的產業化過程中,如何用更少的計算成本、智能水平更高的大模型去提供AI服務,也需要長期考慮。就像有了發電廠之後,仍要繼續鑽研提高發電效率的技術,研究家庭用電接口的方式等等。

所以,中國是否也要做一個ChatGPT出來?基於當前匆匆回應,也許不如進一步面向未來看問題—— 如何驅動整個大模型產業及生態產生越來越多令人驚喜的AI現象?

「大模型只是冰山一角,我們要在大模型磅礴的大生態中找准自己的歷史性位置。」黃鐵軍認為,大模型是一種中間狀態,它不是最終的服務形態,而是現階段用特定技術、特定算法訓練出來的結果。未來的形態應當是以大模型為技術手段、向所有人提供24×7服務的智能運營系統。

如同今天的通信網絡運營商僅有幾家巨頭,將來大模型的服務運營體系也會屈指可數——但龐大的產業群帶來的商業機遇會更多。

從技術出發建立生態,需要一個協作的方式。研究人員提出不同的大模型技術創新,並匯聚到一個開源開放的技術體系下,去展示能力、評估和比較。而且,不是止步於造一個大模型出來,而是持續地進行技術疊代。

智源聯合多家產學研單位建立大模型技術開源體系FlagOpen,正是面向這樣一個長遠的命題:在智能時代以大模型為代表的產業體系中,我們應該做些什麼?

而無論是從對前沿技術的重視程度還是組織的中立性來看,智源作為非營利研究機構做大模型開源這件事是再合適不過。

2 從大模型引領者到開源先鋒

「某種意義上,我們是後退一步,而不是去趕一個熱點。」黃鐵軍說道。

在各路勢力一個接一個宣稱入局ChatGPT的熱潮中,智源推出國內首個大模型開源體系,也更加希望保持冷靜的理性思考,探索還能為人工智慧前沿研發底層環境做些什麼。

作為非營利機構,智源一直聚焦打造有重大技術挑戰、需要緊密工程協作、長期攻關的重大系統級成果。相較於近期的商業化熱潮,智源顯然更關心技術本身,與大模型領域的長期發展。

大模型在中國起飛之初,智源是當之無愧的引領者。過去幾年,已經積累了冰山之下大模型的技術棧。這是智源做大模型開源這件事的底氣。

坐落在「宇宙中心」五道口,智源匯聚了來自北大、清華、人大、中科院等學術高地的AI人才。作為中立非營利創新科研機構,相比高校與企業,一方面可以更好地匯集企業、學界資源集中力量做大事;另一方面非商業不逐利,願意尊重科研創新規律,讓科研人員在自由的環境中充分進行創造力探索。

對有價值問題的聚焦,使得其成為上一波大模型熱潮中的頭雁

2020年OpenAI發布GPT-3,智源立即喊出「大模型時代即將到來」的AI未來圖景,堅定奔走推動大模型研究路線,並迅速組織了「悟道」大模型攻關團隊,訓練出了中文預訓練語言模型CPM。「悟道」團隊的成員,目前已成為國內大模型研究的中堅力量。

之後,智源繼續加大對大模型的投入,在2021年3月發布了大模型項目「悟道1.0」,包含中文語言、圖文多模態、認知和蛋白質序列預測四個方向的模型。3個月後,智源又推出創造當時「全球最大」紀錄的「悟道2.0」大模型項目。

如今,大模型無限堆參數的熱潮已經冷卻,如何在大模型的封閉生態形成前,推動建立大模型開源體系,擁抱開源開放,鼓勵人工智慧的底層技術創新集體熱情?

黃鐵軍斷言:「不可能、也不應該有任何一家企業來完全封閉地主導大模型這麼一個重要的方向。」

大模型的重要性在於,它通過一個通用模型來完成多場景任務,作為底座能夠誕生無數AI應用,因而是AI時代的基礎設施。而從技術層面來講,當前的大模型仍具有諸多難以透徹理解的黑箱特性,因此更加需要以開源開放的方式讓大模型更安全地提供服務。

而開源本身也已經成為必然趨勢。以作業系統為例,為何大家都願意用開源的作業系統?對於商業公司而言,使用開源產品帶來的並非僅僅是成本的降低,更重要的是風險的降低和質量的提高。由一家企業維護的閉源項目一旦終止,用戶就要遷移全部技術棧,但開源不會出現這種風險,而且技術問題在開源的情況下也能更快得到解決。

對於研發成本極大的大模型而言,開源更是能夠集約資源、匯聚人類智慧,避免重複造輪子。智源已經在大模型開源這條路上走了一段距離。「悟道」系列模型已經在持續開源,包括「悟道2.0」通用語言大模型GLM、「悟道3.0」視覺預訓練大模型EVA、視覺通用多任務模型Painter、文生圖大模型AltDiffusion等等。

過去,智源匯集承載產學研各界力量推動大模型研究事業;現在,智源正在推進更艱巨的大模型開源開放生態建設——推出了FlagOpen(飛智)大模型技術開源體系。

3 FlagOpen:大模型時代的「Linux」

大模型的技術創新涉及算法、模型、數據、工具、評測等各個層面,因此FlagOpen開源體系也全面涵蓋了這些模塊,能夠讓開發者和企業更快、更低門檻地上手大模型的研發。

智源之所以選擇在當下發布FlagOpen開源體系,其中一個考慮也是因為看到在這一波ChatGPT熱潮中,許多以往沒有大模型研發經驗的初創團隊,也開始嘗試自研大模型,對他們而言,FlagOpen來得非常及時。

FlagOpen開源體系中的重頭戲,是一個大模型算法、模型及工具一站式開源項目FlagAI。該項目已經涵蓋了各領域的一些明星大模型,如語言大模型OPT、T5,視覺大模型ViT、Swin Transformer,多模態大模型CLIP等,以及智源自家的大模型。

這些大模型在實際調用和復現過程中的技術門檻很高,為此FlagAI集成了很多主流大模型算法技術,以及多種大模型並行處理和訓練加速技術,並且支持微調,開箱即用的方式對開發者非常友好。

大模型生態的另一要素是AI硬體評測,AI軟硬體技術棧異構程度高、兼容性差,應用場景複雜多變,都給評測帶來了很多挑戰。

FlagPerf搭建的AI硬體評測體系,提供了可直接下載且適配各家晶片的整套評測軟體,能大大降低用戶企業和晶片企業的人力成本。

FlagPerf的推出,也體現了智源開源開放的決心。一方面,不同於目前知名的AI基準評測MLperf,FlagPerf不搞排名榜單,且及時跟進最新的大模型基準;另一方面,其他大廠企業做的評測本身有其商業訴求,不夠開放,而智源作為中立機構,建立評測體系的目的是為了讓大模型產業更加成熟,所以評測涵蓋各種晶片,而非僅僅某一款,並且支持多種深度學習框架,對用戶企業的選擇不加限制。

也正因如此,智源第一時間就把多個廠商和團隊拉了進來,包括天數智芯、百度PaddlePaddle、崑崙芯科技、中國移動等,一同推進AI硬體評測建設。林詠華談道,「我們首先希望它先變成一個事實的基準。所謂事實基準是大家評測硬體的時候都愛用它,至於未來要不要發展成產業的標準,我們順其自然。」

科學、公開的大模型評測基準及工具,同樣是大模型取得技術進步的重要條件。尤其是當下AIGC的應用越發火熱,行業亟需對模型在AI生成任務上的評估。基礎大模型評測開源項目FlagEval為此提供了覆蓋多種模態和測評維度的評測工具,其中就包括多模態領域的CLIP系列模型。

在數據方面,智源構建了支撐大模型訓練的WuDaoCorpora語料庫,包含文本、對話、圖文對、視頻文本對四類數據。FlagData還集成了包含清洗、標註、壓縮、統計分析等功能在內的多個數據處理工具與算法。

在AI走向工程化的趨勢下,大型數據集的構建正在成為中國的巨大機會,這個過程需要更大、更開放的協作。智源此次發布的OpenLabel是中文世界首個開放數據標註平台,它轉動了數據飛輪,正持續為大模型提供訓數據源。

除了以上四大模塊,FlagOpen開源體系中還涵蓋了文生圖開源項目集合FlagStudio,以及AI應用微服務框架開源項目FlagBoot,為大模型的研發和應用開放了全方位的能力。

FlagOpen專門圍繞大模型而搭建的開源體系,這也是它與其它開源平台的區別所在。國外有HuggingFace、國內有魔搭社區(Model Scope),而關於FlagOpen的定位,林詠華解釋:

「我們不只是想構建一個很多人參與的繁華社區,更是希望推動大模型技術的發展。」

從產品的角度講,FlagOpen為用戶在研發大模型的需求上提供了一個更合適的選擇。針對「開源的不如閉源」說法,黃鐵軍認為,開源開放是一個大趨勢,開源形式的產品將會占據比較大的份額,而在一個特定方向上某個閉源產品做得更好,這一點並不奇怪。

「這不等於誰打敗誰了,而是大家在滿足自己需求時所做的不同選擇。」就像Linux成功在市場競爭中占據主要份額,但它不是把所有作業系統都打敗了。

FlagOpen剛剛邁出了開源第一步。智源開源的策略並非等一切都足夠完備再開源,而是把種子點做了之後就開源,這樣可以更快地推動企業和團隊在非商業合作協議下互相合作。比如,AI 硬體評測開源項目是先從最難也最短缺的訓練端做起,這一塊做好了推理端便不是難點。

類比13年前雲計算開源平台OpenStack的起家,Rackspace和NASA合夥做了Nova並將其作為種子開源,同時成立了OpenStack基金會,讓更多企業一起參與貢獻,這才有了國內今天所有的雲計算廠商。

這也是智源做大模型開源的初心。而對於FlagOpen的未來,智源的期待是將其打造成大模型時代的「Linux」。

「什麼叫一個開源項目成功了?就是大多數做產品和服務的企業都用這樣的開源體系,就像Linux和Risc-V的開源開放帶來了廣泛採用,希望FlagOpen在智能時代也能發揮類似的作用。」

FlagOpen開源平台入口:https://flagopen.baai.ac.cn

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

公眾號轉載請先在「AI科技評論」後台留言取得授權,轉載時需標註來源並插入本公眾號名片。

關鍵字: