專家論道大模型 | 資源受限下 ,「白澤」有何秘籍?

人民中科cognitive 發佈 2024-03-05T22:37:05.949622+00:00

3月21日,機器之心在北京舉辦ChatGPT 及大模型技術大會。大會圍繞研究、開發、落地應用三個角度,邀請了大模型領域的知名學者、業界頂級專家共談大模型及中國版 ChatGPT的未來。

3月21日,機器之心在北京舉辦ChatGPT 及大模型技術大會。大會圍繞研究、開發、落地應用三個角度,邀請了大模型領域的知名學者、業界頂級專家共談大模型及中國版 ChatGPT的未來。


人民中科創始人、中科院自動化所模式識別國家重點實驗室研究員、博導李兵受邀出席,做了「白澤」—— 面向數字發現的跨模態基礎模型探索為主題的演講。




李兵博士,人民中科創始人、中科院自動化所模式識別國家重點實驗室研究員、博導,國家優青,北京市傑青,中科院 「青年學習標兵」,科技部 「新一代人工智慧」 重大項目負責人,國家自然科學基金重點項目負責人。


長期從事人工智慧、跨模態內容理解與安全方向的研究,在包括 IEEE TPAMI 等人工智慧權威國際期刊和會議上發表論文 100 余篇,曾獲國家自然科學二等獎、中國自動化學會技術發明一等獎。


在 ChatGPT 引爆科技領域之後,時隔不到四個月,OpenAI 又出大招,重磅推出多模態預訓練大模型 GPT-4,號稱史上最先進的 AI 系統!微軟更是將 GPT-4 全面接入 Office 全家桶,人人都可以用人工智慧自動生成文檔、電子郵件、演示文稿。



其實不管是 ChatGPT ,還是 GPT-4,其背後都依賴大模型。ChatGPT的巨大成功要歸功於長久以來業界對大模型發展的重視。短短几年,AI 模型的參數量已經從最初的數億擴張到千億,甚至萬億規模。


從技術上講,ChatGPT是一個出色的NLP(Natural LanguageProcessing,自然語言處理)新模型。如今大火的ChatGPT,得益於AIGC背後的關鍵技術NLP得到突破。NLP賦予了AI理解和生成能力,大規模預訓練模型也是NLP的發展趨勢。


預訓練大模型是面向通用智能最高階的探索,也是AI持續變革的核心發展方向與動力。而隨著 GPT 技術的快速發展,尤其 ChatGPT 展現出來的出眾的智能能力,傳統的 AI 研究範式已經被打破。與此同時,面向未來 Web3.0 環境下海量的多源異構的泛視頻數據,傳統基於單模態內容理解已無法滿足高語義級別的內容理解與線索發現。


多模態是未來人工智慧應用發展的方向。從多模態到跨模態,作為人民中科創始人,李兵帶領的團隊堅持多模態和跨模態基礎研究20餘年,人民中科的核心產品——「白澤」核心技術就是跨模態預訓練大模型。


「白澤」可跨越文字、語音、視頻等多模態內容的語義鴻溝,自動關聯多模態間關鍵要素。可跨模態實現文本搜圖片、文本搜視頻、圖片搜視頻、視頻搜視頻、圖片搜文字、視頻搜文字等功能,是探索數字世界的重要工具。


值得一提的是,從「雨燕」智能計算加速卡,到「白澤」跨模態智能引擎,人民網內容風控大腦全部技術組件實現了整體國產化,形成了涵蓋內容風控,內容聚發,版權保護等新領域、新應用軟硬體技術架構。


從產業價值的角度來看,預訓練大模型帶來了一系列可能性,讓產學研各界看到了由弱人工智慧走向強人工智慧,走向工業化、集成化智能化的路徑。在這樣的驅動背景下,大模型也會有一些可預見的趨勢與發展。


人民中科跨模態技術手段,能通過中小模型解決以前需要上百個模型才能解決的問題,同時跨模態技術的算力和應用的投入是非線性的,可以大幅減少算力消耗。


在受限資源下的基礎大模型探索,「白澤」是如何做到的?


「白澤」大模型前端提速——基於壓縮域視頻內容理解


人民中科-中科院自動化所團隊聯合推出了面向高通量小樣本條件下的基於壓縮域視頻識別新方法,相關成果已被人工智慧國際權威學術會議IJCAI2022接受。此方法對昔日人海戰術的視頻標籤,分類,審核是一項重要的技術突破。

基於該成果,將極大地提高「白澤」對海量視頻數據的識別效率,以及提升其對小樣本視頻的識別性能。


「白澤」——教導主任指導下的大模型蒸餾壓縮一體化


面對越來越深的深度學習模型和海量的視頻大數據,人工智慧算法對計算資源的依賴越來越高。為了有效提升深度模型的性能和效率,通過探索模型的可蒸餾性和可稀疏性,人民中科中科院自動化所聯合研究團隊提出了一種基於「教導主任 - 教師 - 學生」 模式的統一的模型壓縮技術。

基於該項研究成果「白澤」能夠在保證算法性能的情況下,將模型大小進行大規模壓縮,從而實現高通量低功耗的跨模態智能理解和搜索能力。根據初步的實際應用情況來看,該項技術能夠將大模型的參數規模壓縮平均四倍以上。一方面能夠極大降低模型對 GPU 伺服器等高性能計算資源的消耗,另一方面能夠將無法在邊緣端部署的大模型經過蒸餾壓縮後實現邊緣端的低功耗部署。


讓機器理解視頻,提升數字世界透明度。人民中科擁有世界領先的內容理解技術,希望能在數字世界急劇膨脹、安全形勢嚴峻的大背景下,為市場提供高智能、低成本的內容發現和管理服務,為社會治理、政務服務、教育金融、消費娛樂等領域提供技術支撐。


「道路對了,不怕遙遠!」未來,人民中科將繼續深耕內容安全領域,將人工智慧前沿技術與市場需求融合,形成低成本、高效率、自主可控的產品體系,幫助企業降低AI應用門檻。同時,不斷升級產品和服務,護航政府、企業、機構內容安全,為網絡強國建設作貢獻。


責編:岳青植

監製:李紅梅

關鍵字: