來自北大、KAUST、斯坦福、達摩院的大模型前沿動態：MiniGPT-4等

ChatGPT的發布使得國內外眾多的研究機構掀起了一股AI熱潮，而這也進一步推動了人們對大語言模型的深入研究。2023年4月26日，AI TIME舉辦的大模型專場四活動邀請了阿里巴巴達摩院NLP研究員惠彬原、北京大學計算機學院軟體研究所博士生薑雪、阿卜杜拉國王科技大學博士生朱德堯、史丹福大學博士生盛穎。四位嘉賓分別介紹了自己在大模型領域的最新研究工作，分享了自己對於大模型的觀點看法，並展望了未來人工智慧的全新範式。

個人報告

惠彬原：分解，分解，推理！大模型是超越人類的表格推理者

大模型目前已經展現出了在部分能力上超越人類的表現。本次分享中惠彬原首先介紹了表格推理的背景和任務，其次從Program Synthesis和Table Pre-training兩個方面闡述了表格推理相關的研究工作並分析了GPT-3發布之後對表格推理的研究產生的影響與變化，提出要解決的兩個主要問題：大語言模型如何泛化到多行的巨大表格中以及產生包含與證據信息不一致的誤導性思維鏈，然後重點分享了關鍵框架Dater的設計思路以及該篇工作的主要貢獻，通過實驗結果展示了Dater在性能上的顯著提升：Dater在TabFact上首次超越人類，最後展望了未來有待進一步解決的研究問題和研究方向。

姜雪：基於自規劃和自合作的大模型代碼生成技術

編程是一種解決問題強有力的工具，而代碼生成是一種能讓機器自動編程以滿足人類意圖或需求的技術。姜雪首先為大家闡明了代碼生成的具體含義以及目前的研究發展狀況，其次分析了現有代碼生成方法中存在的問題，即只能解決函數級代碼生成、行級代碼補全這種短需求的場景，在面對複雜問題分析以及軟體系統設計時則不盡如人意，她進一步提出了研究目標：使大模型在應對用戶更複雜的需求時能展現更好的代碼生成能力。姜雪介紹了該篇工作的主要思路，即通過引入規劃和合作的方法論使得大模型解決更複雜的需求並且進一步提升代碼生成的質量，最後通過實驗數據展示了所提方法的優越性能

朱德堯：MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models

GPT-4展示了非凡的多模態能力，例如能夠直接從手寫文本生成網站和識別圖像中的幽默元素等。朱德堯首先表達了該篇工作的研究動機，即期望找到GPT-4視覺語言能力的來源並提升Blip-2整個系統的表現力，然後介紹了MiniGPT-4的設計方案及實驗過程，它僅使用一個投影層將凍結的視覺編碼器與凍結的LLM Vicuna對齊，最後通過對demo結果的展示表現了MiniGPT-4的新型功能與強大能力，說明了使用對話模板微調模型對增強模型生成可靠性與整體可用性至關重要。

盛穎：單卡上的高吞吐量大語言模型生成式推理

傳統意義上，大型語言模型(LLM)推理的高計算和內存要求使其僅在多個高端加速器的情況下才可行，本篇工作研究了使用有限資源的高吞吐量大語言模型生成推理。本次分享中，盛穎首先介紹了語言模型的相關背景及其所需的數據條件，其次表明了工作的研究動機，即希望AI能夠被更加民主化地使用，每個人可以擁有自己的大模型，然後闡述了降低大語言模型運行的三種要求，包括：模型壓縮、協作推理、存儲卸載，最後通過具體分析實驗結果，證明了所提方法使得大語言模型在單卡上進行生成式推理的優越性能。

Panel 大模型是否會顛覆傳統的軟體開發？

姜雪：從某種程度上來講，大模型確實在改變著軟體開發的方式，能夠幫助開發人員快速地生成代碼，減少人工出錯的可能性，並且可以自動地生成文檔和測試用例。但是，我認為現在大模型還是不能完全取代傳統的軟體開發，可能會引發一種新的分工，使得人類更專注於專業化和創業化的工作。因為軟體開發需要設計架構、編程、測試維護等各個方面的專業知識。目前大模型在很多情況下是一個比較有利的輔助工具，它並不能解決所有的問題，還是需要人類來提供監督和指導。此外，很多應用程式是依賴於特定的技術和領域知識的，大模型適用性不足，在這種情況下需要專業的人員來完成。

朱德堯：大模型會取代底層重複的沒有創造力的工作，但是對於頂層的架構設計，在短期內還是需要人類去完成的。對於底層來講，大模型具有較大的潛力，在自動化、個人認證等方面展現出較好的邏輯推移能力，如果好好利用大模型將能夠提升工作效率，避免重複勞動。

盛穎：傳統的軟體開發形式會因為大模型的出現有所改變，但是不會被完全取代。目前在軟體開發中已有的技術可以自動補全代碼，提升開發效率，但是最終的結果還是需要人類進行驗證。對於大模型會不會導致開發人員的就業困難這個問題，簡單重複的工作被加速之後，能夠創造出更多的機會，讓大家能夠將精力集中在更加有意思的工作中。

申澤楷：大模型能否顛覆傳統軟體開發沒有一個確定的答案。它可能會顛覆一部分，會取代一些基礎的架構，同時會產生一些新的軟體開發範式。在新時代下AI是無法取代人類的，關鍵在於人類如何利用大模型的優勢克服局限，去提升軟體的開發質量和效率。

Panel 我們離真正的AGI有多遠？

朱德堯：在短期內可能會出現通用的在感知和決策方面都能做到很好的AGI。從技術層面來講，隨著GPT版本的更新，網際網路中的資料庫已被大量使用，那麼在未來可能會因為高質量數據的缺少而出現一個瓶頸。但是在下一步AI的訓練範式又有可能從監督與自監督學習轉化為強化學習，由被動地接收轉變為主動收集數據並從數據中學習。從這個角度來看，一旦AI能夠做到主動地抽取數據，探索學習世界，那麼在未來3-5年內建造一個非常通用的能夠做出決策的AGI模型時很有可能的。

盛穎：我對AGI的未來偏向樂觀，因為他確實已經展現出一些人類無法完全理解的能力。而真正的AGI能否實現取決於兩個方面：一是人類能否接受AI擁有自我意識進行主動探索；二是人類有多大的動力耗費代價去實現真正的AGI。我相信這在最終是能夠實現的，但是短期來看，它對社會的價值更多的體現在輔助性層面，隨著時間的推移，會變得越來越重要甚至不可替代。

姜雪：我對此持中立的態度，既不悲觀也不樂觀。真正的AGI應該像人類一樣去學習，去適應推理解決廣泛的任務，而不是局限在某個特定任務上的表現。目前的AI系統在處理一些任務的時候仍然是需要人類的這個干預和指導的，是沒有辦法完全代替人類的。要實現真正的AGI還是面臨著很多挑戰的，比如說具備人類的適應能力、創造創新能力、對人類情感和道德的理解。所以要實現真正的AGI不僅要解決計算技術的問題，還會有哲學上的挑戰以及很多跨學科、領域的合作，需要很長的時間去發展。

申澤楷：我們在離未來真正的AGI可能還有很長的路要走，或許需要幾十年或者更久。短期之內AGI不斷湧現，但是在最終還是取決於人類對智能的探索，需要不斷地創新和持續的努力。

Panel 大家會更喜歡本地使用或個人專有的模型，還是雲端服務的模型？

盛穎：在未來肯定還是會同時存在這兩種模式的，但是我更希望在將來每個人都能擁有專有的assistant。當然這也與AI模型架構朝著哪個方向搭建有關，是更應該專注於雲端的服務措施還是專注於大模型本身的特色。AI的生態是與物種多樣性相類似的，做到普遍性與特殊性的統一才能推動整個AI系統向前發展。

姜雪：如果有計算資源的話，我個人傾向於本地模型，因為我可以做到自由訪問，探索資源是如何工作的。但是雲端的服務會受到網絡或政策的限制，涉及到數據隱私和安全性的問題。現在的大模型只是作為基礎設施提供雲端服務，在未來我希望有個人的大模型與雲端服務的大模型結合，實現超級大模型。

朱德堯：在不關注硬體條件的前提下，由於隱私安全的問題，我會更希望有自己的模型。小模型會因為參數量的受限而缺乏大模型的湧現能力，目前更實際的問題是大模型需要的計算資源太大，所以雲端模型會稍占優勢，在未來會更傾向於哪一方面主要有兩個影響因素確定：一是大型語言模型的規則是否還起作用，二是硬體的發展速度。

申澤楷：大模型的選擇不是一個「0-1」問題，一定是各有優點和特色的，在未來一定會有更加靈活或者混合的方案出現，從而呈現「百花齊放」的局面，能夠讓用戶根據自己的需求和偏好選擇模型的特性和服務方式。