人工智慧行業專題報告:大模型應用百花齊放,AI發展進入新時代

未來智庫 發佈 2024-03-01T08:10:03.465243+00:00

2023 年 3 月 15 日凌晨,OpenAI 正式發布了 GPT-4 預訓練大 模型,相比於 GPT-3.5 模型進行了全方位的升級。

(報告出品方/作者:東方證券)

一、GPT-4正式發布,多模態能力帶來更多應用想像

1.1、OpenAI發布GPT-4,能力全面升級

GPT-4 正式發布,性能全面升級。2023 年 3 月 15 日凌晨,OpenAI 正式發布了 GPT-4 預訓練大 模型,相比於 GPT-3.5 模型進行了全方位的升級。實際上在半年前 OpenAI 就已經完成了 GPT-4 的模型,隨後又採用對抗性測試對 GPT-4 進行了 6 個月的疊代調整,保證其在真實性、可操作性 和安全方面達到最好。GPT-4 仍為 Transformer 架構的預訓練模型,與 ChatGPT 類似,同樣採用 了基於人類反饋的強化學習(RLHF)方法,在一些專業和學術領域上已經達到了人類水平,是 OpenAI 在人工智慧領域的又一里程碑。

GPT-4 相比 GPT-3.5 具有四方面的能力提升: 1) GPT-4 具有一定的多模態能力,能夠進行圖文結合輸入的分析。GPT-4 是一個多模態模型, 它能夠接受圖片和文本輸入,並輸出文本回復,相比 GPT-3.5 增加了對圖像模態的分析推理 能力。與業界之前的預測不同,GPT-4 並不具備多模態的生成能力,即無法從文本輸入中得 到圖片(類似於 DALL-E),只能對圖片的輸入進行分析,並且圖片輸入目前仍處於研究預 覽階段,還未對公眾開放。根據 OpenAI 顯示,GPT-4 對圖片的處理分析能力達到了很高的 水準,這相當於機器擁有了視覺並且能夠進行思考,在應用層面有非常廣的空間。比如,完 全可以成為視力障礙人群的眼睛,給出題目的圖片能夠直接進行解題步驟的輸出等,在教育 領域有廣泛的落地場景。

2) GPT-4 在複雜專業領域的性能表現大幅超過 GPT-3.5 和當下的 SOTA 大模型。據 OpenAI 顯示,GPT-4 和 GPT-3.5 在一些普通的談話測試中的性能區別不大,但是在處理較為複雜 和專業的任務上,GPT-4 相比 GPT-3.5 則表現更優。在美國律師資格考試測試中,GPT-4 的成績可以達到前 10%,而 GPT-3.5 只能達到後 10%的水平。與 SOTA 模型(state-of-theart model,目前最好的模型)相比,GPT-4 也展現出了更好的性能。

3) GPT-4 能夠處理更長的文本,具有更好的創作能力和邏輯推理能力。ChatGPT 處理的文本 字數上限為 3000 字,而 GPT-4 可以處理超過 25000 字的長文本,支持內容創作、對話拓展 和文檔分析等功能。在創造性方面,GPT-4 可以輔助用戶進行生成、處理和疊代創意工作, 例如創作歌曲、編寫劇本或學習用戶的寫作風格。與 ChatGPT 相比,GPT-4 的邏輯推理能 力更進一步,在複雜的推理問題中表現更佳。4) GPT-4 支持用戶自定義 AI 的對話風格。在 OpenAI 的開發者直播中可以初步窺視 GPT-4 的 頁面布局,用戶可以左側的 System 欄中輸入命令來定義 GPT-4 的交互對話風格,而不是像 ChatGPT 一樣只有一種風格。我們認為,自定義 AI 對話風格對於基於 GPT-4 的二次開發應 用來說是非常方便的,開發者可以輕鬆地創造出具有個人獨特風格的 AI 應用。

GPT-4 已開放給 ChatGPT Plus 用戶使用,並且開放了 GPT-4 API 使用申請,使用成本大幅提 升。據 OpenAI 顯示,目前僅有 ChatGPT Plus 的訂閱會員用戶能夠訪問 GPT-4,但存在容量上 限,OpenAI 會對此進行持續擴展和優化,未來可能會推出免費的 GPT-4 試用版和更高級的訂閱 版本以供用戶獲得更多的使用容量。OpenAI 同時開放了 GPT-4 API 的使用申請,開發者可以申 請進入 GPT-4 API 的等待列表,OpenAI 會逐步邀請開發人員開始試用 API。目前提供給開發者 的 API 只能進行文本的輸入,分為 8k 和 32k token 兩個版本,最便宜的 8k-prompt 版本的定價為 0.03 美元/1k tokens,相比於之前發布的 GPT-3.5-turbo 的 0.002 美元/1k tokens 要貴十倍以上。

1.2、GPT-4有望帶來多場景智能化升級

GPT-4 已在多領域落地,微軟官宣證實 New Bing 背後的大模型就是 GPT-4。伴隨著 GPT-4 的 發布,OpenAI 也給出了 GPT-4 的 6 個應用實例,涵蓋了教育、金融和政府領域。例如在 Duolingo 里加入 AI 與用戶進行日常聊天,加速用戶對語言的學習;摩根史坦利採用 GPT-4 來對 其知識庫進行管理,幫助員工快速訪問想要的內容。微軟也在 GPT-4 發布後官宣,New Bing 背 後的模型就是 GPT-4,並且將隨著 GPT-4 的更新持續疊代。我們在之前的報告中已多次提到,大 模型的能力將對產業智能化帶來重大影響。隨著 GPT-4 的發布以及性能飛躍,大模型在各領域有 望迎來進一步的落地應用。考慮到其對話交互的特性,我們看好 GPT-4 在如下幾個領域的應用。

1) 教育場景:GPT-4的自定義AI風格能力與其連續對話交互能力與教育場景十分契合,對不 同性格的學生採用不同風格的AI作為虛擬導師,回答學生的問題、提供個性化的學習建議 和教育資源、分析學生的學習進展等,達成對學生進行個性化教育的目標,使得每個學生都 能以最大化的效率進行學習。此外GPT-4還能作為教師的輔助教學工具,幫助教師更好地 管理教學過程和學生。例如,教師可以使用 AI 來分析學生的學習數據,針對不同的學生制 定更加個性化的教學計劃和評估學生的學習成果。GPT-4的圖片分析能力還能夠輔助教學過 程中的閱卷工作,實現對主觀題的評分,減輕教師工作負擔,提高閱卷的公正性與準確性。

2) 醫療場景:GPT-4 豐富的專業知識使其能夠做好輔助診斷的工作,通過分析醫療記錄、病歷 資料、診斷報告等數據,提供有關疾病診斷、治療方案和藥物處方等方面的建議和指導,幫 助醫生更加準確地診斷和治療疾病,提高醫療質量和治療效果。在醫學影像領域,GPT-4 新 增的圖片分析能力也可以用於CT等圖像的診斷,智能標記出存在症狀的圖像區域。將GPT4 與可穿戴設備結合,可實現對重症患者的全天候健康監測,進行實時健康風險評估,幫助 患者做好健康管理等。

3) 企業經營管理辦公場景:GPT-4 的對話交互特性與邏輯分析能力可以助力企業經營管理辦公 全流程的效率提升。在企業的 OA 系統中,GPT-4 可以輔助員工快速智能地進行流程辦理; 在企業 ERP 系統中,GPT-4 可以通過數據分析來輔助企業進行經營決策;在辦公環節, GPT-4 的長文本理解能力有望對會議、文檔和郵箱場景帶來效率提升。 4) 工業設計場景:GPT-4 在複雜專業領域的性能以及其多模態分析能力可以成為良好的工業設 計輔助工具。例如在 CAD、CAE、EDA 等工業設計軟體領域,GPT-4 可以作為其中的插件 來進行模型的輔助設計、圖紙生成等。清華大學土木工程系的陸新征課題組已經將生成對抗 網絡技術應用到了結構設計中,能夠自動為剪力牆進行配筋,結果基本和普通的結構設計軟 件給出的配筋結果一致。能力更強的大模型在這方面的應用更加值得期待。

二、百度發布會召開,文心生態圈持續擴大

2.1、「文心一言」正式發布,具備多模態能力

百度的對話式大模型「文心一言」正式發布。3 月 16 日下午,百度 CEO 李彥宏在發布會上正式 揭開了「文心一言」的面紗。「文心一言」是百度新一代知識增強大語言模型,它基於百度 ERNIE 及 PLATO 系列模型的基礎進行研發,其大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。李彥宏表 示,雖然「文心一言」的實際能力還並不完美,但希望通過發布後的真實用戶反饋來幫助大模型 快速疊代,加速模型能力的提升。

「文心一言」具備五大能力: 1) 文學創作:發布會現場以《三體》為例,「文心一言」能夠對《三體》進行續寫,並能回答 事實相關問題,體現出了強大的總結分析與推理能力。 2) 商業文案創作:「文心一言」能夠為公司起名提供創意,並能直接進行商業新聞稿的創作, 展現了模型的理解表達與創作能力。3) 數理邏輯推算:「文心一言」能夠看出題目本身存在的錯誤,並能給出正確題目的解題步驟, 具備較強的數理邏輯能力。 4) 中文理解:「文心一言」基於大量中文語料進行訓練,能夠解釋「洛陽紙貴」背後的經濟學 原理,並能寫出藏頭詩,展現了對中文的強大理解能力。5) 多模態生成能力:「文心一言」可以輸入文字生成圖像、音頻和視頻,並支持多種方言生成。 文字生成視頻的能力現階段還未對外開放,但百度旗下的百家號已經在使用這項技術。

「文心一言」的多模態生成能力亮眼,多模態是未來大模型的發展趨勢。從「文心一言」現場演 示的幾大功能來看,最為亮眼的當屬其多模態的生成能力,能夠支持圖像、音頻和視頻多種模態 內容的生成,而 OpenAI 的 GPT-4 目前還沒有多模態的生成能力,在應用領域將會有更廣闊的的 空間。我們認為,多模態是未來 AI 大模型的發展趨勢,隨著百度多模態統一大模型的能力增強, 「文心一言」的多模態生成能力也會不斷提升。

「文心一言」是新一代知識增強大語言模型,具有六大核心基礎模塊。百度 CTO 王海峰提到, 「文心一言」與別的大語言模型相比,除了有監督精調(Supervised Fine-Tune)、人類反饋的 強化學習(RLHF)、提示(Prompt)這三項大模型均會採用的基礎訓練模塊外,增加了三項具 有百度特色的核心基礎模塊:知識增強、檢索增強、對話增強,充分利用了百度旗下的百度知識 圖譜和百度搜尋引擎等產品的能力。

1) 知識增強:「文心一言」的知識增強主要是通過知識內化和知識外用兩種方式。知識內化是 從大規模知識和無標註數據中,基於語義單元學習,利用知識構造訓練數據,將知識學習到 模型參數中;知識外用,是引入外部多源異構知識,做知識推理、提示構建等等。 2) 檢索增強:「文心一言」的檢索增強,來自以語義理解與語義匹配為核心技術的新一代搜索 架構。通過引入搜索結果,可以為大模型提供時效性強、準確率高的參考信息,更好地滿足 用戶需求。 3) 對話增強:基於對話技術和應用積累,「文心一言」具備記憶機制、上下文理解和對話規劃 能力,實現更好的對話連貫性、合理性和邏輯性。

2.2、文心生態圈持續擴大,大模型帶來新的產業機會

「文心一言」生態圈已加入650家企業,落地場景涵蓋各行各業。李彥宏在發布會上宣布,已有 650 家企業首批接入了「文心一言」,涵蓋了網際網路、媒體、金融、保險、汽車、企業軟體等行 業,百度大模型在 B端的生態圈迅速擴大。我們認為,隨著「文心一言」的首批生態企業應用逐 步落地,百度將建立起開發者及用戶調用和模型疊代之間的飛輪,加速構建開放繁榮的技術生態, 在推動公司增長的同時,也對中國生成式 AI 的發展帶來了巨大的促進作用。

「文心一言」將在 3 月 27 日正式開放,大模型的發展將帶來三大產業機會。「文心一言」目前 仍處於邀請制內測階段,百度智能雲官方宣布將於 3 月 27 日召開發布會,屆時「文心一言」將正 式向大眾開放。李彥宏在「文心一言」發布會上預測,大模型的發展有望帶來三大產業機會:新型雲計算、行業模型精調和應用開發。我們在之前的報告《文心一言發布在即,大模型有望引領 產業智能化變革》也有展望過,MaaS 未來將有望成為大模型落地的新形態,通過模型蒸餾技術 將大模型「瘦身」成為垂直行業模型,能夠大大降低模型搭建的成本。我們認為,隨著「文心一 言」的發布,基於大模型的垂直場景化模型以及基於垂直模型的應用開發將會快速增加,AI 市場 有望迎來需求的大幅增長。

百度具有人工智慧全棧布局,長期的技術積累和生態優勢助力百度成為國內對話式大模型先行者。基於搜尋引擎這一天然的自然語言理解與處理的入口,百度從誕生開始就逐漸在NLP、語義理解方面進行持續的技術積累。過去數十年,百度深耕人工智慧領域,目前已經擁有晶片、框架、模型和應用四層技術棧,文心大模型自2019年推出以來也歷經了多次疊代,目前已經具備較強的泛化能力與性能。良好的技術儲備與自身的生態優勢使得百度成為了國內對話式大模型的先行者,我們也十分看好「文心一言」發布後在各個產業中的落地應用。

三、微軟和英偉達相繼召開發布會,AI應用廣泛落地

3.1、微軟推出Microsoft 365 Copilot,辦公場景根本性變革

微軟宣布 Microsoft 365 服務全面接入 AI 驅動工具 Copilot。3 月 16 日晚,微軟在「The Future Work with AI」發布會上宣布將人工智慧大語言模型技術(LLM)引入 Office 應用程式,推出了 AI 助手——Microsoft 365 Copilot,幫助用戶提高辦公生產力。該 AI 助手由 OpenAI 的 GPT-4 技術 驅動,出現在 Microsoft 365 應用的側邊欄,可以作為一個聊天機器人隨時召喚,帶來更智能、更 高效的辦公體驗。微軟 CEO 表示,Copilot 的核心特點是通過自然語言理解用戶的需求提供更加 個性化的服務,基於自然語言技術將大模型、用戶數據和應用結合起來。

Copilot 打通微軟辦公產品線,數據在各個產品中自由流通。Microsoft 365 Copilot 將大語言模型 的能力與儲存在 Microsoft Graph 中的數據如郵件、文檔、會議、日程、聊天等以及 Word、Excel、 PowerPoint、Teams、Outlook 等辦公產品全部聯繫到一起,通過四個步驟將用戶的文本命令輸 入轉化為應用層的執行。Copilot 以疊代的方式來處理和編排這一系列流程服務,形成了集合大模 型、用戶數據和應用的 Copilot System,實現了多種令人驚嘆的功能。

1) 第一步:用戶在辦公產品端通過文本輸入 prompt,Copilot 接收用戶的 prompt,並通過 Grounding 技術對 prompt 進行預處理,其核心是調用 Microsoft Graph 來檢索與此 prompt 相關的業務內容背景信息,並基於這些信息對 Prompt 進行修改; 2) 第二步:Copilot 將修改後的 prompt 發送給大語言模型 LLM; 3) 第三步:Copilot 獲取到 LLM 對 prompt 產生的回應,並再次通過 Grounding 技術對回應進行 後處理,包括額外的圖形調用、對 AI 生成結果的安全性、合規性檢查等,並生成對應用的 調用命令; 4) 第四步:Copilot 向用戶發送最終回復和對應用程式的調用命令。

Copilot 與 Microsoft 365 應用緊密集成。微軟將 AI 助手 Copilot 與 Word、Excel、PowerPoint、 Outlook、Teams 等產品緊密結合,成為高效的生產力工具。用戶可以用 Copilot 實現在 Word 中 生成文稿,為 PPT 增加圖片和動畫效果,在 Excel 里分析用戶輸入的數據並將結果生成可視化圖 表,幫助 Outlook 進行郵件管理和智能生成回復,在 Teams 里進行會議實時總結和會議紀要生成 等功能,甚至可以在不同的產品應用間進行格式轉換,例如要求其根據給定的 Word 文檔創建 PPT,極大地提高了用戶在辦公場景的效率。

Business Chat 功能將數據轉化為知識,大幅提升辦公效率。Copilot 提供了 Business Chat 功能, 橫跨了所有的數據和應用,用 Microsoft Graph 將來自文檔、PPT、電子郵件、日曆、便箋和聯繫 人等的數據匯集在一起。比如可以直接通過與客戶的聊天、郵件、日曆等信息進行總結,按照 A 文件的格式編寫包含 B 計劃的時間表並給相關聯繫人發送郵件等。同時,團隊中的每個人都可以 在同一個Chat頁面上共同進行業務的推進,比如在員工 A 創建了文檔後,員工B可以直接命令Copilot對文檔進行修改,實現了協同辦公效率的大幅提升。

Copilot 作為流程編排引擎驅動流程自動化與業務應用開發的 AI 變革。微軟將 Copilot 也接入到 了旗下的低代碼開發平台 Power Platform 中,用戶可以在 Power Apps、Power Virtual Agents 和 Power Automate 中用自然語言描述他們想要的應用、功能和流程,Copilot 可以在幾秒鐘內完成 應用和流程的創建,並提供改進的建議。在 2022 年 10 月上線的預覽版 Power Automate 中,采 用了 AI 驅動的流程自動化創建能夠節省約 50%的時間,大幅提高了業務工作效率。

3.2、英偉達GTC 2023召開,展現AI多領域應用

英偉達 GTC 2023 正式召開,展現 AI、加速計算及其他領域的突破性進展。北京時間 3 月 21 日 晚,英偉達 CEO 黃仁勛為 GTC 2023 進行了主題演講,對英偉達在 AI 應用、加速計算等軟硬體 領域取得的新進展進行了介紹。經過幾十年的經營,英偉達不僅成為了全球領先的 AI 算力提供商, 也構建了一套圍繞著實際產業運轉的 AI 應用生態,在自然科學、化學製藥、視覺解析、數據處理、 機器學習和大模型領域成為不可或缺的一環。

AI 產業迎來「iPhone」時刻,英偉達聯手雲廠商推出 DGX 雲服務。黃仁勛在演講中多次表示, AI 產業正處於「iPhone」時刻,生成式 AI 技術的快速進步引發了全球企業對 AI 戰略制定的緊迫 感。為了方便企業客戶更快地訪問英偉達 AI 算力與應用庫,黃仁勛在演講中宣布英偉達將與微軟 Azure、谷歌雲、Oracle OCI 合作,推出英偉達 DGX 雲服務。這一合作將英偉達的生態系統引入 了雲服務廠商,極大地擴展了英偉達的觸及範圍。這意味著當下性能最佳的 DGX AI 超級計算機 將成為能夠提供多租戶的雲服務設施,一眾試圖訓練自營大語言模型、圖片模型的企業,將能直 接通過雲服務快速實現自己的願景。目前已有 50 余家企業客戶已經開始使用 DGX 雲服務,涵蓋 了醫療、媒體、金融等多個行業領域。

生成式 AI 將重塑幾乎所有行業,行業模型有望成為未來大趨勢。生成式 AI 是一種新型的計算平 台,與 PC、網際網路、行動裝置和雲誕生的時代類似,先行者們已經在利用生成式 AI 打造新的應 用,利用其智能自動化和協同創作能力來改變傳統的行業運行模式。對於某些具有較高專業性的 領域比如醫療、藥物等行業,可能需要用專屬的行業數據來構建定製化的行業模型,以滿足該行 業的特定要求。我們在之前的報告《文心一言發布在即,大模型有望引領產業智能化變革》也有 展望過,通過模型蒸餾技術將大模型「瘦身」成為垂直行業模型,能夠大大降低模型搭建的成本, MaaS 在未來將有望成為大模型落地的新形態。

英偉達推出 AI Foundations 雲服務,提供從建立模型到上線運營的全套服務。對想要建立獨有 的垂直領域行業模型的客戶,英偉達推出了 AI Foundations 一站式雲服務,從模型的構建到生成 應用上線,英偉達就類似於晶片行業的台積電,成為了生成式 AI 領域的代工廠,協助客戶快速構 建、優化和運營大模型,把製造大模型的能力傳遞到每一個用戶。英偉達 AI Foundations 由三個 部分組成:

1) NEMO:NEMO 是用於自然語言文本的生成式模型,提供 80 億、430 億、5300 億參數的 GPT 模型,客戶也可以引入自己想要的模型。Nemo 會定期更新額外的訓練數據,可以幫助 企業為客服、企業搜索、文檔處理、市場分析等場景定製生產生成式 AI 模型。 2) PICASSO:PICASSO 是一項視覺語言模型的製作服務,可以用於訓練能夠生成圖像、視頻 和 3D 素材的模型。客戶可以基於英偉達提供的 Edify 大模型或是自建定製模型來進行訓練 和優化,得到自己想要的生成式 AI 模型。Shtterstock 目前正在與英偉達合作開發一款以其 專業的圖像、3D 和視頻素材庫進行訓練的 Edify-3D 生成式模型,用於簡化創意製作、數字 孿生和虛擬協作中 3D 素材的創建過程。Adobe 也與英偉達合作,發布了 Adobe Firefly 這一 生成式 AI 工具,將生成式 AI 融入了營銷人員和創意工作者的日常工作流中。

3) BIONEMO:BIONEMO 是針對於生物製藥領域的 AI 模型服務。生物製藥行業目前正在轉向 利用生成式 AI 來發現疾病靶因、設計新型分子或蛋白質類藥物、以及預測藥物對機體的作 用等。BIONEMO 可以為用戶提供創建、微調、提供自定義模型的平台,包括 AlphaFold、 ESMFold、OpenFold 等蛋白質預測模型。生成式 AI 模型可以在給出胺基酸序列的條件下快 速準確地預測目標蛋白質結構,預測蛋白質和分子的相互作用等,極大地提升了最佳候選藥 物研發的效率。

工業軟體領域與 AI 大模型能力的結合值得期待。本次英偉達 CEO 的主題演講中,AI 與專業的創 意設計、工業設計、模擬仿真類軟體結合方式為 AI 大模型的落地帶來了新的場景,在駕駛仿真、 粒子特效運算、動畫製作、材質表面生成、物理效果等領域都有良好的應用。我們認為,隨著 AI 能力的持續進步和業界對 AI 應用方式的不斷探索,像 CAD、EDA、BIM 等工業軟體也有較大成 長的機會,其模型設計、圖紙生成等功能都與大模型能力十分契合。未來隨著國外頭部廠商進行 大模型方向的創新應用,國內的相關工業軟體企業也會有較大發展空間。

四、生成與通用領域雙線發展,人工智慧邁入「雙G時代」

大語言模型的誕生帶來了新的知識表示和調用方式的變遷。自計算機誕生以來,知識表示和調用 方式歷經了兩次大的變遷。在網際網路誕生之前,最為常見的知識表示方式是關係型資料庫,通過 SQL 語句進行調用,精確度高但調用的方式較為複雜,代表的公司比如 Oracle 等資料庫的巨頭公 司。隨著網際網路的誕生與搜尋引擎的誕生,知識的調用方式變化為了關鍵詞搜索,方便程度提高了,但是對於知識調用的精確度卻有所降低。而大模型的誕生進一步提高了知識調用方式的自然 度,僅需通過自然語言交互即可訪問想要的知識。

當下人工智慧在生成和通用兩條主線上不斷發展,邁入「雙 G 時代」。目前人工智慧最火熱的兩 個賽道分別是生成(Generation)和通用(General),這兩條賽道相互交織並行,AI 領域也進 入了「雙 G 時代」。在生成領域,以 DALLE-2、Stable Diffusion 等引領的生成式 AI 技術與 AIGC 概念如火如荼;在通用領域,AI 研究者們現在都在朝著通用人工智慧(Artificial General Intelligence, AGI)的方向不斷努力,大模型不斷增強的多模態感知能力就是邁向 AGI 的重要途徑。 這兩條賽道是密不可分的,像百度的「文心一言」大模型就既具有多模態的生成能力,又能夠回 答大部分的通用問題,具有一定的通用人工智慧能力。

OpenAI 及其 GPT 系列模型是當前人工智慧賽道上的領跑者,超大規模模型帶來的知識湧現能力 是 ChatGPT 出圈的關鍵。OpenAI 和 GPT-4 毫無疑問是當下人工智慧領域最為耀眼的明珠,回 顧 GPT 系列模型的發展歷程,2018 年 OpenAI 發布 GPT-1 模型,僅有 1.17 億參數,性能也落後 於谷歌隨後發布的 BERT 模型,BERT 也成為當時 NLP 領域最常用的模型。OpenAI 持續在 GPT 模型上發力,陸續推出規模更大的疊代版本 GPT-2 和 GPT-3,在 OpenAI 的研究中,發現了當模 型參數到達一定規模時,模型會開始湧現出 In-context learning(上下文學習)、Chain ofThoughts(思維鏈)、Zero-shot(能夠處理未見任務)等能力,而這樣的能力成為了 ChatGPT 能夠「更像人」的關鍵。

「文心一言」已達「能用」標準,我國在人工智慧賽道上將持續追趕。從近期的「文心一言」相 關測試來看,距離 GPT-4 還有很大差距,但是其能力展現已有 GPT-3 的水平,達到了「能用」 標準,在 B 端、垂直行業端等都有應用的空間。我們認為,我國的人工智慧技術起步晚,經驗積累不足,但是發展速度較快。隨著我國相關科技公司大力投入生成式 AI、大語言模型的研究,我 國在 AI 的「雙 G 時代」中將持續扮演追趕者的角色,爭取和國際領先水平縮小差距。

(本文僅供參考,不代表我們的任何投資建議。如需使用相關信息,請參閱報告原文。)

精選報告來源:【未來智庫】「連結」

關鍵字: