文心一言首秀，百度的AI範式躍進 - 21世紀商業評論

文丨潘幾鶴

「幫我寫一首思鄉的歌曲。」

第一時間拿到邀請測試碼的小何，輸入了這個問題，很快，對面拋出了幾段惆悵的歌詞：

「在遠方的天空，是否還有家鄉的月亮？看著天邊的夕陽，我的心中充滿惆悵……」

網線那頭，與小何互動的，是3月16日，百度正式啟動邀請測試的生成式AI產品文心一言。它基於百度新一代大語言模型，作為ChatGPT的關鍵對標產品，當天的首秀備受海內外關注。

新聞發布會上，百度創始人、董事長兼執行長李彥宏親自出席並做現場演示，足見重視。

從演示效果來看，文心一言某種程度上具有了對人類意圖的理解能力，回答的準確性、邏輯性、流暢性，均逐漸接近人類水平。

「確實不能說完美。」李彥宏說，最近一段時間，他接到了不少人詢問「真的ready了嗎」，儘管大語言模型還遠未到發展完善的階段，但一旦有真實的人類反饋，文心一言的進步速度會非常快。

中國AI市場已處在爆發性增長前夜，商業價值的快速釋放，有賴於革命性產品的引領。外界翹首以待，真正來自全球一線大廠的商業化產品落地。

現在，百度第一個補上了空缺位。

國產第一槍

ChatGPT雖好，但暫不支持中國IP使用，中文語義理解的準確性也有待加強。

世界科幻文壇最高獎「雨果獎」得主郝景芳說，她使用一個漢化版本、底層模型基於ChatGPT做的中文機器人，提問是否知道「雞娃」，得到一個標準的外國機器人答案：

「雞娃」就是母雞的小娃。

中國的普通用戶期待使用門檻更低、更懂中文的自家版本。

發布會現場，李彥宏展示了文心一言在五個使用場景的表現，包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。

其中，值得一提的是中文理解能力。

「『洛陽紙貴』是什麼意思？」「用洛陽紙貴四個字寫一首藏頭詩。」

面對需要深層次理解中國文化的問題，文心一言能迅速給出解釋和創作回答。

由於使用的是紮根於中國市場的大語言模型，文心一言具備先進的自然語言處理能力，擁有對中文語言，以及對中國文化的深層次理解。

這意味著它將比國外開發的模型，更適合中文用戶和中國市場。

接下來回到最基礎的能力範疇。

從文學創作、商業文案的創作能力來看，文心一言與ChatGPT的水平不相上下，可以準確回答「《三體》作者是誰」等問題，能給公司起名、寫slogan、寫新聞稿。

複雜的數理邏輯推算，也不在話下。例如經典的「雞兔同籠」問題，文心一言按步驟算出了正確答案。

據業內人士評估，百度的大語言模型，較ChatGPT可實現整體持平，局部超越。

需要指出的是，ChatGPT並未實現底層模型的顯著突破，其最大的創新在於文本內容生成，巧妙地通過交互式對話的方式，基於人類反饋進行強化訓練，在體驗上帶來智能的感覺。

現階段的生成式AI，主要是單模態的，信息處理主要依靠文字。

由單模態智能向多種模態融合方向演進，是文心一言、ChatGPT等生成式AI的一個明確發展方向。

圍繞下一代多模態模型的創新，李彥宏現場展示了文心一言生成圖片、音頻、視頻的能力，甚至還能生成四川話等方言口音，已走向「Chat」之外更大的範疇。

未來文心一言勢必會繼續強化多模態生成能力，技術能否超車，得看這個關鍵落點。

生態護城河

生成式AI領域，能參與的初創公司寥寥無幾。做出ChatGPT的OpenAl，儘管是家創業公司，身後也站著投資100億美元的微軟。

進入門檻高，因為實在太燒錢了。

資料顯示，跑通一次100億以上參數量的模型，算力至少需要1000張GPU卡，按一張GPU五萬元的市場均價計算，1000張GPU意味著單月至少5000萬元的成本。

業界測算，GPT-3單次訓練成本至少需要460萬元，資金消耗速度驚人。

單算力這個維度，就篩掉了一大批入局者。

那麼，憑什麼百度能做？

13年前，對AI的未來滿懷信心的百度，早早開始加碼AI，做馬拉松式、壓強式的投入。

累計下來，近10年的研發投入超1400億元，每年研發占收入比例都超過15%。

在一個高投入見效慢的領域，保持耐心和決心是儲備先發優勢的唯一道路。

十年如一日的日積月累，帶來的是AI人才矩陣、技術水平和數據規模的無短板領先，構築起生態護城河。

作為全棧自研AI技術架構的公司，百度在IT四層技術棧，晶片（崑崙芯）、框架（飛槳深度學習框架）、模型（文心大模型）和應用（搜索等），均有深度自研。李彥宏表示，放眼全球，能在四層架構的每一層都有領先產品的公司，幾乎沒有。

這帶來的底氣，是四層技術棧可實現端到端優化，尤其是框架層和模型層之間，具有強協同性，能幫助構建更高效的模型，顯著降低成本。

其中，文心一言所處的模型層，市面上主流的大模型僅由幾家科技巨頭以及少數研究機構掌握，初創公司只能依靠開源模型，進行應用創新。

百度首席技術官王海峰介紹，作為新一代知識增強大語言模型，文心一言在ERNIE及PLATO系列模型的基礎上研發，關鍵技術，包括監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。

前三項是這類大語言模型普遍採用的技術，文心一言做了進一步強化和打磨；後三項是百度已有技術優勢的再創新，也是文心一言未來越來越強大的基礎。

多年自研，大量投資，形成的產品反應速度是一般廠商很難快速跟進的。

去年9月，李彥宏給出判斷，無論是在技術層面還是在商業應用層面，人工智慧都有了巨大的進展，有些甚至是方向性的改變。

有觀點推測，或從那時開始，百度就在做文心一言的開發。

無法低估的價值

正式測試前，官宣與文心一言達成合作的企業，已超過650家，遍布網際網路、媒體、金融等行業。

他們將優先內測試用文心一言，在百度技術團隊協助下，打造聯合解決方案，先一步探索AI+的新範式。

產品還沒見著影子，「朋友圈」就提前搭好了。市場對內容生產智能化的火熱態度，可見一斑。

看到文心一言正式測試的消息，一位剛升級做爸爸的網友，很興奮地留言，「給孩子取名字的事，可以委託文心一言來幫忙了！」

寫劇本、敲代碼、給孩子取名……人們不必苦於智能語音助手的傻瓜式回答，聊天機器人的到來，開啟的是一個以人為本的數字智能時代。

北京師範大學教授、教育部特聘教授喻國明認為，以文心一言、ChatGPT為代表的新一代智能互聯技術，是對人類的又一次重大賦能賦權。

「它突破了不同人群在資源使用與整合方面的能力差異，使每個人至少在理論上可以用一種社會平均線之上的語義表達和資源動員能力，進行社會性的內容生產和對話。」喻國明表示。

相較C端，新生產力工具對千行百業的賦能、提效，更是指數級的。

李彥宏預測，大語言模型將為雲計算、行業模型精調和基於大模型的應用服務，帶來巨大的產業機會，尤其在應用層面，會有更多殺手級應用、現象級產品出現。

拿AI客服來舉例，目前在各領域應用廣泛的智能客服，經常會出現答非所問、回答死循環的問題，被吐槽「聽不懂人話」。

若能用上文心一言的技術能力，快速推理用戶的提問邏輯，不僅能提高解決問題的效率，還能賦予人性化的溝通體驗，建立情感連接。

開放文心一言大模型，幫有需要的企業離客戶更近，創造更大的商業價值，在這方面百度想得很清楚。

公司明確多次表態，未來支持更多企業構建自己的模型和應用，賦能交通、能源、製造等實體經濟領域，實現生產效率的大幅提升。

新聞發布會當天，百度宣布，百度智能雲將面向企業客戶開放文心一言API接口調用服務，搜索「百度智能雲」進入官網，即可申請接入並體驗文心一言能力。

李彥宏透露，百度智能雲接下來會有重要動作宣布，主題圍繞文心一言的雲服務和應用產品，既有公有雲服務和也可以做私有化部署。

「我們相信，人工智慧會徹底改變我們今天的每一個行業。AI的長期價值，對各行各業的顛覆性改變，才剛剛開始。」李彥宏說。