【e公司觀察】BAT大模型全部官宣跨過基準線下一步錨點在於「上天入地」

由證券時報e公司發佈 2023-11-03T12:34:54.871693+00:00

截至10月31日，BAT三大廠的大模型，均已明確至少突破了GPT3.5的基準線。經過7個月左右的歷練，以及多輪升級疊代，意味著國產通用大模型都已迎來標誌性時刻。最先發出超越信號的是百度。7月下旬，百度集團副總裁吳甜就表示，新版本文心一言3.5已超越ChatGPT 3.5。

截至10月31日，BAT三大廠的大模型，均已明確至少突破了GPT3.5的基準線。經過7個月左右的歷練，以及多輪升級疊代，意味著國產通用大模型都已迎來標誌性時刻。

最先發出超越信號的是百度。7月下旬，百度集團副總裁吳甜就表示，新版本文心一言3.5已超越ChatGPT 3.5。在10月下旬舉辦的百度世界大會上，李彥宏正式發布文心大模型4.0，並表示其在理解、生成、邏輯和記憶能力上，綜合能力與GPT-4相比毫不遜色。

隨後向市場宣布超越消息的騰訊。10月前後，混元大模型升級，騰訊官宣其中文能力整體超過GPT3.5。

阿里雲姍姍來遲。在10月31日雲棲大會上，正式發布千億級參數大模型通義千問2.0。通過測評，其綜合性能超過GPT-3.5，正在加速追趕GPT-4。

BAT三大廠之所以出現前述排序，與入局大模型的時間節點、資金投入規模等因素有關；同時還與自身業務屬性、戰略定位和AI需求的迫切性緊密關聯。在三家大廠中，百度是最有AI商業化需求的企業，也是最早入局AI賽道的公司。

除了大廠大模型之外，商湯「商量SenseChat2.0」測評表現均領先ChatGPT，部分已十分接近GPT4的水平；科大訊飛大模型也宣布對標GPT4。這表明，大廠之外，其他AI賽道的頭部公司也在加速競逐。

對於國產大模型的這種拉齊、超越、對標，一方面應該持有肯定和鼓勵態度，背後折射出科技型企業對於先進技術的不斷探索與投入。另一方面也應保持理性，國內大模型雖然通過了GPT3.5「基準線」，但部分「超過」只是基於各自平台和局部的指標，技術層面的全面拉齊還有一些短板要補。

「基準線」突破後，「百模大戰」系統性能力的比拼才剛剛開始。下一步的方向將是加速走出象牙塔，在效果、成本支出、商業化三方面，找尋到平衡點，藉助大模型把生產力推升新台階。從這個角度看，「大而強」只是大模型競逐的一維。

除了技術層面「上天」之外，還需要儘快「入地」。短中期來看，如何實現將大模型與產業化、與萬物應用的無縫連接，將是一個持久功課。而從長期來看，大模型的歸途，不僅是模仿人類，而更是幫人類突破新極限。

雖然目前仍未知國產大模型競逐的終局，但是有一些發展方向已經可以初步確定，包括更加精細化的語言表達能力、更加多模態的應用場景、更加人性化的交互方式等。這個過程面臨著不少挑戰，至少體現在如下方面。

一方面，大模型體積大，訓練難度高，算力要求同步抬升。這需要加速突破整個AI產業鏈條上游科技短板的掣肘。

另一方面，數據規模也是一個大問題。不僅收集、挖掘、篩選、清洗是一個大工程，而且數據的安全和隱私等問題，也需要更好的解決方案。

從後一個維度看，除了軟體類和雲服務類頭部企業在競逐大模型之外，包括聯想、小米等硬體廠商也在湧入大模型，除了以場景化、隱私化、輕量化作為切入點之外，數據安全因素也是重要的立足點。

這給我們帶來的啟示是，在大模型落地的過程中，除非用戶願意把數據給到公有雲，否則數據隱私、安全等挑戰不得不提前考量。

【e公司觀察】BAT大模型全部官宣跨過基準線 下一步錨點在於「上天入地」