【e公司觀察】BAT大模型全部官宣跨過基準線 下一步錨點在於「上天入地」

證券時報e公司 發佈 2023-11-03T12:34:54.871693+00:00

截至10月31日,BAT三大廠的大模型,均已明確至少突破了GPT3.5的基準線。經過7個月左右的歷練,以及多輪升級疊代,意味著國產通用大模型都已迎來標誌性時刻。最先發出超越信號的是百度。7月下旬,百度集團副總裁吳甜就表示,新版本文心一言3.5已超越ChatGPT 3.5。

截至10月31日,BAT三大廠的大模型,均已明確至少突破了GPT3.5的基準線。經過7個月左右的歷練,以及多輪升級疊代,意味著國產通用大模型都已迎來標誌性時刻。

最先發出超越信號的是百度。7月下旬,百度集團副總裁吳甜就表示,新版本文心一言3.5已超越ChatGPT 3.5。在10月下旬舉辦的百度世界大會上,李彥宏正式發布文心大模型4.0,並表示其在理解、生成、邏輯和記憶能力上,綜合能力與GPT-4相比毫不遜色。

隨後向市場宣布超越消息的騰訊。10月前後,混元大模型升級,騰訊官宣其中文能力整體超過GPT3.5。

阿里雲姍姍來遲。在10月31日雲棲大會上,正式發布千億級參數大模型通義千問2.0。通過測評,其綜合性能超過GPT-3.5,正在加速追趕GPT-4。

BAT三大廠之所以出現前述排序,與入局大模型的時間節點、資金投入規模等因素有關;同時還與自身業務屬性、戰略定位和AI需求的迫切性緊密關聯。在三家大廠中,百度是最有AI商業化需求的企業,也是最早入局AI賽道的公司。

除了大廠大模型之外,商湯「商量SenseChat2.0」測評表現均領先ChatGPT,部分已十分接近GPT4的水平;科大訊飛大模型也宣布對標GPT4。這表明,大廠之外,其他AI賽道的頭部公司也在加速競逐。

對於國產大模型的這種拉齊、超越、對標,一方面應該持有肯定和鼓勵態度,背後折射出科技型企業對於先進技術的不斷探索與投入。另一方面也應保持理性,國內大模型雖然通過了GPT3.5「基準線」,但部分「超過」只是基於各自平台和局部的指標,技術層面的全面拉齊還有一些短板要補。

「基準線」突破後,「百模大戰」系統性能力的比拼才剛剛開始。下一步的方向將是加速走出象牙塔,在效果、成本支出、商業化三方面,找尋到平衡點,藉助大模型把生產力推升新台階。從這個角度看,「大而強」只是大模型競逐的一維。

除了技術層面「上天」之外,還需要儘快「入地」。短中期來看,如何實現將大模型與產業化、與萬物應用的無縫連接,將是一個持久功課。而從長期來看,大模型的歸途,不僅是模仿人類,而更是幫人類突破新極限。

雖然目前仍未知國產大模型競逐的終局,但是有一些發展方向已經可以初步確定,包括更加精細化的語言表達能力、更加多模態的應用場景、更加人性化的交互方式等。這個過程面臨著不少挑戰,至少體現在如下方面。

一方面,大模型體積大,訓練難度高,算力要求同步抬升。這需要加速突破整個AI產業鏈條上游科技短板的掣肘。

另一方面,數據規模也是一個大問題。不僅收集、挖掘、篩選、清洗是一個大工程,而且數據的安全和隱私等問題,也需要更好的解決方案。

從後一個維度看,除了軟體類和雲服務類頭部企業在競逐大模型之外,包括聯想、小米等硬體廠商也在湧入大模型,除了以場景化、隱私化、輕量化作為切入點之外,數據安全因素也是重要的立足點。

這給我們帶來的啟示是,在大模型落地的過程中,除非用戶願意把數據給到公有雲,否則數據隱私、安全等挑戰不得不提前考量。

關鍵字: