張勇帶隊，阿里朝大模型開了一槍 - 21世紀商業評論

記者丨何己派鄢子為編輯丨鄢子為

「所有產品都值得用大模型重做一遍。」台上的張勇，語氣篤定。

4月11日的阿里雲峰會，張勇來了，一起亮相的，還有他的新身份。

這是他兼任阿里雲智能集團CEO的第15天。

40分鐘的演講，張勇反覆提及「人工智慧」這個關鍵詞。

他透露，阿里巴巴所有產品未來將接入「通義千問」大模型，進行全面改造。

業務重塑，阿里雲打響關鍵的一槍。

高調參戰

人實在太多了。

可容納幾千人的會場，幾乎沒有空位。張勇演講的半途，工作人員不得不臨時增加了幾列座椅。

所有人關注的重頭戲，是阿里大模型的進展。

幾日前，阿里突然上線「通義千問」，與ChatGPT類似，它是達摩院自研的超大規模語言模型，能回答問題、創作文字，表達觀點、撰寫代碼。

《21CBR》記者使用邀請碼，體驗了多輪對話。

在功能上，它能生成散文、故事、文案等各種類型文本，做簡單的數學題，也能編寫代碼。此外，對「雞娃」等中文語境的詞句，也有不錯的理解。

阿里雲智能CTO周靖人特別提到，通義千問還具備多語言能力，可以使用英語、法語等語言進行交流。

不過，它並不支持文生圖、圖生文等多模態功能。

對記者「是否能生成圖像」的提問，通義千問的回答列舉了OpenAI的GPT-3、DALL-E等工具，表示自己並不具備這個能力，「只能提供算法和模型，不能直接生成圖像。」

不同於百度、360在現場演示對話，通義千問主要以周靖人的PPT展示+三個視頻介紹來展現具體功能。

現階段，該模型主要定向邀請企業用戶測試，尚未向公眾開放。

一位行業人士向《21CBR》記者分析稱，阿里雲沒有直接推C端產品，而是先從企業級別開始，在於企業更容易接受新技術，且企業級別的應用場景更複雜，需要更高級別的技術支持。

在深度科技研究院院長張孝榮看來，阿里採取了謹慎務實的策略。

「GPT模型最先進，但出現不少bug。阿里雲大模型技術完善度有限，面向企業市場測試，在輿論層面比面向大眾安全，阿里雲也可提早定位潛在客戶。」

中間形態

負責研發疊代大模型的，是周靖人團隊。

周在微軟工作多年，於2016年加入阿里，曾負責阿里雲、淘寶和支付寶的搜索、推薦等業務。

周靖人表示，不是來湊熱鬧。「我們在這方面一直在積累，是國內最早探索大模型方向的公司之一。」

在他眼裡，「通義千問」是一個中間態產品。「千問是我們既定路線上的一個節點。」

換言之，在阿里，這是一個承上啟下、持續發展的大模型。

要訓練出GPT-3.5這樣的大模型，至少需要1萬張英偉達A100的晶片集群，光硬體投入就需要20億元。

只有大廠，才擁有這個硬體實力。

近日傳出的一份交流紀要里，阿里雲AI專家提到，阿里雲在雲上就有上萬片的A100，整體能夠達到10萬片，集團體量應該是阿里雲的5倍。

大規模應用，成本也高。「ChatGPT完成一個推理任務，需要5張A100在2秒鐘之內做一次推理。」上述AI專家提到。

數據方面，阿里在電商、搜索、辦公領域，有相應積累。算法方面，達摩院在NLP領域深耕多年，較早就確定了多模態方向。

達摩院於2019年啟動大模型研發，2021年4月，發布語言大模型「PLUG」；2021年10月，訓練出多模態M6大模型，參數規模10萬億。2022年9月，阿里發布「通義」大模型；今年4月，通義千問發布。

國盛證券分析師劉高暢測評後指出，通義千問具備基礎常識與初步的邏輯思考能力，有代碼書寫能力，但在複雜理科計算方面仍有提升空間。

「當前未能達到GPT4的水平，但處於國內領軍水平。」他評論道。

周靖人也承認，「GPT4，目前是非常領先的。」

阿里將在多模態大模型的路徑上繼續探索。

「難的是把各個模態的模型能力融入進一個模型，比如怎麼把視覺能力融入到語言模型裡面。」

周靖人表示，就像大腦可以把視覺、語言、聽覺等不同形式的輸入聯合在一起。

他還期待，企業能把通義千問作為底座，在上面進行額外的開發，走進各行各業的場景里去。

走向產業

去年底，張勇親自接管阿里雲。他對大模型的重視，非同一般。

有消息稱，張勇儘管忙著重組集團業務部門，但會親自盯阿里雲的AI項目。

他格外關注AI與場景的結合落地。

2月底的財報電話會議上，張勇提到，「最重要的，不是大家擁有了一個對話式的機器人，而是如何將它融合在各自的業務場景中。」

未來，阿里巴巴所有產品都將接入大模型，率先接入測試的釘釘、天貓精靈，將在評估認證後正式發布新功能。

釘釘能實現自動寫工作方案、生成應用等功能，天貓精靈接入通義千問後，回答水平提升。

淘寶天貓的電商業務，也有大量場景適合大模型切入。例如，以文搜圖、智能客服、賣點文案生成等。

接下來，通義千問將嵌入阿里電商、搜索、導航、文娛等場景。

AI大模型的商業落地，還在於開放API接口，按調用次數收費，這也是國外主流的商業模式。

「未來所有軟體都值得接入大模型升級改造，我們將開放通義千問的能力，為每家企業打造自己的專屬大模型。」周靖人表示，每個企業都可以有自己的智能客服、文案助手、AI設計師等。

前景美好，挑戰也多。

大模型開發和訓練一次的成本，介於200萬美元至1200萬美元之間，相當昂貴。

剛經歷拆分的阿里，各業務單元獨立經營、自負盈虧，大模型相關的成本開支，壓力不小。

行業來看，距離普惠化、規模化應用，大模型還需要走很長一段路。

天使投資人、網際網路專家郭濤向《21CBR》記者表示，「AI大模型產業尚處於早期探索階段，存在關鍵核心技術發展不成熟、算法模型不完善、訓練數據缺乏及偏差、產業生態體系不健全等突出問題。」

問題多，機會更多。

張勇認為，智能化時代，大家都站在同一條起跑線上。