張勇帶隊,阿里朝大模型開了一槍

21世紀商業評論 發佈 2024-01-19T18:25:26.425548+00:00

4月11日的阿里雲峰會,張勇來了,一起亮相的,還有他的新身份。幾日前,阿里突然上線「通義千問」,與ChatGPT類似,它是達摩院自研的超大規模語言模型,能回答問題、創作文字,表達觀點、撰寫代碼。




記者丨何己派 鄢子為 編輯丨鄢子為


「所有產品都值得用大模型重做一遍。」台上的張勇,語氣篤定。


4月11日的阿里雲峰會,張勇來了,一起亮相的,還有他的新身份。


這是他兼任阿里雲智能集團CEO的第15天。



40分鐘的演講,張勇反覆提及「人工智慧」這個關鍵詞。


他透露,阿里巴巴所有產品未來將接入「通義千問」大模型,進行全面改造。


業務重塑,阿里雲打響關鍵的一槍。



高調參戰



人實在太多了。


可容納幾千人的會場,幾乎沒有空位。張勇演講的半途,工作人員不得不臨時增加了幾列座椅。


所有人關注的重頭戲,是阿里大模型的進展。


幾日前,阿里突然上線「通義千問」,與ChatGPT類似,它是達摩院自研的超大規模語言模型,能回答問題、創作文字,表達觀點、撰寫代碼。


《21CBR》記者使用邀請碼,體驗了多輪對話。


在功能上,它能生成散文、故事、文案等各種類型文本,做簡單的數學題,也能編寫代碼。此外,對「雞娃」等中文語境的詞句,也有不錯的理解。



阿里雲智能CTO周靖人特別提到,通義千問還具備多語言能力,可以使用英語、法語等語言進行交流。


不過,它並不支持文生圖、圖生文等多模態功能


對記者「是否能生成圖像」的提問,通義千問的回答列舉了OpenAI的GPT-3、DALL-E等工具,表示自己並不具備這個能力,「只能提供算法和模型,不能直接生成圖像。」



不同於百度、360在現場演示對話,通義千問主要以周靖人的PPT展示+三個視頻介紹來展現具體功能。


現階段,該模型主要定向邀請企業用戶測試,尚未向公眾開放。


一位行業人士向《21CBR》記者分析稱,阿里雲沒有直接推C端產品,而是先從企業級別開始,在於企業更容易接受新技術,且企業級別的應用場景更複雜,需要更高級別的技術支持。



在深度科技研究院院長張孝榮看來,阿里採取了謹慎務實的策略。


「GPT模型最先進,但出現不少bug。阿里雲大模型技術完善度有限,面向企業市場測試,在輿論層面比面向大眾安全,阿里雲也可提早定位潛在客戶。」



中間形態



負責研發疊代大模型的,是周靖人團隊。


周在微軟工作多年,於2016年加入阿里,曾負責阿里雲、淘寶和支付寶的搜索、推薦等業務。


周靖人表示,不是來湊熱鬧。「我們在這方面一直在積累,是國內最早探索大模型方向的公司之一。」


在他眼裡,「通義千問」是一個中間態產品。「千問是我們既定路線上的一個節點。」



換言之,在阿里,這是一個承上啟下、持續發展的大模型。


要訓練出GPT-3.5這樣的大模型,至少需要1萬張英偉達A100的晶片集群,光硬體投入就需要20億元


只有大廠,才擁有這個硬體實力。


近日傳出的一份交流紀要里,阿里雲AI專家提到,阿里雲在雲上就有上萬片的A100,整體能夠達到10萬片,集團體量應該是阿里雲的5倍。


大規模應用,成本也高。「ChatGPT完成一個推理任務,需要5張A100在2秒鐘之內做一次推理。」上述AI專家提到。


數據方面,阿里在電商、搜索、辦公領域,有相應積累。算法方面,達摩院在NLP領域深耕多年,較早就確定了多模態方向。


達摩院於2019年啟動大模型研發,2021年4月,發布語言大模型「PLUG」;2021年10月,訓練出多模態M6大模型,參數規模10萬億。2022年9月,阿里發布「通義」大模型;今年4月,通義千問發布。


國盛證券分析師劉高暢測評後指出,通義千問具備基礎常識與初步的邏輯思考能力,有代碼書寫能力,但在複雜理科計算方面仍有提升空間


「當前未能達到GPT4的水平,但處於國內領軍水平。」他評論道。


周靖人也承認,「GPT4,目前是非常領先的。」



阿里將在多模態大模型的路徑上繼續探索。


「難的是把各個模態的模型能力融入進一個模型,比如怎麼把視覺能力融入到語言模型裡面。」


周靖人表示,就像大腦可以把視覺、語言、聽覺等不同形式的輸入聯合在一起。


他還期待,企業能把通義千問作為底座,在上面進行額外的開發,走進各行各業的場景里去。



走向產業



去年底,張勇親自接管阿里雲。他對大模型的重視,非同一般。


有消息稱,張勇儘管忙著重組集團業務部門,但會親自盯阿里雲的AI項目。


他格外關注AI與場景的結合落地。



2月底的財報電話會議上,張勇提到,「最重要的,不是大家擁有了一個對話式的機器人,而是如何將它融合在各自的業務場景中。」


未來,阿里巴巴所有產品都將接入大模型,率先接入測試的釘釘、天貓精靈,將在評估認證後正式發布新功能。



釘釘能實現自動寫工作方案、生成應用等功能,天貓精靈接入通義千問後,回答水平提升。


淘寶天貓的電商業務,也有大量場景適合大模型切入。例如,以文搜圖、智能客服、賣點文案生成等。


接下來,通義千問將嵌入阿里電商、搜索、導航、文娛等場景。


AI大模型的商業落地,還在於開放API接口,按調用次數收費,這也是國外主流的商業模式。


「未來所有軟體都值得接入大模型升級改造,我們將開放通義千問的能力,為每家企業打造自己的專屬大模型。」周靖人表示,每個企業都可以有自己的智能客服、文案助手、AI設計師等。



前景美好,挑戰也多。


大模型開發和訓練一次的成本,介於200萬美元至1200萬美元之間,相當昂貴。


剛經歷拆分的阿里,各業務單元獨立經營、自負盈虧,大模型相關的成本開支,壓力不小。


行業來看,距離普惠化、規模化應用,大模型還需要走很長一段路。


天使投資人、網際網路專家郭濤向《21CBR》記者表示,「AI大模型產業尚處於早期探索階段,存在關鍵核心技術發展不成熟、算法模型不完善、訓練數據缺乏及偏差、產業生態體系不健全等突出問題。」


問題多,機會更多。


張勇認為,智能化時代,大家都站在同一條起跑線上。

關鍵字: