進軍類ChatGPT,成立項目組?騰訊回應

中國基金報 發佈 2024-04-30T23:36:06.264786+00:00

中國基金報記者 郭玟君據36氪職場Bonus報導,騰訊針對類ChatGPT對話式產品已成立「混元助手(HunyuanAide)」項目組,該項目組Owner為張正友,PM分別為俞棟、王迪、劉田,目前該項目有至少7位組長、7位Sponsor。

中國基金報記者 郭玟君

據36氪職場Bonus報導,騰訊針對類ChatGPT對話式產品已成立「混元助手(HunyuanAIde)」項目組,該項目組Owner為張正友,PM分別為俞棟、王迪、劉田,目前該項目有至少7位組長、7位Sponsor。《中國基金報》獲得騰訊方面官方回應:在相關方面早有布局。

對話式產品早有布局專項研究有序推進

騰訊方面表示,目前,騰訊在相關方向上已有布局,專項研究也在有序推進。騰訊持續投入AI等前沿技術的研發,基於此前在AI大模型、機器學習算法以及NLP等領域的技術儲備,將進一步開展前沿研究及應用探索。

報導稱,該項目組將聯合騰訊內部多方團隊,構建大參數語言模型,目標是通過性能穩定的強化學習算法訓練,完善騰訊智能助手工具,打造「騰訊智能大助手」,並成為國內的業界標杆。該項目組旨在通過性能穩定的強化學習算法訓練,完善騰訊智能助手工具。

據報導,混元助手項目組的一號位張正友是騰訊史上最高職級擁有者,早年曾在微軟研究院就職,帶領視覺團隊從事大量學術研究,貢獻頗豐。張正友於2018年加入騰訊,創建了騰訊機器人實驗室RoboticsX,致力推進人機協作的下一代機器人研究。2021年1月8日,騰訊宣布張正友成為騰訊首位17級研究員/傑出科學家。

「混元AI大模型」4月首次發布

據了解,混元AI大模型(下文簡稱「HunYuan」)是騰訊早前就已經在研發的人工智慧技術。

2022年4月,騰訊首次對外披露HunYuan研發進展。HunYuan集CV(計算機視覺)、NLP(自然語言理解)、多模態理解能力於一體,先後在MSR-VTT,MSVD等五大權威數據集榜單中登頂,實現跨模態領域的大滿貫。2022年5月,更是CLUE(中文語言理解評測集合)三個榜單同時登頂,一舉打破三項紀錄。

隨著AI技術不斷發展,AI大模型(又稱預訓練模型)逐漸成為產業中最火熱的技術名詞。

預訓練模型是指預先訓練好,具有相對通用性的「一套算法」,具有「巨量數據、巨量算力、巨量模型」等特性。大模型通過學習樣本數據的內在規律和表達層次,進化出接近、超越人類的智能程度,具備分析推理能力,能夠識別文字、圖像和聲音。

2022年12月,HunYuan又迎來全新進展,推出國內首個低成本、可落地的NLP萬億大模型,並再次登頂自然語言理解任務榜單CLUE。

「混元AI大模型」已在騰訊多個核心業務場景落地

預訓練的提出使得人工智慧進入全新的時代,引發了學術界和工業界的研究熱潮。

隨著算力的發展,模型容量持續提升,模型通用性和泛化能力也更強,研究大模型成為了近兩年的趨勢。國內外頭部科技公司均有布局,發布了若干千億規模以上的大模型。

然而,面對參數量進一步擴大,業界並沒有在高速網絡、訓練/推理框架、模型算法和落地應用等方面有全面深入的公開性研究。

基於騰訊強大的底層算力和低成本高速網絡基礎設施,HunYuan依託騰訊領先的太極機器學習平台,推出了HunYuan-NLP1T大模型並登頂國內最權威的自然語言理解任務榜單CLUE。

該模型作為業界首個可在工業界海量業務場景直接落地應用的萬億NLP大模型,先後在熱啟動和課程學習、MoE路由算法、模型結構、訓練加速等方面研究優化,大幅降低了萬億大模型的訓練成本。

用千億模型熱啟動,最快僅用256卡在一天內即可完成萬億參數大模型HunYuan-NLP 1T的訓練,整體訓練成本僅為直接冷啟動訓練萬億模型的1/8。

此外,業界基於萬億大模型的應用探索極少,對此騰訊研發了業界首個支持萬億級MoE預訓練模型應用的分布式推理和模型壓縮套件「太極-HCF ToolKit」,實現了無需事先從大模型蒸餾為中小模型進而推理,即可使用低成本的分布式推理組件/服務直接進行原始大模型推理部署,充分發揮了超大預訓練模型帶來的模型理解和生成能力的躍升。

目前HunYuan-NLP 1T大模型已在騰訊多個核心業務場景落地,並帶來了顯著的效果提升。

HunYuan協同了騰訊預訓練研發力量,旨在打造業界領先的AI預訓練大模型和解決方案,以統一的平台,實現技術復用和業務降本,支持更多的場景和應用。當前HunYuan完整覆蓋NLP大模型、CV大模型、多模態大模型、文生圖大模型及眾多行業/領域任務模型。

HunYuan先後支持了包括微信、QQ、遊戲、騰訊廣告、騰訊雲等眾多產品和業務,通過NLP、CV、跨模態等AI大模型,不僅為業務創造了增量價值而且降低了使用成本。特別是其在廣告內容理解、行業特徵挖掘、文案創意生成等方面的應用,在為騰訊廣告帶來大幅GMV提升的同時,也初步驗證了大模型的商業化潛力。

以下是HunYuan在對話生成和小說續寫等場景下的案例。

對話生成:

小說生成:

廣告文案生成:

廣告文案衍生:

論文生成:

編輯:艦長

審核:木魚

關鍵字: