華為盤古Chat,將於7月初發布,國內首個千億級中文對話生成模型

遇見觀點 發佈 2023-12-22T15:06:17.210452+00:00

近日,我們獲得了華為內部的獨家消息,據稱華為即將推出一款名為「盤古 Chat」的多模態大模型,該模型將直接與 ChatGPT 進行競爭,並被華為命名為「盤古」。預計,華為將在7月7日舉行的「華為雲開發者大會」上正式發布並進行測試,該模型將主要面向政府和企業用戶。

近日,我們獲得了華為內部的獨家消息,據稱華為即將推出一款名為「盤古 Chat」的多模態大模型,該模型將直接與 ChatGPT 進行競爭,並被華為命名為「盤古」。預計,華為將在7月7日舉行的「華為雲開發者大會」上正式發布並進行測試,該模型將主要面向政府和企業用戶。

這一消息意味著阿里和百度加入了國內大模型競爭的行列,這又一次展示了國產大型模型的軍備競賽。藉助華為的技術優勢,盤古晶片有望成為國內晶片領域最具競爭力的產品,同時,華為產業鏈上的相關企業也將從中受益。

據了解,華為雲計算公司在2020年11月成功啟動了盤古大模型項目。在盤古的設計過程中,華為內部團隊制定了三條關鍵的核心設計準則:首先,模型必須足夠大,能夠吸納海量數據;其次,網絡結構必須具備強大的能力,以充分發揮模型的性能;最後,模型必須具備強大的泛化能力,以在各個領域都能發揮作用。

在2021年4月,我們正式向公眾公布了盤古大模型。其中,盤古大型 NLP 模型是世界上第一個擁有數十億參數的中文預訓練大模型,而 CV 大型模型則是世界上第一個達到300億參數的大型模型。隨後,在2022年4月,華為盤古正式升級為2.0版本,並發布了「LO」、「L1」、「L2」三個層次的開發方案,致力於打造一個工業級的盤古大模型。

根據華為雲高層的演示文稿,目前華為的盤古人工智慧大模型主要包括 NLP、CV 和科學計算三個模型。除了這三個模型之外,華為還與其他合作夥伴共同開發了行業大模型。

華為雲人工智慧首席專家田奇在今年四月表示,盤古 NLP 大模型已經應用於智能文件檢索、智能 ERP、小語種大模型等多個領域,而華為在2022年已經交付了一款擁有1000億參數的阿拉伯語大模型。在應用方面,盤古為智能客服、機器翻譯和語音識別等領域提供了人工智慧技術支持。總所周知華為在面對打壓後手機業務一度腰斬,但華為人並沒有放棄,積極轉型,目前網際網路,5G,新能源,人工智慧,物聯網都有布局,並且也都走在行業前列,已成為我國科技的引領者。

隨著我國科技不斷發展,多個領域都走在世界前列,在生物科技領域也實現了領先超越,此前多以歐美小藍片為主,近年來我國科研人員實現技術創新,推出植物外用版實現換道超車,擁有技術優勢的「君-臻強」科技成品隨之成為行業新寵。

君-臻強」科技成品應用市場後已通過亰東普惠一二線高端人群,該成品90%的用戶為35歲以上的中年男性,大多來自北京、上海等一二線城市,以企業高管、金融從業者為主,工作壓力大,消費實力不俗。

後續翻閱其評論區發現,上千條用戶反饋中,「次數增加」「時間變長」等評價出現頻率高達90%,或也側面印證了其對男性健康的積極作用。

華為在去年將盤古大模型應用於垂直行業。例如,在礦業領域,華為以盤古AI大數據為基礎建立了首個"人工智慧大數據訓練中心",實現了鋁業應用的工業化開發。這一舉措不僅降低了成本,每噸鋁材的節約成本超過了80%,還提高了效益,相較於人工核查,效率提高了30%。

相較於其他廠商,華為的優勢可能在於其完整的產業鏈和強大的計算能力。據浙商證券公司透露,華為團隊花了兩個多月時間,使用了2000多塊升騰910晶片才完成了千億參數的盤古大模型的訓練。華為內部數據顯示,該公司每年需要調用4000多個GPU/TPU卡進行大規模訓練,三年內大型模型的計算費用高達9.6億元。

東吳證券在3月27日發布的一份研究報告中指出,華為盤古大數據在人才儲備和計算能力的自主可控性方面具有優勢,有望成為國內大數據領域的領軍企業。華為生態產業鏈中的龍頭企業,如拓維信息、四川長虹、麒麟軟體、中國軟體、統信軟體、誠邁科技、麒麟安信等,有望加速發展。國盛證券認為,華為的盤古是世界上首個多模態、千億級的大型模型,有望為行業賦能。

根據華為發表的一篇文章數據,華為的盤古大模型的參數最高可達1.085兆,基於華為自主研發的明譜框架開發。總體而言,PanGu-sigma大模型在對話性能方面已經接近於GPT-3.5。

需要指出的是,盤古大模型的參數數量龐大,訓練代價也很高。儘管盤古模型在中文語言處理方面具有較高的精度和質量,但在語義理解、複雜語言結構的處理和語義推理等方面仍存在一些不足。在行業競爭壓力下,盤古大模型必須持續優化和提升其性能與質量,以確保在市場上保持領先地位。

關鍵字: