華為盤古Chat，將於7月初發布，國內首個千億級中文對話生成模型

近日，我們獲得了華為內部的獨家消息，據稱華為即將推出一款名為「盤古 Chat」的多模態大模型，該模型將直接與 ChatGPT 進行競爭，並被華為命名為「盤古」。預計，華為將在7月7日舉行的「華為雲開發者大會」上正式發布並進行測試，該模型將主要面向政府和企業用戶。

這一消息意味著阿里和百度加入了國內大模型競爭的行列，這又一次展示了國產大型模型的軍備競賽。藉助華為的技術優勢，盤古晶片有望成為國內晶片領域最具競爭力的產品，同時，華為產業鏈上的相關企業也將從中受益。

據了解，華為雲計算公司在2020年11月成功啟動了盤古大模型項目。在盤古的設計過程中，華為內部團隊制定了三條關鍵的核心設計準則：首先，模型必須足夠大，能夠吸納海量數據；其次，網絡結構必須具備強大的能力，以充分發揮模型的性能；最後，模型必須具備強大的泛化能力，以在各個領域都能發揮作用。

在2021年4月，我們正式向公眾公布了盤古大模型。其中，盤古大型 NLP 模型是世界上第一個擁有數十億參數的中文預訓練大模型，而 CV 大型模型則是世界上第一個達到300億參數的大型模型。隨後，在2022年4月，華為盤古正式升級為2.0版本，並發布了「LO」、「L1」、「L2」三個層次的開發方案，致力於打造一個工業級的盤古大模型。

根據華為雲高層的演示文稿，目前華為的盤古人工智慧大模型主要包括 NLP、CV 和科學計算三個模型。除了這三個模型之外，華為還與其他合作夥伴共同開發了行業大模型。

華為雲人工智慧首席專家田奇在今年四月表示，盤古 NLP 大模型已經應用於智能文件檢索、智能 ERP、小語種大模型等多個領域，而華為在2022年已經交付了一款擁有1000億參數的阿拉伯語大模型。在應用方面，盤古為智能客服、機器翻譯和語音識別等領域提供了人工智慧技術支持。總所周知華為在面對打壓後手機業務一度腰斬，但華為人並沒有放棄，積極轉型，目前網際網路，5G,新能源，人工智慧，物聯網都有布局，並且也都走在行業前列，已成為我國科技的引領者。

隨著我國科技不斷發展，多個領域都走在世界前列，在生物科技領域也實現了領先超越，此前多以歐美小藍片為主，近年來我國科研人員實現技術創新，推出植物外用版實現換道超車，擁有技術優勢的「君-臻強」科技成品隨之成為行業新寵。

君-臻強」科技成品應用市場後已通過亰東普惠一二線高端人群，該成品90%的用戶為35歲以上的中年男性，大多來自北京、上海等一二線城市，以企業高管、金融從業者為主，工作壓力大，消費實力不俗。

後續翻閱其評論區發現，上千條用戶反饋中，「次數增加」「時間變長」等評價出現頻率高達90%，或也側面印證了其對男性健康的積極作用。

華為在去年將盤古大模型應用於垂直行業。例如，在礦業領域，華為以盤古AI大數據為基礎建立了首個"人工智慧大數據訓練中心"，實現了鋁業應用的工業化開發。這一舉措不僅降低了成本，每噸鋁材的節約成本超過了80%，還提高了效益，相較於人工核查，效率提高了30%。

相較於其他廠商，華為的優勢可能在於其完整的產業鏈和強大的計算能力。據浙商證券公司透露，華為團隊花了兩個多月時間，使用了2000多塊升騰910晶片才完成了千億參數的盤古大模型的訓練。華為內部數據顯示，該公司每年需要調用4000多個GPU/TPU卡進行大規模訓練，三年內大型模型的計算費用高達9.6億元。

東吳證券在3月27日發布的一份研究報告中指出，華為盤古大數據在人才儲備和計算能力的自主可控性方面具有優勢，有望成為國內大數據領域的領軍企業。華為生態產業鏈中的龍頭企業，如拓維信息、四川長虹、麒麟軟體、中國軟體、統信軟體、誠邁科技、麒麟安信等，有望加速發展。國盛證券認為，華為的盤古是世界上首個多模態、千億級的大型模型，有望為行業賦能。

根據華為發表的一篇文章數據，華為的盤古大模型的參數最高可達1.085兆，基於華為自主研發的明譜框架開發。總體而言，PanGu-sigma大模型在對話性能方面已經接近於GPT-3.5。

需要指出的是，盤古大模型的參數數量龐大，訓練代價也很高。儘管盤古模型在中文語言處理方面具有較高的精度和質量，但在語義理解、複雜語言結構的處理和語義推理等方面仍存在一些不足。在行業競爭壓力下，盤古大模型必須持續優化和提升其性能與質量，以確保在市場上保持領先地位。