虛擬數字人廠商內卷元宇宙

劉曠 發佈 2022-12-08T22:44:59.489673+00:00

一直以來,「虛擬數字人」都被視為另一個更大的概念「元宇宙」的重要組成部分,而受到廣泛關注。而且,在元宇宙被某些廠商不時拿出來翻炒的時候,虛擬數字人的應用其實是走在前列的,發展至今虛擬數字人從設計、製作到落地應用的體系逐漸完整。

一直以來,「虛擬數字人」都被視為另一個更大的概念「元宇宙」的重要組成部分,而受到廣泛關注。而且,在元宇宙被某些廠商不時拿出來翻炒的時候,虛擬數字人的應用其實是走在前列的,發展至今虛擬數字人從設計、製作到落地應用的體系逐漸完整。技術的進步和內容的創新催生出了不同的商業模式,使得虛擬數字人產業進入了商業化加速的階段。

但這種「超前」並不是無限的,至少在商業化面對的對象層面,虛擬數字人還「止步於」B端。虛擬數字人在C端缺少應用空間和變現方式的現狀,使得虛擬數字人廠商的競爭主要在B端集中進行。

集中在B端的需求

從已有的商業模式出發,虛擬數字人大致能夠分為IP型和非IP型,虛擬數字人廠商基本圍繞這兩個概念進行生產經營活動。

其中IP型按照企業具體需求和變現模式,又能分為MCN機構和娛樂公司定製的虛擬KOL和虛擬偶像、品牌定製的品牌類虛擬人和真人明星為原型的孿生類虛擬人,其主要依靠粉絲經濟創造效益,是短期內變現效率最高的一大類別。

非IP型作為功能性場景應用,主要以服務為主,單體產生經濟效益不及前者,但它作為虛擬空間的基礎要素,潛藏規模極為龐大。而能夠比較穩定產出的商業類虛擬數字人,又可以分為基礎服務型和身份型兩類。其中前者正在持續滲透,未來可能會代替APP和UI界面的功能;而後者類比微信號、手機號、郵箱等與用戶強綁定的主體延伸。

和大多基於網際網路的應用,最先在C端發展出商業模式不同,虛擬數字人的商業化首先在B端開展。這是因為當下需求主要集中在B端,而B端需求主要集中在IP型虛擬數字人領域——這是由IP型虛擬數字人作為一種符號的穩定性和高可塑性所決定的。

而非IP型虛擬數字人則受限於性能(形象、交互能力等)和成本,還不足以普及開來;以身份型虛擬數字人為主要目標的普通消費者也缺乏應用土壤,雖然目前已經有一些號稱落地的「元宇宙應用」,但實際使用起來依舊達不到其應有的標準,目前看來倒是占坑位的意義更大一些。

從規模和商業空間的角度來講,當然是非IP型虛擬數字人更加廣闊,但現實是IP型虛擬數字人的應用因為需求的短期聚集,和對成本的高度容忍而走在了非IP型虛擬數字人之前。

虛擬數字人雖然在表現形式上因為直觀而顯得簡單,但想要實現一個形象的從無到有,其實是比較複雜的。具體來說:中游運營廠商會根據需求進行形象設計,然後遞交上游技術廠商,經過涉及建模、渲染、動捕、面捕等技術的製作過程交付成品,再對接下游應用方的企業。

在這個流程中,根據類型的不同,虛擬人的製作成本從幾十萬到幾百萬不等,製作周期從15天到3-4個月不等,例如製作難度較低、周期較短的二次元類型虛擬形象成本就在10-15萬元區間;而後續的運營成本則由運營物料的製作費用和周期決定,一般超寫實虛擬人的視頻製作成本在8000-15000元/秒,也就是說,一個短視頻就要花費十幾萬元。

同時,複雜的製作流程、高昂的製作成本以及無限的後續運營,也決定了沒有核心技術和商業模式的虛擬數字人廠商的生命周期可能非常短暫。因此,這就意味著面向B端的虛擬數字人廠商的關鍵詞在於技術路線和商業模式——並由此延伸出虛擬數字人的兩條路徑。

讓虛擬數字人「活」起來

從虛擬人創造的收益在產業鏈中的分配來看,其中大約60%都被作為技術方參與的虛擬數字人廠商拿走了。按照技術路線的不同,技術型虛擬數字人廠商(簡稱「技術型廠商」)的能力有所偏向,因而擅長的虛擬數字人類型也不同,具體來說,能夠總結出三種被驗證了的商業模式。

第一種是通過建模和渲染等技術,收取虛擬數字人及其相關場景的一次性製作費用。幾乎所有的技術型廠商都有所涉及,可以說這是技術型廠商的基礎能力。但有一些專精軟體方面的技術型廠商,如相芯科技、疊鏡數字、虛谷未來等,聚焦在了虛擬數字人的生成環節,擁有以較快速度生成虛擬數字形象的能力。

第二種是通過動作捕捉、面部捕捉和人工智慧技術,收取虛擬數字人使用期間的技術授權費用。動捕和面捕玩家,主要脫胎於影視行業,在多年特效製作的磨練下,工業流程較為成熟,行業集中度也比較高。走這種技術路線的技術型廠商,基本上都需要大量硬體設備和相應的影棚環境,相關的企業有青瞳視覺、凌雲光等,它們或是出租設備和場地,或是承接動捕和面捕服務。

與此同時,隨著識別算法的進步,目前已經能夠利用手機攝像頭進行基本的動作捕捉,雖然精度的確不高,但極大地降低了虛擬數字人的准入門檻,為一些個人勢(未與機構簽約)的虛擬偶像提供了便利。

而在人工智慧技術方面,許多AI廠商如商湯、曠世、科大訊飛等,它們在虛擬數字人賽道表現出來的能力,普遍是對人工智慧技術的包裝和應用。例如商湯的SenseMARS Avatar就能從照片或視頻中,生成不同風格的虛擬形象;科大訊飛的虛擬數字人業務則是自身以語音為核心的AI技術的延伸,能夠實現「面對面」交互——前者收取使用費用或授權費用;後者則以定製為主。

第三種是通過打造聚合的技術平台、元宇宙平台,收取平台使用費用。這種平台式的商業模式,主要是網際網路大廠在做。一方面,相較於技術單一型的廠商,虛擬數字人的技術和應用與網際網路的關係最為緊密,無論此時是以B端為主,還是以後元宇宙在C端全面滲透,都能夠通過打造平台來實現各個環節的降本增效。

另一方面,這種平台與網際網路廠商自身的業務結合後,更有可能發展成為「真正意義上的」元宇宙,先天快他人一步。最經典的案例就是百度推出的希壤,它一邊面向B端,收取平台入駐費用,一邊面向C端,收取增值服務費用。

總結起來,三種商業模式實際上是依次遞進的。首先,建模和渲染在「靜」的層面給予虛擬數字人最初的形象;其次,動捕、面捕以及人工智慧技術賦予的交互能力則在「動」的層面讓虛擬數字人能夠使人代入、共情;最後,以元宇宙為內涵的平台的出現使虛擬數字人「活」了起來。

像真人一樣去運營虛擬數字人

在虛擬數字人產業鏈中,與技術型廠商相比,主要以內容產出為主的運營型虛擬數字人廠商(簡稱「運營型廠商」)的商業模式就顯得更加「傳統」,因為其中參與者多是MCN、娛樂公司和營銷公司。

對於虛擬數字人來說,技術是其成立的前提,但在元宇宙平台還沒有真正實現之前,如何「活過來」成為虛擬社會的一份子,是運營型廠商的責任。但需要注意的是,目前運營型廠商的商業空間主要集中在IP型虛擬數字人範疇內。

運營型廠商將虛擬數字人視作媒介。虛擬數字人的形象、性格、人設都是可操作的,運營型廠商通過調整這些社會意義上的參數,來塑造一個個與眾不同的形象,並通過運營中的種種技巧來使它「表現得與真人無二」,能夠被受眾接納,進而增加變現的可能性,使商業模式得以閉環。

因此,運營型廠商的核心業務是虛擬數字人IP及數字資產運營。以次世文化為例,它是定位於面向B端客戶,提供虛擬數字人IP形象設計、製作到運營的全鏈條服務的綜合型數字人技術服務商,其業務可以根據虛擬數字人IP的所有權分為自主運營以及代理運營。

關於自主運營,次世文化推出了國風超寫實虛擬KOL「翎Ling」。她在設定上是「一個熱愛國風文化的跨次元女孩兒」,因此其靜態表現如微博、動態表現如抖音中顯示出來的形象,或多或少都包含著國風元素。

從運營角度來講,這極大地凸顯了虛擬數字人的穩定性和受制於成本和製作周期的極高運營難度。一方面,真人很難像這樣嚴地苛時刻保持穩定的人設;但另一方面,虛擬數字人運營所需的高昂製作成本、超長製作周期,使得「翎Ling」只能在微博上保持4-5更/月的速度,抖音最近更是只在有商單合作時才進行更新,這一點就比不上真人KOL的生產力了。

關於代理運營,次世文化在明星的孿生虛擬人方面,與迪麗熱巴聯合推出了「迪麗冷巴」,與黃子韜聯合推出了「韜斯曼」,將明星的孿生虛擬人放進遊戲和漫畫多種媒介中,並基於此開發了明星的孿生虛擬人的實體衍生品。在商業模式上,明星孿生虛擬人的B端C端界限分明,次世文化能夠直接從收益中按比例分成。

在品牌數字資產定製方面,次世文化能夠基於品牌調性,設計不同風格形象、不同人設特點的虛擬數字人。例如次世文化通過全流程合作方式,為I Do、花西子等十個品牌打造數字資產,顯示出非常強的量產IP能力。

但從次世文化的表現中,可以發現問題有二:一是運營型廠商在變現方式上缺乏足夠的想像力,因為其運營模式與真人網紅沒有本質差別,所以其商業模式還是品牌代言、直播帶貨和IP衍生這「老三樣」;二是運營型廠商不擅技術,其虛擬數字人製作需要外部技術支持,例如「翎Ling」就是次世文化與技術型廠商魔琺科技共同打造的——它沒有能力獨自完成。

歸根結底,運營型廠商在產業鏈中的定位類似於「中介」。它們之所以能提供「全產業鏈的服務」,是因為一方面連接著上游的技術型廠商,隨時能夠獲得技術支持,另一方面連接著下游的應用企業,隨時能夠獲得相關需求,並基於自身對娛樂內容的理解把握兩端平衡。

全棧化成大趨勢

從元宇宙的角度來看,各種生活方式和場景,都能在元宇宙中鏡像式地生成出來。這就意味著,一方面每個用戶都需要獨屬於自己的虛擬數字人;另一方面也需要數量更加龐大的非IP型虛擬數字人提供各種基礎服務。也正是因此,元宇宙中潛在的需求正在要求現實中的廠商能夠快速批量地生產非IP型虛擬數字人。

虛擬數字人的外觀可以依靠建模、渲染進行合成,但是其表現出來的行為和感染力,就需要人工智慧技術來實現。就目前情況而言,AI技術決定了虛擬數字人的「仿真能力」。例如自然語言處理技術(NLP)決定了虛擬數字人是否能夠識別和理解語義;而語音合成技術(TTS)則決定了虛擬數字人在回復時,其語音是否符合真人習慣的聲調、情感和習慣。

無論是技術型廠商,還是運營型廠商,面對這種要求,都顯示出一種融合的總體趨勢,都在向著一體化解決方案提供商緩慢演變。例如以AI為核心能力的技術型廠商會為垂直領域提供解決方案;以動捕、面捕為核心的廠商會搭售軟體;運營型廠商則瀰漫產業鏈的上下游,一邊增強技術能力,一邊直接通過運營虛擬數字人直接獲利。

除此之外,其中最核心的就是虛擬人垂直賽道的獨立軟體開發商(ISV),例如中科深智、擬仁智能以及前面提到過的魔琺科技。和技術型廠商、運營型廠商提供的定製化一站式虛擬數字人解決方案服務不同,ISV的注意力集中在將虛擬數字人的製作能力封裝成可快速部署的輕量化標準化SaaS產品。

總的來說,ISV們更注重生產的效率。一方面是生產虛擬數字人的效率,B端客戶通過平台提供的預設模板,自行設定各項參數,快速形成「半個性化」的虛擬數字人形象,或者也可以根據已有設定快速形成虛擬形象;另一方面是生產數字內容的效率,通過平台提供的語音動畫合成技術(Voice to Animation),將文本自動轉化為語音,結合虛擬數字人形象自動生成視頻,並且用戶還能對視頻進行後期調整。

以魔琺科技為例,其旗下「三維虛擬內容製作智能雲平台」滿足了B端客戶從獲客、到生產、再到管理的虛擬內容製作流水線;「虛擬直播和線下實時互動產品」滿足的是虛擬數字人直播場景的需求,從生成實時動畫到直播系統搭建,均能夠一站式完成;「AI虛擬人能力平台」主要通過文本驅動語音及動畫技術、語音驅動動畫技術和有感情的語音合成技術,滿足非IP型虛擬數字人(虛擬教師、虛擬醫生等)的生產。

魔琺科技的商業模式,恰好滿足上文所述的那種「快速批量地生產非IP型虛擬數字人」的需求。這也就意味著,個性化定製式的解決方案正在隨著各個虛擬數字人廠商對行業的理解更加深入,逐漸演變成為標準化的、可複製的、通用型解決方案。這種全棧化能力或許無法極為深入地滿足B端C端紛繁複雜的需求,但這種在多場景快速部署虛擬數字人的能力一定是未來實現元宇宙的必要條件。

關鍵字: