蘋果發布3D版FaceTime,元宇宙究竟需要怎樣的會議軟體?

vr陀螺 發佈 2023-12-17T09:39:28.467793+00:00

文/VR陀螺 萬里可能不少人還記得前些年由於新冠疫情導致在線視頻會議軟體需求爆發的情景:2020年2月釘釘的MAU從7000萬迅速突破至2億、海外會議軟體Zoom 2021年連續三個季度的營業收入增幅同比增長超過了300%。

文/VR陀螺 萬里


可能不少人還記得前些年由於新冠疫情導致在線視頻會議軟體需求爆發的情景:2020年2月釘釘的MAU從7000萬迅速突破至2億、海外會議軟體Zoom 2021年連續三個季度的營業收入增幅同比增長超過了300%。

在線會議軟體爆火,恰逢元宇宙概念盛行,兩者開始催生出奇妙的化學反應。比爾蓋茨曾指出,「在未來兩三年內,我預測大多數虛擬會議將從2D圖像轉向元宇宙,一個有虛擬形象的3D空間。」

目前很多在線會議軟體都進行了元宇宙相關的探索與嘗試,如Meta於2021年發布Horizon Workrooms,微軟Teams上月底推出了3D頭像功能。而近日蘋果發布的Vision Pro,其中一大看點也是能夠實現3D FaceTime通話。

市面上主打元宇宙會議的平台種類繁多,在體驗以及產品打造思路上也各不相同。究竟什麼產品才是我們所需要的呢?接下來,陀螺君將對市面上幾款不同定位的虛擬會議軟體進行體驗並逐一拆解,從中一窺虛擬會議軟體的技術路徑以及發展脈絡。


軟體1:佳能Kokomo—手機+頭顯,玩法類似於MR錄製


在很多人印象中,佳能是一家老牌影像設備製造商,但是它在元宇宙賽道也早已經展開了諸多探索。如2021年,佳能推出3D VR影像製作解決方案——EOS虛擬實境系統(EOS VR系統),可用於3D 180° VR視頻的創作與直播等場景。去年CES期間,其展示了VR會議軟體產品Kokomo,該應用4月底正式上線App Lab,進入了小範圍公測階段。

Kokomo聯合創始人Jon Lorentz曾經指出,打造軟體的初衷,旨在提供一種能超越現有電話、FaceTime或Zoom視頻通話的解決方案,即不僅能在屏幕上看到對方,還能切實感到對方的存在。

玩法上,Kokomo有點類似於PICO去年推出的混合現實錄製(MRC)功能,即通過手機端捕捉用戶真實影像,然後把影像放置於VR空間中,以實現真實通話效果。為了避免手機拍攝時因為佩戴頭顯而產生的臉部遮擋問題,Kokomo的解決思路是預先錄入用戶真實的3D面部表情,然後在通話過程中把臉部表情拼接到上半身,以實現完整顯示效果。

這款軟體的優點主要集中在幾方面:通過視頻錄製來取代傳統的Avatar,它可以補充用戶腿部動作、面部神態細節以及身高等更多真實信息。此外,它還支持3D音頻、裸手交互等特性。

陀螺君體驗發現,想要順利實現通話,操作上略為繁瑣,需要經歷下面四個步驟:①手機APP添加好友;②登陸頭顯然後綁定手機帳號;③在頭顯端/手機端發起通話申請;④把手機放置在腰部以下的位置以拍攝全身視頻。

這款軟體仍屬於內測階段,體驗上還有不少瑕疵亟待解決。一方面,其摳圖算法有待加強,在通話時,用戶身體畫面是一個圖片貼片而非3D立體效果,並且有時候身體周圍會有白邊現象,觀感一般;其次,網絡時延大,有時候會出現動作滯後於聲音的情況,不排除是網絡代理的問題;最後一點,能實現觸發完美顯示(即在畫面中展示用戶臉部細節)的條件仍舊較為苛刻,並且用戶的臉部細節顯得較為呆板。


軟體2:Katmai—以瀏覽器為入口,再造線上辦公空間


Katmai是一家混合協作方案提供商,成立於2020年,今年4月籌集了2200萬美元A系列融資。在元宇宙辦公會議解決思路上,Katmai CEO Erik Braund認為,視頻比3D化身更適合同事之間的交流。「使用真實的視頻可以傳達情感,幫助人們以更自然、更真實的方式建立融洽的關係。」關於這一點,Katmai與Kokomo保持了一致。

不過,Katmai並不傾向於開發VR應用,相反,它打造了一套基於瀏覽器訪問的虛擬辦公解決方案。簡而言之,Katmai可面向各大企業開發其3D版本的虛擬辦公室,裡面設立了會議室、私人辦公室、茶水間等不同區域,以儘可能還原線下真實的辦公場景。

用戶登陸後,他將以一個圓形視頻鏡面的形象呈現,用戶可以在裡面的3D空間中自由走動探索,如果在路上遇到同事,還可與之進行交流。Katmai的虛擬辦公室力求真實,如用戶可以透過虛擬玻璃門看到會議室裡面的用戶,當關閉虛擬門時,能有效阻斷聲音的傳播,以保證私密性。而在會議過程中,裡面同樣配備了類似於共享屏幕、文字聊天等2D會議軟體常見的功能。

Braund透露Katmai的解決方案瞄準的是一些小型或初創公司,它能夠消除物理投資空間的巨額成本。陀螺君認為,Katmai等解決方案的出現,或許能夠給遠程辦公的人提供部分線下辦公的「溫暖」。Kaimai的客戶之一TMS的首席創意官曾在一份聲明中指出,「在虛擬辦公室中聚在一起可以實現更深入的聯繫、實時協作以及獲得自發性的樂趣,這在以前我們的遠程工作流程中是無法實現的。」


軟體3:Workrooms—主打數字人,內置多種腦暴工具


Workrooms是Meta於2021年所發布的一款VR辦公會議軟體,主打「會議+個人辦公」兩大場景,這裡著重介紹它的會議表現。

軟體使用前,需要創建個人Avatar形象。由於技術限制,目前Avatar只能顯示用戶的上半身,如果結合Quest Pro使用,裡面還可以進一步補充用戶的臉部以及眨眼等表情信息。

去年扎克伯格發布的元宇宙自拍照引發了一眾吐槽,原因在於裡面的Avatar系統建模粗糙甚至不及十多年前發布的《第二人生》。但陀螺君認為,Avatar細節真實性只是影響沉浸感的其中一環,得益於Workrooms優秀的物理引擎以及互動設計,最終能夠實現相對不錯的沉浸式會議體驗。

Workrooms裡面配備了6 DoF以及空間音頻技術,用戶可以通過轉頭等方式查看同事的肢體語言並且通過聲音了解環境的相對位置。此外,Workrooms傾向於採用手勢交互,可以脫離手柄實現更多自然操作。

Workrooms裡面配備了小型會議、分組交流、講座等多種會議場景模板,最高可以容納16名VR用戶同時在線。此外,它還支持非VR用戶以網頁的形式接入,會議用戶人數上限為50人。去年Connect大會上,Meta宣布與微軟合作,未來Workrooms還將支持連結Teams。

工具方面,Workrooms提供了三種辦公解決方案:①每一名用戶都有專屬的辦公桌面,桌面上配備了一個記事板,用戶可在記事板上記錄會議日程、想法等;②用戶可以通過串流電腦使用,電腦屏幕會在虛擬會議室中呈現;③裡面配備了共享虛擬白板,會議主持人或者分享者可以在上面共享圖像、表格、PPT、電腦屏幕等內容。


軟體4:Vision Pro 3D FaceTime,主打寫實、低上手門檻


不出意外,FaceTime也成為了Vision Pro的一大重要賣點。在3D通話解決方案上,蘋果傾向於走寫實路線,M2+R1、LiDAR+結構光的硬體組合給它帶來了得天獨厚的優勢。

使用前,用戶需要先把臉放在頭顯面前掃描錄入,即可快速生成一個專屬的寫實風Avatar形象Persona。在通話過程中,頭顯通過內外攝像頭分別捕捉用戶的眼神以及嘴唇信息,再交由AI驅動臉部模型生成連貫的交流動畫。

蘋果透露,裡面使用了解碼器神經網絡,並針對「數千人的不同群體」進行了測試。Persona同樣沒有軀幹以及腿部細節,不過在溝通交流過程中可以錄入手勢動作信息。

根據一些外媒分享得知,3D FaceTime的人臉表情有時候看起來會略為僵硬,The Verge體驗後表示,「在通話過程中會有種恐怖谷的感覺,人臉除了眼睛和嘴巴大部分區域都被凍結了。」不過也有很多媒體給予了相當不錯的評價,他們認為通話時感覺很真實。

根據蘋果介紹視頻,在FaceTime通話時,用戶是以真人大小呈現的,裡面配備的Spatial Audio有助於提升聊天的真實感。此外,在通話過程中,用戶可以在空間中打開網頁、PPT等更多應用,可以很好滿足會議等場景。而Workrooms則需要串流電腦才能實現這一點。

作為蘋果的一貫強項,iPhone、iPad等設備自然也可以無縫接入到Vision Pro的FaceTime當中,不過他們會相應以2D的形式呈現。


軟體5:Webex Hologram—光場全息成像


Webex是一家視頻會議的「鼻祖級」企業,於1996年成立,2007年被思科收購,同年它占領了全球視頻會議市場高達53%的市場份額,值得一提的是,如今視頻會議軟體的頭部企業Zoom的創始人袁征也是出自於Webex。

2021年,Webex發布了其最新的AR會議解決方案Webex Hologram。與前面所提到的基於VR頭顯或者網頁版的在線會議解決方案不同,Webex Hologram在呈現效果上更為科幻,它結合使用了AR+全息技術。

在實現原理上,與會者需要使用採集設備來記錄三維圖像,緊接著系統對圖像數據進行壓縮、上傳雲端最後再傳輸到另一個用戶的顯示設備當中,以完成通信。全息技術的呈現方式有很多種,如紋理貼圖、點雲等,Webex Hologram採用的是光場方案,近日谷歌所發布的Project Starline最新原型所使用的也是這套技術方案。

Webex Hologram現已面向部分企業展開了超過700多次演示,並且完善搭載了12顆攝像頭的最新採集原型設備。Webex暫未透露這套方案的成本售價,不過參考谷歌Project Starline,後者的圖像採集端與顯示端結合在一起,售價超過了1萬美元。


總結:五款產品各有優劣,真實性以及易用性會成為重要訴求


一項研究表明,人類溝通方式主要是語言和動作,其中語言表達占45%,表情動作占55%。而語言表達里的文字內容占20%,語音語調占80%。這項研究背後可以反映,林林總總的辦公會議類應用,除了解決遠程辦公跨區域協作這一底層需求外,儘量朝著溝通信息保留的最大化所發展。在這個過程中,以VR/AR、數字孿生、雲計算、人機互動等元宇宙技術賦能會議應用,會是它下一個重要的發展方向。

由於新冠疫情因素助推,視頻會議類應用市場經歷了一段高速發展期,一些調研數據顯示,該市場目前依舊具備很大的增長潛力。Zippia的研究表明,74%的美國公司正在展開或計劃實施混合工作;IDC預測,2025年全球視頻會議市場規模將達到212.1億美元,2021-2025年的複合增速為17.5%。

我們回顧前面五款應用:佳能Kokomo、Katmai、Workrooms、FaceTime以及Webex Hologram,其實可以發現這五款應用的特點以及差異化都十分鮮明,這可視為元宇宙視頻會議應用在不同方向的探索。如果以成本優勢、技術成熟度、擬真感、沉浸感、易用性五個維度來看,它們各有優劣,並不存在所謂的「五邊形戰士」。

拆開來看,Katmai這款產品更像是常見的在線視頻會議的延伸,除視頻交流以外,它還進一步補充了虛擬空間的角色,並且可以使用網頁接入,易用性也不錯。不過相較於其他幾款產品,它的沉浸感一般,究竟有多少企業需要這一3D辦公空間,還需要市場的進一步驗證。

佳能Kokomo和Workrooms本質上都是VR應用,但是它們的側重點並不同。前者希望在溝通時能以真實優先,以真實視頻為重點,裡面甚至完全摒棄了Avatar系統。只可惜目前這款軟體還存在不少Bug,並且2D人物貼圖結合3D背景有時候容易讓人感到出戲。

Workrooms是一款以Avatar為切入點的VR應用,在呈現效果上相對比較飽滿,並且功能也比較豐富。不過Avatar的卡通化問題從短時間來看依舊無解,有些人非常討厭這個「第二身份」,並且需要佩戴笨重的頭顯設備使用,對於很多用戶而言是一種負擔。

Webex Hologram在呈現效果上可以視為較為終極的解決方案,全息視頻呈現最符合我們的日常使用直覺,並且還可以進一步實現遠程協助等操作。不過,從當前來看,光場等3D全息技術仍未成熟,參考Project Starline,它的成本高昂,體積龐大,並且仍需解決顯示解析度一般、3D區域可視角度偏小等問題,目前這套方案想要大範圍推廣仍不現實。

最後再聊一下Vision Pro的FaceTime,強大的硬體支撐讓它能夠輕鬆實現寫實Avatar驅動以及多屏會議辦公等傳統VR一體機難以勝任的工作,並且無論是從掃描錄入,又或者是通話交流的方式上,它實現方式非常自然,幾乎沒有上手門檻。當然,需要佩戴笨重的頭顯使用目前也是硬傷,並且3499美元的價格想要說服普通消費者買單其實並不簡單。

隨著技術的進步和社會的發展,我們有理由相信元宇宙會議應用將在不久的將來成為我們生活中不可或缺的一部分,企業八仙過海,市場大浪淘沙,未來又會出現怎樣的元宇宙會議應用,有待時間揭曉。

關鍵字: