3D AI合成主播VS遊戲NPC,搜狗AI優勢凸顯無疑

牛華網 發佈 2020-05-25T02:57:20+00:00

一段極具未來感的視頻播報畫面和一個栩栩如生的3D數字人主播,在兩會開幕前夕驚艷亮相新華社、大出風頭,不僅讓媒體再次聚焦搜狗這家AI公司,也引起了網友圍觀討論:這個3D AI合成主播到底有什麼不同?

「大家好,我叫新小微,是由新華社聯合搜狗公司推出的全球首位3D 版AI合成主播,我將為大家帶來全新的新聞資訊體驗……」

一段極具未來感的視頻播報畫面和一個栩栩如生的3D數字人主播,在兩會開幕前夕驚艷亮相新華社、大出風頭,不僅讓媒體再次聚焦搜狗這家AI公司,也引起了網友圍觀討論:這個3D AI合成主播到底有什麼不同?她的出現又代表著什麼?

(搜狗聯合新華社推出的全球首個3D AI合成主播「新小微」)

全球首個3D AI合成主播,和遊戲3D數字人不一樣

很多網友初見搜狗3D AI合成主播,會第一時間聯想到遊戲中的3D NPC和電影中的3D數字人。不過,無論是從技術角度看,還是從實際運用考量,「新小微」這個全球首個3D AI合成主播,與遊戲、電影等3D數字人有著根本上的不同。

從3D數字人建模的技術方面來看,目前市面上常見的寫實類遊戲3D虛擬人物、電影3D數字人大多採用blendshapp或骨骼動畫技術進行製作,雖然保證了外形較高的寫實度,但很難達到其在說話時面部細節動作的高度協調及自然。而搜狗3D AI合成主播採用了全球最領先的肌肉模型、肌肉綁定3D建模技術,使「新小微」面部表情及肢體動作的細節程度不亞於甚至高於一些影視作品及遊戲NPC的寫實程度,能夠經得起高清特寫鏡頭下皮膚材質、毛孔、牙齒、嘴唇、眼睛、頭髮等細節的高度逼真效果考驗。重點是,在該技術的支持下,「新小微」模型每一個肌肉點的運動都會連帶很多面部臉譜協同運動,這就實現了「新小微」講話時,其語音和唇動細節、眼神、面部肌肉運動等整體面部的超高協調度及自然度。

(3D AI合成主播「新小微」高度逼真的面部細節)

在3D數字人驅動方面,遊戲3D NPC和電影3D數字人目前還是主要靠人工驅動。需要讓3D數字人進行一段動作時,先需投入大量的人力、財力掃描採集其真人原型的每一個發音和每一個動作,再通過動畫師一點一滴勾勒製作生成,舉個例子,遊戲《魔獸世界》或電影《阿麗塔:戰鬥天使》中,一段幾分鐘高寫實3D視頻,需要的時間成本往往是以月計、甚至以年為計算單位,更涉及到數百萬乃至上千萬的費用成本。再如洛天依等目前比較火的卡通效果也是靠真人採集進行驅動,沒有做到真正意義上的AI驅動。搜狗3D AI合成主播則不同,「新小微」實現了依靠AI算法的實時驅動,擁有給到一個文本就能即時輸出一個視頻或視頻流的能力。也就是說,要讓「新小微」播報一個臨時突發新聞,只需在後台輸入新聞文本,系統AI算法就能自動理解文本語義,實時驅動「新小微」實現一次面部、肢體和語音高度契合的播報。生成一個1分鐘的視頻,搜狗數字3D人只需要1分鐘,成本低效率高,更利於市場的接入與使用。

秉承「AI賦能於人」,推動AI發揮降本增效的實際價值

作為AI合成主播的開創者,搜狗分身一直是行業發展的風向標,也代表著業內最前沿的技術能力。此次率先推出3D AI合成主播,是搜狗分身技術的又一次重要突破。

能夠隨時變換髮型,隨時更改服裝,隨時去到不同的演播室,甚至隨時穿梭於不同的新聞現場或虛擬場景中……,在AI算法的驅動下,只需要輸入文本內容就能生成自然逼真的實時視頻播報,並且可以無需休息、不知疲倦的工作下去,這讓搜狗3D AI合成主播擁有了無可替代的實用性和普適性,也為新聞節目、視頻內容的多樣化製作和呈現帶來了更多的選擇。

更重要的是,初涉及3D數字人領域,搜狗就以低成本高效率實現媲美遊戲影視專業領域3D數字人寫實度的表現震驚行業,搜狗公司的AI技術實力可見一斑。未來,搜狗分身不僅可能實現在醫療健康、教育金融等垂直領域的落地應用,助力大眾智能生活水平不斷提高,也可能對影視遊戲等專業領域的3D製作產生極大的助推力,降低成本提升效率,真正實現AI降本增效的實際價值。

關鍵字: