商湯科技白皮書:首次將數字人的發展劃分為L1~L5五個等級

單行科技 發佈 2022-05-22T23:10:55.093484+00:00

近日,於重慶舉辦的「中國元宇宙發展高峰論壇」上,商湯智能產業研究院院長田豐受邀參會並發表主題演講,分享了AI數字人的前沿方向以及商湯賦能實體產業的創新應用成果。

近日,於重慶舉辦的「中國元宇宙發展高峰論壇」上,商湯智能產業研究院院長田豐受邀參會並發表主題演講,分享了AI數字人的前沿方向以及商湯賦能實體產業的創新應用成果。

會上,商湯科技聯合增強現實核心技術產業聯盟(CARA)共同發布了《企業級AI數字人:數字經濟發展「新動能」》白皮書,首次將數字人的發展劃分為L1~L5五個等級,並闡述了商湯對AI數字人技術趨勢的核心洞察。

田豐指出,AI時代,數字人正在從有顏無智的「CG數字模特」,進化為可提高生產力、驅動創新服務的「擬人服務式AI」,融入數字中國的千行百業,成為「十四五」數字經濟的新交互媒介、新商業智能服務、新政務便民窗口。通過數位技術實現對現實世界的改造,AI數字人將促進數字經濟與實體經濟的融合和發展,成為實體產業生產力的代表。

L4級數字人將推動生產力變革

曾經,遊戲、電影中創作的逼真CG人物是科幻遐想的代表。如今,這樣的人物已經可以在現實世界中與我們面對面互動,變身各式各樣的服務助手。

從完全手工創作到完全智能化交互,在白皮書中,商湯從生產自動化和擬人化兩個維度,將數字人的進化歷程劃分為五個階段:

L1級:主要以人工製作為主;

L2級:依靠動捕設備採集表情、肢體等動作,例如電影動畫製作;

L3級:可依靠算法驅動口型、表情和動作,例如虛擬化身實時互動;

L4級:實現部分智能化交互,在垂直領域創新服務模式;

L5級:實現完全智能化交互,打造真正的個性化虛擬助手。

達到L4級別,意味著數字人不僅實現了AI仿真動畫生成能力與自然語言理解能力的結合,通過學習大量的真人會話、語氣、表情和動作,可根據表達內容生成相應神態和全身動作,輸出栩栩如生的擬人效果,同時,結合AI算法在製作流程中的深度融合(AIGC),製作效率也得到了大幅提升。只有達到L4或更高級別,AI數字人才能真正的走入千行百業,推動生產力的變革。

在深度學習技術的加持下,更高級別的AI數字人將逐步兼具人類認知能力和機器認知能力,既可以在短時間內學習不同領域的人類知識,成為相關領域的專家,同時又可以在海量數據中提取更多規律,超越人類的現有認知,突破生產力的邊界。

實現AI數字人「量產」,提效千行百業

作為AI數字人技術的領導者,商湯以原創的多模態交互、深度學習和全棧式的AIGC(AI Generated Content)技術,構建了智能化生成、智能化驅動和智能化交互三大引擎,打造出「一站式」AI數字人生產流水線。在實現媲美真人的逼真程度上,讓AI數字人「更聰明、更專業」,並實現「聽得懂,看得見,說得出」的人機互動效果。

得益於自動化的流水線,商湯已根據行業需求,快速、靈活地創建了不同角色的AI數字人,在文旅、展館、金融、教育、商超等實體產業中規模化應用,為用戶提供多樣化的服務和體驗。

比如,在上海中共一大紀念館中,商湯AI數字人擔任講解員,為參會者講解黨史;在廣州永旺商城,商湯AI數字人則是導購員,為顧客提供智能的問詢服務;在寧波銀行上海分行,擔任大堂經理,提供各類業務諮詢和問題回復。在2020年世界人工智慧大會上,商湯AI數字人還擔任大會導覽員,向參會嘉賓講解AI在不同領域的落地應用和成果。

而在醫院場景,AI數字人可以為患者進行分診導診,在減輕導診台壓力的同時為患者帶來有溫度的關懷。在智能汽車的車艙中,AI數字人還可化身虛擬行車伴侶,為用戶定製專屬形象,並通過媲美真人的動作和語言與用戶互動,為人車交互融入更多情感元素。

隨著技術發展邁向更高階的智能等級,AI數字人也將不僅限於我們所看到的人物形象,它成為可以通過不斷機器學習,成為突破想像力的AI智能體。

例如在遊戲中,AI驅動的NPC可以與人類玩家協同作戰;在社群中,AI可以成為擔任社群管理員,提升運營效率和管理水平。

在不遠的未來,無論是在現實世界還是影視、遊戲作品中,AI數字人、AI智能體都將無處不在,為我們增添娛樂體驗、帶來便捷服務、實現效率提升,深刻改變我們的生活和工作方式。

關鍵字: