NPC有靈魂了嗎?大語言模型與智能體設計的新進展

手遊矩陣 發佈 2023-05-24T21:58:12.243000+00:00

遊戲帶來的獨特體驗在於讓人沉浸在一個引人入勝的世界與故事中,並讓人經歷一段與眾不同的旅途。因此,許多玩家渴望一個開放世界,到處是與人類無異的智能NPC,如《西部世界》或《刀劍神域》中那般。

遊戲帶來的獨特體驗在於讓人沉浸在一個引人入勝的世界與故事中,並讓人經歷一段與眾不同的旅途。其中的情節與世界觀又往往通過玩家與NPC的互動一點一點展開。然而,無論NPC有多生動,程序設置的本質終會提醒我們:你面前的並非某個角色,而是遊戲製作者。

因此,許多玩家渴望一個開放世界,到處是與人類無異的智能NPC,如《西部世界》或《刀劍神域》中那般。在AI技術跳躍式發展的2023年,我們似乎能看到一些雛形與嘗試。

《瑞克和莫蒂》中的電池宇宙

斯坦福和Google的研究團隊近期設計了一個實驗並發表了論文,目的是驗證AI是否已經達到可以模擬人類複雜社交互動的程度。

自由聊天?不,是虛擬生活

在實驗中,研究人員創建了25個AI虛擬角色,每個角色都設定了獨特的個人信息,包括姓名、職業、人生目標等,這些AI角色被置入一個小鎮中。基於大語言模型技術,這個虛擬小鎮上的AI能夠進行日常生活對話,對環境進行交互。雖然並不完美,但已為其在更真實場景下模擬人類豐富社交提供了基礎。

它們能自發產生話題,傳播信息,就公共事務形成不同觀點。在實驗的虛擬小鎮環境下,AI角色Sam宣布要競選市長,這一信息很快在其他AI角色之間傳播開來。其中,Tom表示支持Sam的決定,因為Sam一直致力於小區工作,可以為小區發展作出新貢獻。Tom後來與John討論Sam的選舉勝算,兩人都預期Sam會成功當選。

Sam要競選市長的消息成為虛擬小鎮的熱門話題,一些AI角色表示支持,一些則持觀望態度。儘管AI角色的對話並不總是自然流暢,但能在一定程度上模擬人類社會關係的複雜性,實現信息的有效傳播和討論,形成不同的立場和態度。

在虛擬小鎮實驗中,AI角色Isabella的初始設定是需要在情人節舉行一個派對。Isabella在咖啡館工作,她逢人便邀請其他AI角色參加她的派對。Isabella的女兒Maria也邀請她暗戀的對象Klaus來參加。除Isabella舉辦派對和Maria暗戀Klaus的初始設定外,其他行為如傳播派對信息、布置派對場地、邀請其他人等完全由AI自主完成。

在NPC的八卦下,最終有12個AI角色知曉這個派對信息,但只有5個角色實際出席,包括這對相互暗戀的角色Maria和Klaus。其他7個AI角色沒有出席,研究人員後來分析了他們的理由,有4個原本表示有興趣但沒來,另外3個找了其他的理由。這裡AI展現出一定的觀察力和反思能力,可以在一定程度上解釋角色放鴿子的理由。

NPC是如何有靈魂的?

那麼研究團隊具體是如何讓這些NPC看起來更「人性化」的呢?他們制定了一種智能體架構來檢索記憶,動態地更新他們過去的經驗,並將其與智能體的上下文和計劃結合,這些經驗、上下文和計劃可能相互加強或相互矛盾。整個架構有三個主要的組件:記憶、計劃和反思。每個組件負責執行特定的功能。

在記憶與檢索的方法中,記憶流將智能體當前的經歷和觀察提供給語言模型,語言模型據此可以輸出更加符合人類行為的指令與內容。檢索功能則會根據不同的情況進行選擇,如最近訪問的事件以及事件的重要性與相關性。這些方法有助於語言模型選擇與當前情況相關且重要的記憶,讓智能體的反應更加連貫和具體。

計劃描述了智能體未來的行動序列,並幫助智能體的行為隨時間保持一致。一個計劃包括位置、開始時間和持續時間。例如,快到截止日期時,Klaus可能選擇把一天時間花在桌前起草研究論文。

反思則是一種更高級別的記憶,可以回顧記憶和做出更高層次的推理。當智能體對事件的感知達到一定閾值時就會進行反思,根據智能體近期經歷提出的問題,然後,語言模型進行回答並引用相關記憶作為證據。問Klaus最想與誰在一起,他選擇Maria而不是與他互動最頻繁的人,因為Klaus熱衷學術研究,而Maria也總是在做學術研究。

最後,研究者還讓25名人類參與者來評估不同類型的智能體在人性方面的可信度。結果顯示,生成式智能體雖然在語言產生方面達到較高水平,但在理解和生成非語言信息方面,如個性、情感和社交性等方面,其水平還不及人類。自然語言模型在非語言的理解與生成方面存在局限,而如何解決與克服這一局限也是未來研究的方向。

大語言模型會顛覆傳統AI嗎?

在以往的遊戲中,虛擬世界中的角色時有真實之感,這歸因於遊戲創作者在遊戲性與故事性之間的完美平衡,以及玩家在遊戲中同人物與環境互動的沉浸感。

我們也能實際體驗到遊戲中NPC的智能化。《荒野大鏢客2》裡NPC會記得玩家曾經幫他吸出過蛇毒,再次相遇時會給予感恩和回報。《巫師3》開場支線任務里的NPC會欺騙並利用並玩家的善良來達到自己的目的。但這些遊戲一般採用編寫AI行為的方法來與玩家展開互動性敘事,如有限狀態機和行為樹等。

當人們說AI會取代人類時網友就會掏出這張圖

雖然它們可以處理基本的社交互動,但不可能完全涵蓋開放世界中所有可能的互動行為範圍。考慮到製作人員的工作量和效率,這些方法通常簡化了環境或行為的維度,尚未解決在開放世界中可信智能體的問題。

較為開放的沙盒遊戲如《矮人要塞》和《環世界》是敘事過程生成技術的典範。裡面每個NPC都在編寫自己的個人歷史,細看卻發現某些事件之間還是缺乏關聯性和邏輯性。

使用機器算法訓練的AI往往出現在那些易於定義獎勵的對抗遊戲中,這些獎勵可以被學習算法優化。這種方式設計出的AI非常智能,在某些方面甚至超越人類,如星際爭霸戰中的Alpha Star和Dota 2中的Rerun能擊敗職業選手。

可以看出,傳統的基於狀態機、行為樹的而設計的AI和較近的基於深度學習設計的AI在遊戲中都有各自典型的運用。史丹福大學的這個研究項目巧妙地向我們展示了如何將GPT-3.5這種基於深度學習的大語言模型融入遊戲之中。現在,讓遊戲中的AI與玩家直接對話也不是什麼新鮮事了。

一款使用大語言模型的遊戲《Origins》就曾有玩家上傳了遊戲實機體驗視頻。就目前的演示來看,玩家可以直接與遊戲內NPC對話,去詢問證人找出事件真相。玩家分別與清潔機器人和人類進行了對話,與機器人的對話較為流暢,但人類這邊的語調和表情就「機械感」十足,相當違和。

《輻射4》近期也出現了一款可以為遊戲自動生成對話和全程配音的Mod。目前該Mod為遊戲添加300多條全新對話,在一定程度上解決《輻射4》「對話輪系統」的限制, 「對話輪系統」只提供了四種選項,限制了玩家的自由度。AI生成的聲音已經與原聲非常相近,但目前聽起來還是略微「缺乏感情」。

SE免費新作《SE AI技術預覽:港口鎮連續殺人事件》一經推出就「特別差評」,好評率不足10%。據介紹,這款遊戲運用多種AI技術,自然語言處理(NLP)、自然語言理解(NLU)、語音轉文字(STT)等。實際體驗下來所謂的自由對話就是純噱頭,只有在提到某些觸發詞或關鍵詞時,NPC才會生成實質性的、有價值的對話。

連自己內褲的顏色都不知道?

當然運用這項技術的遊戲遠不止這些,在實際體驗中也能夠明顯地感受到這項技術中瑕疵的、機械化的一面。

即使是當今最強大的語言模型GPT-4,其本質更多的是一個統計學原理的概率模型,它的出發點並不是邏輯和語義。「奈何本人沒文化,一句臥槽行天下。」在日常生活中,語言與行為活動密不可分,隻言片語就能表達豐富的涵義。哲學家維根斯坦的「語言遊戲」就說明了這點,深究語言的本質只會走入死胡同,語言的使用比語法更重要,我們需要考慮實際的應用場景。

而到了算力有限,系統交互同樣複雜的遊戲中,目前的AI在遊戲上還是有點捉襟見肘了,它們無法理解語言符號和非語言符號的關聯。就目前來看,利用AI技術縮減遊戲開發中的重複性工作和流程,遊戲開發商投入更多成本和資源到遊戲內容和體驗本身的開發上,這可能是一條更加符合實際需求和發展趨勢的道路。至於未來,我們不妨大膽展望,西部世界在有生之年或許能夠實現。畢竟世界上第一架飛機只飛行了36.6米, 而短短六十年,人們就可以在雲端俯瞰生靈,宣告頭頂並沒有什麼上帝。

關鍵字: