CNCC|遊戲AI算法與平台

ccfvoice 發佈 2022-12-03T18:22:16.694031+00:00

CNCC2022將於12月8日至10日舉辦,今年CNCC技術論壇數量達到122個,內容涵蓋了「計算+行業、人工智慧、雲計算、教育、安全」等30個方向。

CNCC2022將於12月8日至10日舉辦,今年CNCC技術論壇數量達到122個,內容涵蓋了「計算+行業、人工智慧、雲計算、教育、安全」等30個方向。本文特別介紹將於12月8日舉行的【遊戲AI算法與平台】技術論壇。


CNCC2022將解讀算力發展趨勢,帶你洞悉數據價值真諦,與你共議計算領域生態融合與發展!別缺席,等你來,歡迎報名在線參會!



遊戲是人類智慧的競技場,也是各種人工智慧新技術的試驗場。通過制定遊戲規則,可以更清楚地定義我們所謂的智能;通過提供遊戲對戰平台,可以讓人類和機器智能體就某個或系列遊戲任務進行能力對抗,從而既可以評價智能體的智能水平,又能通過重複比賽疊代提升智能體的智能水平。我們現實生活中面臨的各種智能決策問題,都可以抽象成相應的遊戲環境,從而可以在遊戲環境下,通過低成本加速疊代找到好的解決方案。本論壇主要討論現有的遊戲對戰平台和經典遊戲AI目前發展的最新動態。


論壇安排


順序

報告題目

講者

單位

1

用AI提升我們對傳統遊戲的認知

李文新

北京大學

2

大規模不完美信息博弈平台與算法

興軍亮

清華大學

3

遊戲AI的一些新的發展趨勢

王軒

哈爾濱工業大學(深圳)

4

「及第」多智能體開源開放平台

張海峰

中科院自動化所

5

騰訊開悟平台的持續開放之路

鄧民文

騰訊

6

多智能體鏡學習:面向合作博弈的通用求解框架

楊耀東

北京大學人工智慧研究院


Panel環節

全部嘉賓和主席


論壇主席


李文新

北京大學計算機學院 教授、北京大學人工智慧研究院 副院長


簡介:CCF傑出會員。本碩博畢業於北京大學計算機科學技術系,並在香港理工大學獲得第二個博士學位。


論壇共同主席


高陽

CCF人工智慧與模式識別專業委員會秘書長

南京大學 教授


CCF大數據專家委員會執行委員。南京大學計算機科學與技術系副主任、南京大學健康醫療大數據國家研究院常務副院長。


報告及講者介紹


李文新

北京大學計算機學院 教授、北京大學人工智慧研究院 副院長


報告題目:用AI提升我們對傳統遊戲的認知


當人工智慧遇到國粹麻將會發生什麼?本報告將介紹我們將國標麻將遊戲搬上botzone遊戲AI對戰平台,並將之應用於人工智慧相關課程教學和本科生、碩士生、博士生的論文研究課題的過程。在人工智慧與國粹麻將的碰撞中,我們不僅深化了對人工智慧算法的認知,更是極大地提升了對傳統麻將遊戲及其背後蘊含的文化哲理的認知。應用人工智慧方法,透過麻將這項在全球擁有超過6億玩家的傳統遊戲,我們將能夠更加深刻地了解遊戲背後的廣大人群的思維慣性、價值取向和決策模式。

興軍亮

清華大學 研究員


清華大學計算機系研究員,國家優青,主要研究興趣為計算機博弈、計算機視覺和人機互動學習。目前已在人工智慧相關國際會議和刊物上發表論文100餘篇,谷歌學術引用超過13000次,參與編寫人工智慧領域專著2部,完成譯著3部,曾獲清華大學計算機系「學術新秀」、「谷歌學者」、多次頂級國際和國內會議最佳論文獎等榮譽和獎勵,以及十餘次在國際國內智能技術挑戰賽中獲獎,研發的多項技術在重要軍民實際場景中得到了技術驗證和推廣應用。近年來主要圍繞深度強化學習相關的智能感知和決策問題,開放了學界首個大規模不完美信息博弈平台OpenHoldem,研發了多款針對不同遊戲的博弈決策AI,其中研發的星際爭霸AI曾獲2017年IEEE CIG星際爭霸AI第2名,研發的德州撲克AI勝率超過了目前公開的最好德州撲克AI程序DeepStack,速度提升超過1000倍。


報告題目:大規模不完美信息博弈平台與算法


信息缺失是造成複雜博弈決策問題難以學習求解的重要原因。本次報告以德州撲克這一典型大規模不完美信息博弈問題為具體研究對象,首先介紹該問題的研究背景和國內外研究現狀,並由其中存在的問題引出構建不完美信息博弈開放學習平台的迫切性;接下來介紹了我們構建的OpenHoldem這一不完美信息博弈在線對抗學習平台的主要特點和運行情況;在平台的基礎上,我們研發了多種不同類型的德州撲克智能博弈算法,其中包括我們最新的兩人無限注德州撲克AI程序AlphaHoldem;最後,會對我們已有的研究進行總結,並給出下一步的研究計劃。

王軒

哈爾濱工業大學(深圳) 教授,鵬城國家實驗室 研究員,微軟拼音主要研製人


中國人工智慧學會常務理事,廣東省計算機學會副理事長,深圳市計算機學會理事長,廣東省安全智能新技術重點實驗室主任,平安-哈工大粵港澳智慧金融研究中心主任,理光-哈工大聯合實驗室主任。研究領域包括人工智慧和網絡空間安全,主持或參與國家科技重大專項、國家重點研發計劃、國家自然科學(重點)、國家科技計劃重點項目以及來自華為、中興、微軟、平安等企業項目百餘項,獲教育部一等獎、航天部二等獎、省發明一等獎、深圳市科技進步獎等,獲得國家發明專利30餘項,發表學術論文(SCI /EI檢索)200餘篇,專著3部。


報告題目:遊戲AI的一些新的發展趨勢


機器博弈是人工智慧的重要研究領域,AlphaGo在圍棋遊戲的成功獲得了舉世矚目。在大數據、深度學習、高性能計算等關鍵技術發展的助力下,機器博弈在軍事、金融、遊戲領域的應用日益深化。本講座介紹了基於機器博弈技術構建的遊戲AI,在擬人仿真、團隊合作、機制設計等案例中賦能遊戲的新趨勢,以及機器博弈技術與超算平台相結合的解決方案與成果。

張海峰

中國科學院自動化研究所 副研究員,群體決策智能團隊 負責人


CCF計算經濟專業組常務委員。他於北京大學計算機系獲得本科、博士學位,曾在英國倫敦大學學院(UCL)從事博士後研究工作。他致力於多智能體和強化學習的學術研究和平台研發工作,研究興趣包括智能體策略評估、多智能體強化學習算法、強化學習求解運籌優化問題等,研究成果發表在 ICML、NeurIPS、IJCAI、AAAI、AAMAS、《軟體學報》等國內外知名學術會議、期刊,研發項目「及第」多智能體開源開放平台(http://www.jidiai.cn)匯聚各類智能體環境、算法、競賽。承擔多項科技部、國家自然基金委、中科院研究項目。


報告題目:「及第」多智能體開源開放平台


與監督學習算法評估依賴於標準數據集不同,強化學習智能體算法的評估依賴於博弈環境和對手智能體策略。「及第」項目以此為出發點,目標是構建一個匯聚各種博弈環境和智能體策略的開源開放平台,提供智能體在線博弈、評估的服務,打造多智能體科研、教學、競賽、應用社區。

鄧民文

騰訊開悟平台 技術負責人


本科畢業於中山大學,碩士畢業於中科院計算所,先後在阿里巴巴、騰訊工作。於2010年加入騰訊至今,負責搜尋引擎計算平台、強化學習計算平台的工作。在系統工程優化和強化學習工業化等領域積累了豐富的研發經驗,搭建了AI實驗平台"開悟",大幅提升了強化學習AI的研發效能,並且通過舉辦多智能體強化學習高校AI比賽,賦能科研和教育行業。


報告題目:騰訊開悟平台的持續開放之路


介紹騰訊開悟平台的降本增效關鍵技術。介紹騰訊開悟高校AI比賽,如何通過建立產學研合作新生態,解決高校在研究多智能體博弈遇到的難題。介紹hok_env開源項目,以及相關的benchmark。

楊耀東

北京大學 人工智慧研究院助理教授


楊耀東博士,北京大學人工智慧研究院助理教授(博導),倫敦國王大學客座助理教授,國家級高層次留學人才回國資助計劃、中國科協青年托舉計劃獲得者。科研領域包括強化學習、博弈論和多智能體系統,重點關注基於強化學習方法的智能群體博弈及群體智能湧現。他本科畢業於中國科學技術大學,並在倫敦帝國理工大學與倫敦大學學院獲得碩士及博士學位,回國前他於倫敦國王大學信息學院任助理教授。他發表AI頂會論文及專利專著 60 余篇,谷歌引用1900餘次。他的工作曾獲機器人學習會議CoRL』20 最佳系統論文獎、多智能體頂會AAMAS』21 最具前瞻性論文獎。因在多智能體強化學習上的工作,他曾獲得世界人工智慧大會(WAIC 2022)雲帆獎璀璨明星、ACM SIGAI China新星獎、華為英國公司最佳技術突破獎、AAAI/ACM SIGAI 優博獎參選人 (UCL唯一)。


報告題目:多智能體鏡學習:面向合作博弈的通用求解框架


通過強化學習方法求解多智能體博弈合作問題具有眾多的現實應用,例如靈巧雙手操縱、無人機群編隊等。在本講中,我講會介紹一個通用的基於多智能體強化學習技術的合作博弈求解框架:多智能體鏡像學習(Heterogeneosu Multi-Agent Mirror Learning)。HAML提供了一個通用的算法設計範式,它可以催生出一系列的有效的合作博弈求解算法例如HAPPO, HATRPO, MACPO, Mutli-agent Transformer等,並且HAML算法框架中的成員都天然具有嚴格的單調遞增性的保證。此外,HAML框架還提供了一系列新的多智能體算法,例如HADDPG, HADQN, HAA3C。在一系列合作博弈場景,例如星際爭霸,靈巧雙手操作上,他們都達到了SOTA水平。


CNCC是級別高、規模大的高端學術會議,探討計算及信息科學技術領域最新進展和宏觀發展趨勢,展示計算領域學術界、企業界最重要的學術、技術成果,搭建交流平台,促進科技成果轉換,是學術界、產業界、教育界的年度盛會。今年邀請嘉賓包括ACM圖靈獎獲得者、田納西大學教授Jack Dongarra以及高文、管曉宏、江小涓、錢德沛、徐宗本、張平等多位院士及專家,還有七百餘位國內外名校學者、名企領軍人物、各領域極具影響力的業內專家,CNCC在計算領域的水準及影響力逐年遞增。本屆CNCC的主題是:算力、數據、生態。


CNCC2022將匯聚國內外頂級專業力量、專家資源,為逾萬名參會者呈上一場精彩宏大的專業盛宴。大會期間還將舉辦「會員之夜」大型主題狂歡活動,讓參會者暢快交流,燃爆全場。如此盛會,豈能缺席!等你來,馬上行動,歡迎參會報名!

關鍵字: