打造中國版ChatGPT,這是國內最有實力的一批NLP團隊與人才

機器之心pro 發佈 2024-05-11T09:10:15.241550+00:00

ChatGPT 軍備賽開幕,哪些國內機構具備打造下一個 ChatGPT 的實力?自從 2022 年底 ChatGPT 發布以來,海內外就掀起了一陣狂潮。

機器之心原創

機器之心編輯部

ChatGPT 軍備賽開幕,哪些國內機構具備打造下一個 ChatGPT 的實力?

自從 2022 年底 ChatGPT 發布以來,海內外就掀起了一陣狂潮。推出僅兩個月,ChatGPT 月活用戶突破 1 億,成為了史上用戶增長速度最快的消費級應用程式。

ChatGPT 成為了攪動人工智慧領域風雲的新勢力,其背後的 OpenAI 也因此成為了當下最熱門的 AI 公司,甚至引發了科技巨頭們的深度焦慮。

谷歌和微軟兩家科技巨頭正在 ChatGPT 搜索上進行激烈競爭,先後宣布了將大型語言模型(LLM)整合到 Google 和 Bing 搜索中的計劃。更有眾多網際網路公司迅速跟進,掀起了科技領域的又一場「軍備競賽」。有些機構開始著手研究同類型產品,有些機構從零開始布局對話式 AI 背後的一系列相關技術。

中國版 ChatGPT 將誕生於何處,也成為了大眾最關心的問題之一。

鑑於 ChatGPT 是多項 AI 技術的集大成者,遠非「一日之功」。這背後離不開算力、數據、人才等資源的支持。環顧國內群雄,誰最有可能造出下一個 ChatGPT?

在這篇文章中,機器之心將盤點國內最具實力的一批學術型機構和 NLP 研究領域帶頭人,共分為高校、大廠、非營利研究機構、初創公司四個部分,供大家參考、討論。

如有盤點錯誤的地方,歡迎指正。

高校

清華大學自然語言處理與社會人文計算實驗室

清華大學計算機系自然語言處理與社會人文計算實驗室(THUNLP)成立於 20 世紀 70 年代末,是國內開展自然語言處理研究最早、深具影響力的科研單位。實驗室圍繞以中文為核心的自然語言處理,在大規模預訓練模型、中文信息處理、機器翻譯、社會計算、智慧教育和知識圖譜等方面開展了系統深入的研究。

實驗室學科帶頭人是孫茂松教授,教師團隊包括劉洋教授和劉知遠副教授。近年來,該實驗室承擔了一系列國家重點研發項目、國家社會科學基金重大項目等重要研究任務,並與騰訊、華為、阿里、美團等企業建立了密切的學術合作關係。相關成果產生的 Github 開源工具包共獲數萬星標。

代表成員:

孫茂松,THUNLP 實驗室學術帶頭人,清華大學計算機與科學技術系長聘教授,清華大學人工智慧研究院常務副院長,歐洲科學院外籍院士,中國人工智慧學會、中國中文信息處理學會會士。研究方向為自然語言理解、中文信息處理、Web 智能、社會計算和計算教育學等。近幾年在人工智慧和自然語言處理領域頂級國際期刊或會議發表論文 200 余篇,獲得國家授權發明專利 50 餘項。作為首席科學家主持完成國家重點基礎研究發展計劃(973 計劃)項目,國家社會科學基金重大項目。領銜研發中文詩歌自動生成系統「九歌」,累計為用戶創作 3000 萬首詩詞。

劉洋,清華大學計算機科學與技術系長聘教授,清華大學智能產業研究院副院長,國家傑出青年基金獲得者。擔任中國人工智慧學會組織工作委員會副秘書長、中國中文信息學會計算語言學專委會常務副主任。研究方向是自然語言處理、機器翻譯,獲得國家科技進步二等獎 1 項、省部級科技獎勵 4 項、重要國際會議優秀論文獎 2 項。

劉知遠,清華大學計算機科學與技術系長聘副教授。主要研究方向為表示學習、知識圖譜和社會計算。已在 ACL、EMNLP、AAAI、IJCAI 等人工智慧領域的著名國際期刊和會議發表相關論文 100 余篇,Google Scholar 統計引用 2.3 萬次。曾獲教育部自然科學一等獎(第 2 完成人)、中國中文信息學會錢偉長中文信息處理科學技術獎一等獎(第 2 完成人)、中國中文信息學會漢王青年創新獎,入選國家級青年人才、北京智源研究院青年科學家、2020 年 Elsevier 中國高被引學者、中國科學青年人才托舉工程。

代表成果:

「九歌」是孫茂松教授帶領的 THUAIPoet 團隊研發的中文詩歌自動生成系統,支持集句詩、絕句、藏頭詩、詞等不同體裁詩歌的在線生成。作為目前最有影響的詩歌生成系統之一,「九歌」 自 2017 年上線至今已累計為用戶創作超過 700 萬首詩詞,並於全國計算語言學學術會議 (CCL) 榮獲最佳論文獎 ( 2018 ) 和兩次最佳系統展示獎 ( 2017, 2019 ) 。體驗地址:http://jiuge.thunlp.org

清華大學知識工程實驗室

清華大學知識工程實驗室隸屬於清華大學計算機系,同時承擔了清華大學人工智慧研究院知識智能中心、清華大學 - 中國工程院知識智能聯合研究中心、網際網路教育智能技術及應用國家工程實驗室知識建模與分析中心的研究工作。實驗室成立於 1996 年,致力於網絡環境下知識工程理論、方法和應用研究,主要研究內容包括:知識圖譜、社會網絡、新聞挖掘等。研究成果在相關領域的 ACM/IEEE Transaction 以及計算機學會指定的 A 類國際期刊、會議上發表百餘篇高水平論文,Google Scholar 統計論文引用次數 1 萬餘次。發表在頂級國際會議(KDD)和權威期刊(TKDE)的論文引用次數排列前茅。

實驗室在理論與應用研究結合方面成績顯著,構建了國內大規模跨語言知識圖譜(http://XLore.org)、國內第一個全學科基礎教育知識圖譜(http://eduKG.cn)、科技情報大數據分析挖掘系統(http://AMiner.cn)、新聞挖掘分析系統(http://NewsMiner.net)。研究成果服務於華為、阿里、騰訊、搜狗等網際網路公司以及中國科協、科技部、國家基金委、中國工程院等政府部門與研究機構,先後獲得中國人工智慧學會科技進步一等獎和北京市科技進步一等獎等多項獎勵。

代表成員:

李涓子,清華大學計算機科學與技術系長聘教授,清華大學人工智慧研究院知識智能中心主任,中國中文信息學會語言與知識計算專委會主任。2000 年在清華大學獲得博士學位,研究領域為知識圖譜、新聞與社會網絡挖掘。主持研發了基於語義連結的跨語言知識圖譜 XLORE,參與研發了研究者社會網絡挖掘和服務系統 AMiner,曾獲北京市科技進步一等獎、人工智慧學會科技創新一等獎、王選新聞科學技術進步一等獎等多個獎項。


唐傑,清華大學計算機系教授,曾入選 ACM Fellow、IEEE Fellow。主要研究領域包括人工智慧、認知圖譜、數據挖掘、社交網絡和機器學習。2006 年畢業於清華大學,獲博士學位。唐傑曾主持研發了參數規模超過 1.75 萬億的超大規模預訓練模型「悟道」,以及研究者社會網絡挖掘系統 AMiner,吸引了全球 220 個國家和地區的 2000 多萬用戶。

代表成果:

開源雙語千億預訓練模型 GLM-130B 項目原作解讀轉載

清華大學交互式人工智慧(CoAI)課題組

清華大學交互式人工智慧課題組 (Conversational AI, CoAI) 隸屬於清華大學計算機系、清華大學人工智慧研究院。交互式人工智慧是指通過對話、問答等語言交互方式體現出來的智能行為,是人工智慧最具挑戰性、最綜合性的技術,涵蓋了語義理解、知識表示、邏輯與推理、語言生成等各個方面。

課題組由朱小燕教授、黃民烈副教授指導,與眾多國內外知名企業建立了廣泛合作,例如華為、谷歌、微軟、惠普、三星、斯倫貝謝、騰訊、阿里巴巴、搜狗、美團、好未來等。

代表成員:

朱小燕,清華大學計算機系教授、博士生導師。曾任智能技術與系統國家重點實驗室主任、北京市計算機學會副理事長、清華大學計算機系副主任、加拿大國際開發研究中心(DIRC)首席科學家。1982 年獲北京科技大學學士學位,1987 年獲日本神戶大學碩士學位,1990 年獲日本名古屋工業大學博士學位,1993 年到清華大學任教。長期在智能信息處理領域開展深入研究,在人工神經元網絡、機器學習、自然語言處理、信息獲取、智能問答系統、交互智能和人機互動等方面取得顯著成果。

黃民烈,清華大學計算機系長聘副教授,2000 年畢業於清華大學工程物理系,2006 年獲清華大學計算機科學與技術博士學位。研究興趣主要集中在人工智慧與機器學習方法包括深度學習、強化學習等,自然語言處理方法與應用,包括自動問答、閱讀理解、對話系統、情感分析等。主要研究語言理解、語言生成、語言匹配與推理中的科學問題,致力於解決對話系統、自動問答、閱讀理解中具有挑戰性的人工智慧問題。曾獲得漢王青年創新獎、微軟合作研究獎(Microsoft Collaborative Research Award)、IJCAI-ECAI 2018 傑出論文獎、CCL 2018 最佳系統展示獎、NLPCC 2015 最佳論文獎。

代表成果:

清華大學交互式人工智慧課題組(CoAI)長期以來一直致力於構建開源的中文開放領域對話預訓練基座模型,已有成果包括 CDial-GPT 、 EVA1.0、 EVA2.0、OPD 等。

北京大學人工智慧研究院自然語言處理研究中心

北京大學人工智慧研究院自然語言處理研究中心將以研發通用自然語言處理技術為目標,探索通用自然語言處理理論、方法和技術體系,研究通用性魯棒性強且支持跨模態的自然語言理解與生成方法,為通用人工智慧平台和領域 AI 大任務系統的提供技術支撐。主要研究方向有:語義分析與理解、文本推理、問答與對話、文本生成、跨模態語言智能、認知與知識計算等。

代表成員:

趙東岩,北京大學王選計算機研究所研究員,博士生導師。長期從事自然語言處理和大規模語義數據管理的前沿研究工作。主要研究方向為自然語言處理、大規模語義數據管理、基於知識的智能服務技術。主持科技部 2030 新一代人工智慧重大項目(基礎研究類)「面向自然語言的語義分析研究」等國家級項目 8 項,發表學術論文 100 余篇(包括 ACL、AAAI、IJCAI、SIGKDD、SIGIR、SIGMOD、VLDB,AI Journal、TKDE、VLDB Journal 等 CCF A 類會議和期刊 70 余篇),授權發明專利 23 項,先後七次獲得國家和省部級獎勵。

近五年來牽頭研製了具有自動擴展和質量控制功能的開放域語義知識庫構建技術、基於知識庫的語義理解與自然語言問答、語義搜尋引擎等一系列自然語言理解與認知智能的前沿技術,並開展了面向智能知識服務的行業應用。採用上述技術構建的 PKUBase 是國內科研單位建設最早且規模最大的語義知識庫之一。基於知識庫的語義理解和自然語言問答系統在歐盟組織的國際權威評測 QALD 上連續三年取得了第一名的成績,在美國 NIST 組織的 TREC 微博檢索任務上連續兩年取得第一名。

萬小軍,北京大學王選計算機研究所研究員、博士生導師,語言計算與網際網路挖掘研究室負責人,在北京大學獲得學士、碩士與博士學位。研究方向為自然語言處理與文本挖掘,研究興趣包括自動文摘、文本生成、情感分析、語義分析、多模態與多語言 NLP 等。曾擔任計算語言學頂級國際期刊 Computational Linguistics 編委、國際會議 EMNLP-IJCNLP 2019 程序委員會主席,現任 CCF-NLP 專委會秘書長、TACL 執行編輯、NLE 編委、JCST 編委,10 多次擔任相關領域重要國際會議領域主席,包括 ACL、NAACL、EMNLP、EACL,AACL 等。榮獲 ACL2017 傑出論文獎、IJCAI 2018 傑出論文獎、2017 年吳文俊人工智慧技術發明獎、CCF NLPCC 青年新銳獎等獎勵。研製推出了多款 AI 寫作機器人,如小明、小南、小柯等,應用於多家媒體單位。

馮岩松,北京大學王選計算機研究所副教授。2011 年畢業於英國愛丁堡大學,獲得信息科學博士學位。主要研究方向包括自然語言處理;連續多年在面向結構化知識庫的智能問答評測中獲得第一名;相關工作發表在 ACL、EMNLP、TPAMI、AIJ 等自然語言處理領域頂級會議及期刊上。多次擔任 ACL、EMNLP、NAACL、IJCAI 等領域重要國際會議的領域主席或高級程序委員會委員;作為項目負責人或課題骨幹承擔多項國家自然科學基金、科技部 863 計劃和重點研發項目;分別在 2014、2015 年獲得 IBM Faculty Award,2016 年 IBM Shared University Research Award。

復旦大學自然語言處理實驗室

復旦大學自然語言處理實驗室由復旦大學首席教授吳立德先生創建,是我國最早開展自然語言處理和信息檢索研究的實驗室之一。經過 40 餘年發展,在自然語言處理底層分析、文本檢索、自動問答、社會媒體分析等方面取得了一系列的研究成果。實驗室多年在國家自然科學基金、國家 863/973 / 重點研發計劃、省部委基金的支持下,發表了大量高水平國際期刊和會議論文,其中包括中國計算機學會推薦的 A/B 類國際會議和期刊論文(ACL,SIGIR,IJCAI,AAAI,NIPS,ICML 等)論文 150 余篇;參加多項國內外評測,如在自動問答國際評測 TREC/QA 中獲得第 3 名,在文本蘊涵評測 RITE 和閱讀理解評測 SQUAD 都位居前列;發布了國內首家中文自然語言開源系統 FudanNLP,被包括聯合國教科文組織在內的國內外多家研發機構採用。

代表成員:

黃萱菁,復旦大學計算機科學技術學院教授、博士生導師,主要從事自然語言處理、信息檢索和社會媒體分析研究,人工智慧、自然語言處理學科方向帶頭人。兼任中國中文信息學會理事、社會媒體專委會副主任,中國計算機學會自然語言處理專委會副主任、學術工作委員會委員、中國人工智慧學會女科技工作者委員會副主任、AACL 執委,EMNLP 2021 程序委員會主席。在高水平國際學術期刊和會議上發表了百餘篇論文,負責的多個科研項目受到國家自然科學基金、科技部、教育部、上海市科委的支持。獲 2021 年上海市育才獎,併入選「人工智慧全球女性」、「AI 2000 人工智慧全球最具影響力提名學者」及「福布斯中國 2020 科技女性榜」。

邱錫鵬,復旦大學計算機科學技術學院教授,博士生導師。國家優青獲得者,於復旦大學獲得理學學士和博士學位。主要從事自然語言處理、深度學習等方向的研究,發表 CCF A/B 類論文 70 余篇,獲得 ACL 2017 傑出論文獎(CCF A 類)、CCL 2019 最佳論文獎、《中國科學:技術科學》2021 年度高影響力論文獎,有 5 篇論文入選 PaperDigest 發布的 IJCAI/ACL/EMNLP 的最有影響力論文(被引用數進入前當屆會議的 20 名)。出版開源專著《神經網絡與深度學習》,Github 關注數 1.5 萬,豆瓣評分 9.4 分。

主持開發了開源框架 FudanNLP 和 FastNLP,已被國內外數百家單位使用。2015 年入選首屆中國科協青年人才托舉工程項目,2018 年獲錢偉長中文信息處理科學技術獎青年創新獎一等獎,2020 獲第四屆上海高校青年教師教學競賽優等獎,2021 年獲首屆上海市計算機學會教學成果獎一等獎(第一完成人)等。培養學生多次獲得一級學會優博、微軟學者、百度獎學金等。

代表成果:

2 月 20 日晚,復旦大學自然語言處理實驗室發布了具備 ChatGPT 能力的語言模型 ——MOSS,並面向大眾公開邀請內測。MOSS 可執行對話生成、編程、事實問答等一系列任務,打通了讓生成式語言模型理解人類意圖並具有對話能力的全部技術路徑。

西湖大學自然語言處理實驗室

西湖大學 NLP 實驗室由張岳博士帶領,長期開展自然語言處理方面的研究,實驗室研究方向包括自然語言處理、背後的機器學習算法以及相關的應用,在 ACL、EMNLP 等自然語言處理頂級會議發表過多篇高水平論文。

代表成員:

張岳,2003 年畢業於清華大學計算機科學專業,獲得學士學位;2006 年畢業於牛津大學計算機科學專業,獲得碩士學位;2009 年畢業於牛津大學計算機科學專業,獲得博士學位。2010 年 3 月 - 2012 年 6 月在劍橋大學計算機科學專業從事博士後研究,2012 年 7 月 - 2018 年 8 月在新加坡科技與設計大學擔任助理教授。2018 年 9 月全職加入西湖大學,擔任終身副教授。主要研究領域為自然語言處理、文本挖掘、機器學習和人工智慧,具體研究方向包括:1. 中英文基礎自然語言處理中的詞法、句法及語義表示,分析。2. 信息抽取中的實體、關係、事件以及情感抽取。3. 金融領域、生物醫藥領域以及文學領域的文本挖掘。4. 自然語言生成及其在文本總結與機器翻譯中的應用。

張岳博士是近幾年全球 NLP 相關頂會最高產的學者之一。根據相關統計,在 2012 年 - 2020 年期間,張岳博士在 NLP 領域的頂會發表的論文數量是全球第三,僅次於周明和 Yoshua Bengio。

藍振忠,西湖大學助理教授、博士生導師,西湖心辰(杭州)科技有限公司創始人。藍振忠博士畢業於卡耐基梅隆大學計算機學院,是 NLP 自然語言處理領域預訓練語言模型「 ALBERT 」第一作者。

藍振忠長期致力於研究自然語言處理,計算機視覺及深度學習的結合與應用。此前在谷歌 AI 研究所工作,研發成果被應用於谷歌新聞、谷歌助手等多個擁有億級以上用戶的產品;2020 年受聘於西湖大學,創辦深度學習實驗室並擔任博士生導師,而後迅速帶領團隊研發出了 AI 心理諮詢師「小天」、智能寫作平台 FRIDAY 以及 AI 繪畫產品「盜夢師」;2021 年被麻省理工大學評選為亞太地區「 35 歲以下科技創新 35 人」之一。

哈爾濱工業大學 自然語言處理研究所

哈工大的自然語言處理研究開始於 1979 年俄漢題錄翻譯的研究,更加系統深入的研究開始於上世紀 80 年代,圍繞中文信息處理這一核心,在機器翻譯、中文輸入法、自然語言處理平台、語言知識資源建設等方面相繼展開研究,培養了一批以周明、王海峰、張民、荀恩東為代表的優秀校友,取得了一批以「語句輸入」、「語言技術平台 LTP」為代表的標誌性成果,成為我國在自然語言處理領域一支重要的力量。

2020 年 7 月 17 日,哈爾濱工業大學計算學部批准成立自然語言處理研究所。研究所隸屬於哈工大計算學部,由本部的社會計算與信息檢索研究中心、語言技術研究中心和深圳校區的智能計算研究中心組成。

代表成員:

趙鐵軍,教授,博士生導師,哈工大教育部 - 微軟語言語音重點實驗室主任,兼任中國中文信息學會常務理事,中國計算機學會自然語言處理專業委員會副主任,《中文信息學報》、《自動化學報》編委。1987 年開始從事中文信息處理領域相關研究,主要研究方向:自然語言理解、人工智慧應用。近年來承擔國家自然科學基金重點項目、面上項目、國家重點研發計劃項目、國家高技術計劃項目、科技部國際合作項目等 7 項,2018 年擔任國家重點研發計劃司法專題項目(2018YFC0830700)首席科學家;發表學術論文 60 余篇。先後獲部級科技進步獎 6 項,出版專著、譯著 3 部。

車萬翔,教授,哈爾濱工業大學計算學部長聘教授、博士生導師,社會計算與信息檢索研究中心副主任。教育部青年長江學者,黑龍江省「龍江學者」青年學者,史丹福大學訪問學者。在 ACL、EMNLP、AAAI、IJCAI 等國內外高水平期刊和會議上發表學術論文 50 余篇,其中 AAAI 2013 年的文章獲得了最佳論文提名獎,論文累計被引用 4,600 余次(Google Scholar 數據),H-index 值為 37。負責研發的語言技術平台(LTP)已被 600 余家單位共享,並授權給百度、騰訊、華為等公司使用。2018、2019 連續兩年獲 CoNLL 國際評測第 1 名。2015、2016 連續兩年獲谷歌專注研究獎。2017 年,所主講的 MOOC 課程《高級語言程序設計(Python)》獲國家精品在線開放課程。

秦兵,教授,博士生導師,哈爾濱工業大學計算機學院社會計算與信息檢索研究中心主任。擔任中國中文信息學會理事、中國中文信息學會語言與知識計算專委會副主任,國家自然科學基金重點項目負責人。主要研究方向知識圖譜構建、文本情感計算、文本理解與自動生成。連續主持多項國家自然科學基金面上項目及科技部重點研發計劃課題。獲黑龍江省科技進步一等獎、黑龍江省技術發明二等獎、錢偉長中文信息處理科學技術獎等獎項。在國內外重要會議和期刊發表論文 100 余篇,論文累計被引用 6234 余次(Google Scholar 數據),H-index 值為 31。持續與多家網際網路企業開展合作,多項研究成果在企業應用落地。入選「2020 年度人工智慧全球女性榜單」和「福布斯中國 2020 科技女性榜」

劉挺,博士生導師,哈工大計算學部主任兼計算機學院院長。多次擔任國家 863 重點項目總體組專家、基金委會評專家。中國計算機學會理事,中國中文信息學會常務理事 / 社會媒體處理專委會(SMP)主任,曾任國際頂級會議 ACL、EMNLP 領域主席。主要研究方向為人工智慧、自然語言處理和社會計算,是國家 973 課題、國家自然科學基金重點項目負責人。主持研製「語言技術平台 LTP」、「大詞林」等科研成果被業界廣泛使用。曾獲國家科技進步二等獎、省科技進步一等獎、錢偉長中文信息處理科學技術一等獎等。

張偉男,哈爾濱工業大學計算機學院院長助理、副教授、博士生導師,黑龍江省中文信息處理重點實驗室副主任。曾擔任 ACL、EMNLP 領域主席、AAAI 高級程序委員會委員(SPC)及多個國際會議及期刊的程序委員會成員、審稿人及期刊編委。目前為中國中文信息學會青年工作委員會副主任,中國計算機學會(CCF)術語審定工作委員會執委、CCF 哈爾濱分部秘書長,中國人工智慧學會教育工作委員會副秘書長,北京智源青源會會員。主要從事人機對話及自然語言處理等研究。在 ACL、AAAI、WWW、IJCAI、IEEE TKDE、ACM TOIS 等 CCF A 類國際會議及期刊發表學術論文多篇;主導研發了智能人機對話系統「笨笨」,2019 年 3 月「笨笨」中的開放域人機對話功能成功落地到科大訊飛 AIUI 智能交互平台;獲黑龍江省科技進步一等獎、吳文俊人工智慧科技進步二等獎及黑龍江省青年科技獎等。

中科院自動化所模式識別國家重點實驗室自然語言處理團隊

中科院自動化所模式識別國家重點實驗室於 1984 年由國家計委批准籌建,1987 年通過國家驗收並正式對外開放,依託於中國科學院自動化研究所。實驗室目前的主要研究方向為模式識別、計算機視覺、圖像處理與圖形學,口語信息處理、自然語言處理以及模式識別應用與系統等。

代表成員:

宗成慶,中科院自動化所研究員、博士生導師、國際計算語言學委員會(ICCL)委員、中國人工智慧學會會士和中國計算機學會會士。他於 1998 年 3 月在中科院計算所獲得博士學位,主要研究興趣包括自然語言處理、機器翻譯、文本數據挖掘和語言認知計算等領域,曾獲國家科學技術進步獎二等獎、中國電子學會科技進步獎一等獎等若干獎勵和榮譽。

張家俊,中國科學院自動化研究所研究員、博士生導師,主要研究方向為機器翻譯和自然語言處理,獲得國家優秀青年科學基金資助,入選中國科協首屆青年人才托舉工程、中國科學院青年創新促進會優秀會員和北京智源青年科學家。發表 CCF-A/B 類論文 80 余篇,出版學術專著 2 部、譯著 1 部,獲得中國中文信息學會錢偉長中文信息處理科學技術獎一等獎、青年創新獎一等獎和 2020 年北京市科學技術獎一等獎等。擔任中國中文信息學會理事、青年工作委員會主任和機器翻譯專委會副主任。擔任 ACL/EMNLP/COLING 的 (資深) 領域主席,以及《自動化學報》等期刊的編委。

中科院計算所自然語言處理研究組

中國科學院計算技術研究所自然語言處理研究組隸屬於中國科學院智能信息處理重點實驗室,主要從事自然語言處理相關的研究工作,主要研究方向包括機器翻譯、人機對話等。研究組在自然語言處理領域旗艦會議 ACL 和影響力最大的期刊 CL 上分別發表了國內首篇論文;獲 ACL 2019 最佳長文獎,為 ACL 開辦以來國內單位首次獲得此獎項;獲 ACL 2006 Meritorious Asian NLP Paper Award,為國內學者首次獲得 ACL 論文獎;獲 EMNLP 2008 最佳論文提名獎、2020 世界人工智慧大會青年優秀論文獎等。多次在 IWSLT 國際機器翻譯評測和 CWMT 機器翻譯評測中獲得第一名,並在由美國國防部 DARPA 資助的、NIST 組織的世界權威機器翻譯評測中獲國內研究機構最好成績。部分研究成果獲國家科技進步獎二等獎、北京市科技進步二等獎、錢偉長中文信息處理科學技術獎一等獎、中國電子學會科學技術獎科技進步一等獎等。

代表成員:

馮洋,研究員、博士生導師,中科院計算所「新百星人才引進計劃」入選者、2019 年度「卓越之星」獲得者、自然語言處理課題組負責人。研究方向為自然語言處理、機器翻譯、人機對話。在中科院計算所獲得博士學位後,先後在謝菲爾德大學和南加州大學信息科學研究所(USC/ISI)開展研究工作。曾獲 ACL 2019 最佳長文獎,為 ACL 開辦 50 多年以來國內首次獲得該獎項。多次在 NIST、CWMT、DSTC 等國內外權威機器翻譯評測和對話系統比賽中獲得第一名,作為項目負責人主持國家重點研發計劃、國家自然科學基金面上項目等,與華為、騰訊、百度、字節跳動等公司開展合作研究。

中科院軟體研究所中文信息處理實驗室

中科院軟體研究所中文信息處理實驗室始於 1996 年成立的「開放系統與中文信息處理中心」。實驗室當前主要圍繞網際網路環境下的自然語言理解這一中文信息處理領域的核心問題,開展中文信息的認知和理解機理、大規模中文知識圖譜、基於知識的中文分析以及面向大數據智能服務的中文問答等關鍵技術研究。

實驗室成員 2000 年起參加 TREC、NTCIR、DUC、TAC 等信息檢索和自然語言處理領域的權威國際評測,並多次取得優異成績。實驗室目前承擔著國家重大研發計劃、國家自然科學基金重點項目、新聞出版署重大專項、國家語委重點項目、大型網際網路企業合作(華為、阿里、百度)等 10 多項研究和開發任務,近年來在 ACL、SIGIR、AAAI、EMNLP 等頂級國際會議發表論文 50 多篇。

代表成員:

韓先培,中科院軟體所研究員,擔任中文信息處理實驗室副主任,入選國家優青、中國科協青年人才托舉計劃及北京智源青年科學家。主要研究方向為信息抽取、知識圖譜及自然語言理解。承擔中科院戰略先導、科技創新 2030 課題、國家重點研發專項等十餘項課題。在 ACL、SIGIR、IJCAI 等重要國際會議發表論文 60 余篇。擔任中國中文信息學會理事及語言與知識計算專業委員會副主任。相關成果獲中國中文信息學會漢王青年創新獎一等獎及科學技術獎一等獎。

中國人民大學高瓴人工智慧學院

中國人民大學高瓴人工智慧學院由高瓴資本創始人、耶魯大學校董、中國人民大學校友張磊先生捐資支持建設。高瓴人工智慧學院博士生導師實行人才培養導師組的形式,研究方向為:人工智慧基礎理論,智能信息檢索,機器學習,計算機視覺,自然語言處理,人工智慧交叉應用等。

學院已與百度、華為分別簽訂人才培養合作協議、「智能基座」產教融合基地合作協議,與百度共建「松果實踐基地」,與北京智源人工智慧研究院、微軟亞洲研究院開展人工智慧創新人才聯合培養,與聯通、京東、滴滴、浪潮、愛奇藝、美團點評等 20 余家知名企業設立了實訓基地。

2021 年學院師生共發表高水平論文(中國計算機學會 CCF A/B 類)100 余篇。文繼榮院長作為北京智源研究院首席科學家,帶領團隊研發首個中文超大規模多模態預訓練模型「文瀾」,產生廣泛影響。

在國際排行榜 CSRankings 中,2021 年中國人民大學人工智慧領域世界排名已升至第 16 位,在網際網路與信息檢索方向排名位居世界第一。更多國際一流學者正在陸續加入人才培養導師組。

代表成員:

文繼榮,中國人民大學高瓴人工智慧學院執行院長、信息學院院長,大數據管理與分析方法研究北京市重點實驗室主任,北京智源人工智慧研究院首席科學家。曾任微軟亞洲研究院高級研究員和網際網路搜索與挖掘組主任。長期從事大數據和人工智慧領域的研究,已在信息檢索、數據挖掘、機器學習、資料庫等領域國際著名學術會議和期刊上發表論文 200 余篇,總計引用 15000 余次,H-Index 為 57。

竇志成,中國人民大學高瓴人工智慧學院副院長、教授,北京智源人工智慧研究院「智能信息檢索與挖掘」方向項目經理,基於大數據文科綜合訓練國家級虛擬仿真實驗教學中心執行主任。2008 至 2014 年在微軟亞洲研究院工作,2014 年開始在中國人民大學任教。主要研究方向為智能信息檢索、自然語言處理、大數據分析。已在國際知名學術會議和期刊上(如 SIGIR、WWW、CIKM、WSDM、ACL、EMNLP、TKDE 等)發表論文 50 余篇,獲 SIGIR 2013 最佳論文提名獎,AIRS 2012 最佳論文獎。

盧志武,中國人民大學高瓴人工智慧學院教授,博士生導師。2005 年 7 月畢業於北京大學數學科學學院信息科學系,獲理學碩士學位;2011 年 3 月畢業於香港城市大學計算機系,獲 PhD 學位。主要研究方向包括機器學習、計算機視覺等。主持 NSFC、KJW 等多個國家項目。設計首個公開的中文通用圖文預訓練模型文瀾 BriVL,並發表於 Nature Communications。以主要作者身份發表學術論文 70 余篇,其中在 TPAMI、IJCV、TIP、TCYB、TGRS 等重要國際期刊和 NeurIPS、AAAI、IJCAI、CVPR、ICCV、ECCV 等重要國際會議上發表論文 40 余篇,CCF A 類論文 25 篇,入選 ESI 高被引論文 1 篇。

趙鑫,教授、博士生導師。研究方向為自然語言處理以及推薦系統。近五年內在國內外著名學術期刊與會議上發表論文 80 余篇,其中包括信息檢索領域頂級學術期刊 ACM TOIS 和學術會議 SIGIR、數據挖掘領域頂級學術期刊 IEEE TKDE 和學術會議 SIGKDD、自然語言處理頂級會議 ACL 和 EMNLP。所發表的學術論文取得了一定的關注度,據 Google Scholar 統計,已發表論文共計被引用 4000 余次,其中以第一作者發表《Comparing Twitter and Traditional Media Using Topic Models》被引用 1300 余次。

代表成果:

在中國人民大學高瓴人工智慧學院執行院長、智源首席科學家文繼榮教授的帶領下,中國人民大學、北京智源人工智慧研究院、中科院計算所的研究團隊合作開展了大規模中文多模態預訓練模型的研究,並發布了第一代悟道・文瀾,旨在發掘預訓練模型在中文通用多模態數據上的理解能力。文瀾模型經過 6.5 億弱相關中文圖文對的預訓練,學習到獨特的中文語義理解能力並能很好地將中文語義與視覺信息聯繫起來,尤其擅長讀取中文獨有的含蓄語義與圖片中的抽象概念。

南京大學自然語言處理研究組

南京大學自然語言處理研究組從事自然語言處理領域的研究工作始於 20 世紀 80 年代。近年來,研究組在自然語言處理的多個方向上做了大量、深入的工作,集中關注文本分析、機器翻譯、社交媒體分析推薦、知識問答等多個熱點問題,結合統計方法和深度學習方法進行問題建模和求解,取得了豐富的成果。研究組在自然語言處理頂級國際會議 ACL、EMNLP、NAACL 和人工智慧頂級國際會議 IJCAI 和 AAAI 上發表論文三十餘篇,相關系統在機器翻譯、中文分詞、命名實體識別、情感計算等多個國際國內評測中名列前茅。

代表成員:

陳家駿,教授、博士生導師。南京大學計算機系自然語言處理實驗室主任,中國中文信息學會理事。畢業於南京大學計算機軟體專業,獲學士、碩士和博士學位。20 世紀 80 年代就開始從事自然語言處理和軟體工程領域的研究與系統開發工作,研究方向包括機器翻譯、漢語語言處理以及程序設計語言等。承擔過國家 863 高技術、國家自然科學基金、國家社科基金以及教育部博士點基金等項目的研究工作;獲得過國家七・五科技攻關重大成果獎、教育部科技進步二等獎等科研獎勵;發表學術論文 180 余篇,其中包括領域頂級會議和期刊(ACL、EMNLP、NAACL、TALLIP、TACL、AAAI、IJCAI 等)論文數十餘篇。

進擊的大廠

隨著 ChatGPT 的出圈,很多國內大廠也開始支持類 ChatGPT 大模型研究。如果說學術界更看重理論前沿的探索,那麼對於企業界來說,想要打造出「ChatGPT」則意味著在各個層面的能力均有所布局。

OpenAI 早在 2017 年就開始了 GPT 系列模型的研發,並且幾年內來多次疊代。鑑於 OpenAI 並不是一家普通的「初創公司」,背後有微軟提供的雲算力支持,還有數年如一日、不計回報的高額研發投入,以及多年積累的海量用戶數據。縱觀國內,同時具備這幾項基礎條件的企業並不多。

在搜索業務和問答業務方面已積累了大量經驗的企業更具優勢,更可能走在前列。目前,在自然語言處理領域,百度、騰訊、阿里等大廠各種都有相關的技術沉澱和產品化的積累,在硬體、模型、產品層面的積澱尚可與 OpenAI 或者谷歌、微軟這類矽谷巨頭對標。

即使如此,做出對標 ChatGPT 的產品仍不容易,這也是當下各大企業實驗室集中攻關的主題。

百度自然語言處理團隊

百度是最早針對 ChatGPT 做出明確表態的公司之一,2 月 7 日即官宣在 3 月上線百度版 ChatGPT「文心一言」(英文名 ERNIE Bot)。

百度給出的回應中提到「ChatGPT 相關技術百度都有」:「百度在人工智慧四層架構中有全棧布局,包括底層晶片、深度學習框架、大模型以及最上層的搜索等應用。」

在國內的科技企業中,百度大模型產品體系和開發工具是比較成熟的。此外,百度搜索早就接入了文心相關技術,這次「文心一言」的推出或將對百度搜索的升級起到重大作用。

近日,據 36 氪報導,百度目前籌備「文心一言」的團隊主要由 TPG(技術中台事業群)、MEG(移動生態事業群)兩大部門協同。前者負責技術攻堅,後者進行搜索、內容產品承接。項目由百度 CTO 王海峰任總指揮,其他帶隊高管還包括:百度集團副總裁吳甜(同時擔任深度學習技術及應用國家工程研究中心副主任)、百度技術委員會主席吳華等人。

代表成員:

王海峰,現任百度首席技術官,深度學習技術及應用國家工程研究中心主任。王海峰博士是自然語言處理領域世界上最具影響力的國際學術組織 ACL(Association for Computational Linguistics)50 多年歷史上首位華人主席(President)、ACL 亞太分會創始主席、ACL Fellow,還是 IEEE Fellow、CAAI Fellow 及國際歐亞科學院院士等。王海峰博士先後創建和發展了自然語言處理、知識圖譜、語音、圖像、機器學習和深度學習等百度人工智慧技術方向,先後負責百度搜索、百度地圖、百度翻譯、百度智能雲等業務。

吳甜,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任。負責百度人工智慧技術平台與生態,涵蓋自然語言處理、知識圖譜、計算機視覺、增強現實、飛槳深度學習平台(PaddlePaddle)、百度大腦開放平台等。

吳華,百度技術委員會主席。主要研究領域包括自然語言處理、機器翻譯、人機對話、知識挖掘、機器學習等。負責的百度翻譯項目翻譯質量處於世界領先水平,並獲國家科學技術進步獎二等獎。吳華在語法語義分析、機器學習、人機互動、自動問答等方向上進行了多項創新,其成果已應用於百度多數產品。2015 年,吳華曾在百度帶隊研發出世界上首個網際網路 NMT (神經網絡機器翻譯) 系統。

代表成果:

2019 年開始,百度深耕預訓練模型研發,先後發布知識增強文心(ERNIE)系列模型。文心系列模型基於持續學習的語義理解框架,從大規模知識和海量數據中融合學習,具備跨模態、跨語言的深度語義理解與生成能力。2021 年 12 月,ERNIE 3.0 升級為全球首個知識增強千億大模型鵬城 - 百度・文心,同時,產業級知識增強大模型文心全景圖亮相。

通過多年的技術探索與產業實踐,百度文心大模型已經構建了「模型 + 工具平台 + 產品社區」三層體系。即將推出的「文心一言」就位於模型層。

阿里巴巴達摩院語言技術實驗室

阿里巴巴達摩院語言技術實驗室為機器智能技術實驗室下屬實驗室,是阿里巴巴負責 NLP 技術研發的核心團隊,為阿里巴巴經濟體提供包括 NLP 基礎技術、對話技術、應用算法、機器翻譯、內容搜索推薦等技術,在經濟體內數千業務方應用,日調用萬億級,並在很多重要行業如電商、司法、醫療、通信等賦能數千家合作夥伴和外部客戶。

其中,對話智能團隊專注於人機對話交互的創新研究和大規模應用,打造了智能對話開發平台 Dialog Studio,以及 KBQA、TableQA、FAQs、MRC 等智能問答技術,在自然語言理解、多輪對話管理、元學習、遷移學習、基於知識圖譜問答等多個方向上取得前沿進展。開發的對話技術平台和雲小蜜產品已經大規模服務於淘寶天貓電商平台、釘釘、公有雲、私有雲、國際化等業務中,並在智能服務市場居於業界領先地位。

代表成員:

周靖人,哥倫比亞大學計算機科學博士,浙江大學兼職教授,IEEE Fellow。現任阿里巴巴集團資深副總裁,達摩院副院長。曾負責阿里雲計算平台,淘寶和支付寶搜索、推薦、廣告等數據智能業務。研究方向包括雲計算、大數據、人工智慧算法及應用。多次擔任 VLDB,SIGMOD,ICDE 等國際頂級會議程序委員會主編、主席,在頂尖國際期刊和會議上發表論文超百篇,並擁有幾十項技術專利。2022 年 12 月,任阿里雲智能 CTO 兼任達摩院副院長。

司羅,阿里巴巴副總裁兼達摩院語言技術實驗室負責人,2014 年成為阿里人工智慧科學家陣營的一員,帶領阿里 NLP 團隊取得多項重要成果。他領導阿里巴巴語言智能、機器翻譯、文本分析、對話智能以及文本搜索等技術研究方向,累計發表學術論文 180 多篇,被廣泛引用。司羅是最早一批從學術界轉向工業界的人工智慧科學家之一。在加入阿里巴巴之前,司羅是美國普渡大學計算機系的終身教授,並先後獲得美國國家科學基金會成就獎、雅虎、谷歌研究獎等。更早之前,司羅先後獲得清華大學和卡內基梅隆大學的計算機學士和博士學位。他曾先後擔任 ACM 信息系統(TOIS)、ACM 交互信息系統(TIIS)和信息處理與管理(IPM)編輯委員會的副主編,並多次在國際學術會議擔任重要職務(如 2016 ACM CIKM 技術主席)。2019 年,司羅當選 ACM 2019 傑出科學家。

黃非,阿里巴巴達摩院機器智能語言技術實驗室研究員,自然語言基礎技術,對話技術和多模態翻譯團隊負責人。他領導 AliNLP 基礎技術研發和業務落地,雲小蜜對話技術和多模態翻譯技術,並支持集團內外的國際化業務需求。黃非博士畢業於卡耐基梅隆大學計算機學院。之後在 IBM 和 Facebook 從事自然語言處理的研發和技術管理等職位。他在自然語言處理和人工智慧的頂級會議和期刊發表文章 40 多篇,獲得美國專利 10 多項,曾擔任 ACL,IJCAI,COLING 等多個 NLP 國際會議的領域主席 / 資深程序委員和多個期刊會議論文的審稿人。

李永彬,畢業於清華大學,阿里巴巴達摩院資深算法專家,研究方向為Conversational AI & 預訓練大模型。近年來圍繞對話預訓練、人機對話交互、人機協同交互、多模態對話等方向發表30+篇頂會論文(ACL/EMNLP/AAAI等),其中達摩院通義對話大模型SPACE-1/2/3 系列模型在11個國際公開對話數據集取得SOTA,並分別被AAAI22/COLING22/SIGIR22長文錄用。2022年團隊發表25篇頂會論文,其中EMNLP2022一次中稿10篇論文。同時負責對話智能在阿里雲、電商、釘釘等場景的大規模產品化落地,在中國對話式AI雲服務市場份額排名第一。

代表成果:

2021 年初,阿里巴巴達摩院提出了百億參數的超大規模中文多模態預訓練模型 M6,並持續推出多個版本,參數逐步從百億規模擴展到十萬億規模,在大模型、綠色 / 低碳 AI、AI 商業化、服務化等諸多方面取得突破性進展。

2022 年,在探索算力極限的同時,他們也積極展開了針對通用模型的探索,提出業界首個通用的統一大模型(模態、任務和架構)M6-OFA,極大地降低了模型在預訓練、適配下游任務、推理過程中的難度。這個大模型是達摩院公布的阿里巴巴「通義」大模型系列的一部分。該系列分為三個層級:最底層為統一模型底座,中間基於底座的通用模型層覆蓋了通義 - M6、通義 - AliceMind 和通義 - 視覺,專業模型層深入電商、醫療、娛樂、設計、金融等行業。

京東雲 自然語言處理團隊

在通用型 Chat AI 方向,京東雲已經打造了包括京東智能客服系統、京小智平台商家服務系統、智能金融服務大腦、智能政務熱線,言犀智能外呼、言犀數字人等系列產品和解決方案。拆解到細分技術領域,京東雲在文本生成、對話生成、數字人生成方向等方向也已經做出了一些成果。

代表成員:

何曉冬,京東集團副總裁,京東人工智慧研究院執行院長,深度學習及語音和語言實驗室主任,IEEE Fellow,同時在位於西雅圖的華盛頓大學兼任教授、博士生導師。何曉冬博士的研究方向主要聚焦在人工智慧領域。其在深度學習、自然語言處理、語音識別、計算機視覺及信息檢索等方面均有重要貢獻。其工作包括 DSSM(深度結構語義模型 / 深度語義匹配模型)和圖像描述機器人 Caption Bot 等。在加入京東之前,何曉冬博士就職於美國微軟雷德蒙德研究院,擔任主任研究員(Principal Researcher)及深度學習技術中心(DLTC)負責人。何曉冬博士於 1996 年獲清華大學學士學位,1999 年獲中國科學院碩士學位,2003 年獲美國密蘇里大學 - 哥倫比亞分校博士學位。

吳友政, 京東集團高級總監,京東科技語音語言算法部負責人。2006 年中科院自博士畢業後,先後在日本國立信息通信研究機構、英國愛丁堡大學、索尼中國研究院從事自然語言處理相關研究工作。工作主要聚焦自然語言處理、人機對話、語音識別、機器翻譯等前沿技術研究和產品研發工作,並取得了諸多技術突破,累計發表頂級國際會議和期刊論文 30 余篇,曾獲得語音識別(IWSLT2012、IWSLT2013)和自然語言處理(QuAC2021,DROP2022,Multiwoz2022)領域多項國際比賽的冠軍。他與團隊密切合作打造了言犀人工智慧應用平台,為客戶提供涵蓋客戶服務、營銷導購、流程自動化的整體智能化解決方案,為京東超 5.8 億用戶提供智能服務,也為零售、政務、金融、交通等行業提供產品與解決方案。

代表成果:

基於產業需求,京東雲旗下言犀人工智慧應用平台將推出 ChatJD,定位為產業版 ChatGPT,旨在打造優勢、高頻、剛需的產業版通用 ChatGPT。

ChatJD 將通過在垂直產業的深耕,快速達成落地應用的標準,並不斷推動不同產業之間的泛化,形成更多通用產業版 ChatGPT,構建數據和模型的飛輪,以細分、真實、專業場景日臻完善平台能力,最終反哺和完善通用 ChatGPT 的產業應用能力。

ChatJD 將以「125」計劃作為落地應用路線圖,包含一個平台、兩個領域、五個應用。

  • 1 個平台:ChatJD 智能人機對話平台,即自然語言處理中理解和生成任務的對話平台,預計參數量達千億級;
  • 2 個領域:零售、金融,得益於京東雲在零售與金融領域 10 餘年真實場景的深耕與沉澱,已擁有 4 層知識體系、40 多個獨立子系統、3000 多個意圖以及 3000 萬個高質量問答知識點,覆蓋超過 1000 萬種自營商品的電商知識圖譜,更加垂直與聚焦;
  • 5 個應用:內容生成、人機對話、用戶意圖理解、信息抽取、情感分類,涵蓋零售和金融行業復用程度最高的應用場景,在客戶諮詢與服務、營銷文案生成、商品摘要生成、電商直播、數字人、研報生成、金融分析等領域將發揮廣泛的落地價值。

騰訊AI Lab

騰訊 AI Lab 是騰訊的企業級 AI 實驗室,於 2016 年 4 月在深圳成立。實驗室由 100 余位來自世界知名院校的科學家,以及 300 多位經驗豐富的應用工程師組成,並與世界頂級院校與機構合作,共同打造產學研用一體的 AI 生態。目前,實驗室已在 ICML、CVPR、NeurIPS、ACL、ICASSP 等多個頂級學術會議或期刊累計入選論文超過 780 篇。

在基礎研究方面,關注機器學習、計算機視覺、語音技術及自然語言處理等四大方向,780 多篇研究論文已覆蓋國際頂級學術會議。在技術應用方面,聚焦在遊戲、數字人、內容、社交四大領域,在微信、QQ 等 100 多個產品中落地。

在自然語言處理方向,騰訊 AI Lab 旨在藉助騰訊豐富應用場景、大數據、計算力及一流人才方面的長期積累,賦予計算機系統以自然語言文本方式與外界交互的能力,追蹤和研究最前沿的自然語言文本理解和生成技術,孵化下一代自然語言處理技術與商業應用場景。研究方向包括文本理解、文本生成、智能對話、機器翻譯等。

除騰訊 AI Lab 之外,騰訊 QQ 瀏覽器實驗室、微信 AI 實驗室等均設有 NLP 方向的研究團隊。

代表成員:

張正友,騰訊首席科學家、騰訊 AI Lab 及 Robotics X 實驗室主任。1985 年本科畢業於浙江大學信息與電子工程系,於 1987 年在南錫第一大學(現洛林大學)獲計算機科學碩士學位,並於 1990 年獲巴黎第十一大學計算機科學博士學位。2021 年 1 月 8 日,張正友受聘騰訊歷史上最高專業職級 ——17 級研究員 / 傑出科學家。

俞棟,騰訊 AI Lab 副主任,主要研究領域涵蓋自動語音識別、語音處理和自然語言處理等,是將深度學習技術成功應用到語音識別領域的開創者之一。作為 100 多項專利的發明人及開源軟體 CNTK 的發起人和早期主要開發者,俞棟發表了多篇引領性的論文,獲得了 IEEE 信號處理協會 2013、 2016、2020 和 2022 年的最佳論文獎(表彰過去 6 年內發表的最佳期刊論文),2021 年 NAACL 最佳長文獎, 2022 年 IEEE 信號處理雜誌最佳論文獎(表彰過去 10 年內發表的最佳論文),以及 2022 年 IEEE 信號處理雜誌最佳專欄獎(表彰過去 10 年內發表的最佳專欄文章),谷歌學術引用量高達 5 萬多次,h-index 超過 80。他提出的理論與模型已經廣泛用於業界的語音識別和處理系統中。

代表成果:

騰訊公司的相關技術儲備包括「混元」系列 AI 大模型、智能創作助手文涌(Effidit)等。

混元系列 AI 大模型來自騰訊廣告多媒體 AI 團隊,完整覆蓋了 NLP(自然語言處理)、CV(計算機視覺)、多模態等基礎模型和眾多行業 / 領域模型。去年,混元 AI 大模型團隊推出了萬億級別中文 NLP 預訓練模型 HunYuan-NLP-1T,該模型已落地於騰訊廣告、搜索、對話等內部產品並通過騰訊雲服務外部客戶。

智能創作助手「文涌」為騰訊 AI Lab 出品,實現融合了知識抽取、文本理解、文本生成、大規模預訓練模型、經典語言模型、搜索等技術,具有智能糾錯、文本補全、文本潤色等功能,部分功能的實現使用「混元」系列 AI 大模型作為底層預訓練模型。

在 2 月 9 日對 ChatGPT 的相關回應中,騰訊公司表示:「目前,騰訊在相關方向上已有布局,專項研究也在有序推進。騰訊持續投入 AI 等前沿技術的研發,基於此前在 AI 大模型、機器學習算法以及 NLP 等領域的技術儲備,將進一步開展前沿研究及應用探索。」

科大訊飛

科大訊飛在 NLP 方面同樣有諸多研究積累。2005 年,科大訊飛研究院正式成立。2017 年 12 月 13 日,科技部批准依託科大訊飛股份有限公司建設認知智能國家重點實驗室。這一實驗室是科技部首批 20 家標杆全國重點實驗室之一,多年來始終保持關鍵核心技術處於世界前沿水平,在去年曾獲得 CommonsenseQA 2.0、OpenBookQA 等 12 項認知智能領域權威評測的第一。實驗室瞄準國際認知智能技術的理論和技術發展前沿,面向國家重大戰略需求和人工智慧產業發展,以人機互動、智慧教育、智慧醫療、智慧司法等領域對認知智能技術的廣泛和共性需求為牽引,重點開展語義計算、知識建模等認知智能基礎理論及技術研究。

與此同時,科大訊飛面向認知智能領域陸續開源了 6 大類、超過 40 個通用領域的系列中文預訓練語言模型,成為業界最廣泛流行的中文預訓練模型系列之一,在 GitHub 獲 13346 顆星,位列中文預訓練模型星標數第一。

2 月 8 日,科大訊飛在投資者互動平台回應稱,ChatGPT 主要涉及到自然語言處理相關技術,屬於認知智能領域的應用之一,公司在該方向技術和應用具備長期深厚的積累。科大訊飛 AI 學習機將成為該項技術率先落地的產品,將於今年 5 月 6 日進行產品級發布。

代表成員:

胡國平,認知智能全國重點實驗室主任,科大訊飛高級副總裁,研究院院長,訊飛創始團隊成員之一,中國科學技術大學兼職教授、博導,國家新一代人工智慧重大專項指南專家,中國人工智慧學會會士。自 1998 年以來,一直從事智能語音及人工智慧核心技術研究及產業化工作,多次承擔國家 863、自然科學基金以及省部級等層面的重大科研項目, 曾獲國家科技進步二等獎、 國家信息產業重大技術發明獎、省科技進步一等獎、萬人計劃中青年領軍人才等。

美團搜索與 NLP 部

美團搜索與 NLP 部是美團人工智慧技術研發的核心團隊,致力於打造高性能、高擴展的搜尋引擎和領先的自然語言處理核心技術和服務能力,依託搜索排序、NLP(自然語言處理)、Deep Learning(深度學習)、Knowledge Graph(知識圖譜)等技術,處理美團海量文本數據,打通餐飲、旅行、休閒娛樂等本地生活服務各個場景數據,不斷加深對用戶、場景、查詢和服務的理解,高效地支撐形態各樣的生活服務搜索,解決搜索場景下的多意圖、個性化、時效性問題,給用戶極致的搜索體驗,構建美團知識圖譜,搭建通用 NLP Service,為美團各項業務提供智能的文本語義理解服務。團隊既注重 AI 技術的落地,也開展中長期的搜索、NLP 及知識圖譜基礎研究。目前項目及業務包括搜尋引擎研發、知識圖譜、智能客服、語音語義搜索、文章評論語義理解、智能助理等。

快手 MMU NLP 中心

快手 MMU 是負責快手短視頻搜索系統以及視頻理解的 AI 中台,業務覆蓋 OCR,ASR,分詞,NER 等基礎 AI 算法;短視頻分類,標籤體系建設等中台技術;以及短視頻搜索等系統服務。

作為一款國民級短視頻 App 背後的公司,快手的業務和 AIGC 息息相關。機器之心獲悉,目前,快手正在開展大規模語言模型(LLM Large Language Model)正在開展大規模語言模型,並啟動了相應專項,覆蓋 LLM 模型訓練、文案自動創作與生成、對話系統開發等領域。

內部有關人士介紹稱,快手在 LLM 領域的研究,更聚焦於用戶體驗的提升,以及和業務場景的融合。例如,對話系統在快手中的主要應用場景包括虛擬人、電商智能客服、智能助理等人機互動或人人交互場景。相關研究的推進,將賦予 LLM 與人類自然交互的能力,對於 to B 類業務場景的擴展將有重要幫助。

代表成員:

王仲遠,快手技術副總裁、MMU&Y-tech 負責人。曾擔任 Facebook 公司 Research Scientist,負責 Facebook 產品級 NLP Service。在 Facebook 之前,王仲遠是微軟亞洲研究院的主管研究員,負責微軟研究院知識圖譜項目和對話機器人項目。後任美團點評高級研究員、高級總監、搜索與 NLP 部負責人。2020 年 10 月,王仲遠加盟快手,負責多媒體內容理解部。多年來專注於自然語言處理、知識圖譜及其在文本理解方面的研究,在國際頂級學術會議如 VLDB、ICDE、IJCAI、CIKM 等發表論文數十篇。

張富崢,博士,快手 MMU NLP 中心負責人。主要負責 NLP 及相關多模態技術在快手場景下的建設和應用,發表論文 60+ 篇,谷歌引用 7800+。張富崢博士入選了史丹福大學發布的 「全球前 2% 頂尖科學家榜單」 以及 「2022 年人工智慧全球最具影響力學者榜單 AI 2000 中的數據挖掘領域排名前 30 的最具影響力學者」。

字節跳動 AI Lab

字節跳動人工智慧實驗室成立於 2016 年,其主要研究重點是開發為字節跳動內容平台服務的創新技術。實驗室的研究領域包括自然語言處理、數據挖掘、計算機視覺、機器學習、計算機圖形 & 增強現實、系統 & 網絡、安全 & 隱私、語音與音頻等。

代表成員:

李航,字節跳動科技有限公司研究部門負責人畢業於京都大學,是東京大學博士,曾就職於 NEC 公司中央研究所、微軟亞洲研究院、華為技術有限公司諾亞方舟實驗室。他的主要研究方向是自然語言處理、信息檢索、機器學習、數據挖掘。他還是 ACL Fellow 和 IEEE Fellow,也是《機器學習方法》等書的作者。

代表成果:

在 AIGC 方向,字節跳動的研究成果包括非自回歸模型 DA-Transformer、端到端語音到文本翻譯模型 ConST、多顆粒度的視覺語言模型 X-VLM、圖片和文本統一生成模型 DaVinci 等。其中 DA-Transformer 在機器翻譯上首次達到了 Transformer 同樣的精度,而處理的速度提高了 7~14 倍。DA-Transformer 不僅可以用於機器翻譯,而且可以用於任意的序列到序列任務。

小米 AI 實驗室

小米在 2014 年成立小米 AI 研究院,其前身為小米探索實驗室,2016 年初正式成立小米 AI 實驗室,研究方向包括計算機視覺、聲學、語音、NLP、知識圖譜、機器學習等多個領域。

作為一家以智慧型手機、智能硬體和 IoT 平台為核心的消費電子及智能製造公司,小米關注基於硬體的 AI 技術支撐,將語音交互作為基礎能力進行構建,優勢體現在應用場景多樣化、數據豐富度高。在自然語言處理核心技術上,團隊重點打造了搜索、推薦、廣告、多模態、機器翻譯、人機對話和文本創作等方向。

代表成員:

王斌,小米 AI 實驗室主任,NLP 首席科學家,本科、碩士畢業於武漢大學,博士畢業於中科院計算所。加入小米之前在中科院從事 NLP 及信息檢索的研發工作,曾為中科院研究員、博導,研究方向為信息檢索與自然語言處理。目前主要負責小米 AI 實驗室的技術研發和落地工作。

代表成果:

小米 AI 實驗室的搜索、推薦、廣告等技術支持了小米商城、有品、新零售、廣告推薦等業務。

  • 利用多模態技術自動生成廣告創意,成功支持廣告投放。
  • 機器翻譯廣泛應用到小愛同學、手機、MIUI 傳送門與網頁翻譯、小愛老師、小愛滑鼠等設備。設備端翻譯體驗業界領先,同聲傳譯已上線到小愛面對面同傳、會議同傳、AI 字幕、通話翻譯等場景,成為小米高端機型產品宣傳頁功能。
  • 人機對話方面重點研發了閒聊對話功能,是小愛同學在手機、音響等重要設備中用戶最喜歡使用的功能之一。
  • 機器寫作基於最新的預訓練生成技術在對聯、詩歌生成領域達到接近人類水平的效果,應用到小愛同學節日運營傳播;語言風格轉換技術成功支持了小愛同學多款自定義音色的語言風格定製。

華為雲

目前,華為未對「是否開展類 ChatGPT 產品研發」的問題進行具體回應。華為計算產品線相關負責人就「華為在大模型的布局」回應稱,公司 2020 年在大模型開始有布局,2021 年基於昇騰 AI 與鵬城實驗室聯合發布了鵬程。盤古大模型,是業界首個千億級生成和理解中文 NLP 大模型。

2021 年 4 月的華為開發者大會 2021(Cloud)上,華為雲便發布了盤古系列超大規模預訓練模型,包括 30 億參數的視覺(CV)預訓練模型,以及與循環智能、鵬城實驗室聯合開發的千億參數、40TB 訓練數據的中文語言(NLP)預訓練模型。

在大模型產業化方面,華為已發起了智能遙感開源生態聯合體、多模態人工智慧產業聯合體、智能流體力學產業聯合體等。華為將以聯合體的模式把科研院所、產業廠商等結合起來,更好地讓大模型產業形成正向的閉環迴路。這些聯合體由國內多個學界、業界機構組成,他們圍繞自身與華為構建的一些基礎設施展開大模型研究。比如:

  • 中科院自動化所基於昇思 MindSpore 打造了全球首個千億參數三模態大模型紫東。太初,通過跨模態語義關聯達成了視覺 - 文本 - 語音三模態的統一表達和高效協同;
  • 鵬城實驗室基於昇思 MindSpore AI 框架打造了面向生物醫學領域的 AI 平台 —— 鵬程。神農,包含蛋白質結構預測、小分子生成、靶點與小分子相互作用預測以及新抗菌多肽設計與效果評價等模塊,深度賦能生物製藥;
  • 武漢大學利用武漢人工智慧計算中心 AI 集群推出了武漢.LuoJia,包含全球首個遙感影像智能解譯專用框架武漢.LuoJiaNET 和業界最大遙感影像樣本數據集武漢.LuoJiaSET,並已於今年 6 月分別上線昇騰和昇思社區。

代表成員:

田奇,計算機視覺、多媒體信息檢索專家,IEEE Fellow。1992 年本科畢業於清華大學電子工程系,1996 年碩士畢業於美國德雷塞爾大學,後赴美國伊利諾伊大學香檳分校學習,師從 Thomas S. Huang 教授獲博士學位。2002 年至 2019 年間,任美國德克薩斯大學聖安東尼奧分校計算機系助理教授、副教授和正教授。2018 年至 2020 年間,任華為諾亞方舟實驗室計算視覺首席科學家。2020 年 3 月,加入華為雲,任華為雲人工智慧領域首席科學家。

代表成果:

華為雲盤古預訓練大模型包括自然語言處理大模型、視覺大模型、多模態大模型、科學計算大模型、圖網絡大模型等多個系列大模型,可實現一個 AI 大模型在眾多場景通用、泛化和規模化複製,減少對數據標註的依賴,讓 AI 開發由作坊式轉變為工業化開發的新模式。在預訓練模型 + 微調的模式下,開發周期能夠縮短到幾天,甚至幾個小時。

與 OpenAI GPT-3 相比,華為盤古 NLP(自然語言處理)同樣達到千億級參數量,並且,盤古 NLP 是全球最大的中文語言 AI 訓練大模型。

浪潮信息

2021 年 9 月,浪潮發布參數量為 2457 億的中文語言大模型」源 1.0」,比此前 OpenAI 發布的 GPT-3 大模型,參數量增加 40%,訓練數據集提升 10 倍,」源 1.0」發布時即獲得中文語言理解評測基準 CLUE 榜單的零樣本和小樣本學習兩類總榜冠軍。2022 年,浪潮深入推進「源 1.0」開源開放計劃,持續加強開發者社區建設及行業應用落地,當前社區已經擁有超過 3000 名開發者,打造了「AI 劇本殺」、「 心理諮詢 AI 陪練」、「AI 反詐」「金陵詩會」等爆款應用,推出了對話、問答、翻譯、古文等技能大模型 (Skill Model)。浪潮信息基於「源」大模型驅動的企業」智能客服大腦」,榮獲了《哈佛商業評論》新技術突破獎。

此外,大模型在巨量算力、海量數據和高效平台等方面的超高門檻,成為了當前 AI 領域眾多初創企業、創新團隊、大學或研究機構進行生成式 AI 研發創新方面的主要障礙。浪潮信息已推出相關 AI 算力服務,以加速國內 AIGC 創新步伐、賦力生成式 AI 產業創新的出發點。

非營利性研究機構

ChatGPT 的躥紅讓其背後的研發公司 OpenAI 成為了 AI 界的當紅炸子雞。這家公司在 2015 年由一群科技領袖創辦,包括山姆・阿爾特曼(Sam Altman)、彼得・泰爾(Peter Thiel)、里德・霍夫曼(Reid Hoffman)和埃隆・馬斯克(Elon Musk)等,最初只是一家致力於學術研究的小型非營利性實驗室。從反響平平的 GPT-1 到今天名聲大噪的 ChatGPT,這家公司幾度沉浮終見曙光。

在國內,我們同樣能看到一批非營利性研究機構的誕生和蓬勃發展。

智源研究院

2018 年,北京智源人工智慧研究院在科技部和北京市支持下,聯合北京人工智慧領域優勢單位共建。成立三年多以來,智源研究院始終聚焦原始創新和核心技術,在北京建成全球最佳的人工智慧創新生態,打造世界人工智慧的「學術高地」。

代表成員:唐傑、劉知遠等。

代表成果:

2021 年 3 月 20 日,智源研究院發布了我國首個超大規模智能模型系統「悟道」的第一階段成果。「悟道」由智源研究院牽頭,匯聚清華、北大、人大、中科院等高校院所,以及諸多企業的 100 余位 AI 領域專家共同研發,從基礎性能、有效使用到預訓練模型擴展,提出一系列創新解決方法,取得多項國際領先的 AI 技術突破和多個世界第一。

2021 年 6 月,智源研究院發布「悟道 2.0」巨模型,以 1.75 萬億的參數量成為當時全球規模最大的預訓練模型。不僅如此,悟道團隊還基於 GPT 與 BERT 各自在自然語言生成(NLG)和自然語言理解(NLU)任務上的優點,成功將兩者融合併提出通用語言模型 GLM,將所有自然語言任務都化歸為生成任務進行統一處理,GLM 也成為首個在 NLU、NLG、Seq2Seq、不定長填空等任務中全部登頂的語言模型。

鵬城實驗室

鵬城實驗室是中央批准成立的突破型、引領型、平台型一體化的網絡通信領域新型科研機構。實驗室擁有一支由院士專家、傑出領軍人才、中青年骨幹、博士生團隊組成的多層次合理人才隊伍,建成了以「鵬城雲腦」「鵬城靶場」為代表的若干重大科技基礎設施與平台,發布了「絲路」多語言機器翻譯平台、「鵬程。盤古」中文預訓練語言模型等一系列重大應用。

其中,網絡智能研究部由高文院士領銜,擁有全球領先的智能算力大科學裝置「鵬城雲腦」,貫通雲態智能計算軟體體系,研製體系化網絡智能集群開源軟體棧,突破感知、評價、決策一體化的多維度協同與持續進化的雲網協同智能等共性關鍵技術,支撐智能製造、物聯網、工業雲、人工智慧等規模化產業應用。研究部設有雲腦研究所、高效能雲計算研究所、視覺智能研究所、雲腦使能研究所。研究部人員構成多元化,現有全職、博士後、雙聘、訪問學者、聯培博士生等 500 多人,團隊成員均來自海內外知名高校。

代表成員:

高文,現任中國工程院院士、鵬城實驗室主任,北京大學博雅講席教授,新一代人工智慧產業技術創新戰略聯盟理事長,全國專業標準化技術委員會副主任,數字音視頻編解碼技術標準 (AVS) 工作組組長,國際電氣和電子工程師協會會士(IEEE Fellow)、美國計算機協會會士(ACM Fellow)。曾任第十屆、十一屆、十二屆全國政協委員,國務院學科評議組計算機學科成員,中國計算機協會理事長,計算機學報主編;2013 年至 2018 年,在國家自然科學基金委員會工作,任自然科學基金委副主任。2018 年被聘為鵬城實驗室主任。曾一次獲得國家技術發明一等獎、一次獲得國家技術發明二等獎、五次獲得國家科技進步二等獎,獲得「2005 中國十大教育英才」稱號和中國計算機學會王選獎。主要從事人工智慧應用和多媒體技術、計算機視覺、模式識別與圖像處理、虛擬實境方面的研究,主要著作有《數字視頻編碼技術原理》、《Advanced Video Coding Systems》等。在本領域國際期刊上發表論文 200 余篇,國際會議論文 600 余篇。

IDEA 研究院認知計算與自然語言研究中心

粵港澳大灣區數字經濟研究院(International Digital Economy Academy,簡稱「IDEA 研究院」)的使命為「推動人類 AI 技術發展,立足社會需求研發顛覆式創新技術,並回饋社會,讓更多的人從數字經濟發展中獲益。」研究院實行理事會領導下的院長負責制,由沈向洋博士擔任理事長,理事會成員包括:中國工程院院士、鵬城國家實驗室主任高文,深圳市科技創新委員會主任梁永生,福田區委副書記、區長黃偉,香港科技大學首席副校長倪明選。

研究院目前已聚集一批包括院士、世界著名大學教授、世界知名開源系統發明人在內的國際一流技術專家,致力於在 AI 基礎技術與開源系統、人工智慧金融科技、區塊鏈技術與機密計算、企業級 AI 系統、產業智能物聯網與智慧機器人等領域研發國際頂尖成果,並培育一批國際領先科技企業,帶動深圳乃至大灣區萬億級數字經濟產業發展。

IDEA 研究院認知計算與自然語言研究中心(CCNL,Cognitive Computing and Natural Language)致力於在預訓練大模型時代建設認知智能的基礎設施、推動 AI 學術和產業發展。目前,研究中心在預訓練模型生產、少樣本 / 零樣本學習、受控文本生成、自動化機器學習等技術領域,都達到了領先水平。

代表成員:

沈向洋,IDEA 研究院創始人、理事長。沈向洋博士是美國國家工程院外籍院士和英國皇家工程院外籍院士,計算機科學與人工智慧領域的世界級專家和全球科技產業領袖,在學術界、企業界、投資界擁有重要影響力。沈博士曾擔任微軟公司全球執行副總裁,主管微軟全球研究院和人工智慧產品線,並負責推動公司中長期總體技術戰略及前瞻性研究與開發工作。他參與創建了微軟亞洲研究院,擔任院長兼首席科學家,培養了眾多國際一流的計算機科學家、技術專家和企業家。

張家興,IDEA 研究院認知計算與自然語言研究中心講席科學家。北京大學博士,清華大學、香港中文大學、香港科技大學等兼職 / 實踐教授。曾任微軟亞洲研究院研究員、螞蟻集團資深算法專家、360 數科首席科學家 / 副總裁。在 IDEA 研究院期間,張家興博士帶領團隊創建了中文最大的開源預訓練模型體系「封神榜」,也成功於近期開源中文第一個 Stable Diffusion 模型太乙。

代表成果:

封神榜開源大模型體系包括封神榜大模型、封神框架、封神榜單三個子項目,將數據和算力沉澱成具有認知能力的預訓練模型,目標是成為海量下游任務和各種算法創新研究的堅實基礎。其中「二郎神」模型已獲得中文 NLP 權威榜單 FewCLUE 與 ZeroCLUE 的雙料冠軍。

極具潛力的初創公司

元語智能

杭州元語智能科技有限公司成立於 2022 年,是一家致力於提供通用人工智慧技術(AGI)的初創公司。公司願景是「堅定通用人工智慧信仰,持續不斷在全球範圍內,為實現可靠、有效、無害的通用人工智慧貢獻中國力量,讓人類受益」。

元語智能訓練了元語 AI(ChatYuan)模型,它可以通過對話形式進行交互。模型可以用於回答問題、可以結合上下文做對話、做各種生成任務,包括創意性寫作,也能回答法律、新冠等領域類問題。它基於 PromptCLUE-large 結合數億條功能問答和多輪對話數據進一步訓練得到。目前已經提供支持功能型對話的開源中文大模型免費下載及 API 服務,以及基於網頁、小程序的類「ChatGPT」的機器人交互產品等。

據天眼查信息顯示,該公司成立於 2022 年,是一家以從事軟體和信息技術服務業為主的企業,註冊資本 100 萬元人民幣,持股 50% 的大股東徐亮也是杭州敬天愛人管理諮詢合夥企業大股東,持股 70%。後者主要從事商務服務業,註冊資本 100 萬人民幣,以 40 萬元金額投資了元語智能,持股 40%。元語智能另一家持股 10% 的股東為西湖心辰(杭州)科技有限公司,創始人為藍振忠。

代表成果:

2 月初,元語智能推出了國內首個基於大模型的功能型對話產品 ChatYuan。ChatYuan 可以用於問答、結合上下文做對話、做各種生成任務(包括創意性寫作),也能回答一些像法律、醫療等領域問題。

元語智能表示,國內無論是大型科技公司還是創業公司,目前都面臨著各式各樣的挑戰,很難有像 OpenAI 的資源和人才密度。國內創業公司或許在一段時間內可以專心技術研發,但很快就會受到盈利壓力的挑戰,而不斷調整戰略方向。大型科技公司雖然看起來資源充足,但是很少能在未有落地成效的情況下,堅定信念進行長期持續投入基礎設施建設。

在上線後不久,元語智能 ChatYuan 小程序頁面提示已變更為「系統更新維護中」。2月21日,ChatYuan 發布升級版本,支持中英雙語交互、多次編輯、上下文關聯交互、模擬情景設定等多種新功能。

瀾舟科技

瀾舟科技是業界領先的認知智能公司,致力於以自然語言處理(NLP)技術為基礎,為全球企業提供新一代認知智能平台,助力企業數位化轉型升級。其主要產品是基於「孟子輕量化模型」打造的一系列 SaaS 功能引擎(包括搜索、生成、翻譯、對話)等和垂直場景應用。

瀾舟科技擁有自主智慧財產權的「孟子輕量化預訓練模型」,並融入了類 ChatGPT 的底層技術,在 AIGC 技術生成內容等方面有所布局。

代表成員:

周明,瀾舟科技創始人兼 CEO。世界著名的 NLP 專家、中國計算機學會副理事長,哈工大等 5 所學校博士導師。曾任國際計算語言學學會主席、微軟亞洲研究院副院長。他是世界上發表 NLP 論文最多的學者之一,H-index 100。周明於 1991 年在哈工大獲得博士學位,後在清華大學任教。1999 年加入微軟亞洲研究院,長期領導 NLP 研究。2021 年創立瀾舟科技,從事輕量化大模型和新一代 NLP 產品的研發,獲北京 HICOOL(2021)創業大賽最高獎。

代表成果:

2021 年 7 月,瀾舟科技 - 創新工場團隊與上海交通大學、北京理工大學等單位聯合研發的中文語言模型 — 孟子輕量型模型,超越騰訊、搜狗等公司,在中文語言理解評測 CLUE 榜單上登頂第一,刷新業界記錄。

孟子預訓練模型是基於瀾舟團隊自研技術研發的大規模預訓練語言模型。可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。孟子模型基於 Transformer 架構,僅包含十億參數量,基於數百 G 級別涵蓋網際網路網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。

循環智能

循環智能創立於 2016 年,為企業提供從全渠道溝通數據採集到錄音轉寫、內容挖掘、NLP 語義建模、會話分析洞察和溝通實時輔助的完整解決方案。運用 NLP、語音、多模態、大模型等人工智慧技術打造「銷售科技」方案,幫助企業的銷售團隊提升銷售業績。

代表成員:

楊植麟,循環智能聯合創始人,清華大學交叉信息院 NLP 實驗室負責人,智源青年科學家。本科畢業於清華大學,博士畢業於卡內基梅隆大學,Google Scholar 引用累計 10,000 余次,與多名圖靈獎得主合作發表論文。作為第一作者發明的 XLNet 在 20 項任務上超越 Google BERT,是 2019 年全球引用最高的同行評審 NLP 論文。他發明的 Transformer-XL 是首個全面超越 RNN 的注意力語言模型,也是 ACL 2019 引用最高的論文。曾主導開發盤古 NLP 大模型,獲世界人工智慧大會「 2021SAIL 之星」,入選福布斯亞洲 30 under 30。他創辦的公司循環智能累計融資超 4 億元,連續三年營收增長超 100%。

追一科技

追一科技是一家企業級智能服務 AI 公司,創立於 2016 年 3 月,主攻深度學習和自然語言處理,為金融、零售、生活服務等領域企業提供智能服務系統和解決方案。追一科技的智能服務系統 AIforce,擁有 AI 語義理解能力、智能產品矩陣。

「我們始終站在自然語言處理(NLP)技術研發和實踐的前沿,在大規模預訓練模型、自然語言智能交互(NL2X)、NLG(自然語言生成)等領域屢有創新,並將我們的技術成果開放給業界,持續推動 NLP 技術的發展。」

代表成果:

追一在機器閱讀理解與 NL2SQL 技術上擁有深厚積累,舉辦了國內首個中文 NL2SQL 比賽,並在機器閱讀理解比賽中多次登頂榜首。

2021 年 4 月,追一科技開源了國內首個中文生成式預訓練模型 T5 PEGASUS,在自動摘要、問題生成多個自然語言處理任務上達到了新高度。憑藉出色的小樣本學習能力,T5 PEGASUS 可以幫助企業和開發者大大減輕數據標註訓練負擔。

2021 年 11 月,追一科技聯合粵港澳大灣區數字經濟研究院(IDEA)發布 10 億級大規模預訓練模型「周文王」。

潞晨科技

類似於 ChatGPT 這樣的大模型,對於任何一家企業來說,訓練成本都是極高的。即使花巨資使用超級計算機集群、聘請專家,也難以實現 AI 模型的高效訓練。針對這一行業痛點,也有很多初創公司在提出自己的解決方案,潞晨科技就是其中的代表。

2021 年,潞晨科技發布大規模並行 AI 訓練系統 ——「夸父」(Colossal-AI) ,通過多維並行、大規模優化器、自適應任務調度、消除冗餘內存、降低能量損耗等方式,旨在打造一個高效的分布式人工智慧訓練系統,作為深度學習框架的內核,幫助用戶在最大化提升人工智慧訓練效率的同時最小化訓練成本。

潞晨科技的團隊核心成員均來自美國加州大學伯克利分校,史丹福大學,清華大學,北京大學,新加坡國立大學,新加坡南洋理工大學等國內外知名高校。

代表成員:

尤洋,潞晨科技董事長兼總裁,新加坡國立大學校長青年教授。尤洋是 UC Berkeley 博士,曾創造 ImageNet 和 BERT 訓練速度世界紀錄,獲 IPDPS 和 ICPP 最佳論文,西貝爾獎學金,ACM-IEEE HPC Fellowship,Lotfi A. Zadeh Prize,ACM Doctoral Dissertation Award,福布斯 30 歲以下精英榜(亞洲),IEEE-CS 超算傑出新人獎。

小冰公司

小冰公司前身為微軟(亞洲)網際網路工程院人工智慧小冰團隊,是微軟全球最大的人工智慧獨立產品研發團隊。該團隊於 2013 年 12 月在中國組建,2014 年 9 月擴展建立日本研發分部,團隊分布於北京、蘇州、東京等地,技術產品覆蓋中國、日本及印度尼西亞等多個國家,商業客戶覆蓋全球範圍。為加快小冰產品線的本土創新步伐,促進小冰商業生態環境的完善,2020 年 7 月 13 日,微軟宣布將小冰分拆為獨立公司運營。

作為微軟全球首個以中國為總部的人工智慧產品線,小冰經多年發展,已成為微軟最有價值的人工智慧技術框架之一。小冰框架以自然語言處理(NLP)為基礎,持續推動完備疊代發展,目前是全球承載交互量最大的完備人工智慧框架之一,技術覆蓋自然語言處理、計算機語音、計算機視覺及人工智慧內容生成。其中,在開放域對話、多模態交互、超級自然語音及內容生成領域居於全球領先。

代表成員:

李笛,2013 年加入微軟,同年創立微軟人工智慧情感計算框架,於 2014 年推出微軟小冰。小冰是目前全球範圍內承載交互量最大的人工智慧系統,占全球交互總量 60% 以上。2020 年 7 月,微軟宣布將小冰分拆為獨立公司運營,李笛擔任小冰公司 CEO。

徐元春,小冰公司營運長、人工智慧創造力實驗室負責人,CCF 計算藝術分會執行委員,中國音像與數字出版協會音樂產業促進工作委員會專家委員會特聘專家,中國樂器協會未來音樂科技專業委員會委員。從 2017 年開始領導團隊從事小冰在 AI 創造領域的技術研發、產品革新和應用落地。致力賦予 AI 擬合人類的創造能力,運用 AI 技術展開具有創造性的內容生成,並倡導通過 AI 技術解決高度定製化內容的供需矛盾。目前在文本、聲音與視覺方面掌握全球領先的核心技術,擁有豐富的包括端到端的音樂創作(作詞,作曲,編曲)、詩歌(現代詩,古詩)、繪畫(西方油畫,中國畫)、藝術設計等創造模型,在 AI 創造領域不僅內容形態眾多且質量穩定,並已形成完善的產品線,以及廣泛的合作夥伴生態陣營。

思必馳


思必馳是國內專業的對話式人工智慧平台公司,擁有全鏈路的智能語音語言技術,自主研發了新一代人機互動平台(DUI),和人工智慧晶片(TH1520);為車聯網、IoT及政務、金融等眾多行業場景合作夥伴提供自然語言交互解決方案。截至2021年底,思必馳擁有各類已授權智慧財產權900餘件,其中已授權專利近400項,軟體著作權近300項。並擁有中英文綜合語音技術。思必馳語音識別、聲紋識別、口語對話系統等技術曾經多次在美國國家標準局、國際研究機構評測中奪得冠軍。

思必馳被列入國家發改委「網際網路+」重大工程和人工智慧創新發展工程、工信部人工智慧與實體經濟深度融合創新項目、江蘇省工業和信息產業轉型升級項目、江蘇省科技計劃項目等,並累計參與40餘項國家標準、行業標準制定。憑藉雄厚的AI技術實力與廣泛的產品業務落地,2020年,思必馳完成pre-IPO輪融資;2021年3月,思必馳完成股份制改造,正式更名為:思必馳科技股份有限公司。

代表成員:

俞凱,思必馳創始人、首席科學家、上海交大教授上海交通大學-蘇州人工智慧研究院執行院長。劍橋大學工程系博士,入選國家級人才工程、科技部中青年科技創新領軍人才,國家自然科學基金委優青。中國計算機學會語音對話及聽覺專業組副主任,中國人工智慧產業發展聯盟學術和智慧財產權組組長,中國語音產業聯盟技術工作組副組長。2014年獲得「吳文俊人工智慧 科學技術獎」進步獎,2016年獲評「科學中國人年度人 物」。IEEE高級會員,IEEE Speech and Language Processing Technical Committee委員。 在一流國際期刊和會議上發表論文 180 余篇,擔任InterSpeech、ICMI等國際權威學術會議程序委員會主席,以及ACL、EMNLP、InterSpeech等國際會議的語音和對話技術領域主席,多次獲得國際權威期刊和會議優秀論文獎,以及多個國際公開研究評測競賽冠軍。

面壁智能

面壁智能(ModelBest)是一家人工智慧大模型加速與應用落地賦能公司。公司依託開源社區打造大規模預訓練模型庫與相關工具,加速百億級以上大模型的訓練、微調與推理,降低大模型使用門檻,並進一步推動大模型在人工智慧典型場景與領域的應用與落地。

公司創始團隊來自於清華大學計算機系自然語言處理與社會人文計算實驗室,並由知名清華大學教授擔任首席科學家。公司目前已完成百萬級天使輪融資,並與知名機構與公司達成戰略合作。

聆心智能

AIGC 初創企業聆心智能由清華大學黃民烈教授創立,成立於 2021 年 11 月,由清華大學計算機系孵化。團隊核心成員均來自於清華大學、卡內基梅隆大學、谷歌等國內外頂尖高校及公司,具有豐富的商業化經驗。聆心智能的核心人員是國內最早開展大模型底層技術的團隊,在語言生成、對話生成方面具有獨特的技術優勢。

自成立以來,聆心智能致力於將最先進的人工智慧技術應用到精神健康的數字診療服務上,通過建立先進的 AI 數字療法體系,為臨床患者和廣大心理亞健康人群提供高質量、低成本、個性化、全天候的情緒支持、心理諮詢和干預方案,為用戶提供更科學、高效的精神健康服務。

作為 AI 心理賽道中自然語言處理基因領先的創業團隊之一,聆心智能已開發了心理諮詢及朋輩支持服務線上平台聆心悠然、AI 數字療法軟體聆憂,可為不同需求層次的用戶提供服務。

代表成果:

基於生成式大模型,聆心智能打造了 Emohaa 情緒療愈機器人,並與知名精神心理平台好心情達成合作,成功落地了國內首款人工智慧心理陪伴數字人;與高端豪華電車品牌 Beyonca 合作,打造了新一代智能駕艙的貼心助手。

同時,聆心智能自研全球技術指標領先的中文對話大模型 OPD,在自動評測和人工評測中顯著優於同類模型;去年 11 月,推出了首個超擬人 AI 產品 ---「AI 烏托邦」,該系統允許用戶快速定製 AI 角色,只需要輸入簡單的角色描述,就可以生成相應人設的 AI ,與之進行深度對話和聊天。

關鍵字: