大模型111人:谷歌和OpenAI的人才戰爭

量子位 發佈 2024-04-09T22:33:02.511493+00:00

今天要關注的,不是違背「非盈利」初心的OpenAI,也不是商業模式面臨顛覆的谷歌搜索。借著的ChatGPT燎原之勢,2月中旬同一天的30分鐘內,就有2位谷歌大腦大模型人才先後官宣入職OpenAI,其中之一Jason Wei是思維鏈的最早一作。

衡宇 發自 凹非寺

量子位 | 公眾號 QbitAI

當我們圍觀ChatGPT炸開的多場激戰時,還有什麼是暗流下激戰的?

今天要關注的,不是違背「非盈利」初心的OpenAI,也不是商業模式面臨顛覆的谷歌搜索。把目光從公司層面挪開,看向另一場已經白熱化的戰爭——

借著的ChatGPT燎原之勢,2月中旬同一天的30分鐘內,就有2位谷歌大腦大模型人才先後官宣入職OpenAI,其中之一Jason Wei是思維鏈(chain-of-thought,CoT)的最早一作。

大模型交鋒背後,谷歌和OpenAI的人才戰爭打得正酣。和動輒上億美元的投融資同樣重要,AI人才也是兵家必爭的財富。

但其實,AI人才流動、被搶奪,早開始在ChatGPT攪動漩渦之前。

GPT系列:8人聯創新公司,成谷歌對戰ChatGPT一步棋

勢如破竹的ChatGPT,積攢了OpenAI從GPT一路疊代至InstructGPT的技術經驗與實力。

ChatGPT基於OpenAI的GPT-3.5創造。2018年和2019年,OpenAI分別推出了1.17億參數的GPT-1和15億參數的GPT-2;2020年,大力出奇蹟的GPT-3問世,訓練參數達到1750億,湧現出一些人腦獨特的能力,引起轟動;而後又在2022年初推出全新的InstructGPT模型,只要13億參數,效果就比GPT-3更好。

《紐約時報》披露,原本下一代GPT-4在OpenAI內部幾乎準備就緒,只待發布;去年11月中旬,高層突然宣布新任務:兩周後發布免費聊天機器人應用,代號「Chat with GPT3.5」,這就是今天見到的ChatGPT。

51位作者,其中2人參與3次論文創作

GPT系列共發表了4篇論文,51位作者參與其中。

作者名單中出現最頻繁的是Alec Radford和Ilya Sutskever兩位,均參與GPT-1到3的論文創作。前者是OpenAI的ML研究員,也是indico.io的聯創,谷歌學術上他被引用最多的研究是DC-GAN;後者更為人所熟知,OpenAI聯創之一,也是OpenAI首席科學家,主導了GPT系列以及DALLE系列模型的研發。

另有5人在GPT系列論文中2次貢獻了自己的力量:

51人組成的人才圖鑑,學歷一欄中名校印記俯拾皆是。據不完全統計,出現頻次最多的是MIT和史丹福大學,曾在耶魯大學、UC伯克利、哈佛大學、牛津大學攻讀學位的人也不在少數。也不乏在這些名校中輾轉求學的人,譬如表格中提到的OpenAI前研究副總裁Dario Amodei,先後就讀於普林斯頓大學和史丹福大學;再比如InstructGPT背後論文共同作者之一Gretchen Krueger,MIT、哈佛大學、哥倫比亞大學都是他的母校。

出走團隊打造ChatGPT競品對話式AI

毫無疑問,GPT系列背後的51人引領了大語言模型的創新風潮。從GPT系列結束戰鬥後,不少人從OpenAI脫離。除開GPT-3共同作者、哥大博士在讀的Melanie Subbiah本就不屬於OpenAI,50人里共有16位人才從OpenAI流失

其中8位的最終流向是AI初創公司Anthropic。更準確地說,包括Dario Amodei、GPT-3論文一作Tom B. Brown在內的一批核心人才不滿OpenAI成為微軟附庸——因被注資,OpenAI要使用Azure超算來搞研究,要將技術授權給微軟,甚至要給微軟的投資活動籌集資金,這與OpenAI創立的初衷(關注高級AI安全)相悖。

最終,包括8位GPT系列作者在內,共11名OpenAI前員工怒而離職,於2021年創辦Anthropic,要搞能控制、可解釋的AI,重心放在生成式AI上。

△出走創辦Anthropic的GPT系作者

1月底,Anthropic開始內測聊天機器人Cladue。同為生成式對話AI,與ChatGPT的同台競賽不可避免,二者各有千秋,最終測評結果:Claude在12項任務中有8項更強。

關於Anthropic的最新消息讓這家「復仇者聯盟」愈發走到人們熟悉台前。月初,谷歌向它投資3億多美元(約合人民幣20.3億元),拿下後者約10%的股份。交易條款要求,Anthropic需要從谷歌雲計算部門購買計算資源。這恰好與3年前,OpenAI接受微軟高達10億美元的注資,將微軟定位獨家雲提供商所呼應。

換句話說,Dario Amodei帶著Anthropic走上了3年前所不齒的OpenAI的老路,接受金主爸爸提供的算力來進行技術開發。現如今,Anthropic最新估值50億美元,除谷歌外,已有的投資人包括Facebook聯創Dustin Moskovitz,谷歌前CEO、現技術顧問Eric Schmidt等人。

也曾有人轉投谷歌門下

OpenAI GPT系作出走16人,Anthropic是他們的主要流向,剩下8人中,有3位第一時間投入谷歌門下

其一是GPT-1的三作Tim Salimans,2018年7月他就履新谷歌大腦,base阿姆斯特丹,擔任職位為高級管理科學家;其二是GPT-2的四作David Luan,2020年9月起他加入谷歌任主管,工作1年多後離職,後來和Transformer論文作者Ashish Vaswani、Niki Parmar一起,創辦了一家叫Adept的公司,目標是創造讓人和計算機能夠協同工作的通用人工智慧;第三位叫a,在2021年3月加入谷歌大腦。

時至今日,Adept和Anthropic兩家AI公司的聲量比不上風頭正盛的OpenAI和其強勁對手DeepMind,不過各自在AI產業界頗有建樹,甚至拿出Claude這種可與ChatGPT一較高下的產品。從這兩家公司的今日成就不難側面看出,GPT系作者是的確不是等閒之輩。

LaMDA:1/4成員只有本科學歷

梳理完GPT系論文作者現狀,鏡頭轉向谷歌的LaMDA論文背後團隊,作者共60名。和GPT系作者團一樣,LaMDA作者團隊同樣不乏耀眼的名校背景,斯坦福校友最多,統共有6人;其次是哥倫比亞大學,有三人曾在哥大就讀;接著是浙江大學、比拉科技學院、杜克大學、上海交通大學、耶魯大學、台灣大學,這6所大學出現了2次。

不過有一說一,相比較而言,LaMDA團隊的名校光環更少,成員的學校背景中常出現阿比林基督教大學、伊比利亞美洲大學、哈丁西蒙斯大學等類似的非頂尖名校。

15位作者只有本科學歷,多數人出身計算機專業

還有三個特點在LaMDA作者履歷中顯現。

第一,至少有17人在某個求學階段主修學科為計算機工程/科學,計算機學科背景貫穿求學始終的人也不在少數,像Hongrae Lee,先是在首爾國立大學拿下計算機科學本碩學歷後,又赴往哥倫比亞大學攻讀計算機科學博士學位。

第二,據不完全統計,至少有15位LaMDA論文作者只擁有本科學歷,這些人中有一半就讀的專業是計算機工程/科學。

第三,有7位LaMDA論文作者在谷歌工作了10年以上,資歷最老的是Igor Krivokon,截至今年2月,他在谷歌的工作年限為19年又5個月;Will Rusch也在谷歌工作了19年,從美國南加州大學電氣工程系畢業後,他就成為了谷歌的一份子,直到今天。

△Igor Krivokon

上文提到,有5%的GPT系作者跑到了對家谷歌幹活,相比之下,LaMDA論文作者,沒有一位跳槽到對家OpenAI,很穩。那麼,究竟是什麼樣的公司,能夠得到出走的LaMDA論文作者的法眼?

答案是兩家AI初創公司,一家是Inflection AI,另一家是Character.AI。

出走後,成AI初創公司Inflection AI&Character.AI創始團隊

先來聊聊Inflection AI,這家機器學習初創公司是LaMDA作者中的Joe Fenton,和從OpenAI出來的Rewon Child(3位投奔谷歌的出走成員之一)共同創立,創始團隊中還有LinkedIn聯創Reid Hoffman和DeepMind創始成員、谷歌人工智慧產品與政策副總裁Mustafa Suleyman,陣容十分豪華。LaMDA論文作者,曾擔任谷歌研究工程師的Maarten Bosma在公司成立後也被挖走,現為Inflection AI技術人員。

據了解,這家公司的總體目標是利用人工智慧幫助人類與計算機「對話」。去年5月,Inflection AI獲得了2.25億美元的A輪融資,資金來源尚不清楚,公司估值超過12億美金

以及,現有5名LaMDA論文作者進入Character.AI就職。

Character.AI的創始人Noam Shazeer是谷歌前首席軟體工程師,不僅參與了LaMDA的研究,還是Transformer論文作者之一。杜克大學本科畢業後,2000年年底,Noam Shazeer加入谷歌,是谷歌最重要的早期員工之一。雖然中途一度離職,但截至他2021年10月離職創辦新公司,共在谷歌工作了17年又5個月。Character.AI的現任總裁也是LaMDA論文作者,Daniel De Freitas,加入谷歌前,他曾在微軟Bing做軟體工程師。

實際上,LamDA論文發表時,Noam Shazeer和Daniel De Freitas都已經從谷歌離職,開始籌備Character.AI了。據報導,Character AI已經創建了一個基於LaMDA的神經語言模型聊天機器人Web應用程式,能夠生成類似人類的文本響應並參與上下文對話。

額外提一點,除LaMDA背後作者外,谷歌的大模型人才近期流動也都比較頻繁。先不用說BERT模型四位作者之一,被稱為BERT之父的Jacob Devlin今年1月剛剛離開谷歌加入OpenAI,看看去年ChatGPT發布頁面的致謝名單里,就有Barret Zoph等5個人,都是谷歌前員工,他們在ChatGPT問世前加入OpenAI,在調整和準備ChatGPT中發揮了關鍵作用。此外,The Information消息披露,進入今年1月,又有至少4名谷歌大腦成員加入OpenAI。

危急存亡之秋,谷歌嗅到了人才流失的危險,相繼推出了一系列舉措。除卻重金投資OpenAI出走團隊打造的Anthropic外,其旗下專注語言大模型領域的「藍移團隊」(Blueshift Team)宣布,正式加入DeepMind,旨在共同提升LLM能力——先進行陣列自行調整,集中內部力量,迎接OpenAI炮火。

人才大戰里的華人面孔

今年年初,大模型人才的跳槽愈發頻繁。從谷歌加入OpenAI的谷歌大腦4人之一中,包括華人顧世翔(Shane Gu),谷歌大腦日本團隊前成員,劍橋大學博士,本科在多倫多大學師從三巨頭之一Hinton。去年5月,只要加上一句「讓我們一步一步地思考」就能讓GPT-3做數學題的準確率暴漲61%這事,就是顧世翔參與的研究發現。

像他這樣,在谷歌和OpenAI的人才爭奪大戰中出現的華人面孔還有多少?據不完全統計,共有16人,LaMDA論文作者里就有14人,占87.5%,也就是說華人面孔占據了大模型111人中的14.4%。

這裡要著重提2個人。一位是美籍華人Ed Chi,1973年出生,現為谷歌傑出科學家,早年以應用資訊氣味理論預測網站可用性而聞名。

從美國明尼蘇達大學雙城分校取得碩士學位後,Ed Chi於1997年至2011年期間,在帕洛阿爾托研究中心(PARC)擔任研究科學家。2011年,Ed Chi以高級研究科學家的身份從PARC離職,成為谷歌的一名研究科學家。2012年,他擔任任人機互動領域最負盛名的學術會議CHI的技術項目聯合主席。2017年,Ed Chi被提升為谷歌首席科學家。

另一位要提到的是歐陽龍(Long Ouyang),他參與了與ChatGPT相關的7大技術項目中的4項研究,包括InstructGPT、webGPT、RLHF和ChatGPT,是InstructGPT論文的一作,RLHF論文的第二作者。

革命性科技浪潮背後,人才頻繁流動

梳理後不難看到,谷歌和OpenAI雖為大模型重鎮,但人才流動其實是很尋常的事。僅僅在本文涉及的人員里,GPT-2論文四作和Transformer論文一作和共同創辦的Adept,不到半年就亮出了新公司的首個大模型ACT-1;Anthropic更是憑藉對話機器人Cluade成為谷歌和OpenAI大戰中的一把利刃。

△大模型人才從OpenAI和谷歌出走後,創立的AI初創公司

總體而言,爆炸性的ChatGPT讓大模型背後的人才更加收到世人關注,對這些人來說,ChatGPT帶來的風口也是他們必須迎頭面對的挑戰。

由此提出一個思考:做類ChatGPT產品,中國的優勢在哪裡?

很大程度上,構築大模型堆參數、堆數據的大力出奇蹟之道,其實是中國團隊向來擅長的事情。但不可否認,小公司負擔不起高昂的天價成本,大公司需要綜合考慮整體戰略,種種因素,從不同角度成為一個中國版ChatGPT誕生的外在桎梏。

如此一來,破除外在束縛需用巧力。在算法、數據等都存在差距的現實條件下,人才,或許能成為這場轟轟烈烈全球擂台賽里的破局點。大模型背後的每一個參與者和理念、數據、技術擁有同等的重要價值。中國不缺人,更不缺人才,從GPT系論文和LaMDA論文背後的華人作者數量更可以看到AI人才的實力,人才的聚集能形成人才規模核心競爭力。

The battle of AGI never ends!埋頭研究,伸手搶人的現象,已經在國內出現。想招人的,想找工作的,都可以開始準備了。

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

關鍵字: