他用「玩具,球拍,鋼筆」發了一篇頂刊論文……

中科院物理所 發佈 2024-03-25T12:39:35.967107+00:00

小約翰·納什最著名的突破是發現納什均衡,但在這之前,他還針對另一個問題,納什議價問題撰寫了一篇論文。

認真閱讀下面的文章,並思考文末互動提出的問題,嚴格按照 互動:你的答案 格式在評論區留言,就有機會獲得由江蘇科技出版社提供的優質科普書籍《重新發現太陽系:國家地理終極探索指南》

小約翰·納什( John F. Nash Jr. ,1928-2015)最著名的突破是發現納什均衡,但在這之前,他還針對另一個問題,納什議價(討價還價)問題撰寫了一篇論文。納什議價問題是一個關於合作議價的研究,求證兩人討價還價問題的唯一解(Nash,1950).議價問題中的設定可以簡單總結如下:

兩個玩家各自要求獲得一些財物(一般是一些金錢)中的一部分。如果二人索取的總和少於財物總額,那麼兩人都能如願以償;如果總和超過了財物總額,那麼兩人什麼都沒有。

納什對於後面這種情況提出了一個公理化的解決方法,本文就將介紹納什剛涉足馮諾依曼和摩根斯坦新發現的博弈論領域時首先獲得的成果,這為日後關於納什均衡的工作提供了靈感。

1.不變性:在議價前後效用函數隨偏好的轉變應保持不變。

2.弱帕累托有效:如果有兩人都能獲益更多的結果s,那麼玩家就不能同意另一種分配t。

3.無關選擇的獨立性:如果玩家在兩個解s和t中選擇,其中s是首選;如果一個備選解r出現,那麼除非r的偏好變化,t仍不會超過s被選擇為解。

4.對稱性:如果玩家之間沒有區別,那麼他們之間達成協議不應有偏袒。

納什證明,滿足上述公理條件的解(x,y)正好可以使下面的表達式F取最大值:(u(x) — u(d)) (v(y) — v(d))

其中,u和v分別是玩家1和玩家2的效用函數,d則是無法達成協議的結果。這個解包含每個玩家獲得當前收益(非合作收益)和合作收益。

背景

在離開位於西維吉尼亞布魯菲爾德的家鄉三年後,20歲的納什進入了大學。1948年,當他還是卡耐基理工學院大三的學生時,就已經獲得了哈佛、普林斯頓、芝加哥和密西根大學,四個擁有美國頂尖數學項目的錄取。雖然納什的首選是相對更有名、社會地位和師資力量更強的哈佛大學,但由於在備受推崇的普特南競賽中表現平平,他在哈佛的獎學金略低於普林斯頓;同時,納什在卡耐基的學術導師理察·達芬( Richard Duffin, 1909-1996)和約翰·辛格( John L. Synge, 1897-1995)都力薦他選擇普林斯頓大學,其中一位甚至稱他為「小高斯」,認為普林斯頓是「純數學(拓撲學、代數學和數論)家的搖籃」,與他完美契合 (納薩爾, 1998) 。

而普林斯頓這邊,數學系主席所羅門·萊夫謝茨( Solomon Lefschetz,1884-1972 )同樣渴望說服納什,最終開出了每年1 150(相當於2021年的13 200)美金的甘迺迪獎學金:

我們喜歡把握住有前途的人,趁他們還年輕、思想開放。

——萊夫謝茨給納什的一封信

納什在獲得諾貝爾獎的自述中提到,靠近自己的家鄉布魯菲爾德也是選擇普林斯頓大學的因素之一。於是由於種種原因,納什在1948年的夏天離開了新澤西,帶著卡耐基導師的鼓勵和萊夫謝茨個人的強烈歡迎,選擇了普林斯頓大學。

達芬給萊夫謝茨的推薦信里只有一句描述納什能力的話,後來變得非常有名:

他是一個數學天才。

下面展示了達芬和辛格的推薦信:

左:納什在卡耐基理工的論文導師達芬寫的推薦信,寄至普林斯頓大學的所羅門·萊夫謝茨教授;右:任卡耐基理工數學系主任的辛格寫的推薦信(圖源:Princeton University Archives )

普林斯頓大學就讀時期(1948-1951)

納什20歲離開家鄉赴卡耐基上大學時,普林斯頓數學系充斥著聰慧的頭腦,系主任萊夫謝茨和拉夫·福克斯(Ralph Fox,1913-1973)、諾曼·斯廷羅德(Norman Steenrod,1910-1971)帶頭在美國首先開展拓撲學研究;埃米爾·阿廷(Emil Artin,1898-1962)主攻代數;而萊夫謝茨的學生塔克(Albert W. Tucker,1905-1995)則主攻博弈論,這個學科在1944年馮·諾依曼(John von Neumann,1903-1957)和經濟學家摩根斯特恩(Oskar Morgenstern,1902-1977)出版《博弈論與經濟行為》一書後才剛剛興起。

普林斯頓大學的數學系位於名為Fine Hall(直譯為「好樓」)的大樓中,是40-50年代數學圈內傳奇的代名詞。如納薩爾(Sylvia Nasar)在1998年所描述的:

(如一位歐洲裔所說,)我想Fine Hall是用於數學研究的最豪華的建築,是一個可以去度假的數學鄉村俱樂部。

它的基石由維布倫(Oswald Veblen)設計,裝有著普林斯頓數學家們工作的副本和業內一些常用工具的鉛盒:兩隻鉛筆、一段粉筆,當然,還有一塊橡皮。

「它代表數學家們『賴著不走』的聖所,暗色石頭所包圍構成的走廊既適合獨自散步,也適合『數學社交』。為高級教授準備的九個書房——注意不是辦公室——有著雕刻的石板、隱藏式櫥櫃、黑板、東方地毯和厚重的軟墊家具。

「每個辦公室都配有電話、盥洗室都配有閱讀燈;三樓庫存豐富的圖書館全天開放,擁有世界上最豐富的數學期刊和書籍;愛好網球的數學家們在回辦公室前無需再回家一趟(附近有個網球場),因為它設有淋浴的更衣室。

——納薩爾《美麗心靈》(1998)

納什當時是一個由塔克領導的推進初期博弈論發展的學派成員之一,他們從純數學意義出發,基本不關心研究內容在現實世界中的應用。據經濟學家、納什的好朋友、摩根斯特恩的學生舒比克(Martin Shubik,1926-2018)所說:

當時數學系的學生和職工都沉浸在研究博弈論的幸福中,完全沒有意識到經濟學系對此的態度,當然他們即使知道,也不會關心。在普林斯頓沒待多久,經濟學系和數學系之間鮮明不同的態度就根植在我心裡了。經濟學系有一種培養常規博士工廠、一切照舊的保守主義氛圍,其中不乏明星但毫無激情和挑戰可言;而後者則被靈感和狩獵的純粹樂趣所點亮。從心理學上來說,他們好像來自於不同的星球。如果在下午茶時間,一個光著腳、穿著破爛牛仔褲的十歲大的流浪小孩帶著一個非常有趣的理論走進Fine Hall,那一定會有人去聽;但當馮·諾伊曼進行有關增長模型的研討會時,除了少數幾個例外,普林斯頓那一大群經濟學家肯定會無聊到只打哈欠。

——舒比克(參考 Düppe and Weintraub, Finding Equilibrium* , 2014 p. 94)

而學派的領導人塔克,則繼續指導普林斯頓未來的頂級博弈論學家,包括大衛·戈爾(David Gale,1921-2008)、2012年諾貝爾獎獲得者羅伊德·沙普利(Lloyd Shapley,1923-2016),當然,還有納什。

議價問題(1949)

在研究納什均衡以前,納什發表了他第一篇期刊論文——同樣關於博弈論,將經典經濟學問題視為議價過程。此前已經有不少學者(包括Cournot、Bowley、Fellner等人)從包括雙邊壟斷調查等不同角度,對這個問題進行過研究。

左:學生時期的納什;右:納什1950年的論文《議價問題》( The Bargaining Problem. Econometrica 18(2), pp. 155-162. )

納什的文章描述了這樣一種議價的情況:兩個人都有機會互惠互利,但是沒有一方可以在未經允許的情況下單方面影響另一方的牟利。類似於經典的「劃分選擇協議」的情況:兩個人需要公平地分配一個蛋糕,那麼其中一個人切蛋糕,另一個人可以優先決定自己想要哪一份,這就是無嫉妒蛋糕分配機制

納什的論文就是基於這樣的議價情況進行理論分析,同時在特定條件或其他「理想化條件下」給出確定的「解」,即確定滿足個體期望的收益。這樣的理想化條件包括:假設兩個個體是理性的,並可以對各種物品有著精確的偏好感知,具有相同的議價能力,以及完全了解對方的偏好信息。

納什的解法採用了從馮·諾伊曼和摩根斯特恩的書中發展出的效用的概念,也使用了期望的概念定義不同玩家在給定策略下認可的收益。在納什的文章中,他假設有一個人小明,知道自己第二天會獲得一百塊錢,那麼可以說他有「一百塊的期望」;類似地,他也可以有「兩百塊的期望」。如果他知道,次日會通過拋一枚公平的硬幣來決定他獲得一百還是兩百,那麼可以說他有「50%一百和50%兩百」的期望。

對於在這種情形下的單個個體效用理論,納什提供了充分的假設,並對他在1944年發表的論文《博弈論與經濟行為》中提出的情形進行區分。他認為,論文中並未分別對每個人參與博弈的價值進行估算,除非這個博弈是零和的()。於是對於雙人的非零和博弈,納什對參與玩家的預期值進行了推導:

首先定義一個雙人期望值為兩個單人期望值的某種組合:如果有兩位玩家,各自對未來的情形有準確的期望,且單人期望值可以構成雙人期望,那麼單人效用函數可以用於求雙人效用函數的期望值。這樣如果有兩位玩家,各自對未來的情形有準確的期望,且單人期望值是構成雙人期望的元素,那麼我們可以將單人的效用函數以及各自的概率用於求雙人的期望值:

如果 [A, B]代表一個雙人期望,且 0 ≤ p ≤ 1,那麼 p[A,B] + (1 - p)[C,D]= [pA + (1-p)C, pB + (1-p)D]。

納什定義了兩個個體的效用函數為 和 ,且將 c(S) 定義為包含原點的緊凸集合 S 內的解點。首先他提出了一些必要的假設,保證 最大時的解落在第一象限:集合的緊性保證解存在,而凸性保證解唯一。

圖1 來自納什的論文《議價問題》,示意了玩家1和玩家2的效用集合S中唯一最優點。

議價問題實例(納什,1950)

假設小明和小紅兩個很聰明的人,他們手上只有可以交換的貨物,但是沒有錢用來找零。為了簡單起見,再假設一個人獲得所有物品的效用是這部分中各貨品對他的效用之和。下面的表格列出了每個物品的所屬權和對每個人的效用,兩個個人的效用函數單位是任意的。

小明擁有的貨品:

小紅擁有的貨品:

這個議價問題的圖像是一個凸多邊形,其中效用乘積最大的點在一個頂點上,對應著唯一一個預期,其中:

小明給小紅:書、鞭子、小球和球拍;

小紅給小明:鋼筆、玩具和小刀。

納什在論文中對此議價問題進行的作圖

實例:解點位於第一象限、矩形雙曲線與可選集合的唯一切點上。

目前我們還不清楚納什如何得出這樣結果的過程,他要好的朋友,出版於2002年的納什傳記《 The Essential John Nash 》的作者之一——庫恩(Harold Kuhn,1925-2014)回憶這篇論文時說:

我記得(這篇文章)在納什畢業後的第一年就送到了馮·諾伊曼手中,納什當時還提醒了馮·諾伊曼(這篇文章的)存在。如此看來,這篇文章應該是納什還在卡耐基理工時上的唯一一門經濟學選修課的課程論文。

但他補充道:

納什的記憶與我有出入,他在1995年某次和羅傑·梅耶森的午餐中說到,他是到了普林斯頓之後才寫的這篇論文。無論這篇文章的真實歷史如何,其中的舉例暗示寫作的是個年輕人,因為物品包括球拍、球或是鋼筆小刀之類的東西。可以確定的是,當時納什還從未讀過論文引文部分所提到的古諾、鮑利、廷特納以及費爾納的工作。

—— 庫恩

納什20歲時到了普林斯頓大學,終於在1950年的時候在著名期刊《計量經濟學》上發表了自己的論文《議價問題》:

Nash (1950). The Bargaining Problem. Econometrica 18(2), pp. 155-162.

與馮·諾依曼的交流

儘管納什的推論在某種程度上與馮·諾伊曼和摩根斯特恩關於合作博弈論的工作相反,但他為非合作博弈理論打下的基礎顯然來源於前人工作。也因為受到了這樣的啟發,納什發現了納什均衡, 得以在1978年獲得約翰·馮·諾伊曼理論獎。

現存的文件中只找到了一份記載納什和馮·諾伊曼之間的交流,可以肯定的是其餘多數都已經隨著時間而丟失了。據納薩爾回憶,納什在1949年普林斯頓統考後沒幾天就與馮·諾伊曼進行了談話——在他發現納什均衡之前:

當時他驕傲地告訴秘書,他準備和馮·諾伊曼教授討論一個能激起他興趣的想法。對於一個研究生來說,這是件相當大膽的事情。

…這當然像是納什會做出的事情,畢竟他前一年還帶著一個想法去見了愛因斯坦… 他聽得很認真,輕敲著手指,時不時還偏一偏頭。納什開始描述腦海中對超過兩位玩家博弈的均衡的證明。

馮·諾伊曼在他說出更多雜亂的句子以前打斷了他,突然對納什未下定論的闡述說:「這沒什麼意思,只是個不動點理論罷了。」

——納薩爾《美麗心靈》 (1998)

看起來馮·諾伊曼並沒有在納什討論的非合作博弈論的概念中看到價值,但納什隨後便在給歷史學家羅伯特·萊納德的信中為這位偉人的反應辯護,他分析道:

我當時在和馮·諾伊曼進行一場非合作博弈,而不只是尋求加入他的聯盟;顯然從心理學上說他不會對一個競爭的理論完全滿意。

雖然如此,馮·諾伊曼和摩根斯特恩最終都給予了納什有價值的指導,在納什發表的論文中,對兩人都進行了致謝:

作者希望感謝馮·諾伊曼和摩根斯特恩教授的幫助,他們在閱讀完論文的初稿後都提供了非常有幫助的建議。

參考文獻

• Düppe, T. & Weintraub, E.R. 2014. Finding Equilibrium*. Princeton University Press.

• Nasar, S. 1998. A Beautiful Mind. Simon & Schuster.

• Nash, J. F. 1950. The Bargaining Problem. Econometrica 18(2), pp. 155-162.

• von Neumann, J. & Morgenstern, O. 1944. Theory of Games and Economic Behavior. Princeton University Press.

作者:Jørgen Veisdal

翻譯:zhenni

審校:藏痴

原文連結:Nash's Bargaining Problem (1950)


翻譯內容僅代表作者觀點

不代表中科院物理所立場


編輯:藏痴


關鍵字: