香港公司

Nash equilibrium

9547 171

納什均衡(Nash equilibrium)——完全信息靜態博弈

目錄

  • 1 納什均衡簡介
  • 2 納什均衡的得來
  • 3 納什均衡例子
  • 4 納什均衡的重要影響[1]
  • 5 納什均衡案例分析
    • 5.1 案例一:納什均衡在貨幣政策效應中的應用[2]
  • 6 參考文獻

納什均衡簡介

  納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什均衡。

  一個策略組合被稱為納什均衡,當每個博弈者的均衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略。

納什均衡的得來

  關於納什均衡的普遍意義和存在性定理的證明等奠定非合作博弈理論發展基礎的重要成果,是約翰·納什在普林斯頓大學攻讀博士學位時完成的。實際上,博弈論的研究起始於1944年馮·諾依曼(Von Neumann)和奧斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈論和經濟行為》。然而卻是納什首先用嚴密的數學語言和簡明的文字準確地定義了納什均衡這個概念,併在包含“混合策略

(mixed strategies)”的情況下,證明瞭納什均衡在n人有限博弈中的普遍存在性,從而開創了與諾依曼和摩根斯坦框架路線均完全不同的“非合作博弈(Non-cooperative Game)”理論,進而對“合作博弈(Cooperative Game)”和“非合作博弈”做了明確的區分和定義。阿爾伯特·塔克(Albert tucker)教授評價其論文,“這是對博弈理論的高度原創性和重要的貢獻。它發展了本身很有意義的n人有限非合作博弈的概念和性質。並且它很可能開拓出許多在兩人零和問題以外的,至今尚未涉及的問題。在概念和方法兩方面,該論文都是作者的獨立創造。”

納什均衡例子

  博弈論中一個著名的例子就是囚徒困境。囚徒困境是一個非零和博弈,說的是兩個嫌疑犯甲和乙私入民宅聯手作案,被警方逮住但未獲證據。警方於是將兩個嫌疑犯分開審訊。警官分別告訴 兩個囚犯,如果你招供,而對方不招供,則你將被判刑3個月,對方將被判刑10年;若兩人都不招供則因未獲證據但私人民宅將各拘留1年;如果兩人均招供,每人將被判刑5年。於是,兩個人同時陷入招供還是不招供的兩難處境。結果是,儘管甲不知乙是否招供,但他認為自己選擇“招供”最好,因而甲會選擇“招供”,同樣乙也會選擇“招供”,兩人各判5年。而兩人都選擇不招供,雖證據不足但因私人民宅將各拘留1年的結果是不會出現的。

博弈矩陣 囚犯甲
招供不招供
囚犯乙 招供判刑五年甲判刑十年;乙判刑三個月
不招供甲判刑三個月;乙判刑十年判刑一年

  在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什均衡。納什均衡又稱為非合作博弈均衡,是博弈論的一個重要術語,它是以美國數學家、日後成為電影《美麗心靈》主人公的納什的名字命名的。在上述囚徒困境例子中,兩個囚犯符合自己利益的選擇是坦白招供。這種兩人都選擇坦白的策略以及因此被判刑五年的結局就是“納什均衡”。

納什均衡的重要影響[1]

  納什均衡理論奠定了現代主流博弈理論和經濟理論的根本基礎,正如克瑞普斯(Kreps,1990)在《博弈論和經濟建模》一書的引言中所說,“在過去的一二十年內,經濟學在方法論以及語言、概念等方面,經歷了一場溫和的革命,非合作博弈理論已經成為範式的中心……在經濟學或者與經濟學原理相關的金融、會計、營銷和政治科學等學科中,現在人們已經很難找到不懂納什均衡能夠‘消費’近期文獻的領域。”納什均衡的重要影響可以概括為以下六個方面(謝識予,1999):

  (1)改變了經濟學的體系和結構。非合作博弈論的概念、內容、模型和分析工具等,均已滲透到微觀經濟學、巨集觀經濟學、勞動經濟學、國際經濟學、環境經濟學等經濟學科的絕大部分學科領域,改變了這些學科領域的內容和結構,成為這些學科領域的基本研究範式和理論分析工具,從而改變了原有經濟學理論體系中各分支學科的內涵。

  (2)擴展了經濟學研究經濟問題的範圍。原有經濟學缺乏將不確定性因素、變動環境因素以及經濟個體之間的交互作用模式化的有效辦法,因而不能進行微觀層次經濟問題的解剖分析。納什均衡及相關模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經濟學家們提供了深入的分析工具。

  (3)加強了經濟學研究的深度。納什均衡理論不迴避經濟個體之間直接的交互作用,不滿足於對經濟個體之間複雜經濟關係的簡單化處理,分析問題時不只停留在巨集觀層面上而是深入分析表象背後深層次的原因和規律,強調從微觀個體行為規律的角度發現問題的根源,因而可以更深刻準確地理解和解釋經濟問題。

  (4)形成了基於經典博弈的研究範式體系。即可以將各種問題或經濟關係,按照經典博弈的類型或特征進行分類,並根據相應的經典博弈的分析方法和模型進行研究,將一個領域所取得的經驗方便地移植到另一個領域。

  (5)擴大和加強了經濟學與其他社會科學、自然科學的聯繫。納什均衡之所以偉大,就因為它普通,而且普通到幾乎無處不在。納什均衡理論既適用於人類的行為規律,也適合於人類以外的其他生物的生存、運動和發展的規律。納什均衡和博弈論的橋梁作用,使經濟學與其他社會科學、自然科學的聯繫更加緊密,形成了經濟學與其他學科相互促進的良性迴圈。

  (6)改變了經濟學的語言和表達方法。在進化博弈論方面相當有造詣的坎多利(Kandori,1997)對保羅·薩繆爾森(Paul Samuelson)的名言“你甚至可以使一隻鸚鵡變成一個訓練有素的經濟學家,因為它必須學習的只有兩個詞,那就是‘供給’和‘需求’”,曾做過一個幽默的引申,他說,“現在這隻鸚鵡需要再學兩個詞,那就是‘納什均衡’”。

納什均衡案例分析

案例一:納什均衡在貨幣政策效應中的應用[2]

  一、博弈論下的貨幣政策博弈分析

  貨幣政策博弈分析 利用博弈論方法分析巨集觀金融博弈問題。因而,博弈論是巨集觀金融博弈分析的方法論基礎。納什(Nash) 在195O年和1951年發表了兩篇關於非合作博弈的重要文章,從一般意義上定義了非合作博弈及其均衡解.並證明瞭均衡的存在.基本奠定了現代非合作博弈論的基礎。因而,該均衡以後被博弈理論稱為“納什均衡”。即是指由所有的參與者的最優策略組成的策略組合。在這種策略組合中 給定其他參與者的策略,沒有任何單個參與者有積極性選擇其他策略 也就沒有人主動去打破這種均衡。相反如果一種均衡或制度安排,如果不是一種納什均衡.即不是所有參與者的最優策略組合 那麼,這種組合就不能成立或者至少不能持續。合作博弈強調團體理性、效率和公平。而非合作博弈強調個人理性、個人最優決策

。其結果可能是有效的 也可能是無效的。現實中 大量的經濟博弈問題是非合作博弈。非合作博弈理論的發展為其在經濟研究中的廣泛應用創造了條件並推動了合作博弈的進一步發展。

  納什均衡假定博弈參與者在選擇自己的策略時,把其他參與者的策略當做給定的。而不考慮自己的選擇如何影響博弈對手的選擇。這個假定在靜態博弈下是成立的,但在動態博弈下卻不成立。

  在靜態博弈中,所有參與者同時行動,不可能在自己採取行動前觀察到其他人的行動 因而就無暇反應。但在動態博弈中 一方行動在先 另一方行動在後.後者自然會根據前者的選擇而調整自己的選擇,前者自然會理性地預期到這一點,所以不能不考慮自己的選擇對其他參與者的影響,由於決策者不考慮自己的選擇對他人選擇的影響,納什均衡允許了不可置信威脅的存在。1965年澤爾騰(Selten) 將納什均衡的概念引入了動態分析定義了子博弈精練納什均衡” 的概念。將不可置信的威脅策略從納什均衡中剔除出去,從而解決了完全信息動態博弈均衡求解問題 將不可置信的策略變成可置信策略的行動 即經濟學中的 承諾行動”。如果當事人不履行其承諾時將為之付出相應的代價 這種承諾就是可置信的,否則就是不可置信的。該概念的提出,對利用博弈論方法研究貨幣政策

問題奠定了基礎。

  二 納什均衡在貨幣政策效應中的應用

  在理性預期條件下,我們考察一期的貨幣政策博弈均衡。假定中央銀行的目標成本函數為:Z=\frac{1}{2}\pi^2+\frac{1}{2}(y^*-y)^2

  其中:π為通貨膨脹率;y為實際經濟增長率;y * 為中央銀行期望的經濟增長率。

  根據盧卡斯供給曲線:y = yn + α(π − πe),α > 0.其中:y_t^n為潛在經濟增長率;\pi^e_t為公眾的預期通貨膨脹率:a表示非預期通膨脹對經濟的影響程度,即總供給曲線的斜率。

  假定α=1,即:y = yn + (π − πα)

  同時假定中央銀行對貨幣增長有完全的控制能力.公眾的預期完全理性 不存在真實供給衝擊和貨幣流通速度變化的影響.通貨膨脹率π等於貨幣供給增長率m,通貨膨脹預期πα。等於貨幣供給增長率me,中央銀行期望的經濟增長率與潛在的經濟增長率相等。有Z=\frac{1}{2}m^2+\frac{1}{2}(m-m^e)^2

  令公眾的目標函數為避免由於預期誤差導致的通貨膨脹之害,因此可把公眾的效用函數定義為:U = − (mme)2

  可得該貨幣政策博弈的支付矩陣如下:

中央銀行策略(m)公眾策略(me)
01
0(0,0)(0,0,5)
1(1,-1)(0,5,0)

  矩陣中m=0表示中央銀行選擇零的貨幣增長率 m=1表示中央銀行選擇正的貨幣增長率:公眾策略的含義同上。由支付矩陣可知 對中央銀行來說,m=1的效用嚴格優於m=0的效用.m=1為其最優策略。在理性預期下,公眾迅速認識到中央銀行會選擇正的貨幣增長率,其必然選擇m=1以使其效用最大化,該博弈模型的納什均衡是中央銀行選擇正的貨幣增長率,公眾選擇正的通貨膨脹率預期,效用函數為(0,5,0)。均衡結果顯示貨幣政策只會影響通貨膨脹率而真實產出不變。

  貨幣政策博弈具體表現為貨幣政策的決策和執行過程中存在動態不一致性問題。博弈主體在當前做出的關於未來的最優決策,在決策執行時對決策制定者已不再是最優決策.因而他必然要調整其決策。例如 在公眾預期形成之前 對於貨幣政策制定者來說,零通貨膨脹(或較低通貨膨脹)可能是最優的選擇。因而為了影響公眾預期,他可能在此選擇和許諾他將實行零通貨膨脹(或較低通貨膨脹)。但是,當公眾預期形成以後零通貨膨脹(或較低通貨膨脹)對政策制定者來說已不是最優決策。為了獲得非預期通貨膨脹對經濟增長和就業增加的刺激作用,政策制定者必須實行正的(或更高的)通貨膨脹.在完全信息條件下公眾知道政策制定者會這樣做.因而他的許諾是不可置信的。具有理性和完全信息的公眾不會被其愚弄.最後結果必然是被預期到的正的(或更高的)通貨膨脹。相機選擇貨幣政策的這種通貨膨脹(通貨緊縮)傾向是由該博弈結構內生性決定的,即該均衡(納什均衡)允許了不可置信的威脅策略的存在,中央銀行關於零通脹(或低通脹)的許諾是不可置信的。

  要消除貨幣政策的通貨膨脹(通貨緊縮)傾向 必須消除這種不可置信因素——中央銀行在公眾預期形成之前承諾其將毫不改變地執行單一規則的貨幣政策 通過承諾行動中央銀行獲得了影響公眾預期的能力。因而,在選擇其貨幣供給增長率時.就必須考慮它對公眾預期的立即和充分的影響 就不能期望製造非預期通貨膨脹(通貨緊縮)來刺激經濟、增加就業或為預算融資。這就是說,提高政策的穩定性和可信程度是消除通貨膨脹(通貨緊縮)的關鍵。

參考文獻

  1. ↑ 高紅陽.納什均衡的重要影響及其問題局限
  2. ↑ 毛瑩.納什均衡在貨幣政策效應中的應用[J].商場現代化,2009,(5):363.