
電大博弈與決策形成性考核冊答案
- 更新時間:2016-06-29
-
電大作業
以下是為您推薦的《電大博弈與決策形成性考核冊答案》,希望能對您的工作、學習、生活有幫助,歡迎閱讀參考!
因部分圖片無法顯示,完整答案請下載文末附件
博弈與決策
一、名詞解釋
1.博弈論:是指研究多個個體或團隊之間在特定條件制約下的對局中,利用相關方的策略而實施對應策略的學科。
2.完全信息:是指所有參與者各自選擇的行動的不同組合所決定的收益對所有參與者來說是共同知識。
3.靜態博弈:是指博弈中參與者同時采取行動,或者盡管參與者行動的采取有先后順序,但后行動的人并不知道先采取行動的人采取的是什么行動。
4.動態博弈:指的是參與人的行動有先有后,而且后選擇行動的一方可以看到先采取行動的人所選擇的行動。
5.非合作博弈:如果參與者之間不可能或者根本沒辦法達成具有約束力的協議,不能在一個統一的框架下采取行動的話,這種博弈類型就是非合作博弈。
6.納什均衡:是對于每一個博弈參與者來說是這樣的一個戰略組合,即給定其他參與者的戰略,每一個參與者的這個戰略能使其期望效用最大化。
7.純策略:如果在每個給定信息下,只能選擇一種特定策略,而且參與者選擇了這個策略之后就不會單方面改變自己的策略,這個策略就是純策略。
8.純策略納什均衡:是指在一個純策略組合中,如果給定其他的策略不變,在該策略組合下參與者不會單方面改變自己的策略,否則會使策略組合令人后悔或者不滿意。
答:(1)對可口可樂而言,高價是劣勢策略,用橫線劃去“高價”所對應的行;
(2)對百事可樂而言,高價是劣勢策略,用豎線劃去“高價”所對應的列;
(3)余下的策略組合是(低價,低價),這就是該博弈的最優結果。
[注:步驟(1)(2)顛倒亦可]
答:(1)對員工乙而言,策略R是明顯劣勢策略,用豎線劃去“R”所對應的列;
(2)對員工甲而言,在員工乙剔除R策略之后,C策略是劣勢策略,用橫線劃去“C”所對應的行;
(3)對員工乙而言,此時劣勢的策略是L,用豎線劃去“L”所對應的列;
(4)對員工甲而言,此時劣勢的策略是D,用豎線劃去“D”所對應的行;
(5)余下的策略組合是(U,M),這就是該博弈的最優結果。
三、根據優勢策略下劃線法找出以下博弈的純策略納什均衡,并指出是否存在混合策略納什均衡。
要求: (1)劃出相應優勢策略的下劃線;(2)給出最優的博弈結果。

答:(1)下劃線如圖所示;
(2)沒有形成一個純策略納什均衡。
(3)按照納什均衡存在性定理,這里還存在一個混合策略納什均衡。
[注:括號的數字和字母順序不能顛倒]
2號廠商
W X Y
1號廠商 A 3
7 2
0 5
4
B 6
8 2
2 5
0
答:(1)下劃線如圖所示;
(2)形成兩個純策略納什均衡,即(A,Y)和(B,W)。
(3)博弈的結果有兩個:(4,5),即1號廠商獲得4單位支付,2號廠商獲得5單位支付;(8,6),即1號廠商獲得8單位支付,2號廠商獲得6單位支付。
(4)按照納什均衡存在性定理,這里還存在一個混合策略納什均衡。
[注:括號的數字和字母順序不能顛倒]
四、在以下博弈矩陣圖中找出哪一個是囚徒困境博弈,并簡要解釋理由。
乙
壞心 好心
甲 壞心 12
10 2
50
好心 60
12 39
100
圖1-1
乙
壞心 好心
甲 壞心 12
10 0
110
好心 50
0 39
100
圖1-2
乙
壞心 好心
甲 壞心 20
10 0
30
好心 30
0 12
11
圖1-3
答:(1)利用下劃線法找出博弈的納什均衡,如圖所示。
(2)囚徒困境反映的是基于個人理性的個體最佳選擇并非集體最佳選擇,參與者之間會選擇相互“壞心”,而且對雙方而言,(好心,好心)的結果一定要比(壞心,壞心)更好。
(3)在三個博弈中,圖1-1不是囚徒困境博弈,因為參與者甲在選擇“好心”(即合作)策略時才能實現均衡。圖1-2所示的博弈為囚徒困境博弈,因為參與者只有在都選擇“壞心”(即不合作)策略時才能實現均衡。圖1-32所示的博弈也不是囚徒困境博弈,因為對乙而言,(壞心,壞心)的結果比(好心,好心)的結果有利。
五、博弈分析
假設你所在的公司現在的發展雖然還可以,但是未來前景不容樂觀,所以老板只能對一個人加薪。如果你和你的同事之間只有一個人提出來加薪的請求,老板會考慮為提出要求的這個員工加薪,當然不會對那個沒有提出來的員工加薪了。但是假如你和你的同事兩個人一起提出來要加薪,那么老板就只有選擇同時辭退你們倆。
請給出這個博弈的矩陣分析圖,并解釋你最優的策略。
答:該博弈矩陣如下:
同事
要求 不要求
你 要求 被辭退
被辭退 無影響
加薪
不要求 加薪
無影響 無影響
無影響
根據下劃線方法,在這個博弈中,我們可以找到兩個納什均衡,即(要求,不要求)和(不要求,要求)。這個結果說明,你和同事只能一方提出加薪的要求才可以,同時選擇要求加薪的行動只會帶來最壞的結果——都被辭退。
換句話說,你要想獲得福利的改進,就應該先行一步提出來加薪的要求。而假如你看到你的同事首先選擇了要求加薪的策略之后,你最好不再提出來這樣的要求。
平時作業講評(2)
一、名詞解釋
1.不確定性:就是指經濟行為者在事先不能準確地知道自己的某種決策的結果,或者說,只要經濟行為主體的一種決策的可能結果不止一種,就會產生不確定性。
2.最大期望收益法:就是在事件結果不確定的情況下,應該選擇給他帶來“期望收益”最大的策略。
3.混合策略:如果在每個給定信息下,參與者只能以某種概率選擇不同地策略,就稱為混合策略。
4.支付均等法:當一個參與者在均衡中應用一個混合策略時,他所得到的支付必須與他在混合策略中所應用的每一個純策略的支付相同。
5.子博弈:如果從第一階段以外的某個階段開始的后續博弈階段,也有初始信息集,具備進行博弈所需要的各種信息,能夠自成一個博弈,我們就將這個博弈階段稱為原動態博弈的一個“子博弈”。
6.逆向歸納法:從最后一個階段或最后一個子博弈開始逆推上去,逐步向前倒推以求解動態博弈均衡,這就是逆向歸納法。
7.承諾:就是對愿意與你合作的人給予回報的方式。
8.空洞威脅:當發出威脅的博弈參與者選擇威脅所宣稱的行動策略時,對自己并沒有好處,這就不可信了,這叫做“空洞威脅”。
二、請用最大期望收益法尋找最優策略。
要求: (1)寫出計算步驟;(2)給出最優的策略結果。
甲乙兩家企業,為了市場份額的爭奪,在價格定制問題上各有兩種純策略,如圖2-1所示。兩家企業都知道自己在各個策略組合下的收益情況,但是并不知道對方的收益。假設甲采取U的概率為0.3,乙采取R的概率為0.6。
乙
L R
甲 U 1
2 4
3
D 4
4 2
1
答:(1)當乙采取R策略的可能性為0.6時,采取L策略的可能性為0.4,那么甲據此判斷采取自己的策略U時所獲得的可能的期望收益EU(U)=0.6×2+0.4×3=2.4。甲采取自己的策略D時所獲得的可能的期望收益EU(D)=0.6×4+0.4×1=2.8。很顯然,甲應該選擇策略D,因為EU(D)> EU(U)。
(2)當甲采取U策略的可能性為0.3時,采取D策略的可能性為0.7,那么乙據此判斷采取自己的策略L時所獲得的可能的期望收益EU(L)=0.3×1+0.7×4=3.1。乙采取自己的策略R時所獲得的可能的期望收益EU(R)=0.3×4+0.7×2=2.6。很顯然,乙應該選擇策略L,因為EU(L)> EU(R)。
(3)最終該博弈的結果就是(D,L),均衡的支付為(4,4)。
三、求解以下博弈的所有納什均衡。
要求: (1)寫出計算步驟;(2)給出所有納什均衡策略。
曹操
華容道 其它路
關羽 華容道 -2
2 3
-2
其它路 1
-2 -1
2
答:(1)對該博弈矩陣利用下劃線法,發現沒有純策略納什均衡。
(2)假設關羽選擇華容道的概率為p,選擇另外一條道的概率為1-p;也假設曹操選擇華容道的概率為q,選擇另外一條道的概率為1-q。
根據支付均等法:
對關羽而言,U華容道= U其他路,即2•q+(-2)•(1-q)= (-2)•q+2•(1-q),可以得到q=1/2。
對于曹操而言,V華容道= V其他路,即(-2)•p+1•(1-p)=3•p+(-1)•(1-p),可以得到p=2/7。
該博弈的混合納什均衡為(2/7,1/2)。
2號廠商
X Y
1號廠商 A 10
10 4
1
B 1
4 5
5
答:(1)對該博弈矩陣利用下劃線法,發現有兩個純策略納什均衡(A,X)和(B,Y)。
(2)假設1號廠商選擇A的概率為p,選擇B的概率為1-p;也假設2號廠商選擇X的概率為q,選擇Y的概率為1-q。
根據支付均等法:
對1號廠商而言,UA= UB,即10•q+1•(1-q)=4•q+5•(1-q),可以得到q=2/5。
對2號廠商而言,VX= VY,即10•p+1•(1-p)=4•p+5•(1-p),可以得到p=2/5。
該博弈的混合納什均衡為(2/5,2/5)。
四、請用逆向歸納法分析以下博弈的可能結果。
答:(1)逆向歸納法畫圖如圖所示。
(2)可能的均衡路徑為A—U,1號參與者選A,2號參與者選U,結果為(20,20),雙方各得到20單位的報酬。
(3)C—Y路徑上的報酬(1000,1000)遠大于A—U路徑上的(20,20),但是并不能成為均衡。因為如果1號參與者選擇了C,2號參與者選擇Z就可以獲得做大的報酬,并使1號只能獲得0單位報酬。1號參與者并不能保證2號參與者會選擇Z,而且2號即使有這種保證也是不可信的。
五、尋找可信的威脅。
假如有兩個博弈參與者,2號威脅1號說,假如1號參與者對他使壞心,他就會對1號參與者也使壞心。那么在以下哪些博弈圖中,1號會相信2號的威脅?
圖2-1 圖2-2
圖2-3
答:(1)對三個博弈圖利用逆向歸納法分析,如圖所示。
(2)只有當壞心比好心對2號參與者更有利時,2號所提出的威脅才可信。
(3)在圖2-1和2-2中的威脅才可信。因為如果1號選擇壞心的話,2號選擇壞心才是最優的,所以威脅可信。
(4)在圖2-3中,2號所提出的威脅不可信。因為如果1號選擇壞心的話,2號選擇好心才是最優的,不會選擇壞心的。
六、博弈分析
1.假設你是公司的管理者,某天有位員工向你提出加薪的要求,但是你既不舍得他辭職,也暫時不想給他加薪,那么你該如何巧妙地回絕呢?
答:你應該告訴他,加薪這事不屬于你管,有專門的部門或其他領導負責。所以,你對此無能為力,因為你對此事沒有決定權。而一旦知道自己要和這樣的人力資源部門去博弈了,這位員工的立場就會發生變化,也許就會軟化下來。
2.(1)如果一個男孩子給女孩發短信說:“親愛的,你知道我愛你愛得很深,我愿意為你赴湯蹈火,我每天每時每刻都很想見到你,什么艱難險阻也不能阻止我向你靠近。周五下班的時候,如果不下雨,我就一定過去找你!”。(2)有一位父親對自己很淘氣的兒子說“你再不聽話,我就擰掉你的耳朵!”請你分析一下這兩個場景中的“承諾”和“威脅”是否值得信賴。
答:(1)中的男孩對女孩的“承諾”是不可信的,因為“下雨”是一件成本很小的事,但是男孩卻因此不能去做他所說的“每天每時每刻都很想見到你,什么艱難險阻也不能阻止我向你靠近”。所以,廉價的承諾是不可置信的。
(2)中的父親的“威脅”是不可置信的“空洞威脅”。因為擰掉兒子的耳朵對他并沒有任何好處,還會因此帶來更大的負擔,也影響了孩子的一生,父親也要為此背負一輩子的心理成本和經濟成本。對孩子而言,這也是一生的不良影響和沉重的心理負擔,以及巨大的機會成本。顯然這個威脅這對整個家庭沒有任何好處。所以,這個威脅根本不可置信。
平時作業講評(3)
一、名詞解釋
1.網絡外部性:如果一種產品對消費者的價值會隨著其他使用者數量增加而增加,這種產品就具有網絡外部性。
2.大規模協調博弈:源于網絡外部性,假如有成千上萬的人在同時進行一次性博弈,那就形成了大規模協調博弈。
3.重復博弈:指同樣結構的博弈重復許多次,其中的每次博弈稱為“階段博弈”。
4.無名氏定理:只要博弈參與者具有足夠的耐心,那么在滿足博弈參與者個人理性約束的前提下,博弈參與者之間就總有多種可能達成合作均衡。
5.針鋒相對策略:如果博弈參與者第一步采取合作,此后每一步都重復對方上一步的行動,要么是合作要么是背叛,只要是博弈沒有確定的期限,由于長期利益對短期行為的制約作用,因此有一些在一次性博弈中不可行的威脅或諾言在重復博弈中會變為可信的,那么就會形成一種持續合作的態勢。
6.冷酷策略:是指參與人在開始時選擇合作,在接下來的博弈中,如果對方合作則繼續合作,而如果對方一旦背叛,則永遠選擇背叛,永不合作。
7.雙邊博弈:在某些博弈中,每個博弈者的策略組合都相同,博弈者之間的支付或收益對稱,這種博弈被稱之為雙邊博弈。
8.演化穩定策略:說的是,如果均衡一旦得以形成,此后偏離均衡的運動就會受到自然選擇的打擊。
二、請分析以下重復博弈的合作與背叛問題。
1.圖3-1和3-2的兩個囚徒困境博弈會一直重復下去,而且沒有確切的截止日期,請問哪個博弈的參與者更有可能出賣對方?為什么?
乙
好心 壞心
甲 好心 20
20 40
0
壞心 0
40 5
5
圖3-1
乙
好心 壞心
甲 好心 20
20 22
0
壞心 0
22 5
5
圖3-2
答:圖3-1所示的囚徒困境博弈的參與者更容易背叛對方。
這圖3-1和圖3-2的兩個博弈中,雙方都使用好心時,各自獲得20個單位的支付。一個參與人在對方好心而自己使壞心時獲得的支付是不一樣的,圖3-1為40個單位,遠大于好心時的20個單位;圖3-2 為22個單位,僅稍大于好心時的20個單位。所以,圖3-1中的參與者更容易背叛對方。
2.圖3-3和3-4的兩個囚徒困境博弈會一直重復下去,而且沒有確切的截止日期,請問哪個博弈的參與者更有可能出賣對方?為什么?
乙
好心 壞心
甲 好心 20
20 40
0
壞心 0
40 18
18
圖3-3
乙
好心 壞心
甲 好心 20
20 40
0
壞心 0
40 15
15
圖3-4
答:圖3-3所示的囚徒困境博弈的參與者更容易背叛對方。
這圖3-3和圖3-4的兩個博弈中,雙方都使用好心時,各自獲得20個單位的支付;一個參與人在對方好心而自己使壞心時獲得的支付為40單位。在圖3-3中,即使對方也使用了壞心,雙方也還各自獲得18個單位支付,與都好心時相差2個單位;而在圖3-4中則降低為15個單位,與都好心時相差了5個單位,背叛要付出比較高的代價。所以,圖3-3中的參與者更容易背叛對方。
三、分析以下博弈的結果及策略。
要求: (1)給出可能的博弈均衡;(2)寫出應采取的行動策略。
1.假設你是一位非常出眾的男士,有一位熱戀的女朋友,她各方面則比較普通。今天晚上在洋河體育場有一場足球比賽,你想去看足球比賽。而此時,在奧體中心也有一場王菲的演唱會,你的女朋友想去聽演唱會。博弈矩陣如下,請:(1)分析該博弈的均衡;(2)面對著沖突,你有哪些行動可以選擇?
女方
足球賽 演唱會
男方 足球賽 1
2 0
0
演唱會 -1
-1 2
1
答:(1)根據下劃線法,如圖所示,博弈均衡為(足球賽,足球賽)或者(演唱會,演唱會),即二人要么都去看球賽,要么都去聽演唱會。
(2)你可以選擇:一是主動告訴女方,愿意陪她去聽演唱會;二是主動告訴她,你很想去看足球賽,希望她可以陪你去看;三是自己先發制人地買好兩張足球賽的票,告訴女方你已經買了票;四是利用你自身的優勢,告訴她要是不陪你去,有其他人愿意陪你去。
2.你和你的朋友分別經營著一家企業,你們二人可以考慮合作,也可以不合作。當然,基于產品和市場的預期不同,現在有兩種情形出現,分別的博弈矩陣如圖3-5和3-6所示。請你分析:(1)兩種情形分別屬于什么博弈?(2)給出博弈的均衡結果。
乙
合作 不合作
甲 合作 10
10 4
0
不合作 0
4 4
4
圖3-5
乙
合作 不合作
甲 合作 10
10 12
0
不合作 0
12 4
4
圖3-6
答:(1)圖3-5屬于合作博弈,是獵鹿博弈。有兩個純策略納什均衡,即(合作,合作)和(不合作,不合作)。如果對方愿意開展合作,甲和乙的最優行動選擇就是選擇合作,從而各自獲取10個單位的支付。
(2)圖3-6屬于不合作博弈,是囚徒困境博弈。有一個純策略納什均衡,即(不合作,不合作)。由于個人理性的存在,甲乙雙方只有選擇不合作,從而各自獲得4個單位的支付。
四、請解釋以下問題。
1. Windows操作系統與大規模協調博弈以及網絡外部性有什么關系?
答:Windows操作系統的使用具有網絡外部性,使用該系統的人越多,這個系統的價值就會變得越高。這樣一來,使用者就要考慮使用哪種操作系統的普及率更高。假如有成千上萬的人在同時進行一次性博弈,那就形成了大規模協調博弈。
2.如果你是一個理性的人,看到周圍的朋友都逐漸擁有了QQ賬號,你應該怎么做?為什么?
答:QQ這種即時通訊工具,具有很強的網絡外部性,使用QQ的人越多,通過QQ形成的交際網絡就變得越大,其網絡價值就越高了。而如果你周圍使用QQ進行聊天交流的人越多,你擁有的QQ賬號所起的作用就越大。所以,你應該也申請一個QQ賬號。
3.微軟公司為什么在一定程度上默認盜版的泛濫?
答:微軟公司在一定程度上默許了盜版的泛濫,實際上就是讓自己的產品在市場上逐步深入,得到了更多的使用客戶,從而讓新使用者首先想到的就是要配備安裝微軟公司的Windows系列操作系統,從而充分發揮其產品的網絡外部性。正是盜版幫助了微軟公司在中國的發展,沒有盜版就沒有微軟如今在中國市場上的壟斷地位。
五、博弈分析
假設你是一家上市公司的董事長,可以選擇如實披露財務數據或向投資者說謊也就是發布虛假的信息,投資者可以選擇投資或不投資。博弈矩陣如下。請分析該博弈的均衡策略,你們公司該怎么做?為什么?
投資者
投資 不投資
上市公司 如實披露 5
5 0
0
虛假披露 -5
10 0
0
答:如果這是一個單期博弈的話,其納什均衡只有一個(虛假披露,不投資),即上市公司選擇披露虛假財務信息,投資者選擇不投資,雙方的博弈支付均為0。
如果是多期重復博弈的話,情況就不一樣了,只要在沒有明確截止期限的情況下,就可以實現(如實披露,投資)這個博弈結果。但是,一旦企業披露的信息有誤,有虛假的成分,那么投資者就不會再相信這個上市公司,就在接下來的博弈中選擇不投資。
所以,上市公司要想和投資者達成合作,就必須向外部的投資者樹立一種較強的正面的聲譽,不能披露任何虛假的信息,并致力于長期維護這個聲譽,從而保證合作得以持續,(如實披露,投資)這個結果才會出現。
平時作業講評(4)
一、名詞解釋
1.英式拍賣:也稱為公開拍賣或者增價拍賣,買者自由地相繼出價,且出價是逐步提高的,直到沒有人愿意支付更高的價格為止。
2.第二價格密封拍賣:每個競標者分別向拍賣方提交自己的報價,而且他們不知道別人的出價,出價最高的競標者將獲得物品,并按所有的出價中僅次于最高出價的第二高價格支付給賣家。
3.私人價值拍賣:在這類拍賣中,拍品對不同競標者的價值可能并非是獨立的,每個競標者都確切地知道該拍品對他本人的價值,但是卻不能從其他競標者的估價中得到對自己的估價任何有用的信息。
4.邊緣政策博弈:是一種將博弈參與者和其他對手置于災難發生的可能性逐步增大的風險中的一種戰略,但是可怕的災難結果實際上發生與否并不全在發出威脅一方的控制之中。
5.信號顯示:具有信息優勢的一方(擁有私人信息的一方)采取某種行動向信息劣勢一方(不了解對方私人信息的一方)發送相關信號,來告訴對方自己的真實類型,這就是信號顯示。
6.信號篩選:是在博弈中沒有私人信息的一方為了減弱非對稱信息對自己的不利影響,以便能夠區別不同類型的交易對象而提出的一種交易方式。
7.道德風險:就是從事經濟活動的代理人在最大限度地增進自身效用的同時做出不利于委托人的行動。
8.激勵相容約束:委托人提供一個合約,讓代理人在努力工作時所獲得的收益大于不努力工作時的收益,這就是激勵相容約束。
二、請分析以下問題。
1.小張有一件古董,他認為值 30000元。小李想買這件古董,他認為值50000元。在二人不知道協商如何進行的情況下,請你分析一下可能的結果。
答:小張和小李雙方可能在30000元至50000元之間的價格上成交。
2.在上面一個問題的基礎上,小王也想買這件古董,也愿意出價50000元來買。在不知道協商如何進行的情況下,而且小李和小王不會串通起來,請你分析一下可能的結果。
答:小張應該以50000元的價格賣給小李或者小王,而沒有其他結果。因為他們二人都認為該件物品值50000元,那么低于50000元的出價是不穩定的。
3.假設有一片果園要對公眾拍賣,采用英國式拍賣的方式。這片果園的真實價值大概為30萬元,但是這個信息不能有效地被競拍者所獲取。一共有五個人參與競拍,甲的預期價值是30萬,乙的預期價值是37萬,丙的預期價值是49萬,丁的預期價值是27萬,小劉的預期價值是53萬。請問:(1)小劉應該報出的多少競拍價格是多少?(2)他獲得的預期支付是多少?(3)獲得的實際價值是多少?(4)這種情況屬于什么問題?
答:(1)小劉應該報價53萬。
(2)他獲得的預期支付為4萬元,即53-49=4萬元。
(3)他獲得的實際價值為-19萬元,即30-49=-19萬元。
(4)這種情況就是“贏者詛咒”。
4.你想買一輛二手車,但是無法判斷它的價值。你自己覺得這輛車子的質量優良或者不值得買的概率各占一半,但是汽車的質量只有賣方才知道。下面列出了汽車對你和賣方的價值。
汽車質量 對你的價值 對賣方的價值
好 100000元 60000元
差 10000元 0
請問在這個博弈中,你是否愿意買車?為什么?
答:不愿意買車。
由于無法判斷舊車的價值,而且質量優良或者不值得買的概率各占一半,你只愿意出價(100000+10000)/2=55000元,那么賣方就不會提供質量好的車子給你,而讓質量好的車子退出市場。而你如果出價60000元以上,你也只有一半的機會能買到高質量的車子,還有一半的機會買到質量低劣的車子。所以,你也不愿意花60000元以上來買平均質量只有55000的車子。
三、請解釋以下問題。
1.一些高級會所為什么采用會員制?
答:由于信息不對稱,一些高級會所并不清楚消費者屬于哪種類型的,而會員制則是一種信號顯示和信息甄別的組織形式,其篩選機制能有效地顯示會員信息,能有效地進行身份甄別,從而降低信息不對稱所引起的交易成本,提高交易效率。
3.你在搬家后想找一位新牙醫,但你可能只想找至少好幾月內都排不出時間的牙醫,為什么?
答:你最想找的牙醫應該是能滿足你的需求并能不斷吸引新客戶、保住回頭客戶的醫生,而要約這種牙醫為你治病需要等待很長的時間。但是那些客源迅速流失的水平糟糕的牙醫則會有很多空閑的時間。也就是說,那種你一預約就可以安排時間給你治療的牙醫可能就是你最不想要的醫生。
3.醫學科技發展了,為什么人工流產率反而上升了?
答:隨著醫學科技的發展,各種新型的避孕工具和藥物以及人工流產技術讓人們放松了道德層面的約束,降低了意外懷孕的擔心,讓人們性生活的意外成本大大地降低。所以,人們在性生活時就會傾向于冒險,比如在性生活中傾向于不采取任何保護措施,事后可以吃緊急避孕藥,實在不行的話,大不了就是進行人工流產。因此,現代醫學醫藥技術的發展,助長了對性生活的冒險,也就提高了意外懷孕的機會,拉升了人工流產率。
4.作為企業老板,你會為全部員工配股還是僅為高層管理者配股?
答:持股計劃對高層管理者有效,是因為高層管理者人員少,每個經理人可以獲得的股份就比較大,而他們對于公司的盈虧有著重要影響,足以激勵其他們努力地為公司工作。持股計劃對普通員工低效或無效,是因為普通員工人員眾多,難以避免地出現搭便車問題。所以,應該對高層管理者配股,不應該為全部員工配股。
5.一些日本企業在招聘員工時,那些字跡潦草的應聘者可能被優先錄用,你覺得是為什么?
答:這是一個信號博弈。站在信號博弈的角度看,接受普通教育的人往往炫耀他們刻意寫得工工整整的字跡,但受過良好教育的人卻常常字跡潦草難以辨認。另外,字跡端正工整的人做事嚴謹刻板,缺乏進取心;而進取心強,創造性高的人對字跡往往不講究,比較適合企業管理和產品開發工作。
四、博弈分析
1.如果你是一家公司的老總,鑒于近期公司的效益明顯下滑,人事部經理向你提出了降低人力資源成本的方案擇:一是裁掉20%的現有員工;二是全員降薪20%。你應該如何決定呢?為什么?
答:應該選擇裁掉20%的現有員工。如果選擇全員降薪20%,那些業務能力很強的員工就會另覓新的東家,得到一份收入持平甚至更好的工作,而你其實更希望這些有能力的員工留下來。如果你選擇裁員20%,那肯定是根據以往的業績表現而做出的裁員名單,就可以確保將那些工作能力不佳的員工裁掉,這樣會讓你的隊伍更加健康、更加有活力。
2.假如你是一位風險投資家,而我正好在為自己的一個項目尋求投資,我向你提出來,希望你能夠為我投資2000萬,我把新創公司80%的股權給你。而你認為必須讓我自己出資50萬元,你只擁有新創公司的50%的股份。這是為什么呢?
答:對于風險投資家和企業家而言,他們的立場和出發點完全不同。作為創業者,肯定希望得到投資,但是又不希望受到很大的約束,希望可以規避掉自己可能的損失。作為投資資本家,肯定希望項目能夠成功,也只有成功才可以從中獲得投資回報,那么就必須想辦法讓企業家努力工作。風險投資家讓企業家自己也出資一部分,才能有效激勵企業家努力工作。
《博弈與決策》期末復習指導
期末復習資料
第一章博弈論的基本理論
(一)博弈論的基本概念
博弈:現實生活中,不同的決策人為了爭奪資源、爭奪機會使得決策人處于相互依存的復雜關系中,這就不得不思考他人有針對性行為對自身所產生的影響。
博弈就是一種游戲,在這種狀態下,參與者必須作出選擇,并對對方的選擇作出判斷,這種判斷和選擇決定了博弈的結果。每個對弈者在決定采取何種行動時不但要根據自身的利益和目的行事,也要考慮自身的決策行為對其他人的可能影響,以及其他人的行為對自身的可能影響,通過選擇最佳行動計劃,來尋求收益或效用的最大化。
博弈論:就是以參與人之間有針對性的行為產生的互動過程為研究對象的理論,探討在互動過程中參與人的一般行為規律。博弈論的核心問題在于如何在“策略互動”的局勢中找到局中人的最佳行為方式,使得采用最佳行為方式的局中人能獲得最大的收益。所以博弈論可以簡單理解尾研究策略互動局勢中的局中人的理性行為的理論。
(二)博弈論的構成要素
1、博弈一般由以下幾個要素組成,包括:參與人、行動、信息、策略、得益、結果、均衡等。
2、參與人指的是博弈中選擇行動以最大化自己效用的決策主體(可以是個人,也可以是團體);
3、行動是指參與人在博弈進程中輪到自己選擇時所作的某個具體決策;
4、策略是指參與人選擇行動的規則,即在博弈進程中,什么情況下選擇什么行動的預先安排;
5、得益是參與人在博弈結束后從博弈中獲得的效用,一般是所有參與人的策略或行動的函數,這是每個參與人最關心的東西;
6、均衡是所有參與人的最優策略或行動的組合;均衡結果是指博弈結束后博弈分析者感興趣的一些要素的集合,如在各參與人的均衡策略作用下,各參與人最終的行動或效用集合。
上述要素中,參與人、行動、結果統稱為博弈規則,博弈分析的目的就是使用博弈規則來決定均衡。
二、博弈論的發展簡史
1、萌芽階段:博弈論思想古已有之,我國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論專著。博弈論最初主要研究象棋、橋牌、博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。
2、產生階段:1944年科學家馮•諾伊曼和經濟學家奧斯卡•摩根斯坦合著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統的應用于經濟領域,標志著博弈論作為一門獨立的的學科誕生。
3、發展階段:1950年,約翰•納什(John Nash)引入均衡(解)的概念,即納什均衡,將博弈論從零和博弈推進到非零和博弈(即參與人會出現雙贏或雙輸的情況),納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。納什獲得1994年諾貝爾經濟學獎。
4、高潮階段:20世紀40年代末到50年代中期是博弈論研究的第一個高潮時期,一方面是合作博弈發展到了鼎盛時期,包括納什和夏普里的“討價還價”模型,“核”的概念。另一 方面非合作博弈開始創立,納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)以及Tucker于1950年定義的“囚徒困境”。這一時期海提出了“微分博弈”,奧曼提出了“強均衡”概念,“重復博弈”也開始研究。
1965年和1975年蘭哈德•澤爾藤(Reinhard Selten)把納什均衡推廣到動態博弈,并提出子博弈完美納什均衡;1967-1968年間,約翰•海薩尼(John Harsanyi)把納什思想推廣到不完全信息模型,提出貝葉斯均衡;他們與納什一起分享1994年諾貝爾經濟學獎。1996年諾貝爾經濟學獎獲得者詹姆斯•莫里斯教授和威廉姆•維克瑞教授在20世紀60、70年代提示不對稱信息對交易帶來的影響,并提出相應對策。70年代的重要事件海包括“進化博弈論”,“進化穩定策略”,此外“共同知識”也 引起了廣泛關注。
5、成熟階段:80、90年代是博弈論于駐留經濟學融合時期,也是博弈論走向成熟時期。這個時期最重要的進展包括Elon KohlbergZAI 1981年引入“前向歸納法”,克里普斯和威爾遜在982年提出“序列均衡”,斯密1982年出版《進化和博弈論》,海薩尼和澤爾藤在988年提出有關非合作博弈中均衡選擇的一般理論和標準。1991年佛德伯格和泰勒提出了“精練貝葉斯均衡”。
三、博弈論的分類
1、參與人行動的先后順序:靜態和動態
靜態博弈是指參與者同時采取行動,或者盡管參與者行動的采取有先后順序,但后行動的人不知道先采取行動的人采取的是什么行動。
動態博弈:參與者的行動有先后順序,并且后采取行動的人可以知道先采取行動的人所采取的行動。
2、參與人對其他參與人的了解程度:完全信息和不完全信息
完全信息博弈:參與者對所有參與者的特征、策略空間及策略組合下的支付有充分了解稱為完全信息;
不完全信息博弈:參與者對所有參與者的特征、策略空間及策略組合下的支付的信息了解得不夠準確或者不是對所有參與者的特征、策略空間及策略組合下的支付的信息都有準確的了解。
3、參與人之間是否進行合作:合作和非合作
合作性博弈:參與者從自己的利益出發與其他參與者談判達成協議或形成聯盟,其結果對聯盟方均有利;參與人在協議范圍內進行博弈。
非合作性博弈:參與者在行動選擇時無法達成約束性的協議
4、非合作博弈四種類型及對應的均衡:
(1)完全信息靜態——納什均衡、占優均衡
納什均衡是指這樣一種均衡:在這一均衡中,每個博弈參與人都確信,在給定其他參與人戰略決定的情況下,他選擇了最優戰略以回應對手的戰略。也就是說,所有人的戰略都是最優的。
占優均衡指不論其他參與者做何種策略選擇,每個參與者的最佳策略都是唯一的,其結果為占優均衡。當所有博弈者都有一個占優戰略時,其結果將是占優均衡。占優均衡一定是納什均衡。
(2)完全信息動態——子博弈精煉納什均衡
子博弈精煉納什均衡是澤爾騰(Selten)于1965年首先提出的,其目的是將那些不
可置信威脅策略的納什均衡從均衡中剔除,從而給出動態博弈一個合理的均衡解。在動態博弈中,參與人的行動有先后順序,后行動的參與人在自己行動之前就可以觀察到先行動者(參與人)的行為,并在此基礎上選擇相應的策略。而且,由于先行動者擁有后行動者可能選擇策略的完全信息,因而先行動者在選擇自己的策略時,就可以預先考慮自己的選擇對后行動者選擇的影響,并采取相應的對策。
(3)不完全信息靜態博弈——貝葉斯納什均衡
貝葉斯納什均衡:在不完全信息靜態博弈中,參與人同時行動,沒有機會觀察到別人的選擇。給定其他參與人的戰略選擇,每個參與人的最優戰略依賴于自己的類型。由于每個參與人僅知道其他參與人有關類型的分布概率,而不知道其真實類型,因而,他不可能知道其他參與人實際上會選擇什么戰略。但是,他能夠正確地預測到其他參與人的選擇與其各自的有關類型之間的關系。因此,該參與人的決策目標就是:在給定自己的類型,以及給定其他參與人的類型與戰略選擇之間關系的條件下,使得自己的期望效用最大化。貝葉斯納什均衡是一種類型依賴型戰略組合。
(4)不完全信息動態博弈——精煉貝葉斯納什均衡
精煉貝葉斯納什均衡:在不完全信息動態博弈中博弈開始時,某一參與人既不知道其他參與人的真實類型,也不知道其他參與人所屬類型的分布概率。他只是對這一概率分布有自己的主觀判斷,即有自己的信念。博弈開始后,該參與人將根據他所觀察到的其他參與人的行為,來修正自己的信念。并根據這種不斷變化的信念,作出自己的戰略選擇。
第二章簡單博弈與博弈均衡
(一)占優戰略與占優戰略均衡
占優戰略是博弈論(game theory)中的專業術語,所謂的占優戰略就是指無論競爭對手如何反應都屬于本企業最佳選擇的競爭策略。
占優戰略均衡必定是納什均衡,因為局中人的占優戰略是對所有其他局中人的任何戰略組合情況下的最優戰略選擇,自然它也一定是對于所有其他局中人的某個特定戰略(其他局中人的最優戰略)情況下的最優戰略選擇。但反過來不成立,納什均衡不一定是占優戰略均衡。
(二)納什戰略均衡
1、納什均衡的意義:
納什均衡理論奠定了現代主流博弈理論和經濟理論的根本基礎,其重要影響可以概括為以下六個方面:
(1)改變了經濟學的體系和結構。非合作博弈論的概念、內容、模型和分析工具等,均已滲透到微觀經濟學、宏觀經濟學、勞動經濟學、國際經濟學、環境經濟學等經濟學科的絕大部分學科領域,改變了這些學科領域的內容和結構,成為這些學科領域的基本研究范式和理論分析工具,從而改變了原有經濟學理論體系中各分支學科的內涵。
(2)擴展了經濟學研究經濟問題的范圍。原有經濟學缺乏將不確定性因素、變動環境因素以及經濟個體之間的交互作用模式化的有效辦法,因而不能進行微觀層次經濟問題的解剖分析。納什均衡及相關模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經濟學家們提供了深入的分析工具。
(3)加強了經濟學研究的深度。納什均衡理論不回避經濟個體之間直接的交互作用,不滿足于對經濟個體之間復雜經濟關系的簡單化處理,分析問題時不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規律,強調從微觀個體行為規律的角度發現問題的根源,因而可以更深刻準確地理解和解釋經濟問題。
(4)形成了基于經典博弈的研究范式體系。即可以將各種問題或經濟關系,按照經典博弈的類型或特征進行分類,并根據相應的經典博弈的分析方法和模型進行研究,將一個領域所取得的經驗方便地移植到另一個領域。
(5)擴大和加強了經濟學與其他社會科學、自然科學的聯系。納什均衡理論既適用于人類的行為規律,也適合于人類以外的其他生物的生存、運動和發展的規律。納什均衡和博弈論的橋梁作用,使經濟學與其他社會科學、自然科學的聯系更加緊密,形成了經濟學與其他學科相互促進的良性循環。
(6)改變了經濟學的語言和表達方法。在進化博弈論方面相當有造詣的坎多利(Kandori,1997)對保羅•薩繆爾森(Paul Samuelson)的名言“你甚至可以使一只鸚鵡變成一個訓練有素的經濟學家,因為它必須學習的只有兩個詞,那就是‘供給’和‘需求’”,曾做過一個幽默的引申,他說,“現在這只鸚鵡需要再學兩個詞,那就是‘納什均衡’”。
2、占優戰略均衡和納什均衡的聯系與區別:
納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術語。在這一均衡中,每個博弈參與人都確信,在給定其他參與人戰略決定的情況下,他選擇了最優戰略以回應對手的戰略。也就是說,所有人的戰略都是最優的。
占優戰略是博弈論(game theory)中的專業術語,所謂的占優戰略就是指無論競爭對手如何反應都屬于本企業最佳選擇的競爭策略。
占優戰略均衡必定是納什均衡,因為局中人的占優戰略是對所有其他局中人的任何戰略組合情況下的最優戰略選擇,自然它也一定是對于所有其他局中人的某個特定戰略(其他局中人的最優戰略)情況下的最優戰略選擇。但反過來不成立,納什均衡不一定是占優戰略均衡。顯然,占優戰略均衡是重復剔除的占優戰略均衡的一種特例
第三章 重復博弈與序列博弈
一、重復博弈
重復博弈中的“針鋒相對”策略博弈
重復博弈是指同一個博弈在相同的環境、規則下反復多次執行的博弈問題。重復博弈最好的策略十分簡單,只要將一個原則貫穿始終,即“針鋒相對”。這一策略的獲勝有一個十分重要的條件,即博弈是無限次重復的。也就是說,對局者都預期這一博弈將永遠持續下去而不會停止。如果對局的次數是有限的話,上述結論將不再有效。
二、序列博弈
序列博弈是指對局者選擇策略有時間先后的順序,某些對局者可能率先采取行動。序列博弈也是一種動態博弈。在序列博弈中,先行者可能占據一定的有利地位,我們把它叫作先行者優勢。在某些市場中,特別在涉及市場進入的競爭時,先行者優勢對于企業的經營具有重要意義。
第四章博弈論在企業經濟管理決策中的應用
一、“保證最低價格”的策略
重點掌握保證最低價格策略
條款內容:該條款規定,顧客在本商店購買這種商品一個月內,如果發現其他任何商店比本店更低價格出售同樣的商品,本店將退還差價,并補償差額的10%。對消費者來說,保證最低價格條款使你至少在一個月內不會因為商品降價而后悔你的購買,但這種條款無疑是企業之間競爭的一種手段。
假定推行保證最低價格條款的商店為商店A,它的競爭者為商店B。當商店A把某產品定為5000元并推行保證最低價格條款的時候,商店B應如何定價最為有利呢?如果商店B高于5000元,顯然對其競爭不利,因為除非顧客不了解情況,否則他們將到商店A去購買該產品。如果商店的定價低于5000元,它能否因此而爭取到更多的顧客呢?不能,因為商店A已經有了保證最低價格的條款。這樣,對商店B來說,它的最優的定價策略就是與商店A制定同樣的價格。
再如,如果你在該商店花5000元購買了一架尼康相機,一周后你在另一家商店發現那里只賣4500元,那么你就可以向該商店交涉,并獲得550元的退款。
對消費者來說,保證最低價格條款使你至少在一個月內不會因為商品降價而后悔你的購買,但這種條款無疑是企業之間競爭的一種手段。
證最低價格條款是一種承諾,由于法律的限制,商店在向消費者公布了這一條款之后是不能不實行的,因此它是絕對可信的。這一承諾隱含著商店A向商店B發出的不要降價競爭的威脅,并使這種威脅產生其預期的效果。
二、擴大生產能力策略
壟斷者為阻止潛在進入者進入市場,壟斷者可能對潛在進入者進行威脅。但壟斷者的這種威脅是否能達到阻止進入的目的,取決于其承諾。所謂承諾,是指對局者所采取的某種行動,這種行動使其威脅成為一種令人可信的威脅。那么,一種威脅在什么條件下會變得令人可信呢?一般是,只有當對局者在不實行這種威脅會遭受更大損失的時候。與承諾行動相比,空頭威脅無法有效阻止市場進入的主要原因是,它是不需要任何成本的。發表聲明是容易的,僅僅宣稱將要作什么或者標榜自己是說一不二的人也都缺乏實質性的涵義。因此,只有當對局者采取了某種行動,而且這種行動需要較高的成本,才會使威脅變得可信。
三、限制進入定價策略
限制進入定價是指現有企業通過收取低于進入發生的價格的策略來防范進入。潛在進入者看到這一低價后,推測出進入后價格也會那么低甚至更低,因而進入該市場終將無利可圖。
四、掠奪性定價策略
掠奪性定價是指將價格設定為低于成本,而期望由此發生的損失在新進入企業或者競爭對手被逐出市場后,掠奪企業能夠行使市場權力時可能得到補償。這也是一種價格報復策略。掠奪性定價與限制定價之間的差異在于,限制定價是針對那些尚未進入市場的企業,是想較長一段時間內維持低價來限制新企業的進入。而掠奪性定價則將矛頭指向已經進入的企業或即將來臨之際。
案例分析
囚徒困境
案例:警察把甲乙分開關押,并在提審時分別告之,如果你坦白而他不坦白,那么你將只判0年,他將被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你們兩人都坦白了,各判5年;如果你們兩人都不坦白了,各判1年。
分析:每個博弈方選擇自己的策略時,雖然無法知道另一方的實際選擇,但他卻不能忽視另一方的選擇對他自己的得益的影響,因此他應該考慮到另一方有兩種可能的選擇,并分別考慮自己相應的最佳策略。對囚徒A來說,囚徒B有坦白和不坦白兩種可能的選擇,假設囚徒B的選擇是不坦白,則對囚徒A來說,不坦白得益為-1,坦白得益為0,他應該選擇坦白;
假設囚徒B選擇的是坦白,則囚徒A不坦白得益為-8,坦白得益為-5,他還是該選擇坦白。因此,在此博弈中,無論囚徒B采取何種策略囚徒A的選擇只有一種,即坦白,因為在另一方兩種可能的情況下,坦白給自己帶來的得益都是較大的。同樣的道理,囚徒B的唯一的選擇也是坦白。
所以最可能的結局:該博弈的最終結果是兩博弈方同選擇坦白策略。
其支付矩陣如下:
性格大戰
案例:一對戀人準備在周末晚上一起出去,男的喜歡看足球,但女的喜歡看時裝表演。當然兩個人都不愿意分開活動。不同的選擇給他們帶給他們不同的滿足。
分析:可以看出,分開將使他們兩人得不到任何滿足,只要在一起,不管是看時裝表演還是看足球,兩人都會得到一定的滿足。但看足球將使男的得到更大的滿足,看時裝表演則使女的得到更大的滿足。
在這樣的一個對局中,男的和女的都沒有占優戰略。他們的最優側率依賴于對方的選擇,一旦對方選定了某一項活動,另一個人選擇同樣的活動就是最好的策略。因此,如果男的已經買好了足球的門票,女的當然就不再反對;反之,如果女的已經買好了時裝表演票,男的也就會與她一起看時裝表演。
價格戰
案例:假設市場中僅有A、B兩家企業,每家企業可采取的定價策略都是10元或15元,我們可以得出得益矩陣如下:
分析:無論對企業A還是企業B來說,低價都是他們的占優戰略。從表可見,企業A的占優戰略是10元,因為無論B采取什么戰略,企業A都能獲取比定價15元更多的利潤。
如果企業B定價10元,企業A定價10元能夠獲利80萬元,而定價15元只能獲得30萬元;如果企業B定價15元,企業A定價10元可獲利170萬元,而定價15元卻只能獲利120萬元。同樣地,企業B的占優戰略也是定價10元的策略。
如果企業A定價10元,企業B定價10元能夠獲利100萬元,而定價15元只能獲得50萬元;如果企業A定價15元,企業A定價10元可獲利180萬元,而定價15元卻只能獲利150萬元。同樣地,企業A的占優戰略也是定價10元的策略。
最后有一個最容易出現的結局就是(10,10),故雙方均采取低價策略。