本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
# Q: L$ J/ T: D* j7 S. |# Y. h) P) X( a, K
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);. t L; y0 u& e$ B; N: U* D$ G
以下三个定义:
|, g' B' u. C1 k! k* U0 @, b: O% r# ?) Q 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " y6 t* N: N! s: e
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
7 Y* `8 V+ J) G: V4 `* F7 i3 D 所谓的双方优势策略则是指双方利益总和最大的策略。 - v( \: ^* {5 \" W+ @% \1 I
[编辑本段]严格优势策略举例分析
( j6 W+ U; f( N$ s 一、经典的囚徒困境 " _* G/ q+ m! Y% B- u0 w8 ?
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ J5 M% J0 E0 V- H N 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 Y$ T9 w5 s# Y& [: j 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* y' n0 C3 S+ G. l 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
! K5 n3 p @3 k# y7 P: [2 w+ r/ m2 \ ` 若二人都互相检举(互相“背叛”),则二人同样判监2年。2 u/ |& b% R/ @+ w
+ H6 `: |! z6 [+ K. h$ R用表格概述如下:
. @1 [3 C: [% v! j V8 [: Q& S# h! S' x+ U% \6 K! Z8 e
甲沉默(合作) 甲认罪(背叛)
. d5 W, J4 W9 {' c5 a乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ K5 S5 Q1 X4 ~/ _ N% U$ i0 P乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 7 [8 d/ u- j& i! h% i5 v6 u) q3 Q
& v8 ~, X& f0 t
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 `- I5 N* d1 |% p
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % |( b! h+ ?3 E' u. J2 q L) j6 G
若对方沉默、背叛会让我获释,所以会选择背叛。
4 A' D: N( y% g 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 . z* @. o8 w4 ~* o* B8 y
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 |: H# ^2 H* s6 m+ [5 r; x
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( H- A4 `' H+ h. P% [$ o: d 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。$ y# B; s$ c) l
[编辑本段]二、智猪博弈理论) E: v2 |6 u8 Q6 s0 O# }
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 y+ o! l" l: } W 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 \9 f( o, G) B; i/ k 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 H' Q0 D S: L/ N/ V3 }5 Z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! B. _- t1 h& O5 D- D; v$ y2 Z% _
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
D, \( i+ J I h/ _* G+ G. L 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 * K2 J9 D& f4 z8 O) n
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。+ {$ J$ O" a- }) z+ V# F; b
# f8 F6 ^! @( J9 x- p' u三、关于企业价格策略
+ P( r8 o0 H2 }1 u" q0 Q
4 ?' H, i6 o( \ - O: T" j$ Z3 a. P" q$ p* i
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 r6 x% r- |- w; {9 k; S
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! b# c( E1 j( L w
以下三个定义:9 f8 r5 n6 r0 i3 v0 ]- H
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 w5 t- L* @3 I( B$ P+ v% y
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 I% j8 o3 @% m/ J' y7 [ 所谓的双方优势策略则是指双方利益总和最大的策略。 . L6 {, ~% x0 `, v; l% x. Q
[编辑本段]严格优势策略举例分析
" B- p/ ?2 O( E8 N0 O. t) K4 W p4 M( @ 一、经典的囚徒困境 / `$ `1 i/ D! Q
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( z# I3 x% Y0 x# f 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 p7 l2 J5 F1 t, B' x
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 " i' F( Y. t' I; h3 B m
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 r7 W5 K$ x# } 若二人都互相检举(互相“背叛”),则二人同样判监2年。 W; | X7 \% k `5 T7 b5 A
; T4 P$ Q4 v& o/ p' E L! L, t
用表格概述如下:# w# F5 _) l% X, E6 V
/ ], G: d: l- u# R6 Y
甲沉默(合作) 甲认罪(背叛) / d6 |" X) N D! C
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
1 n5 |) I5 Q: n$ w6 ~( L2 Q乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ' n+ y* @% F+ |2 g$ A$ X
$ q$ X8 c& m5 b% j8 y( U
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 K7 Y3 ?0 o2 y8 w
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : O: f. n6 {- X
若对方沉默、背叛会让我获释,所以会选择背叛。
5 j' K! \' ^; }5 V 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) p% m+ E1 T$ ~; D( e2 _4 b. a7 e 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 D7 ~* }' u2 e7 e A" w 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 y d4 _* H: j 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 Y2 \$ u, e8 U2 _, `- K[编辑本段]二、智猪博弈理论4 C: j/ l& f0 Z0 B! L& N, h
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ) {$ q# m' _$ N
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 $ Y, {5 P O2 ^! o- l. M( P$ b1 R
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : h% n+ N" x! X& I3 I5 W
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
* |: e6 s0 R1 U “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 5 L5 \2 C4 Z+ f8 d0 e
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
X c, W8 `3 a 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, u$ \! N* [; X , K; s/ S2 h5 f3 _6 P
三、关于企业价格策略3 w" c7 r5 X6 V3 [
+ W6 _0 ]7 g/ @
3 [3 y4 a! [! v- b6 x5 ?; E% t 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 x6 p* W$ F: e5 ? 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, R5 N& J* ?+ `( t: }7 J- J! n 以下三个定义:
) ` } n- U" _0 x$ i 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( \, c( g0 \& c
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
8 W2 g8 |' N" v7 n5 Y 所谓的双方优势策略则是指双方利益总和最大的策略。
2 X8 D% y8 e! g: \# T1 `[编辑本段]严格优势策略举例分析3 l1 X+ p5 a# M) ]' A/ S
一、经典的囚徒困境 2 f9 d8 r1 A1 F$ x4 c0 U# U' {, u
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 G5 P' Q) D& l# s; p0 {, O- X 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
# }" V9 V& l& ^ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 2 [* [6 X) N4 ?; n
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , k9 D% G/ B$ S/ M; y
若二人都互相检举(互相“背叛”),则二人同样判监2年。
- v% t6 S: y9 z3 N$ @
+ U1 A5 Q! ]& `用表格概述如下:
0 ^ \% x/ d+ N1 U+ x0 l# _; G& \; {7 w" P1 x5 q# G! u* x1 C
甲沉默(合作) 甲认罪(背叛)
0 M0 f5 H( u& G1 ?乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
$ h, {% S; {6 A2 d. \乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 : b+ h* m" ~: n, k5 X4 W
3 a' U ?) ?) B! L6 q2 Q
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 [& `: ^" I6 C5 E0 L" O 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
) `1 m) I8 _; { 若对方沉默、背叛会让我获释,所以会选择背叛。
0 F$ w" x: ^8 L( u# ?, { 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) g7 D. g! q9 Q/ E4 T- `5 L 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 q# y0 Q2 T* u& e8 s, G
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 p" a1 |1 |- z3 i9 |
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. U) B: H' \6 A: N) M* f! Z
[编辑本段]二、智猪博弈理论
$ y. h7 ]* p1 _& Z" c 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* u: o1 P" r1 g/ M1 a' j. k# z 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. V6 A/ {4 ?' _; n 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 J6 |1 A) z, `# U* m
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. h* ]# o b. }+ j “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . C" f( ]; P/ T3 M2 [1 v
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 \; B/ G5 z& c6 S& B 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ \# {$ G# R* a/ X ~3 z $ c n1 h; E0 D q( C& J/ l8 q
三、关于企业价格策略
- h3 m! |5 ~0 q2 x. Y- G! K! f$ Q1 {2 |1 J) U, z# s% F' I: \
1 [9 b4 t4 N9 m2 l 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 k7 |- z b2 S: A, K* R 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 q6 Q8 `" Q: T7 U H- Y5 d 以下三个定义:& Q9 n9 T4 {& Q5 F
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 9 I7 P" f- A' [& X' C5 Z5 R
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # W: H6 H; p& S4 b* L8 W1 b* {
所谓的双方优势策略则是指双方利益总和最大的策略。
& i8 }* @$ i. @[编辑本段]严格优势策略举例分析4 X1 r* d$ e/ R, ^
一、经典的囚徒困境
R5 Y1 f. W2 U0 f$ x 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " n4 H8 G- u. G9 C
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 s0 k1 ?! Q& p0 Q% B 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 |5 U: ]. F' u! O5 _4 v" h. D 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) D5 @+ r4 \9 D
若二人都互相检举(互相“背叛”),则二人同样判监2年。( N, Z' ? d$ i: B5 R6 K
* k' a- ^% ~! ?6 [. R, t用表格概述如下:
- {% H% }: A2 Z9 f* Q: v6 A# ~ A- ^" a& x" k
甲沉默(合作) 甲认罪(背叛)
" h/ l' ` ^. m0 \乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 3 [# l* O4 G! Y* j; `! q- m& J
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 b- {" C' p+ P
) {* {& E8 j% h1 G6 {5 ?
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 u7 z: a. s- t0 y8 z- M7 G- S 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 U/ f# ?. I7 e3 i+ } 若对方沉默、背叛会让我获释,所以会选择背叛。
/ L+ I; t5 t6 h9 m; } 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 \; r3 P2 F* y; ]4 F 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' U U8 K( n1 `' @% g) {3 x4 D. F! @ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 2 R$ A/ X& T9 t9 w2 O
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 [ J5 r+ d2 H
[编辑本段]二、智猪博弈理论. B- G$ F# t- |# U: {, j" d
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + N" ~( s* \3 [7 |
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + J3 v) c/ U; Q3 D
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* o/ Q! \; q$ f9 ]; R 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; [0 C5 {- H a “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 P2 U8 \6 v7 G- | 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; ^+ ~# I% k% K 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, N1 A5 t& O' `) w . x2 A# c) ?$ O1 d- Q
三、关于企业价格策略
9 q F o1 g- Z7 z& _; _
$ X5 _* @+ R4 |% P) `& ^ : B! A: V- e9 i( H5 {/ }
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 b+ ]/ q9 @- P2 e* m 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |