本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
! }, c' d- B$ y8 W! m; N' H" z- w3 \/ d4 |
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ Y0 ]( Y! n6 c% H8 ^1 J8 X 以下三个定义:- k. W" c; U. j P
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& ~ H9 u' b8 l2 g: T 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; ^' E4 L9 B( V% z3 P; }" M 所谓的双方优势策略则是指双方利益总和最大的策略。
. b i. H! h# [, j& e7 O& P[编辑本段]严格优势策略举例分析
$ ?- g) t: i2 t9 b2 @3 z/ V; Z2 k 一、经典的囚徒困境
4 D5 h2 b2 r& z* j 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / G& J3 f y8 [; J+ G# V5 z
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 |3 w: D6 `8 a2 c
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( X- A( w' h; q 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 p/ H3 w; ?, }, N+ K+ P! o# ^' Z
若二人都互相检举(互相“背叛”),则二人同样判监2年。
0 O2 I" o* L: S. ^ S& o8 b
8 z5 I/ z5 ^7 h4 W用表格概述如下:) x- i# g: _: S0 I* j, L
' Q1 i2 d" s K6 @
甲沉默(合作) 甲认罪(背叛) ) T# R) _0 ]7 ?: b7 t
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ! e4 S# i6 Y, n9 C" i
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
" I* q7 z+ k& |5 o" e+ H# k% O; ]7 h# z
- c4 r# d' h! g; _ O5 e3 q 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; u! ?! a3 G% ]4 w 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
) f- l( \9 l+ ]2 G& U. V 若对方沉默、背叛会让我获释,所以会选择背叛。
) o6 H- S) r+ M: e b 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 V4 v2 D9 b, N$ t; @) G 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 |; w( o' V- c' U, I 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % A3 x' E8 I; _. G# H- z+ P
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' c" a9 x |; Z @, E[编辑本段]二、智猪博弈理论6 E2 @6 f( Q! q" C7 `6 u
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
1 |+ [/ ?1 l/ @& T+ b* Y5 U 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , G/ b3 p! e( e Q# a* ^
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 M1 x$ {# [. s- f' a 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # z! }: K- `" Q6 X
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! g3 t4 N1 R5 d6 r4 O, G 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ! a' U+ k1 j3 _5 k+ h8 V7 g$ R
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 O, o( l. y; f6 | % p4 [6 P- z% K; Y9 ]4 ^
三、关于企业价格策略
' q# q& a3 _! \+ B7 s8 o
% L* }( x! F; R$ W; h I ' _: }+ B/ Y% H& [$ _+ Z0 _* i. A
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( K8 c& x* v8 |% H a9 f$ d* U
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ B4 F' z8 K% _& ?7 Y 以下三个定义:3 G1 {6 C8 ?* P' z1 H' ?9 K- Q7 f
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 - x2 w% I# ^1 i/ t
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 _4 y% v& {! x' v; Q' V+ V: |
所谓的双方优势策略则是指双方利益总和最大的策略。 3 d4 Z: o C- P
[编辑本段]严格优势策略举例分析- N1 Q- K |: |# Z6 b c
一、经典的囚徒困境 $ r& D/ b. r3 U+ f) P. Y z
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( d5 ~# o! ?; s, D 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' ]6 p8 n$ O3 x
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 K' C6 }6 o! t( S7 Y5 a
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 5 p- z d& S2 i+ Z
若二人都互相检举(互相“背叛”),则二人同样判监2年。
; j8 [0 \& f6 e+ a9 `4 s2 `" U, I
2 q( g# k" s5 h用表格概述如下:% A' ^; g: D) \
3 { a! T8 u( }- K2 L 甲沉默(合作) 甲认罪(背叛)
% ^# u( O/ |4 N, ]) r2 e5 v乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 6 P8 |, r( ^" y- L
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 t8 ]' ? v6 V' ^( i
: \% Z' K. z( e: K D& u- }9 u7 s 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ( F! w. I; I, V$ B: u
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* J; p/ J* H4 s 若对方沉默、背叛会让我获释,所以会选择背叛。 0 J7 o( }3 s) }0 M6 e4 t, o5 X0 J
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 s4 b: B- t6 o" ^9 x/ b( p; c 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * |- d' n/ M+ D% S% R
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 & \' }" l+ ^ K A
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* J z; ?$ R E. z( B S
[编辑本段]二、智猪博弈理论8 o) ]4 N, @! P$ \, I8 L
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 , F8 h2 B; u6 y- b+ E* n- q
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 Z @ @3 P0 \. V7 F
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' B. F8 p5 q. \6 q7 j 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " k" ~; D. U0 |' z0 \$ y7 Z
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' v1 _5 P0 ` J2 a% I; `0 z 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 G. O* e# w; ~' U
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
1 Q* f+ E: K) s$ _) G5 N) |% O
! S. o8 Z) O0 e# o. I三、关于企业价格策略
+ T% [1 W! {* k% k; h S( a% u E" p" C" m
+ x! v) [5 ? E1 ^ B6 _% j# U 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ [7 L( z$ e- j2 r7 _5 n 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
) P6 }% J. P" F 以下三个定义:
/ P- g) H+ U; H; t! E' C% Z( \ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 L3 h) x1 s. P4 z/ j 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- @' p2 T$ `/ J# Z 所谓的双方优势策略则是指双方利益总和最大的策略。 * Q; @+ |; w( `
[编辑本段]严格优势策略举例分析
7 {0 [/ W8 g% Y5 g7 i+ [ 一、经典的囚徒困境 " V; v& C; x# G/ }9 ]
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / G6 K& v" m- H$ x0 k- I
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 K6 Q/ g [9 |8 R4 R6 n 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 f l/ K4 C8 |$ k/ C' d 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 {& p. B4 m5 A, ~& y' e5 w4 R
若二人都互相检举(互相“背叛”),则二人同样判监2年。# D: t) x4 p. ?' G
$ ~4 I5 S0 ^: ~) B& K) E用表格概述如下:: `1 |; o; J! z9 o R5 l/ g
/ L" Z4 [2 g( e% u2 I& ]
甲沉默(合作) 甲认罪(背叛) 7 |# N/ Z0 O+ q2 F& l# ^) I/ u. r
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 " d/ J R% ~! [$ u( w; Z; ^, i
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + c5 T0 U& L. s* l1 K
2 n2 ?9 f- N$ O4 j
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 W7 c: t5 w+ q* A. P3 @1 v; m 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! l( ^1 u, a$ d* Y 若对方沉默、背叛会让我获释,所以会选择背叛。 . ^/ m& J2 B4 a: Q6 A: D
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 T$ U1 Y; {0 I! ?5 ^1 @
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 o3 c- F" z8 n& ~& Y- [& | 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 0 B9 `- W2 q; r" [ ` L: \
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
s5 |% l2 }. O, {. d[编辑本段]二、智猪博弈理论! L3 f: t% q5 H& K( d
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; A+ _" [4 h- b9 d: I& h; W, c 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # j) I& o0 x' J& n2 h- d* D
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* C6 U. ]& G2 r+ V# M 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 T3 r+ Q6 z4 D
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
~4 X8 a$ x1 d4 m! ?. I8 K 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 w1 F* p) z' A7 g! T2 y
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
Y2 O8 z+ n+ C. C) N4 {6 T/ Z; E
0 i5 u# G* r. G7 j) K三、关于企业价格策略5 M+ }4 ~3 d% A! U
3 E$ Z0 ~* E8 u2 [% k1 M
% P0 D% j U. U6 w A- R2 e8 m; k) C 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 C! y4 L2 n9 e7 u( {& t% S 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 N I Q' `0 `* @ w T& k 以下三个定义:7 q8 ?$ z m$ R% H i+ Y1 G
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- e6 |! R2 S# b* f, K s 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 V% i7 k7 q6 t* D+ n2 k; d. I5 U 所谓的双方优势策略则是指双方利益总和最大的策略。
# M; O. S0 t+ V/ F& @[编辑本段]严格优势策略举例分析
, V# ^; U8 Q9 y- |6 Q i 一、经典的囚徒困境
- r% t$ V( w; m. |" L 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 M; j0 ~7 { ]8 P: `* s
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: X( | v, I! L" S! ^+ y) @
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 }0 `& R- B: E3 [3 Z9 F* R0 f/ p
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 E, F$ s2 H5 f0 \6 Y5 K 若二人都互相检举(互相“背叛”),则二人同样判监2年。. P/ M8 o" {, G2 q, I! Z1 [3 q; p
7 G/ a* e( h/ f" v, | \
用表格概述如下:- w; k4 s: f% W* { l
- k0 l7 B& I: f2 ? 甲沉默(合作) 甲认罪(背叛) 2 ~2 n& {% F! g: Q- Q- @: ]
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 - S: E' q$ T2 w6 Z1 P. k: a. A
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
# n. ?( T u$ B3 D" `( S
/ N( I- a& t$ x# x8 m7 o8 J D 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 Z, |$ e' Z8 ]# J
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: . U' c$ I: Y0 W! T: r$ d
若对方沉默、背叛会让我获释,所以会选择背叛。
. y u. H/ J& {/ S% G6 h 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' s, W5 `1 N: p
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( |/ [$ F. \. v! m
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % I& }- c7 v7 P
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
: r2 V9 U" o5 f2 s' ?7 d" y% m# E1 R[编辑本段]二、智猪博弈理论
1 x1 y" u7 w2 r; T2 u 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ r9 u/ e1 @ \# h/ T$ J; H 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * v! B( e, M" X+ V7 R5 Y( ]* g8 {
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . m0 K! x7 g& ~5 H- T" ?; [
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. H( |# @! S0 x" G4 a. L4 l# O) l/ [) C “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * t* P! B9 I- O6 D4 O
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 w' U O# F! ?+ W- V+ U* e1 r3 C, l 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 r! \1 Z1 F- m% }0 \' C: X
: h7 T: B' Z5 e% O/ T: z三、关于企业价格策略/ t" K, p* w# ?7 p. w- q
' ^. h9 l& j: l C m
9 `) ]# d: T2 ^$ N* n 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' F L+ a4 o3 w 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |