本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 ! p: [8 C1 V0 x& F! G$ @
$ d8 b2 Q- R+ n
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ o3 P* Z; D E' w, `& Q
以下三个定义:
) T: J, Q7 v; q# Q) D 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* [3 b) ?/ R% K2 K( V$ D 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( S$ `7 R3 }. U' M* Y3 v
所谓的双方优势策略则是指双方利益总和最大的策略。
4 O, h+ X! m4 P: o, c6 u[编辑本段]严格优势策略举例分析
' v0 k/ O" ^5 _) h: j$ m 一、经典的囚徒困境 ' Y# K. }; |( r8 R6 \
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " k; l. W5 P- y; Q, c' ?# F; f
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # n1 J( ]# P" o5 C, M) N! R2 F7 Q
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / N; L: J- Y( [
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* g: d7 H) H# U; w' e- J 若二人都互相检举(互相“背叛”),则二人同样判监2年。
) B$ B6 f! c: A8 r7 e & Z6 U, N P/ J+ x6 O3 A
用表格概述如下:) q* r& v' {7 F6 R# x2 T
8 D1 _ M9 ? w B9 { 甲沉默(合作) 甲认罪(背叛)
) A' I& G0 N4 s2 f/ d4 u. n乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
) U& q6 l- k0 ]6 @7 J乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
7 d6 J; Y! T0 {0 W# a# E/ {( W1 ^9 K0 h; f+ R" X
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 W; F- h) G4 B& h
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + r6 O: D4 J) ?; c8 u* Q- z! Y! x$ K
若对方沉默、背叛会让我获释,所以会选择背叛。
1 X* Y* o. O2 u( m6 [2 E! @: J 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- T5 O, Q7 n/ v$ ?, K/ I 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % Y1 z/ c. v) j6 x7 _
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * P$ u' E+ \) }( ~6 W7 l, z/ z
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。$ u+ t4 b( Y9 G- n+ | o+ L7 K
[编辑本段]二、智猪博弈理论
' s5 z" R3 o6 o+ w 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 q) n# B$ J9 b/ s( X) ^ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . U' f+ h0 z V9 a/ |9 E( K
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 * ~, A. a5 b: o* @4 I7 u
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * g6 e* l; v3 p
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 9 G8 D5 c. I7 b" m4 Z3 |
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
5 [! m1 L& w% r7 ~8 r1 t" f/ O 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 S5 b+ {& G9 |% M- s
8 S# {5 T5 Y; f$ P8 P三、关于企业价格策略% {+ z( j y5 p1 h8 U, S9 d
+ v' u1 P2 S. U# M* C
% F% i! ^4 o1 r, D% o 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, l! ^# \2 J% T! |' `4 ?1 Z 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 C, Y& v* U/ E( l8 f- A8 }
以下三个定义:6 d: [! c2 X6 G+ y; S/ }
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 5 r- i, H2 ? y1 s6 ^) l8 Y
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 % n) j( c' @) \! ?6 Y( x
所谓的双方优势策略则是指双方利益总和最大的策略。
1 _; ~3 A0 v4 j V4 G[编辑本段]严格优势策略举例分析
7 J0 p" r6 ?( c5 C& G( V2 @ 一、经典的囚徒困境
! t( [5 v% N9 D# Y- y5 W 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 k4 }# d5 u/ l: N- w$ l7 X7 C
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ Y, ]0 Z8 B1 z# d2 b0 V- P+ z 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& J1 z1 V6 V* a2 r7 R- x 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( Y+ _. W) k4 }: R t1 R2 m
若二人都互相检举(互相“背叛”),则二人同样判监2年。2 z! h. N/ u% w, B1 e
h! I7 g. U q1 X7 f3 S
用表格概述如下:4 L. n& q* _% i/ Z
; E' k( I2 x- @+ Y. ~; `0 ]
甲沉默(合作) 甲认罪(背叛)
# f+ ^. \* ?5 D% r: Y" _9 b4 w1 I乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
3 r) m+ D" K' N# o- ~" u8 R1 p乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
7 t- b) m( F7 Q2 o5 ~
6 p u, q; q4 k2 k, X 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" J. B* D( \' D2 I" }5 I 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # `4 a* g) [1 ?* ]+ P( E5 k* q
若对方沉默、背叛会让我获释,所以会选择背叛。 % z. W }9 N7 H U* Z# K3 v y
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 % P% S- Z2 p* C( n
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
. V L @4 S* _: t- |$ b 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% Z t/ v* W7 d: X; I 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" R+ r' Y7 d+ H1 b
[编辑本段]二、智猪博弈理论0 r- D, c( K& a3 J' X7 @/ j0 L
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; f! S- T6 [" @( \
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) ?# a7 Y6 Z/ G- l, o
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - I1 |* v1 E2 h" k
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 Q6 J% B) @, c3 j+ [: ^
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : M+ Z' z/ w- W6 [+ S$ l
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- G$ Z$ D9 l7 O9 R* w! R+ R 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( ~3 G& r# @/ B Q5 }0 E& w
8 j0 [: e; s: J% G3 t9 p
三、关于企业价格策略
/ {' m, G- A; U- b3 ~4 g% b6 N0 \* h# f' R. b$ R
0 z% @' o2 [" S3 t# w 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( m7 u/ s, h" h$ Z( e. V. p: E) j
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
6 Q$ K, D& L1 |; O9 y 以下三个定义:; N) K5 n2 E" v: C
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
) p r! K' v) f 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 x7 `% g' k# S9 Q/ k6 b 所谓的双方优势策略则是指双方利益总和最大的策略。 4 n2 o* O2 g( X9 q
[编辑本段]严格优势策略举例分析
2 m/ F: {; Y; S+ |9 y) T7 y* {$ y 一、经典的囚徒困境 8 \& ]- H" h/ z/ o( u; m
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: V! H8 j6 Y' y0 Z& U
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 x) g6 d" L* [. d 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) k3 b3 [+ X5 b0 ]" ]1 \$ n! d* U 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 {" ^( g3 P0 i9 k 若二人都互相检举(互相“背叛”),则二人同样判监2年。9 z: x d o# v T
( c( ?9 h' L( Q# c5 R用表格概述如下:9 l4 t; v4 ^2 m. U* w
. R3 X5 F% G( K) d% F 甲沉默(合作) 甲认罪(背叛) - d0 v, _# [: h$ \" Q
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 7 ?" w" g4 [' g1 j, b. d8 F
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 * A( F/ J+ Q$ I9 x# v {
( b) D h3 I& G2 G8 H7 G
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ C& E# \ _9 _+ L 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: & N; Y- ^+ \8 F4 S. i
若对方沉默、背叛会让我获释,所以会选择背叛。 2 Q! l! a4 D V j
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , n% o- m3 }! s y X( y7 [
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* [) V( }( E4 I1 c% W6 { 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 a! E8 R# i* u7 T9 M, `4 P. F( {
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。% p; ~6 ^4 v9 N, z. I- o; A9 @* k8 t
[编辑本段]二、智猪博弈理论
5 c/ ^3 h' Q9 P& h# w 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
7 u8 c- O: P% I3 L* F 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 K1 \! m. c9 X& R- ~4 M
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, |0 S% Q/ j& s" i; D( P [- E& D3 j 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ @4 k! s+ K# X8 ~' h
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + G( x+ N v' A6 z. o# U" G
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 w7 F T7 ~. X4 |# ? x$ t, l8 c
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。: \+ s8 ^- `% l) ^! x9 [, k
! T: l& b, W6 X& G; Z$ U2 Q三、关于企业价格策略
) n" H$ S, i* [, {3 q/ K ^
) I1 w. x! I+ w* ~% e: _8 b+ I * U- H+ Y3 I. u) V- g
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 C# T6 J# O1 O V: |/ F& g
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 L" S1 U1 O: V8 K' A" u
以下三个定义:
/ t/ h5 }! [$ c8 s 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 s5 Z5 j5 E8 i7 I! n; Q0 ~- F 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 R+ ^" w6 r* K8 ~: b8 a6 S 所谓的双方优势策略则是指双方利益总和最大的策略。
" [6 [& }1 r1 [: ~6 I[编辑本段]严格优势策略举例分析4 D# F5 F* J# {
一、经典的囚徒困境
, C3 r+ A# a& s% u" i! T 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( p0 `4 _" P; U2 X% v" x$ u" E4 b 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 J( x+ I+ t1 O( Y: ?) R
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 3 u9 \3 i1 W" _
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 A2 j9 g1 o- r/ |) m r 若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 {( C) ]- G7 G + N5 J: u# ]/ H# t8 j6 \
用表格概述如下:' C. P0 y! V4 |* D; z
, z& V; p2 H3 ^( H2 h j 甲沉默(合作) 甲认罪(背叛) ( t. b( v6 j7 B2 E
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 7 \9 X4 h* {: d* [/ N1 D/ C
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 3 }6 I. \' H; q( C7 C
L5 d. M5 R3 j1 I7 P/ D9 I
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 G/ @7 D% Q. O+ ^( a' `( { 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 s% j1 A; ]: ] r! R J
若对方沉默、背叛会让我获释,所以会选择背叛。
5 @$ n+ T* o7 Y. ?( M9 i* P3 \1 E) C 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. G& O% n0 _, B1 o2 y7 O& X. P 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 q% |8 n- r) b0 C
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
+ j* e$ [+ F- J* | 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
/ {. d) x* ^# {4 H% t[编辑本段]二、智猪博弈理论" f) j- ^# R/ v- V% x0 @
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 3 b" w1 q9 }4 Y& \2 \
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( W2 P6 r/ C% w; O" P: ^4 [( Q5 B 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( V. {& D, L3 D0 ^9 a 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 B+ X! t1 O1 \) U “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 ~' E- L+ E) F1 D; i
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: R( ~: K; i8 ^% m! Q" V 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ x6 F/ w0 M$ Q0 {$ I: ]( B
, W; @$ T0 S" a6 S( _4 U- ~- W
三、关于企业价格策略+ h& H6 ^! m3 e0 f7 f# U. L% m# o0 A: w
6 {: a$ n0 K3 h/ e' p L8 V
3 ^; K, S( r2 l8 i9 L 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; j5 k u( u- X& V# j- S0 D1 T 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |