本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 9 `, r- Y" O) C ^9 \! Z
, q5 I" z) M9 d' ^' c5 K
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 j) d. q: K# f6 H% P 以下三个定义:
- t7 Q# V+ j! ? 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , P4 a+ A6 E/ ~" p
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & d7 v8 P3 s7 N) ~7 Y
所谓的双方优势策略则是指双方利益总和最大的策略。
3 [3 V* m8 E5 v; [7 E[编辑本段]严格优势策略举例分析
2 p9 |2 {- o) ]6 s# o2 Y" K 一、经典的囚徒困境 . Z- o% D5 l D/ C u1 O0 v$ B
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
3 |" ?# `% l# V' m5 y# S 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 {5 n4 B3 B) V& T+ J
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) t- ~& ]: }6 M; ?% |
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* F0 \9 v# h7 m' q- W 若二人都互相检举(互相“背叛”),则二人同样判监2年。3 ~' l0 ?, t* j" K
1 P5 |% W% K8 T5 Y用表格概述如下:2 G. K+ v" k; e$ M& L$ T
" S) d; I8 N" l, n 甲沉默(合作) 甲认罪(背叛)
/ t# s6 K8 j! ]$ U1 J乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
8 |0 B2 d/ G5 Q8 B3 l! L4 o乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
1 P1 ?0 B, F+ F7 B* }: o0 a! K2 ^0 h7 K+ R/ f, `6 i
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 M! l! U3 r/ y' [& @
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 s8 ?( }( M/ B- R
若对方沉默、背叛会让我获释,所以会选择背叛。 ( Z6 b& W M# V- X
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 J7 \0 P* M4 B4 c( S& o
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' K3 s1 x2 ]/ N 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 C8 P) ?3 ~9 e2 q 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# C1 @% D( p8 k! a# t1 c% E( k
[编辑本段]二、智猪博弈理论
2 z6 y8 s3 V7 M# }: Y s 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 |" ^' y' ?, A7 g9 f) `; A$ E 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) O, z3 O1 n2 c$ Y. p a
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % N" K5 X* Q0 v: e2 j! ]
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 F) h, \8 D H+ _6 K2 T “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
+ f& n0 Q0 Z+ u" x8 L+ m 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 , g1 K" X* B7 q( J! K9 I
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; f, R" Y0 m5 Z# }
% ]% p3 S2 F! P1 W) l9 r三、关于企业价格策略
: D! K% Z# x* d7 F: X+ n
( y! [. T& H. j. y% q
0 o9 u" @6 T: L 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ m7 H- c1 J$ v6 w2 _# N 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ p. j) a* e P( I
以下三个定义:4 b; z8 K$ a$ {; z# J) ^! x) A
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ b# [1 B. g2 S J8 a4 i 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 }6 [+ L; S1 G
所谓的双方优势策略则是指双方利益总和最大的策略。
8 r( T& j3 m7 V[编辑本段]严格优势策略举例分析
7 p+ s. `2 ^7 {3 _. z( w/ n1 ] 一、经典的囚徒困境 6 t+ N1 {. W( O, p' @
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) X3 d: G7 ?% R6 {' L8 r. O9 m+ l 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; |( r1 m3 Z- X* s( F$ n 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
: G' l; a6 _3 I: p% n 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 E9 y( d( r7 ]0 E; m. |0 H
若二人都互相检举(互相“背叛”),则二人同样判监2年。: Z% s( U* }7 M* j+ M1 U1 m; s
0 S2 x2 g5 D4 l: x: Q; b用表格概述如下:
% h' \7 a1 c A( d T# q1 Q
/ g! f; v4 ^7 c) V 甲沉默(合作) 甲认罪(背叛)
% [9 ?5 F" |( |3 s' i. O4 n乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% Q x `7 l; D% o3 y乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 : e: P9 h4 ^( g. v
s( X7 I* M+ ]- v' Y& ]5 d1 \2 c 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
3 g' D% y; a2 \ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 w' ]8 ~3 N. _7 M% Y 若对方沉默、背叛会让我获释,所以会选择背叛。
" Z; ` L! w! V: z 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * Z! T3 k7 C. C( d1 c! i% E
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 }9 X7 [ _) \) \0 g9 O 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
, M$ T7 F4 N0 p# ]; ~ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* @6 P. z+ a+ a: s6 t" s
[编辑本段]二、智猪博弈理论
7 D+ @: ~; j e$ c& B 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & x5 J/ N" E( Q& j$ x. _2 o7 K
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 G8 P; e( r" w% W+ ]. a+ @. ~
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 8 w) Y# h% F8 k/ M
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " \) E; M7 U; \6 j) s* V* o
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 $ ], c! F$ C; O& u
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) A" i5 h8 r) H% y! C0 e3 R
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 D' n0 v% Q( q, V2 P
5 C+ c% J2 t% C! k- t! U三、关于企业价格策略% C$ ?# j4 \; ]9 ^) u2 t# w
" R; I }: G y
) Y+ g w! ?- n; Q$ u0 H, j; p ?' `
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ Q) ]6 y J5 N! s4 G
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 T; l" k0 H# r- s$ m 以下三个定义:6 ^) Y5 P$ L% o4 v
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 % p% ~1 R5 S8 j
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
F, b( ~: A: ]% V* @ 所谓的双方优势策略则是指双方利益总和最大的策略。
# b" e. b( t8 J& E- j( {: H( L[编辑本段]严格优势策略举例分析
: d( `3 H5 d0 t" }$ D7 Q9 u3 k- h$ k 一、经典的囚徒困境
: f& e( p0 Y! K9 [. ?: z$ l0 D 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 M$ g0 f/ K0 Y% y+ @9 z* U
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
5 A# z6 D# O5 l 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' D/ d- |) j4 l& l! F. h 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- L9 i' I$ D, j: w; ? L7 E2 Q 若二人都互相检举(互相“背叛”),则二人同样判监2年。3 n, b' J4 u2 C/ S: U- M
% ]6 j% h) I) f x
用表格概述如下: p2 H: @1 {5 h7 @) i) L
4 J' L" a t9 l n8 a! y; _; C
甲沉默(合作) 甲认罪(背叛)
4 p+ d% q- q$ p0 q. M乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
# s" p% e; C% H0 c* @# G乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
/ l- C; T6 n0 O' E. ]+ d
$ J0 x) z3 y& F' z( i3 G% d% P# k 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 q, ^4 r4 `7 D3 o8 K$ T% m9 W 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : Y1 O4 `8 f1 x! X7 V3 g
若对方沉默、背叛会让我获释,所以会选择背叛。
( W/ U; {' \% F/ [5 }' r& Z 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : R6 j, R* }7 Z5 o2 ]2 y, \
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 ?& I+ u7 _( } 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) O# v1 l% U6 A5 I6 Y; p: R
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" a) X* b; p5 d0 H) v6 ]
[编辑本段]二、智猪博弈理论
. y! x; y0 H9 Q 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
! O0 E! v5 X: y3 K( d+ A( r$ g8 c 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' X: b, u) F5 A
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 l( t8 o$ A8 f: B
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 T0 N/ o" _, h1 G3 f6 A" _ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 v* @: [4 u! L! y6 Y; Z$ t 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
9 Y5 m% ^- v: _! z 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 r- D2 B: x! Y* G$ H5 Z
) P) t& V- U) s* F/ J B E三、关于企业价格策略. Y: ]2 x0 i5 T
( x7 ~" m8 c4 W6 U& ^; ~
7 c; f+ U: ^' T. f7 [3 N 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 ?3 r0 F! X$ z/ z# I! y7 Y j% u8 U
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
6 P& k0 b- `2 n6 R+ B; ^, w( n+ a$ A 以下三个定义:
# z& K, A) @- s$ T, e+ y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 5 Y9 n, k' }6 A0 Q/ B
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* n% n8 m# m! Q* G: n/ K 所谓的双方优势策略则是指双方利益总和最大的策略。
7 \6 G( e% T% ~ C$ l[编辑本段]严格优势策略举例分析
# `1 [- t. V3 H+ [1 B 一、经典的囚徒困境
- \/ T( C4 P$ h' Q8 \4 p/ p! G 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ z; z3 B, b5 ]( }, m! m. N2 Y 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; R$ S$ z( P q, E3 z 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 W/ h# b6 V: g. c- { 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 J7 @9 Q, i! m$ I( P/ C5 V# j
若二人都互相检举(互相“背叛”),则二人同样判监2年。" ]/ i' _ H- y$ i) U7 K7 D
- \/ S# J f2 c/ _用表格概述如下:
. _$ E# }, ?% N
|9 V) V* e5 X2 k2 \ 甲沉默(合作) 甲认罪(背叛) . u9 H$ n2 A" _ a
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
$ V* r3 _+ X' \& ^$ f! ]9 w乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& Q/ V8 I+ b$ _ A: A% k
/ e/ z S, j& A' S% u 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 ]5 d2 z4 D m8 s- ] 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' Y$ L$ G3 G) j& Q 若对方沉默、背叛会让我获释,所以会选择背叛。
- Q9 Z, L Y ?3 x5 S7 `. s 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
& j$ D2 b7 I. |- ? 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 . c7 ?) v7 G; j) [$ _
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 5 U8 o% g6 y% p- M
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# O$ Y$ b4 N% I! j/ j[编辑本段]二、智猪博弈理论
) H+ `" k& r2 c5 x 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 }$ Q9 U/ @* n/ o; Z" E0 w
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! l3 j% b4 ?4 G2 N1 C 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : ^- q) s9 S' a# A2 t: ]! p1 N
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ L" U7 h8 a5 q/ g3 k1 E “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
4 u! z) r" ^+ u$ y- d) L, @' G 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & \$ U* a2 r0 y# D0 Y: U# r5 P- X
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
1 Y1 I. E# H3 n; g ; Q1 h0 N$ I7 Z& s N
三、关于企业价格策略. [+ v; n7 i' m. e
4 H7 h. j$ f) Q* S: S g9 \
8 y& x8 {, b) b- H 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 L2 N8 g# t0 F! @6 a3 K: c% s4 y' ` 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |