本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 - B l. |8 s: |
2 B0 N; c; ~8 c# x' G0 @1 i. |严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 q' O/ v/ p* Y; j1 e6 F3 m/ S
以下三个定义:
; ~1 z3 J' p h& ?4 X( l 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ Z3 j% J3 J. W+ H' [; Y! x 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 r" i2 j; Y0 X$ R! j8 P, ]- @- T 所谓的双方优势策略则是指双方利益总和最大的策略。
8 W) D1 r, [. R# I7 `$ c* h' L* O8 b[编辑本段]严格优势策略举例分析- V2 R2 Q7 t6 [" @5 y e
一、经典的囚徒困境
" u& X+ m0 p) z8 U8 Y, {! H 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " q' m- K* i) {: b3 L0 ?, ~
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 F9 _. F. x3 J6 L( |( ~ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 E d. X7 H" ?. n) [% Q 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- ?% `4 |+ Y% [# ~2 X% q4 s& Y. J) T 若二人都互相检举(互相“背叛”),则二人同样判监2年。+ W. m% }. s# o, B# E) ?
+ K6 h! p* g! S, W; c- t用表格概述如下:1 u0 r8 {2 M# s* y# f
) i! Y% j F' g1 N% k0 |1 G
甲沉默(合作) 甲认罪(背叛) ) x4 Z" I" V, A9 Z
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 " |8 i& t B( s1 Y$ N9 [
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& U# d: v0 C: I) S, z1 d5 ]
g: {% z0 Y5 G' \5 q! m 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' [2 h0 L9 d: q& n& v7 N% h 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 z" T) z! p" _, O 若对方沉默、背叛会让我获释,所以会选择背叛。
7 _2 F7 M( p- Z7 A% o- p 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 D8 I) @. j0 F
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
|- ~, H; E8 D& K' C; ^& k 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 Q# x# y/ E* i% u
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。; v- p! R, J8 N/ @4 U
[编辑本段]二、智猪博弈理论/ _; |- ~, w7 E7 L2 Z Y
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 . O F( ?: Z: j$ w- U+ x
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 g: M6 [' Y) n/ ?# Q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; D0 ^; i2 O! E* S. Q
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' j" j3 |' W) a8 t7 H f' a# |5 K* ` “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # y* i& {& K1 x |
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
, z% s& U* p4 w R& m 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 _( p. |" ^# M3 K) R; T2 B' E' Z
5 D/ Z) S2 \( q# v" A
三、关于企业价格策略% A, t! t% J8 x" ]
% B Z4 U9 `) w : r6 W: t3 Z( e" `4 K: A% T7 a* l
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 B" }% N2 t7 f% F; k* q 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) Q$ ^+ k5 [' u% |
以下三个定义:" w+ R: Q) e: ^3 E; C5 ^2 a5 T
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( {* \- S/ s. ^, {+ `& H 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) I+ o {0 K4 z# R O1 K3 k
所谓的双方优势策略则是指双方利益总和最大的策略。
- ]- i2 h3 r1 x! A3 v7 s3 d1 O[编辑本段]严格优势策略举例分析 h9 i' } M: x- b& @4 b
一、经典的囚徒困境
# z: W3 f! M" H# I 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ) |8 u/ N8 c; v& I2 H' P% |
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
5 Q, S6 Y5 E6 U/ L7 p3 m( i7 u1 G 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' A) O8 G* k' e' X 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 F9 P) o3 R; ]* Y
若二人都互相检举(互相“背叛”),则二人同样判监2年。# {& p9 c2 J3 ?# H/ `0 o. T! W' F
; F% e' U" O9 i* c) X. H; s
用表格概述如下:3 q% s+ O4 B3 P, H6 j C' o, K& l& W
0 }6 c& S1 O: n
甲沉默(合作) 甲认罪(背叛) , v; n0 E# ?' Y
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
# G+ `* y% ?- s9 {乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
6 p2 G7 g. H% `8 ?1 F
! ^4 [+ v8 H o6 F( P7 I 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 N( |* r6 H( D" @" |! [8 a5 z
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
) G) @/ A4 g1 Q5 @0 i 若对方沉默、背叛会让我获释,所以会选择背叛。 8 U6 Z5 ]+ g+ }
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# v S1 N$ M7 d# C% l+ r 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 Y/ f% V9 R, d6 _' b1 W2 o3 S
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 n# d% q* F: ?* m- D5 j
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" A1 N# C1 H/ ]3 L1 O
[编辑本段]二、智猪博弈理论/ d+ S7 ? A Q. w
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 k) g6 b+ _, b% s
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 F" [5 p' d# {# G: `
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 H/ K, K( s* s& W+ A 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! k3 x, ?& _, {$ h
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * Q4 c* D1 l$ l/ ?
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 J" [) g A F2 ?3 S
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" \% \& B( x6 X 7 v( `* \3 o. q) ]8 b
三、关于企业价格策略
1 @" r" e8 J8 o2 ]5 f& J
8 w; F$ V7 c+ W) _7 ^ / v, Z3 a0 `" J
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( {2 I0 \0 k5 o# f" a 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 u# j! F( q% g3 _$ y0 _ 以下三个定义:: J1 _2 u6 y |, k) M6 Z
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
2 c" R% x, ]; l 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
, N0 {4 j8 H0 f- Z 所谓的双方优势策略则是指双方利益总和最大的策略。 0 ^# L* p! M2 j2 w7 D {& a
[编辑本段]严格优势策略举例分析8 y7 Z; i4 `* |1 F. K& ~
一、经典的囚徒困境
5 @/ b2 O; Z2 J. N 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 6 n3 \, |" |( i
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 L( ], s6 G3 p 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 |( o& d8 A1 g4 M4 z; V' o; _
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# W& K1 A- X5 t 若二人都互相检举(互相“背叛”),则二人同样判监2年。
" g0 }. S6 _+ Y4 {2 t/ Y" } 4 |# Y0 b9 v: K/ R
用表格概述如下:6 j7 ] V* Q) W; o Y& }0 P
8 U9 {% A$ v" Z# l3 b% T 甲沉默(合作) 甲认罪(背叛) : j2 |3 J- k) b h
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 / w% I9 c1 c6 t2 m" F3 ~2 E0 e
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
3 b$ o2 r9 E" i( s \0 w/ y7 K! D
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 i1 G q) i. k7 z9 p8 n: s( o 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 x6 X% w/ d. I: p# {
若对方沉默、背叛会让我获释,所以会选择背叛。
* q" Q4 R% X& _- X$ G8 y4 x 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 0 o4 I# B! g: d4 G3 Y
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
3 p& `) N$ G1 [" k) _1 X 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
. n/ I! N8 ]; ]: ?( p2 i. A# x 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* Z" `& ?- [8 N( }[编辑本段]二、智猪博弈理论0 `% v% t/ `; k1 M- e8 \
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* w0 L% F, Q5 B- ^9 T 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; J/ C& r9 Z& ?0 `9 J 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 V, Z2 i5 P: d6 ]3 C# o4 [& Z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 g& ?( U6 b6 b0 ~ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - t+ W3 P6 u( j( q, C6 Z% x2 e
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 n' l# T7 T; [$ _
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) Q6 U1 J% l% Z. P# e E g
/ X. W* C3 m/ V) M
三、关于企业价格策略
* g& f- W! S x# `, r* p' k; P% q1 x( o) z
1 L0 P9 i- q# [( E
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 i( D" a! E7 J& ~1 p 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);( v; A, Z$ }( W& t
以下三个定义:
* p, I- u# }, |4 p7 ]) S/ S8 [0 t 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * y: p6 E9 {* j' U% Z
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & s7 G! r! [ I& ]
所谓的双方优势策略则是指双方利益总和最大的策略。
' u9 }2 R$ G5 a- u[编辑本段]严格优势策略举例分析
1 j" B3 Z2 o, b$ ^ 一、经典的囚徒困境 ) q5 p5 a- W4 e" }0 o# U6 A
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
& b# Q/ R; W- E( O; l 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 G% k# {" b$ }) v. Y
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 " {8 Q; l" R7 _ {5 T
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' e p& Z+ Y1 E0 b3 R
若二人都互相检举(互相“背叛”),则二人同样判监2年。
" T; U9 V8 E5 r5 F4 r$ [) b# h / ~0 ?0 [ E% J' ^: ~
用表格概述如下:: O3 ]+ c2 Q. a( q" N% K @
7 |8 t$ W* \& G7 F$ P# o 甲沉默(合作) 甲认罪(背叛) . \' A" H% i1 v3 R# w! r; X
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & p% Z ]9 \! v8 j' l3 \
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ' u2 Z B. W* a5 L% B
4 ^( L$ S4 K9 ~3 q0 A" \
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 A* ^+ [2 Z) G6 C 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( r+ ?( U7 F* P G. Q- h# T( ]
若对方沉默、背叛会让我获释,所以会选择背叛。 ! N+ Y1 W g) k$ ?5 f& z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , H& A- u- ^) J( N( L" T
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 U, x+ ]; |; k# e" J
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( [/ }- v9 g; V: ~) z
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 J% z: V" a) x% p9 [ u
[编辑本段]二、智猪博弈理论4 G9 g C$ J5 u' O8 W
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: d6 i$ F6 K- x2 i+ l 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , i* w* q+ t3 Q( I/ a
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 7 l. P1 w) j/ _$ q7 _$ o
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 x( D G1 M" Y% |: Q+ v' f. n “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
/ w- K; I1 C- X- w8 G; S" K; {- t 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & j: L1 C! q/ p, E9 @1 x/ |- q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
. M! z/ e9 H' t, m6 W9 o# r, p
: C2 a0 [# y- c) k* R$ ^" Z6 V三、关于企业价格策略
4 B6 J, a" N# Z% U, A3 Y; Q( j% a% `( _) N% k" z5 ]
& ~: v) R$ g* j" H7 P" T
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 1 D8 ~ l; V6 [( P* M
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |