本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 0 X4 x% z$ f/ z5 i- {4 ]
+ Z/ a$ Z8 v6 y9 [9 V3 `
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 p+ X* u( {/ g6 }8 |
以下三个定义:# p6 E8 v. u2 j, i
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% |2 M2 D) l6 M7 y6 n 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) @; e8 J% O: n
所谓的双方优势策略则是指双方利益总和最大的策略。 9 Z; o' I) G4 |. M, q! R
[编辑本段]严格优势策略举例分析+ p# B7 o9 n% U3 R
一、经典的囚徒困境 9 ^) q- ~3 ~8 ? M" m
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 4 t c4 P' J7 H I% L
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 H+ c! L6 L9 F% M
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - I1 U& a: |( ?2 v1 ?) l1 f
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; L2 `$ B- S6 _, }8 ~0 p 若二人都互相检举(互相“背叛”),则二人同样判监2年。8 j" d8 |! E0 X( i
' f! ]2 H$ l% E! c3 O用表格概述如下:6 ]* E6 i5 W' D$ O r& v2 |: c
: b! E* m1 j. j2 E9 D 甲沉默(合作) 甲认罪(背叛)
2 @" m6 R# {6 b. \- M& ? V乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; Y1 `% B0 q) ~1 u# Y) v6 p) L乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ! W! K. G- Q4 _
# l5 Z, K/ U& b6 m, P* k) R
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 _ L& p9 ]- k: i. T$ Q 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; A9 p/ B0 b' c1 m, F) F! q
若对方沉默、背叛会让我获释,所以会选择背叛。
8 U$ J6 E! @# |7 X9 p6 J: {) l 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + R. u7 U7 f0 C
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + U% ^, j6 ~9 A; X# `$ ]9 l$ R
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 ]* V% o* L2 T. R 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( z: x5 T5 D( ~
[编辑本段]二、智猪博弈理论+ N1 V# ~# v' O/ Y# I5 k7 G
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( k4 i. }% q9 U* E 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
0 g0 J7 d* Q1 y# b: v 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . _ l8 p$ H O8 S9 Q* |
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 @1 S7 a7 a: k6 q; L# x$ ~ { “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) O/ z& X9 }7 J9 I& J# |. o c6 n6 A
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 ~5 R- j4 ~4 h m
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 L1 d- W& l7 {) S8 E( A, c. ~1 N
- n1 N. S$ _9 @2 D+ h! T三、关于企业价格策略1 x- |6 i( {3 y
7 f. G" c5 e( w+ q/ c" `% p" E 5 l% e$ t2 ]; {* t/ a
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) m' C8 i2 ~( W6 D0 @/ n 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' V J" E& g) N- L
以下三个定义:8 R6 Z" A* i7 ~8 a) ~! n# Q
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " s" G @" e! M; A+ Y
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 - {# l; Q9 p+ B
所谓的双方优势策略则是指双方利益总和最大的策略。
. a* w# y$ R6 T& U3 z a8 Q[编辑本段]严格优势策略举例分析
( [. S4 Q& m& t4 b 一、经典的囚徒困境 * q' Z/ ]: v6 _
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
0 C7 U0 O. E5 [7 y4 u- F& F U 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( w; |7 L% v& V2 m- b4 G# H
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; _4 f- |+ V& j! m0 G6 c 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( s3 H: J: v8 m: h/ k4 x 若二人都互相检举(互相“背叛”),则二人同样判监2年。! t8 a6 x% c2 [
, A7 m; P" n1 |% ^: P8 R
用表格概述如下:
1 \0 G* U/ O, U* O7 J/ E
* }) Q0 O) L6 s1 X' p9 o 甲沉默(合作) 甲认罪(背叛) 3 o+ x; ~7 Z5 p. z! \# {
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! U. ~* E( W9 Y* D: X& `乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ a5 n: \. _. }- D, q
$ n( e( @$ g" e1 i" v O) ~5 g: o
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 f; x4 } G1 K l$ y
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / z4 a! m' b& A+ q5 O9 Y! K
若对方沉默、背叛会让我获释,所以会选择背叛。
+ {+ b" I# n' ^& N, t 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 d H$ ~4 H' Y* [' Q 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - |# @; d" Z$ v9 {/ N- t
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % a5 Z) e5 n+ U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。% Y0 s. R; X( q7 V t: X1 e; t
[编辑本段]二、智猪博弈理论$ Z: \6 U% Q6 D! `2 _/ B
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* q' S- d r7 ?- M* u4 F 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 K, Y# ^+ y# v+ l& x
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: q0 o* E' m1 o$ H. t# \ 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - Y* U$ V6 R5 |8 {
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
. L) e/ u8 S" f4 {; J9 q4 K; d 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; c% W; C9 k! o2 k$ s
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
6 v- r% r! O7 Z4 k- C) w. w j' I3 ~ X- D
三、关于企业价格策略& ?+ J5 s k. x/ t9 w$ ^
8 P0 n Z3 S: A3 U
& c L' J+ y$ {: a' t; R% n! G }5 q 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; W. o7 x/ P+ |3 n3 E* O 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 [ D) V" W! c2 Q
以下三个定义:
' _0 \: S, b, ?4 R- b, e. D 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, p& ^$ g5 u2 s) ?7 g9 I 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 ~1 O$ {9 I! n" s, ~; W4 k
所谓的双方优势策略则是指双方利益总和最大的策略。 2 W. I% T9 Z ?% n3 j
[编辑本段]严格优势策略举例分析
& V, F r. v. Z/ x' m 一、经典的囚徒困境
0 T2 J; v9 s$ s% _7 I h1 L+ k$ K 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
& I& x5 C- J6 q7 p# _4 O2 Y7 f 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. e& S p, [, z& H( D; M( q 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 2 C: `+ P) A% q# V7 p, j
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 j9 O( f; w" K# F9 h
若二人都互相检举(互相“背叛”),则二人同样判监2年。! }. S7 k7 t0 l" P" k# D6 h
' B: A, g" |5 ~$ q/ V, I, N' D
用表格概述如下:! I; r+ G) x3 r) |7 i
0 A9 L" L5 v/ d( X1 \5 d- i 甲沉默(合作) 甲认罪(背叛) s3 H9 l0 }! z
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
8 m, |, x3 ^* F; y, A3 P乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
6 b+ ~& W8 K1 Q' H% H5 M9 x2 F& K3 l) @1 V% d! d5 J
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 4 {* O; f, w0 z* p: P/ p& ?
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 K1 f: e# S7 b: ~$ C, u6 ?
若对方沉默、背叛会让我获释,所以会选择背叛。 4 b# h/ A+ G2 a
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 - F; a' S y' J" D! `
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
1 b: @- s' X% V: r& X; X0 f 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& a0 k% O' _( h' E# H$ v 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 O1 b: {2 n8 r! F/ ~( Y7 G9 u
[编辑本段]二、智猪博弈理论
7 V R: A* Z4 r; O% O 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# ^" ?5 U% A& u5 I 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 Y' q. B. a+ Y; I 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 + ]) a2 S, e4 c3 ~
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! d! {/ h+ F2 g4 r& ^
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 Y; }9 V# {6 r: E 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) c* Z% {1 s- K6 ^9 g 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' m% ~2 ^8 r$ q( L9 h7 o
/ K6 w" X5 @- `三、关于企业价格策略, n' b) f; p# E* j& `& Q
' |' ]* X, D' b$ _( C# H5 [ , \! o l- Y' h; z
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / L' t K: t7 G
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
9 S0 {/ _6 @1 U: [) ? 以下三个定义:' o- ~- r1 v& H
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # Q/ u6 N% A9 B, y& n$ e& P
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # N M2 V3 j) M/ _; Q8 ~ q$ p) m; S
所谓的双方优势策略则是指双方利益总和最大的策略。
9 `2 n7 O$ l8 o5 @+ v: b2 F[编辑本段]严格优势策略举例分析
5 v1 w, i. V+ ~+ ^3 r. Q 一、经典的囚徒困境 & s* V. }5 W9 v6 m( A% a$ M, a
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % I [3 z% W) q% S* c; k
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 k6 Y" g5 t' ~" H. h6 N 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + k: G6 j5 W( d8 j& f; `* r
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% S6 o {. O" \; j2 f( x 若二人都互相检举(互相“背叛”),则二人同样判监2年。
& ~/ E9 U5 ?( M& p l* {* N " m- I' _8 [$ f# v
用表格概述如下:
6 o* x( v4 d: `9 l' d/ H3 _
1 v/ u2 E4 |9 t- I0 r 甲沉默(合作) 甲认罪(背叛)
1 k$ o3 ]3 g6 ^; b7 H2 w$ f乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
5 }8 H' Z% n3 o& b# @+ N0 Q" ^乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 6 n( h; N7 X- {% \
8 j5 M* w; Y% j7 j: Q0 g" R! I 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 - g/ ?8 x6 y6 a" z1 A9 w& ~
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: " C" D1 ^) C' T) o$ G4 O6 a# {! D
若对方沉默、背叛会让我获释,所以会选择背叛。
5 d2 y( @, C* f. {# c 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 d7 A) W1 ]( @2 r9 b 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 B& B: c) L) d, e 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
0 t. ~) m6 O8 N5 a l/ q 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
U. g% N/ P6 b* y, a[编辑本段]二、智猪博弈理论
* C2 W7 x( x1 g: [, K 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 5 D# y: O0 Y* P% R2 U# i
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 y/ R* Z8 j7 X: ~ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - b' C* R! H9 q/ a3 f
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' X# M1 f; L- B
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 `0 m H) {$ T9 T3 l; m
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 o: V. u5 E# Q7 w
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 S+ t5 u: j/ h# C# q
$ y- D+ `# h* h
三、关于企业价格策略9 R* n! w# L# e1 t8 c! ~
7 Y" A; j% g) V& s- T
5 |9 B# M" R: P! H9 D, l 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% d" B7 y1 W( i* n9 k 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |