本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
6 |( |4 w* V) o1 p' x9 b, x0 A' W! I7 |2 r' M8 ?) S
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: g; k# |; w9 F$ @0 N5 {& A 以下三个定义:, R0 b& `; H1 k/ ~- X9 h
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
T, ~- g6 ?& L4 e, v& C8 J4 |: d 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 n L6 ~$ H2 w7 u& Z) Q 所谓的双方优势策略则是指双方利益总和最大的策略。 8 U& q) H3 w9 U
[编辑本段]严格优势策略举例分析
' t" y( X" W9 T0 t5 H 一、经典的囚徒困境
+ U9 U' H. }7 G0 K 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 v- |0 ?( k/ j% z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 w) T5 r0 r- J! E$ B 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
w. _1 i; ]' C" y5 A, o 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; v* S2 ^ X; D7 f' F 若二人都互相检举(互相“背叛”),则二人同样判监2年。2 C0 e3 Z9 O9 D7 ]
( I/ C, p" }; ^2 f( {) L/ U用表格概述如下:5 X; y# S- F# ?' |
+ s7 }+ q. d1 s. s3 L 甲沉默(合作) 甲认罪(背叛)
6 y8 f$ y5 `8 m0 i乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 " _$ x( t4 h2 v1 V, e
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
1 b3 a7 \. b8 @2 U! }; R# ]! J$ c
% K; Y- R3 v7 y) Q* b4 V) J 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, x- H+ K$ d% C. `( g: D$ N4 K 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
e2 y8 _8 q& d3 E% u9 Y 若对方沉默、背叛会让我获释,所以会选择背叛。
3 }# _+ {8 r. A( H 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ E5 o7 D4 Y8 }9 s+ r) h' P
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & T. V4 i. V+ h
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
) _- a4 N$ m- J: K' \( j8 d 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- ]8 K! x* v, J" A$ x1 [5 V[编辑本段]二、智猪博弈理论
6 G, q4 w$ L t* E6 v' Z1 z 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; s+ f& H! G) G7 h4 s# b
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 x4 _" L) g# I4 h 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 ^8 J3 e4 c5 C$ D( b8 H 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; X& c* M7 j% y" Z9 A$ H
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - u( t6 T! D& Q$ S$ X" a+ Z
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 I: }, g9 S! m 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* ?, A i+ ?' k1 E, e 9 p& k$ a. [! M) m. I
三、关于企业价格策略) \( B8 P$ m/ y5 n
2 t* ?8 n! n: `; [* v1 i
/ d7 k. p& Z+ E, u 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' s, I3 U$ f! R 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ x3 F# r! J! h) V8 l- g( [ 以下三个定义:
' E/ h- }+ U$ A5 a! O4 p 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 J, v* i8 g. n% j: x1 L( g; I 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 Z1 b% l6 O0 M8 s8 i) o- e& {
所谓的双方优势策略则是指双方利益总和最大的策略。
* U2 i5 e! O+ u* c" D2 M[编辑本段]严格优势策略举例分析
- g. G# u6 \/ H0 q. l y* I- m 一、经典的囚徒困境
# V& X. U5 I0 j: I5 m 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ( |* \' b: Z: f" a: G+ Z
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 3 ?* [% O9 Y9 L4 u* x7 r _2 w: C
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) _8 h* G& [) [6 v- X, t1 @ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' d+ Z$ _ P2 c T2 u
若二人都互相检举(互相“背叛”),则二人同样判监2年。
& j% H* t* D2 w! I( u" K , G% u' O2 v8 ?4 H" V0 `" c
用表格概述如下:) s, I1 T5 |# s! M% B! l5 K; F
8 }3 L: W. X/ W0 d! P 甲沉默(合作) 甲认罪(背叛) % n5 O. K2 E+ @
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! G( S# Y% g( t. K乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
% c& j9 u/ }4 y
0 O: {( S0 c' B; b0 Y0 \- x 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 # ~) ]9 z! l: a4 H4 f
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: r1 A" G8 {' \4 E, k4 i! W 若对方沉默、背叛会让我获释,所以会选择背叛。
1 U( a6 m0 b9 ^0 y- B 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. ]2 K9 D$ i7 } m 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
) P: y+ R: M# ^/ {3 M0 [' M 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
! G6 x6 V9 s8 e v0 P, D& ` 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% [8 ^( t+ C `9 F M. D[编辑本段]二、智猪博弈理论 c F6 ?' ^- W" T- R0 P
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 C2 C0 |/ j0 u2 `/ T
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 & l+ f: B7 ~! n W* ~0 V! Z
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; L1 Q- a0 {. W, B9 `/ P2 {
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. b) `7 ^0 e/ U* C; I1 ]; i! Q “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * s& [% o; O7 V
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" }4 h9 z% z; @7 R+ [. |6 k 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! T5 |% }+ [# k! C X- C1 N0 q( N {9 W5 @
三、关于企业价格策略' `6 N5 F! Y4 }5 }
9 r1 A* t5 o B/ i1 V. ] " h2 n" J; x2 }
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 7 `5 f7 @" w+ c, v4 N( S+ y
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 z: e5 ^/ i6 V" m/ `
以下三个定义:7 }, ]' a3 S. B* b5 f
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 . Y9 f) J9 E% Z0 n
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 F3 a. t) R2 r7 m 所谓的双方优势策略则是指双方利益总和最大的策略。 . P! H$ w9 U$ C0 D9 q1 k
[编辑本段]严格优势策略举例分析& d( E( e. x+ ?
一、经典的囚徒困境 7 n2 D1 @. S8 l7 X" _
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' [+ x" h& y: W% ] 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% L* U) M+ F+ ^# {; r* G6 E! i; f$ G 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 v/ H7 ]* G, _+ F+ y* i) b( Y 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 5 I+ |1 ~7 V D
若二人都互相检举(互相“背叛”),则二人同样判监2年。: A- B5 {3 T: ~; ~
- O. N$ W1 Y5 c |: _* C. j( O V用表格概述如下:
$ H* T$ @5 X4 d6 H2 A% U; B! s( a: e |
2 T9 q& m# H- i 甲沉默(合作) 甲认罪(背叛)
G) Q$ |& X( J! p乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
0 L: S h; s; E8 @乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
. J$ |- l$ `( f9 x/ d9 j" z. W; R6 c
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# h2 b. ^, ?: s. v9 \7 T 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 \( \1 t% |7 z W 若对方沉默、背叛会让我获释,所以会选择背叛。
& N# c( e5 v) _; x: X6 U 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ T; C0 d0 o+ \) k0 Z: l
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; T( U/ y; Y4 ^; q7 m 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; n& c# C7 `% w7 _3 p 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ J* F& q! ~( |: b R
[编辑本段]二、智猪博弈理论
+ I* y% l4 m2 X3 e: C s, Z 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 z& f% {* h/ W" K' X& w' ]
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 C; U; Y j6 D9 ]; d. m 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 g8 r! t9 T$ w
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ K7 P; n: B# J- @& w# I
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; `3 T* M, a) Q3 X 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 w: z, p% z) v# j7 `
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 ^8 F9 R! H3 p: A4 k% o ) U% Q4 E; L. Z; l+ X0 Z
三、关于企业价格策略* A- f! [6 S1 C; H
; m' K+ I. m% h& p* U2 [
2 u% \2 U) L5 {* S8 a. b; L 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " k0 E) S/ n8 A, T- l8 k# b' M+ |
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 i1 a! F2 } s- M8 e
以下三个定义:
$ }- M& |6 C' C. d- C8 W# k: J% h5 g 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# b/ i9 O/ }% d; X( { 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; B- M+ b f M 所谓的双方优势策略则是指双方利益总和最大的策略。
" z3 ?! {3 y8 X# J$ q5 n[编辑本段]严格优势策略举例分析
S% j# O) ^3 `% Q1 [+ w5 {! Q 一、经典的囚徒困境 : ~3 D# j$ Y, u$ N2 w# Z0 J
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 B( X2 s5 l4 c% g- {# ^5 K- ?( f
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, Y, S. @+ ]; h6 W/ k2 }6 s 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 X3 b# T5 v3 @ S2 x 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * C7 r! F4 S2 c- Q6 Y0 \4 g
若二人都互相检举(互相“背叛”),则二人同样判监2年。
) {3 w) K: O2 x
! v) }6 E+ t+ L用表格概述如下:
% s% m! Y% r. A0 a+ I0 ` s$ e
9 x8 b0 E, S j; k9 e- [2 l N B 甲沉默(合作) 甲认罪(背叛)
4 @; ~0 C' N, R% j. A. j4 w3 \乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% E) U% u x! m" |2 O乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ i! e. C4 @) d5 A' O o
; X7 T: u2 R& V' \! { 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. S9 j4 h e" u) F 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % d% b) d7 H' c, E. f$ u
若对方沉默、背叛会让我获释,所以会选择背叛。
]8 Z1 ~& S3 o3 s1 z 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 E9 n5 \0 I/ D: E
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) \4 \# Y; p. U# s
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 O4 P; _5 A2 K8 }7 l
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 I# n1 i8 V3 G' z6 m: v, B1 {( W% N1 @- @[编辑本段]二、智猪博弈理论6 P6 y8 D" R7 i6 [5 w6 h- B3 w5 V
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " y. t# r( T) d; M3 M0 T$ K) N
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 y, i* i" x* s* X% R$ | 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( L( Z1 v- u* N0 q
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ h! D2 G2 t0 N- H; P “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . J' r9 f; T7 D2 I* I" r c
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
2 O6 m+ s3 ]/ a 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ R: X4 G6 a& [( M$ i1 Y 0 ]7 M, M& v0 M" k8 {
三、关于企业价格策略9 D3 z/ ]' }( [8 m- N4 }
) t) Q" @7 a, R3 }
* L/ s3 v4 z" c* F# J5 o$ V
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! u$ x2 Z3 {5 ?9 y8 w
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |