本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 8 d& T$ t3 a0 j# @. O7 o& I3 J3 e: P
# e0 J2 y, F( @) _4 G严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 b9 R4 G" Z3 F/ C) Z2 ~
以下三个定义:
2 i: O$ f8 O3 X _) W 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; o( ^9 G; ~5 k7 S$ M
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ; d. s& }0 @2 ]+ B' c
所谓的双方优势策略则是指双方利益总和最大的策略。
# f0 P7 ~# }3 F( u( q) S! D% [4 N0 Q9 C9 B[编辑本段]严格优势策略举例分析
* J; Q+ V k4 y) y2 ^9 b 一、经典的囚徒困境
3 t; o! { z$ H( ~ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 G! W" z+ a) R
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 8 ]6 t7 b q8 X
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' |8 v7 I+ q& \, ]. P 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 H+ F5 V# A: i/ E8 ^4 S
若二人都互相检举(互相“背叛”),则二人同样判监2年。5 B% \: x' F2 v M: H$ W2 |+ L& W
5 [ l( r/ Y) V7 E; w9 V! X/ r用表格概述如下:
3 a4 B3 x3 W: o- ^. h! T
! W, O; E! ^! j8 [- x# C0 [% P 甲沉默(合作) 甲认罪(背叛) 4 i& Q" @3 A/ f! ]: l
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ ^& R/ z* q' M8 v# f2 W: k; M乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 1 \2 X' L# D5 Y- z8 |
/ A8 V3 y# h; s! d5 g 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 ?; h4 p4 F' r9 L% A) Y( H# w
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 2 f/ f' q3 ]. b6 @6 ]1 q2 b7 x
若对方沉默、背叛会让我获释,所以会选择背叛。 2 f- W/ R5 r) ]2 K) L; k; A/ g2 D
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
& X, |$ G, s% P: Z# k 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# @* `1 E0 n, e1 D( ] 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 F9 r: U( Q$ o2 b, \! y! L3 @
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 F& E4 K; w# e+ n) O; X+ j1 [[编辑本段]二、智猪博弈理论0 p2 W! P; d8 y& c F& R) f0 t2 y
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
7 @$ x; L( b. n5 g6 a 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 [) M, l N2 X* m( c) a
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 E1 V% l ?- l0 X3 e' s: n
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 c6 D1 W4 k( p “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 $ \/ g7 C) \ L$ A' ^
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ) P2 F, u) F4 Z
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 [. F) G- @9 V/ Q# n 0 A, j0 f' p( p6 l5 |; M% ]7 W
三、关于企业价格策略( m6 r+ J) L0 C5 m7 T/ E- x
- {$ e; _ ~: G* W" Q; y . X" E" e% E3 p8 g n# @& y: y
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 q' \; l* z5 u; t7 f' i% ^3 z- S 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 N! \# {2 D/ [( x( g
以下三个定义:6 e5 o0 `* D( e1 }3 {
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 l) a/ Q; f4 R2 c0 G9 J; Z
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 Z8 D- R' u0 w 所谓的双方优势策略则是指双方利益总和最大的策略。
r0 ?! ], _9 C3 _" m) |[编辑本段]严格优势策略举例分析
# q! Y, _, D' K 一、经典的囚徒困境
/ J1 b- U6 [: t 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 A1 y' u3 T8 }$ ^+ i6 X 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
! y& e6 g1 |% a1 V* E 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! Y. Q6 a0 |" Z' q* z/ Y' ~/ \% ?! S' I 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 E, |' x6 A d/ e J! k+ ]' D
若二人都互相检举(互相“背叛”),则二人同样判监2年。0 @# v( I( W/ ?% J7 f
9 _1 g& q, o L3 l! B# H5 e用表格概述如下:, f; L" p0 s/ h! n/ X* ~
8 U& k+ j6 M2 o, A
甲沉默(合作) 甲认罪(背叛) ' d( o$ n' M% v" \1 e
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% s7 }. h% d `& G9 j; j乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
* Z( B/ L2 U/ _1 }9 m& @0 C& d2 W( w& x% K" F4 Y: D
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 z! I1 j9 Q4 ]3 f. p% T1 _$ C
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ! q" |; e# F6 f& {, b/ A6 U% i
若对方沉默、背叛会让我获释,所以会选择背叛。 $ I* h( M2 G2 q+ d1 E% H- M
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' R6 J7 i/ O- W7 n: M
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 , T3 w: O) n; t; ?" g9 v: V
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
) h. z% G' n8 ?1 q5 x/ X1 C 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, s5 `1 x' p( X
[编辑本段]二、智猪博弈理论
u- f. X2 b. ~ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 t/ B8 i m3 }5 I* G
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, R0 X! b( p" {/ k$ a 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 d( r9 ]' x8 @* _: f) o 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : c2 a4 R/ ]. ~3 C2 }* t
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 t! J. E9 `% U/ a0 N5 F 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
$ L! C; L a4 U1 i' \ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 x" m* g3 e# c- ~
& m6 P4 M2 g" `( w三、关于企业价格策略; H! U; I1 s* [9 g2 R1 F& Y! d7 H
4 a9 w/ |$ y$ Z5 c V
6 H2 Y" s, a! } 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& k7 ~/ R9 K& J# i1 B. J2 x 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" Q2 v) y+ P: r* G7 s0 d
以下三个定义:
6 q! l' {/ \; H 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 7 p- {( b J8 Q: }$ P9 ~' S, E$ j
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 W# o7 c! D; g8 s! G( q+ l 所谓的双方优势策略则是指双方利益总和最大的策略。
* Q3 D9 g2 j5 H3 i% z" r[编辑本段]严格优势策略举例分析
. B+ B0 l2 N( N: e; i* D 一、经典的囚徒困境
. L* ?7 V/ Q9 I 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " z# ^8 V) n) w- s% O6 _
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 ~% }, d5 z1 X' }$ _
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% A& i3 |* J% T 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 z% J) L1 J5 r8 n$ A
若二人都互相检举(互相“背叛”),则二人同样判监2年。
: Q/ I+ c$ e0 I; J5 B" B ! q3 G3 P) D! Q1 m( {* a
用表格概述如下:- N& G: N0 [. l+ }7 p! [1 D6 C
2 U6 o0 `9 }: b8 L
甲沉默(合作) 甲认罪(背叛) 6 m$ w z. Y2 x/ a, V/ i' x
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; B+ A& K+ ]! D9 J& S乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
0 v4 _; m5 O8 B5 x! n; S& W: m" i0 k6 S. @8 ~! M+ X
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 V& R; `7 G1 B
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 A/ V# l4 y1 `" Y 若对方沉默、背叛会让我获释,所以会选择背叛。 " E1 I/ t2 X4 Y, r- K& [8 x
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( Q5 R! U4 H/ | p, e: L
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 d; e, y0 A* f+ { X9 U, z
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 6 j( q1 m# p5 w6 A5 \
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 F2 l. e; C3 I: u, B: ?/ J+ c
[编辑本段]二、智猪博弈理论
- P) R8 I+ H W7 [8 n 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ r1 k- n) z& \8 c
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 9 g) B( Y- J) a; }* [- i
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 # G! a* Y d' p1 V
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, U/ R, r! o+ t% @- v1 U9 ~ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! d& b" B, I* i& u& H 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( u( S+ O, Q: I 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; C$ C3 Q# R! C
. y- l& X7 y) d
三、关于企业价格策略" S6 n# l. v+ O9 ~9 b: d3 ^# x
; s' M" ]/ U$ I( w( ^
7 ]1 ^+ s9 L/ G& Q& Z+ r% ]3 |
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , I" j7 \9 Y0 }' D6 K
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- X5 X6 P/ d# |% S4 g" S 以下三个定义:, o0 L$ z/ S9 a: l
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : Y1 j# B( g" `* y: {8 ?
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! b: ~$ T# V. s, I( j+ H0 X
所谓的双方优势策略则是指双方利益总和最大的策略。 . r* M2 l( k4 u9 e% Y4 B( c
[编辑本段]严格优势策略举例分析5 ?( q1 t k. X$ m
一、经典的囚徒困境
4 r1 w' w& t8 i- T) ?5 J) @ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: - F t" [5 \" V j$ \+ C4 I9 p9 `
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ g& p" P1 z8 C( r9 U5 l 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 F% T- B( x* e' l
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
. O9 f+ A8 Y9 l7 L# `* [! { 若二人都互相检举(互相“背叛”),则二人同样判监2年。
# |( H0 n! N" \; d: u* w
, O; E3 M+ j# I8 q! H2 @用表格概述如下:" q- M0 ?: s7 g& Q3 z! e Z
' z8 c; i0 H) Z9 H1 U! j
甲沉默(合作) 甲认罪(背叛) ) R1 I% ]9 u6 J7 B& J% d4 Q
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 5 G% j+ {' ^0 Z8 j" I! Z. O
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
! J+ L& c% `4 B6 r/ A! v4 d" y3 x- u) [9 X
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , N- f: }) r. C; P
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 B, e9 i- ^" h4 M+ c* y 若对方沉默、背叛会让我获释,所以会选择背叛。
+ n* w! q# i0 O$ a* f) i; Z [8 G* Q- V5 M 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' A: |9 @- @' q) C
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 i) [& Q' |9 A5 c1 b5 z 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 p* D- Y" q. c% R2 m4 b& T 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& ~6 q+ h" b2 |! Z) I# X6 T[编辑本段]二、智猪博弈理论 O% n$ T! v' X6 ]$ |6 I
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. e n( ]5 J! c 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) d. J9 Q! m- V1 ^* P
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 ^, K* k3 D4 C 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 ]4 M& l, ?8 X( ~" ` “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % V$ P( `8 M$ [# Q, `! {& x
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # F& O( O& N, F0 O H% P
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
; D3 D9 [) w& s; \% L
@* w$ M- x, r8 {1 e三、关于企业价格策略
0 P, X+ J6 h. J- j; z: c" g" e+ F! n8 f7 s
& N& P& z- s& ]- Q
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 T* i; M6 y& K6 I/ q; B3 ?/ D 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |