本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
! P" L! U# p# B( z$ Z- u Y( q& y2 e! M( t+ Y
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy); y& J0 F0 T6 }/ W
以下三个定义:
8 S9 P3 B$ k0 ^ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& f+ \# @6 \9 r3 I+ b2 e 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
$ x' A/ x+ h1 k; c- N5 B0 [& C 所谓的双方优势策略则是指双方利益总和最大的策略。 * y/ h$ O" e/ H# M. O
[编辑本段]严格优势策略举例分析: b l8 z* s. c# A6 Z$ X
一、经典的囚徒困境
" \. ~$ ~* W$ i8 T( u" ]. w" X 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + c# G5 P; B1 Y( H
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: * a3 r* R1 s# y6 s
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ d W( H% u z 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 - [1 s) J, v9 {. d; \7 T
若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 }6 v8 U7 B- M. C1 F# z 3 R6 M8 t' d8 h9 v3 F L3 V
用表格概述如下:( _. M. z: u9 s9 J+ W) z
6 S+ Z9 P4 G* j! e- s" G! M+ h
甲沉默(合作) 甲认罪(背叛) , |4 O& U/ \1 x @( {
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; Y7 K. ^. F% P; ~! l8 S
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ) M& r: z3 J8 _. H O
! i) V7 p, e% M/ l7 Q 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 c6 m, n. s7 B2 w4 |- c
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 q! U1 C" r; B1 Q5 w. \ 若对方沉默、背叛会让我获释,所以会选择背叛。 ; r, T6 I, u; Y; w( A
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 T) x- l- g: q4 ?6 ~$ s 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# g. f7 I2 y5 ` 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 & P/ V# Y3 q! v' p: }
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 t0 J# X2 v1 e. j n$ m' ~[编辑本段]二、智猪博弈理论
: |6 A* c6 Q, m2 ~; H 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# C! J1 M# }+ g# C! X1 N 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& Y6 r) @7 U2 I- \; z 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - e) Z. \1 M3 N+ ~
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' h9 }( R; c/ h( `" E2 X: E
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 W! J; V" F7 B: y7 K4 h S
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + [. Z8 A5 M7 l l1 o! f- p
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
6 O4 m% j. q2 ^/ A$ _, R \ ) E; G4 |1 Q8 ~* u; f# v2 ?
三、关于企业价格策略
' ?0 O" C4 @/ c1 x" p/ q" x5 F9 h, K# {7 j# u' T2 ~9 ]! a' u9 }- c
5 Z" n0 h: d6 W+ q) a1 e5 I 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( Z! y- F" A2 G
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 S1 V. h& ^+ Y1 R8 W2 M 以下三个定义:
: G R6 D6 L6 k* @( W* Z$ | 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. @- X* P- W2 A2 N, Y, X 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 D9 @( D1 s1 I- [+ i o
所谓的双方优势策略则是指双方利益总和最大的策略。
1 j9 g( P- T3 v8 J[编辑本段]严格优势策略举例分析
. ?" y5 P: O; j1 ~ 一、经典的囚徒困境 9 Z2 {/ Q+ A7 _# S4 z( o
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 W% q$ z! I6 v+ O+ X+ k/ ~ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 ~3 p9 @6 q. G7 U: e
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ; G4 S: ?# g R# \
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ Z% Z( h) ?* k: l; k 若二人都互相检举(互相“背叛”),则二人同样判监2年。
! @- ~- x4 R! z. |9 d+ q
! m7 N4 _* v! d+ ]/ e用表格概述如下:
' n# ^) B1 E3 J+ ^ X5 F( A- d* L" t: R5 X4 e
甲沉默(合作) 甲认罪(背叛)
: w9 [+ B0 Q2 |5 k- @' a乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ' A* @: V3 [% C
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 1 [6 `- h7 g/ C$ _& c8 R& A, K9 U
# [; W* u6 a1 O$ d) q Z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ ?3 l. w+ r1 G! b
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 [/ M# t; Y% [* M) F
若对方沉默、背叛会让我获释,所以会选择背叛。 $ v! ?; x; H" \
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 v! ?: I, R/ J; M$ Q 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 Y) d+ ]) j% v% D
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 c* ?: w. c/ L$ J* o 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 j- I. Z; w; f2 M d[编辑本段]二、智猪博弈理论
0 ?3 i3 V6 o/ t 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 b( u" I6 S/ J' ^- d- [! W
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) p9 r: q# Y7 w6 g9 g
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 }' X# c2 h. e1 Z" o8 }: H 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' c5 v+ p- c1 g; t! ? r “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + u" H' Q" J, A6 J1 i8 m
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
7 K$ C" A* Z% X 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ O$ l# B0 t& w/ A/ ^( f / C$ H, R5 h% o8 B, \% v$ Y
三、关于企业价格策略
9 v" m% Z4 {$ U+ N8 ^1 M! k6 _& G+ V# x; ~. l, [# h
8 E9 h, B, S& y% L1 ~+ P
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 Q3 l( N+ c9 Q: I" }$ V! j4 x 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);- Y: B, F! S: X! `
以下三个定义:
/ t' p$ Z; d% l( l( P 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 g8 i% o- {, h5 Q$ x8 C# v" o
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 r9 X& i( }% V 所谓的双方优势策略则是指双方利益总和最大的策略。
: y9 u7 r/ z- E0 U, K1 y1 L[编辑本段]严格优势策略举例分析
: L8 K4 H4 s0 N5 L 一、经典的囚徒困境 ( }7 \ N% w. G# u3 X: C
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: s% o) y4 a1 ]: D
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 C$ O5 d% l5 r( d8 q: B 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ; N: j- h- O) j
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 m/ ?1 h; e5 G) u/ E. A 若二人都互相检举(互相“背叛”),则二人同样判监2年。: [" H- M! k/ Q7 U7 L
6 V* P8 q4 d: N# N% _1 I2 f
用表格概述如下:$ v6 r; A3 |. R; L) f: Y
% V# Y: R8 ]9 _2 ^6 E 甲沉默(合作) 甲认罪(背叛)
$ s3 ]/ G' }, B. g) y3 ~$ P- S乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
2 X6 v: H) O# v/ V& C0 A乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- ]- _: i3 n% @: m
7 `+ I$ C' m! k 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 J8 ?1 S8 w& w$ t$ D
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * q% |5 J8 ~7 w5 J4 I) C9 _
若对方沉默、背叛会让我获释,所以会选择背叛。 ; y; D7 ?" J( U& K
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 \3 X! a" V5 T5 B. _( ^ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 8 l' D0 C4 t3 S, p
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
/ G. j% ^$ y/ R 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 W z) }0 {5 E1 J9 P2 h
[编辑本段]二、智猪博弈理论
" R$ z, }- |- j, i2 M& ~ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ U: r+ f( d3 {+ U% K 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # J: `% m" c7 x2 i) W% s
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 I8 ^; ]6 \) d2 E8 x Q9 S( g 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 F& b# \6 h+ P. x' k+ A
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
S9 x9 k/ t' s: a7 ] 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 . \. K; U/ D0 G# L$ b
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 r1 ^% |7 [. _5 [
! \1 ~ j5 \, Z1 Z
三、关于企业价格策略" l- `4 C; ]$ B& O
! r9 S. Y9 u1 ?5 j8 G6 i- j3 h
1 l3 t% [ u. }# s r, a4 K5 a# a* W 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 C4 ^. O8 M# ~% a' Z
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ k8 {. z" j+ T5 U' B
以下三个定义:
# [& {' ?& E5 q; T 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 S$ ]) a* y( A0 P0 w$ }6 y
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * M P7 V" Y6 v, P
所谓的双方优势策略则是指双方利益总和最大的策略。 ; h! N0 ~: e: E* V3 f1 @1 y7 E7 [9 U
[编辑本段]严格优势策略举例分析
0 c5 |7 U1 `0 [6 z! s% s 一、经典的囚徒困境
8 [* s% W! u5 j, N; g+ o2 v 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / W) w7 z# `- E
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 o# `0 x/ x. }* V& s. q" C
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) C3 `' f# X k; ^: t; `
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . j2 F; x8 A# K" d9 ?2 {3 a
若二人都互相检举(互相“背叛”),则二人同样判监2年。0 g3 [, d' O$ L/ h) T1 {
4 {& C1 ^4 M) B2 H: ]# }3 n用表格概述如下:; n) V0 Y' U6 p
1 m/ `' ^& b/ d! f5 q
甲沉默(合作) 甲认罪(背叛) 6 K' W2 I. z+ U3 V
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & s4 R$ L% B/ S O% n
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 , J! s* r* g7 v# G/ z2 Y5 `0 g
/ B: h+ w& \- j9 E( a$ U
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ' E6 t2 a1 A; B& F! H) e6 N
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # E3 t* Q8 F; x% E! Z9 z& S) n
若对方沉默、背叛会让我获释,所以会选择背叛。 ' m {' ?. e/ H. I7 Y: ?
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- t) f- X5 I; k1 ~0 @5 T) o: [3 F 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( {! L' B! p$ c. H/ K4 g/ X V
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 c* a7 h% o# e {3 M- R# M
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
/ m7 {/ ^6 x# N7 u- n[编辑本段]二、智猪博弈理论9 } c$ E6 C$ J' s/ b
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 D8 n6 E: D, r2 K( b* M7 x# h 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 x& i" A2 \6 x: x' D' r
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
$ V+ ~5 K% O- h9 S$ J) t3 Z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
/ n2 p, I+ W8 |) j! W* b3 e4 w3 G0 N “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' A9 E$ U& U% F) V8 S2 y4 n( Q3 g$ T, u" @ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 | u1 G' c$ Q2 e+ X
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
7 G# G* g( H- P }3 M+ _
8 E+ l1 ~& x& s三、关于企业价格策略6 _& k$ z7 g2 ~8 P7 |# }
1 W% M; I6 r3 Q) t3 b
8 v0 V2 ]7 k6 J3 b- |2 b+ }4 z
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 h0 S. R0 L1 E1 ^- f* \ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |