本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 # G6 f2 Y* F- e/ Q* K
2 B/ E+ g( r7 ?0 O! l" N6 a% ~严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);: i- J7 B/ ?5 _# @
以下三个定义:
; K* F# j5 G' U2 Z! R$ f# a 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. g9 y: w9 _/ `$ X% b, E6 x1 I 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , A R! x2 h3 L; x5 J$ N+ }9 [/ V3 H
所谓的双方优势策略则是指双方利益总和最大的策略。
1 s% }& }1 j+ Z, Y7 }[编辑本段]严格优势策略举例分析3 q$ }$ \0 ^* H: ]2 x
一、经典的囚徒困境 3 ]; S5 x @0 C, Q8 v
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 _! r" \5 d* |5 k) b
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; U! b% {- U1 d* q' Z6 F/ u+ ?
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! ?" r' x# _7 _, {$ X 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 s/ k: M6 g, W, `. Z8 B Q8 l
若二人都互相检举(互相“背叛”),则二人同样判监2年。2 S5 J* Y5 V% m3 m( z9 q G9 @
- h& c$ k# q$ q* y0 x; W
用表格概述如下:
9 K% n& O1 r. S% S) j) E" I$ t1 u. e' X
甲沉默(合作) 甲认罪(背叛)
$ ^ G+ W# C: p- ]( k乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 9 V/ |7 ~+ p# m/ D
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 P( D1 H. Z6 L" k
% p( c/ s9 f K1 P6 ?/ t 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! p1 B5 i( L4 @5 F8 C! z" k
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / k( j" @" P$ s* {) _
若对方沉默、背叛会让我获释,所以会选择背叛。 * f& G, ~/ @+ d! | i
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
& b( x/ t* c$ g% t) P/ O7 u" f 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 |' a m2 d- U' r; d
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . H% Z& w, ]2 E8 @
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 {6 p+ `8 x _
[编辑本段]二、智猪博弈理论
: {: _% E, h+ D3 P, g4 o( j 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# @% \) N. a2 q; ~# p 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
1 p: U& A2 f6 h, y 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! ^1 T& G& D5 C- W 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 \; Y, L* Q2 A “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
) r+ t: z( U9 s' [7 [ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % U% |4 \8 X* d$ X( P g
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. J m# @, T/ W
" M- c, P+ Z, d0 h* Q三、关于企业价格策略1 D2 |" q. }6 W' ]) V
- u4 U! L; M3 f% Q
! n- K6 F3 V0 q. m! O 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
- F( z5 j, S/ p, I6 g+ y+ Q8 u 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 V! L7 _' v1 M1 e 以下三个定义:
9 ^3 a, L- A+ z% x( Y7 C 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 G% _! o& p: j) n. p8 y% v
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 y# i) b Y( } B5 d% V
所谓的双方优势策略则是指双方利益总和最大的策略。 4 J) E* J5 N7 Z
[编辑本段]严格优势策略举例分析/ L& R, E- d* |
一、经典的囚徒困境
/ k; P) V9 q3 l 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 g5 ]* A& C. q9 P* p
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 r" F; g$ [& K 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) I. X' T- n* b# n5 L0 s 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : U- r: U4 k( y/ n
若二人都互相检举(互相“背叛”),则二人同样判监2年。! Z" ~2 F! W% c& C" d. G5 y( }
, h' o3 z, b+ C# u! l# }: X
用表格概述如下:
! V8 d/ J9 M# j, D( [7 k3 @6 l2 Q% y
8 r5 ~" y6 {4 a 甲沉默(合作) 甲认罪(背叛)
: Z. R' Q5 a2 U9 ^" g) j! f乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; ~. |7 \: s9 w D1 Y$ O- v
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
; R+ m4 D+ r+ K d" R0 [, H( A3 u5 k5 x. h
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: F. o% B1 Q9 D5 l 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 s3 i0 Q7 B" j- i" x- j# ^ 若对方沉默、背叛会让我获释,所以会选择背叛。
, m3 V* Z7 E6 r; v 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; Y0 I# U! D4 _* Q- M
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 R( Y2 W6 ]! t9 o% H5 h* }
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) L! j; [3 u8 C7 E* L% O a; H
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. o* w/ k" Q5 K& E( h9 N6 U) W[编辑本段]二、智猪博弈理论1 L: c1 t7 |( v p! T
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; F. h5 w+ V" B% f0 S. N! g/ |
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( F2 a- M/ V0 _2 j7 Y+ k 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 c% ^5 R6 }) m, v- p; S A
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# }- u) u' h6 d- } j5 t3 I “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : u/ w& A6 [4 k! `
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
7 G" W0 A' L& A3 E. E3 [" h 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 ^0 o! B3 C7 v
% t/ R1 m2 E3 }1 G三、关于企业价格策略& Q6 V* e8 w9 f( D
# J1 B: |' P5 o1 I6 l
( G0 X( E" m6 M7 @* g& I
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! [$ N0 n8 o; z9 i/ q+ z
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! W2 @- N. l3 D 以下三个定义:
( x4 D- ^+ A1 c& b& G* p. F( {3 Z 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 b* I" `: E2 F
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 v7 R# p2 a$ T+ ?" c$ ?4 D o
所谓的双方优势策略则是指双方利益总和最大的策略。 ; a" A- `4 c* q* B0 |/ C2 v
[编辑本段]严格优势策略举例分析
) Z: Z( F. u/ ` 一、经典的囚徒困境 4 ^$ b- t/ q# }3 Z2 R @
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + R: \, L( P8 g- B9 e a" {0 R
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& n( o l- f7 F; t a+ T 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 e0 A7 @" p3 w' y' y( Q* P% y
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 \9 V: g3 S* U; W. A* O/ r
若二人都互相检举(互相“背叛”),则二人同样判监2年。
* T/ s- S4 p6 K& d9 A ) U. ^8 I1 Z% B" q' F) F* @1 x$ I) b) A
用表格概述如下:
& I$ m4 ~% q3 m
* A1 [* K# `5 E( j. p% E 甲沉默(合作) 甲认罪(背叛) ( k+ c9 @* F- Y2 T. Z! [/ Z
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
9 V" K' m! V+ ~- Y& \乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ; `7 a: D+ A9 W ]0 j, k0 \
' H" G7 z3 }) h6 o; [( {) j 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( w1 e8 u8 j2 i0 G. G0 ` 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: " F6 c3 B* k$ t3 l1 ]) z8 Q
若对方沉默、背叛会让我获释,所以会选择背叛。
& I+ H7 K) J( D* j" M 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 Q6 d( w, }6 o! Z$ h7 B. D% T1 m
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ k6 |9 N& c3 o' A; G1 \/ K+ H 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 [& S! c- j# B7 S/ q: y0 ~ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 o8 m* l$ z& t' \+ b- t
[编辑本段]二、智猪博弈理论/ C9 c3 f" i p& _: g: Q
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
}3 S7 h' I7 s8 Q* q 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 `: b& U: a- U
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 m/ b" ]/ d O
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
* w4 E' w) `! C0 _- C" Q; ~ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( o9 ]' q6 o+ K) E1 t$ I3 M 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 x0 ~8 w) n) ]# C2 I4 E
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! R6 V( d6 U! V3 b0 z
E. S+ D/ ~. B+ Y: s3 x三、关于企业价格策略$ d8 J" m- c U, w' A6 B
0 l" s) t( x; @9 I' L 7 X5 g& v6 j# L. H
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' X! }# n$ P6 l: z) ?
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; k# d0 M+ ^ Z. c. u b" a$ l! d/ X/ [
以下三个定义:6 f. l0 j$ c, K. }% C+ a
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 % @2 H) P8 F! \9 z& u; N$ L
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 _/ E1 |! O, E: ]; E/ O 所谓的双方优势策略则是指双方利益总和最大的策略。
& h* D7 }$ ~$ l( X1 H$ G; e2 A[编辑本段]严格优势策略举例分析, x( r9 ~5 [+ T$ ]. g; `, p6 S+ F2 r
一、经典的囚徒困境
7 Y( N" e7 }! {1 E4 U3 E1 f% k% y 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: ?/ m" @. M& A2 ~ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + a5 o: b2 ~1 M3 `7 h: g
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; W5 t0 f' i' F 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 z8 O& v5 ^+ D7 g' Q& b* f! C# G( F
若二人都互相检举(互相“背叛”),则二人同样判监2年。. p) r: ~8 k9 l, h
/ r; A9 ~5 U1 u+ {1 z0 M+ ?+ a% r用表格概述如下:
' P+ H/ ?8 d& d4 |* E
% e3 `& }! c, |- X 甲沉默(合作) 甲认罪(背叛)
: l1 `% N6 H0 o$ g$ C( n1 \3 x* t乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. O! s/ B& G$ N6 d5 B8 D5 O乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 5 x4 V6 f/ x( q( g
: `. \; `' Q4 H% o$ D7 q
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 t2 _( d+ D6 @$ A/ Q0 t* e. C7 n 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , t1 @' y- {1 i$ y% y8 k; z
若对方沉默、背叛会让我获释,所以会选择背叛。
0 X' r+ U+ [# K; Q0 A1 V 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 h& G% H: _) t8 y( i 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ ]: A/ f1 M" p) N5 W9 l2 B 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* X9 |/ l- b1 f) E" \ K 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 i7 P( ~7 ^( m, U% k# C
[编辑本段]二、智猪博弈理论. X2 f) @9 o X9 c$ S3 T6 M
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / T$ g7 N3 M+ K( p% V
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
1 ?" B+ W$ {9 i: H( o' t 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 B" g* E; |9 u7 X" D 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 7 m, M5 f' u2 h+ l+ g- I
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' p1 ]$ i' @1 e' P1 b& o# { 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - m8 M# U8 K; ~7 I A( X0 [9 {' F& e
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 u9 N3 w8 Y7 s8 J, o
7 F$ d7 U [2 ]. i4 C6 {% m三、关于企业价格策略
, w% v/ H: [% }; `4 O
+ k0 H% h+ L, s/ a' q
7 a0 `( p% N3 u; ^ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 v& D. o' z9 f1 y
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |