本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
. t* x8 v$ I* Z A$ d( ?
9 K4 L# g& D. t: i! ?严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy); V- q) d# P0 N5 j# @2 e
以下三个定义:
2 j; M! s9 O8 u. }& q2 K. w 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : O0 E- n y# _- O% B
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 Z* k3 V9 u, V; H& m. B 所谓的双方优势策略则是指双方利益总和最大的策略。
& M& d) i( x! ^: |[编辑本段]严格优势策略举例分析0 y0 g. j V4 z9 t- r: f4 ?9 L
一、经典的囚徒困境
) _( C1 h. x* f* _ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " P8 U+ C5 O1 c6 U; w) z
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : e1 J, M% @ R) L* \
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 g% i1 Z' T% L 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 V! E# C3 @9 X3 s
若二人都互相检举(互相“背叛”),则二人同样判监2年。
3 K4 m0 P: b/ P8 ^. [4 X+ r `0 H& t, U! X! [) W
用表格概述如下:; A. W6 l" ?* O8 u
5 n& _& P+ L; X' ^) i 甲沉默(合作) 甲认罪(背叛) - A* v* ^0 q0 G1 F4 ^. A- v+ U7 g
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 : K! o/ h9 [6 P8 a
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 e& u8 o' ?1 W: {
5 n% P+ Z- `# ~, p1 y 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 `% {& Z% w4 `2 x6 B% Y
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ ]4 l* p; E. i9 D 若对方沉默、背叛会让我获释,所以会选择背叛。
7 R# [8 v9 }8 Q 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 r c' G0 ~4 j/ e2 k; `- _' I 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! u8 ~9 \9 `1 K0 M: k0 G2 S# F& i 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . _4 b1 |) o( V3 {8 I" m6 \
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
! i5 K6 Z. j5 C z3 B% L[编辑本段]二、智猪博弈理论% o8 ]) b9 ^2 Z2 {
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ s# ^( b) s! d! b9 K 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 $ f- H& z' H7 E1 K( K! S& a8 g
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 7 @/ r# r: A/ H3 v+ N1 x p
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; u# f8 c3 }7 l “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
/ H4 N6 z0 g$ N$ j7 b 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 u. Z+ ?; p; f" _" V. r* S x6 T5 R 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% [. V3 H0 E3 U$ L. z7 D
1 W! I% C5 j# A @& {三、关于企业价格策略
5 o% [" }" E5 r/ Y
. {4 F4 R5 z" x+ m3 P |% q+ U( c9 y4 R) l % H; R# R6 d7 v) f6 Q$ }4 F
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? : ?3 f6 C, T1 k) f: n, B0 [9 d1 T+ r
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 U+ z% t% w/ A( @6 H" J
以下三个定义:
# _: j6 o: C: A: R, ^0 q 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& T2 r1 }6 W7 J. v 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 \6 `# o/ ?' l- r. {
所谓的双方优势策略则是指双方利益总和最大的策略。
" c$ r+ ^/ Q, s% ]1 A" n[编辑本段]严格优势策略举例分析8 X8 s% W8 U: L! C7 ^: q
一、经典的囚徒困境
P% b% I4 T* g" S# J 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 x; Z3 V3 P, l; w1 ?& V3 B
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 V# O( ~3 Y+ U; k, K p3 `3 E; } 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 F! U% p0 L# L: T, W3 C- O 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
. M! [6 N% l9 c1 w1 | 若二人都互相检举(互相“背叛”),则二人同样判监2年。
) N+ n' F$ z* J$ e' z y) a5 P+ q6 F& S$ `4 B1 x
用表格概述如下:
1 |0 G! K; M: R D7 b$ B$ b2 w' u* L
甲沉默(合作) 甲认罪(背叛)
1 L% U+ A& N& M" x+ f \乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
8 l8 @1 i' R2 z, N. k1 f/ y0 n乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 2 A" A$ }; @$ N9 H; w+ b) L# u
! z7 Y7 G0 m! l& \5 C
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 # y) ?, G+ t" U. t6 K$ o
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 A9 u: U! Y0 c 若对方沉默、背叛会让我获释,所以会选择背叛。
4 ] _) |( ?! G5 D6 k 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% R8 T1 X5 B- L. U 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ t2 O( S( E5 L9 V, I5 F" Z 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 0 p- x: z$ t1 U# r
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' U2 M. m5 p( B! d[编辑本段]二、智猪博弈理论
: M( j o6 r& f" q; z( J 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 i7 |# ^8 |* H( a; K 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 1 x* X$ k% P0 M% Y; I
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, _, y* i. H2 O' `% ? 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& a8 {) k& C4 E | “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
9 R: B, [) N! w- F( Y' D( S 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 G& W! T+ F, _. T! n7 j( i* l
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ n8 N* ` }9 ~' J
9 j+ N+ h* j7 O8 |7 b* p9 Z j三、关于企业价格策略
2 K0 W4 u$ T/ o
7 b4 F; H; E, ]* r# ^
# o+ G% u/ ]- r4 Y+ ^ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 g# i3 V3 N2 r& C# A8 I. z
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 x4 t D& C2 |; j7 s) ^ L
以下三个定义:
: Y& a5 u: F9 N6 v 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 / D& Y! J: V: g/ U8 I) T
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
8 T% Z* F; A) B1 b" A. h 所谓的双方优势策略则是指双方利益总和最大的策略。 * y9 E+ ^0 P# s. d: t: ?7 J
[编辑本段]严格优势策略举例分析
5 y! |1 T8 x2 H2 P3 ]; B6 K/ A: @ 一、经典的囚徒困境
8 ]5 l* p2 B! \+ T 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , I8 w9 t( @1 f' D6 z$ ]. ~( }
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 m7 U: _, U [# g0 _( J 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . l# j) S: x' w- t& Q2 G
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 3 ]& T( k/ _8 V2 a: }
若二人都互相检举(互相“背叛”),则二人同样判监2年。8 I* L S- Z; L
& G6 `+ y# g6 A7 s# r+ \8 V& q
用表格概述如下:
/ A/ Y1 s# t+ Z1 P/ P. U1 E l) e0 J* \3 D y, y% X0 k
甲沉默(合作) 甲认罪(背叛)
3 j9 J6 ^7 j# ?& i3 Z乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ' H' b4 U, o! ]. _( \/ U% N
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 , f6 G$ p9 u1 o7 ]
; E. R$ [& i+ R/ z3 u! ^" v
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 . m' L( V# t' i" [ Y9 n$ E) {
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 2 A9 o! S$ f# n$ b1 P- h! m
若对方沉默、背叛会让我获释,所以会选择背叛。 ; M* D5 ]* f' D- B( S( w3 i7 X
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 @$ v' i' w {8 @0 q1 e
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + u0 n |: D% r# |! a% a o s' o& u, w
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 W3 U$ k5 u1 n5 Y' v8 e' u 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) Q/ M5 A: s8 G' Z& n0 b; j$ j
[编辑本段]二、智猪博弈理论$ S" }: C5 A6 ]; \
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& g2 c* c) M D' D 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 R* N7 i" q9 d, Y8 |2 Y( D, w
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 w" A! N \; s/ ` 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ b# E% R j0 @6 K3 q
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ ^9 H' j' Q0 A9 r, p# h/ H- E; q( X 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 U1 E8 N5 N& X* P' N+ z 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 ~, {& Y! c. f8 b8 P 0 E7 p- B8 e6 b/ ?4 F
三、关于企业价格策略+ H7 C. V6 f. d9 ~1 V# X
5 f( o4 h8 a3 U5 m7 d( @ " O2 w) y1 S5 G) g ]# }
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 1 R$ p- `% g* v, x: r
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 ?# k; c! F& Y9 ~9 |
以下三个定义:
( h0 ?! V: F+ U$ J% S# k$ e$ v 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 u: G' K m" O* k3 L+ D1 i9 l 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 1 S: k( W: C" l: o1 B. S
所谓的双方优势策略则是指双方利益总和最大的策略。
9 j" b( f- W! u% a[编辑本段]严格优势策略举例分析6 {3 J. f7 s# z
一、经典的囚徒困境 # v1 k1 @$ S+ A9 I: P
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 A( ~: r; x2 T9 `9 s0 H 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : {4 o: Y' y: Y
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 I2 u! l: Z& |' K7 ~8 x, B- a 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
' U, u& n6 A" N1 Z: [' D 若二人都互相检举(互相“背叛”),则二人同样判监2年。
. ^. C8 Y/ A% s
$ w, k1 z/ U7 `" y& g, A, P用表格概述如下:
0 [, Z, x6 L( x# c1 Y% [. Y, V: H# E; Q6 {* p* W1 ?: x7 l" b2 A: k7 t
甲沉默(合作) 甲认罪(背叛)
. n, N& N. z- `# u u3 z乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 7 f! V; x9 S3 p d' c. x' z
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 5 r$ c5 F9 V+ @" _+ J G
" a* G; u/ Q# ?# O7 h0 J
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, P* G2 n4 j5 A 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* a: E) s. W9 a9 i' [% Q9 N* d8 I 若对方沉默、背叛会让我获释,所以会选择背叛。 ! X2 B0 y% x# y7 H! u9 L, y' ^
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 [# z& {# N& N( g1 C n6 ^
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# `! x0 m( O) B; ~; j# ?; w K 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 7 ? n4 Y/ `5 C3 t0 T* b
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
Y, \1 c' c3 {7 S# |# v& w6 h[编辑本段]二、智猪博弈理论& a7 s3 Y4 ~& O3 H
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 T$ M: g: i/ S' o# M1 \ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * P7 {$ D2 Y+ O+ B# u6 [- @
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 w: y+ ^& A1 P3 v* u6 p 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; O: i# ~+ Y3 ~( G# {2 q “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! E$ A, V9 Z' a/ S `' {& U
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; l8 k/ k _/ ~
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( v( Z& K0 I {* A2 E3 W. U2 u
# p# i) g% w) {$ N1 h三、关于企业价格策略
: K/ N- F: `/ f8 y3 y9 C
- U2 i! s" \1 [- J( t) ]6 e: g
$ p1 A. L6 k! U& }1 P 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; u h8 R3 Z9 Y( N2 x l/ q 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |