本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
' K ]# g; z& T4 W. {, y' n
. @4 |+ O* J' L B4 t' q# ?* \) X严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 N, n$ t# _2 o. S$ | 以下三个定义:
) N* o2 W* X, R s1 A: ~( X/ R; f 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * d0 o8 P4 L) |- k: n& }
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# `5 _- g+ D k+ o* S% q4 s 所谓的双方优势策略则是指双方利益总和最大的策略。
% |6 O0 N/ @4 f. `# h- a. h- G J[编辑本段]严格优势策略举例分析$ q( q s' a# {5 L% @! p; V
一、经典的囚徒困境 0 Z# f/ i# `' a7 O6 S+ {; Y
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
% e! v" U2 E( G6 i 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . g( z0 q- X# w
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 g, W# y* q) D: x* J
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * f& l' P$ ?7 b$ P( h# o/ w; i# T
若二人都互相检举(互相“背叛”),则二人同样判监2年。+ T5 n7 U. d4 Y8 ]- H
% n5 M- I3 G; Y5 j# _5 S
用表格概述如下:. H/ D6 G3 d9 X; x3 R% i3 j3 c
0 D( r6 O! D& D9 |. i 甲沉默(合作) 甲认罪(背叛)
/ V- S* G# J) R* w, P3 F乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
4 k8 F% K$ T6 A M) v$ p* H乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- Z4 {6 {! A1 A9 R p5 W. O
8 |. D& u8 T9 \8 m+ Y8 }# A' {1 S& l4 n$ ] 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 }3 k( `7 I( L0 X, @8 q 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! F& A N8 E9 j3 g( h 若对方沉默、背叛会让我获释,所以会选择背叛。 # R% a# h% k5 U! @' U
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" d9 M$ j& x1 c5 }0 d 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
3 r. j, B9 z6 e" T 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 x& E" Y! F) Y/ l2 \
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。- f/ D" y& ?7 g
[编辑本段]二、智猪博弈理论
7 w: |, X. P( S5 t0 I 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
8 _, H( N& E2 M1 A6 f8 ~9 A! | u 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 r3 _0 O% @) E: b3 Y, Z 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
1 t6 t, f( Q; L$ T5 C4 U# m( Y 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' T3 Z1 G8 a) v9 k) k& e2 m/ Q" T “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 [, K' r" V8 Q5 z( Y
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
$ n" G+ \& w/ I- _! h7 `% y 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. t) F( N* h5 Z) ~5 Y0 M! o6 J4 I
; ?9 k! Q# c* w" p* j
三、关于企业价格策略
- ]1 x7 N/ E' F( n' b+ m4 W' ?/ g6 r7 t
$ z3 i- L$ z8 n! } 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ t( K$ t1 p( P$ ]4 R
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);# ?4 g/ H# I1 u5 f
以下三个定义:
- Z8 O$ n" a9 N9 ^% t 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ M8 r4 C1 k/ \ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 % T- S- b1 ^' J) F
所谓的双方优势策略则是指双方利益总和最大的策略。 ; v, b' l0 r- V% @6 Q
[编辑本段]严格优势策略举例分析
6 ~$ k7 ?9 r F1 L0 H! u 一、经典的囚徒困境
; r2 u: u; ?$ T8 l+ t5 l- D 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / o1 A8 f0 Q4 B% y9 B( o X/ j
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . d" G$ I/ R0 ]3 y. b D' ^- a, w
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
, b% `# d2 L" h: S. u* G6 z# A8 I- ^+ a 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* q: v4 W( a0 C: x1 o5 l' z 若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 s- y: D2 s+ y& n: i 1 T4 z/ s3 v9 A1 u- m6 [
用表格概述如下:, U8 e8 x/ t7 C* P ~) w* p
% h' |" i2 _$ R1 O# `0 f! I
甲沉默(合作) 甲认罪(背叛) " ^% v& v4 ?8 R0 `
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* X* G/ ?! X/ f乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
' e5 |1 Y c7 d- f) F+ o
3 p! J. L4 {- G( r 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 @1 ~! U# ?, T3 Y8 o/ m1 M
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
& Q+ ?( X4 ~1 ` 若对方沉默、背叛会让我获释,所以会选择背叛。 6 t- f* p6 p$ [/ Q; p9 @
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 U9 j6 [. }# l; g3 U
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % u- q$ a0 t0 e4 L, I" b# a- _- Q
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- a, @4 \% p& T" a; D& p 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ L6 h* g6 G" ]5 d3 }
[编辑本段]二、智猪博弈理论6 Y5 b; Z, z( b8 p7 t% ^: @
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + Q5 ?5 ]* f$ n
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 `1 e2 H2 J6 }/ z% T5 u7 O 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 z# o0 `) f* R( c# z. l( W, x2 i c
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 X2 X3 B0 I) u# q
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 1 q) A6 A) ]; G
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
7 {% {5 y- G) m6 x" ^* W' Q* F 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* a' m; r$ D# h
+ f6 g7 M& `8 W1 h2 q6 M: J9 h3 g3 e三、关于企业价格策略
- h' |" ^+ p9 z1 L/ ^+ D1 L; C+ P: f
/ G$ E1 T/ _, U" o: m+ Z
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ n8 O1 `. G8 |2 Q/ F 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* Z6 S5 s+ c4 n3 ?1 x% d( Z
以下三个定义:
0 f- v, q9 i% S0 D0 { |9 y. n 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
5 t8 M: E. @" A3 N& I4 Y6 l% Q6 M' t 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 B* F6 J$ W S8 {6 X7 V 所谓的双方优势策略则是指双方利益总和最大的策略。
" B6 L2 ~( Y; ^2 @8 U2 A! D% `5 X[编辑本段]严格优势策略举例分析9 }7 G5 [3 B% X" [/ e
一、经典的囚徒困境 , u1 L0 T! O9 t% m7 a3 x
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' K# K" s, }6 z3 |/ c2 h3 g/ ] 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ u4 B' w' l2 F- e0 ` 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : E: Z$ J% J( ~+ i( S# A' x
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , O5 v* T. z8 J4 y; @
若二人都互相检举(互相“背叛”),则二人同样判监2年。: O5 a* c: y% Y o
4 a% W1 _) L) n- y* u. E
用表格概述如下:
) Q& A: l7 o3 s( R* @4 s, s
7 g* A/ p" m% V5 c& ^ 甲沉默(合作) 甲认罪(背叛)
% i# `& l+ H5 h: h乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 + i0 d7 M, P7 D* [
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 # F, ]/ Z; A h6 x* m0 n
2 g; e; c; ~/ p* {% K# ]4 Y 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 ]' L; K5 S" _) p7 u# f+ r9 f+ j 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 ]7 }* W1 T/ R% _# p. | 若对方沉默、背叛会让我获释,所以会选择背叛。
1 C& ~! ? t7 W. Y/ B 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- a$ M5 I& c! l7 X 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 O w( Y! U- m
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
. j C, H! H! v/ o# S 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 F5 `/ Z: _+ T/ G+ a
[编辑本段]二、智猪博弈理论: j$ M# y6 k! a2 c
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# z, I/ x9 M" D+ s 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 E* {6 x" s3 E- W
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 g+ J2 f/ W# F& _+ U" q3 W/ {- O
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * k* q& ~2 U$ T4 A6 y5 ^
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ; ]- q2 j2 D" G% Y; Z& g
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
0 l& J% ]2 p1 ?* }0 O* q1 t$ V- H: Q9 p 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 b( V$ A1 G8 `: a4 H& y% c6 D* ^* @ 3 t0 H' b8 q8 f
三、关于企业价格策略
+ S( _1 ]/ x. U! u5 j
3 Q4 j; B8 L7 I( ^- x- Q( k ) T1 ]9 w# B% X, q0 @( Q7 P* F
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 5 t+ ^$ F- Z8 V6 b! \, l
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 ]4 b- G5 e* I, P. l9 {; @ 以下三个定义:4 N7 [& O6 [* y" V! r1 R
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
" u+ G; h5 E( p5 s 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 f. K p. {7 u" m# s" m 所谓的双方优势策略则是指双方利益总和最大的策略。
) r: Y; m* C6 `6 j& w _3 O3 P[编辑本段]严格优势策略举例分析' @) _! l' N8 F3 T
一、经典的囚徒困境
+ n# {$ }/ G' t2 L( N( `) ~6 W 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ) s8 ~6 ? Y+ a% `. D3 e
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% q; D6 r7 }, U. ] 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! y$ r% ]' d7 }2 B, r
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 `% s, G2 I5 V6 n. m( g
若二人都互相检举(互相“背叛”),则二人同样判监2年。, p# z6 Q p7 k0 r+ }; m/ S$ N
: v" a- X5 m9 {
用表格概述如下:1 q" V# Q# z8 H( H ^% @# ]
9 t1 ^ M& ]& `5 `$ Z% {8 G
甲沉默(合作) 甲认罪(背叛) ; e I: d; L& U
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
3 P' j' W! g0 O7 ^乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
/ ]( f" A% `) s! F! a
8 e, d3 t q; i8 W4 ?# p7 r& K; x 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
0 B# W$ L( z4 R& o/ P 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: l& p% F* k' C/ l
若对方沉默、背叛会让我获释,所以会选择背叛。 - [# U: x5 J& S
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ x- w! D7 n1 N" Z/ f# U 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * w2 G/ ]; @2 Z, Q9 M0 Q: W3 q
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
' L( e1 }1 x9 z M. A 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。& I$ ^! Q) C( q X- l2 m
[编辑本段]二、智猪博弈理论; n: ^% _, g4 _& s( a: z* E
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
$ I' ]9 M1 H9 g) W t# n; A 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 7 S4 \( w+ b1 x! ]$ G6 K: {( |" O
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 8 b3 Z' k1 ^& j$ q* A/ N9 V5 D
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ _3 K4 @; H2 j+ g5 Z! X “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
- c7 s! j" S# t6 p% w7 u5 r S 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + w/ W* V9 d' s& o4 Z& Q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。& o- \% h6 b2 e9 t) U; X& q
2 U0 V( P; Y2 Z( Y三、关于企业价格策略' z# q* ~( f% e1 ^
+ B/ Z- x1 ?% R% ^) _
/ I: o2 K, h( J5 P& ]: R @
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 7 F# ?% u2 I9 a4 |" ^
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |