本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 % R8 V3 y! k$ |
# |- N1 {! _' \) B! F# T v% t/ P1 V( ]严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 r) i5 a* l$ P; {& M9 ^+ P; |
以下三个定义:
! l8 e8 z! _$ S& H' l$ Z 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ C, A) a2 N) y3 u
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) |4 @# S2 \6 b# U- \ 所谓的双方优势策略则是指双方利益总和最大的策略。 ; i# j" ^" K3 P0 }( n i9 s2 Y
[编辑本段]严格优势策略举例分析 L, o* G8 g' _0 w/ j0 E+ j
一、经典的囚徒困境 & S* C) S$ a; Y6 u4 s4 ?# A2 H
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) W7 _& Y( T4 s6 O8 n 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : c$ C% b! g' C+ |5 c$ Q
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 Y# i% h* A! z, g( U& e4 [
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% N+ M5 @2 ]$ a( p$ K6 s: T 若二人都互相检举(互相“背叛”),则二人同样判监2年。
u5 {+ z8 T) o4 B 1 K5 R' `2 N* N* |: _
用表格概述如下:
- S. |- ^3 \! y/ x9 j$ l7 R( w. H+ E6 l( k m
甲沉默(合作) 甲认罪(背叛)
3 H8 s* A7 I& [* V. w' B乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 , p! }% J4 D+ B' U
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 ]' m3 ^+ z, J8 ~: w2 g0 l1 `% }* G4 X6 |
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : p( l3 z& V1 z; L) ?, S. Y4 m% {
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( I3 W; T+ _# L5 R
若对方沉默、背叛会让我获释,所以会选择背叛。
; k. P0 s) j4 l7 R% T 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 0 M2 x0 J$ g3 [8 ]0 W4 j5 A; p4 D' `
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 X/ ~& Y9 H U- j
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 6 G( I* Z+ N7 g0 a9 `9 ^% n$ F
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 C& `% ^" J3 p1 ]/ [[编辑本段]二、智猪博弈理论, S% ~8 J$ h% _0 z* _
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 P R4 Y1 e" n5 ?
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 N2 o" K# M# J+ y% e% J3 } 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( ~1 i9 \" b" T! A 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ) h+ q$ N+ z( j D+ [% B; |
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 H: p& }0 ?" W 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 }4 L. W& [, Z! ^& L
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 X0 J+ U2 e! \7 u6 D : H/ Z0 {! R3 }2 v& x/ W$ D
三、关于企业价格策略/ h+ \4 @2 l0 _+ f/ P
, _* n& ~7 M+ a- Q
8 F6 F$ |) Q* ]! a
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 h4 L; w" i3 |" D+ ?/ @
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 j5 u7 B- P- g8 b7 H6 O4 N 以下三个定义:
* Z# j# f& _0 Z1 e) O0 _( f 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 R$ m. _( Q8 L5 j 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ; e: a* j( E( r- ]
所谓的双方优势策略则是指双方利益总和最大的策略。
2 V1 {* d. Z- }% ^* d* |% Z[编辑本段]严格优势策略举例分析; V9 f* m. z2 Y- t( v" z
一、经典的囚徒困境 - e% K3 Y/ J( Q( p, k9 ~
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
% P# b" {3 l. ]0 A1 p! z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
5 J5 K" N; t( \' E) q 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' u; V/ @1 t8 q7 ?! ]3 u0 g1 P& I 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ V( \4 Z) {5 G9 @0 {) V 若二人都互相检举(互相“背叛”),则二人同样判监2年。
. y+ R0 y$ z+ X6 i. O+ U! B
4 \5 Y) T- b: b. T2 u/ }用表格概述如下:
$ P1 X2 T" e/ ^7 O3 E
: a' e2 ?! O$ q6 t; v" I7 L& l 甲沉默(合作) 甲认罪(背叛) 8 c& j. a) }, i: H# ]7 s5 U' U% [
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
5 |$ ^. }- a9 R# h0 A乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 X; w3 P2 R/ B! V) G
- i( b, G0 e1 d9 p4 j* q2 Z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 y/ [( Y1 m9 n! H
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 0 h7 B/ v" B3 b( N* _1 r
若对方沉默、背叛会让我获释,所以会选择背叛。 % d8 Z! v0 H0 I4 n
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
? l; }4 [" x! M 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + P& Q4 m! a* U* Y2 U
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : R4 P1 a$ F$ l' D9 C: |$ U w
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
: K0 I& \ f+ Z' I* k[编辑本段]二、智猪博弈理论, U+ K* Z; ?/ j6 G6 H) U( O1 c
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 * z( g$ S6 Y! V( y9 @6 L$ @$ H
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * A& e9 k+ t. s8 t1 P
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - C8 y# n% w9 i1 V
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 L" y, W5 L" H E+ `9 M
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 B" T5 U. {& t0 f7 I
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! w$ u7 s* J4 L! P, Y, k 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( z9 e! q. t7 W
. R: w9 P5 B& `: a& X1 j, t) b& p- W+ ~三、关于企业价格策略8 d/ g8 X2 t' f8 l5 [' ^
# Z: q2 q7 C' }4 @% F
9 h8 Z1 o: V/ y; G 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& Q9 `4 r+ S# ?) b) z4 }6 k 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
9 ]8 v/ v2 Z8 w$ D 以下三个定义:
D& w. b; ]6 F& f2 t 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ U1 z6 S; y" p9 U) Q% P$ U3 s 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
/ V2 M0 I8 J; }, P g2 V, j$ j 所谓的双方优势策略则是指双方利益总和最大的策略。
, H6 O7 q6 N' t7 y[编辑本段]严格优势策略举例分析
; N2 l7 D2 U E0 {" S5 } k 一、经典的囚徒困境
% Y/ d, d* O5 {& K# v; g5 M% X 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ( Y3 j# _; Z1 {$ J. n
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. t& s( x" Y' Y1 ] x3 Z6 d 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
. b: f" Q0 K2 m+ z0 i, ]3 S/ ? 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* B( s7 @% b' i 若二人都互相检举(互相“背叛”),则二人同样判监2年。6 ?0 J" U) K0 C& U* V! `0 T7 l
( F, W- u( x% C& H# a& [用表格概述如下:9 P6 K( E( I8 Y; {
k1 R; k0 w2 g( k5 A' j+ M
甲沉默(合作) 甲认罪(背叛) + X* t5 C+ R9 ~2 @# L0 K
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 6 }. f) T- ?. D8 o
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 3 C3 a+ k- {5 m# S7 ]) N
" |8 E' d/ ^& I8 `: n! E0 ?1 E
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# g$ r$ k; O; w( L0 m6 u/ g 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % v6 `/ @* R4 o2 Z0 Y. Q
若对方沉默、背叛会让我获释,所以会选择背叛。 , f5 J7 L* O/ j: ^) C; ?( O
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) @; u$ i1 h3 S 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! R3 \. F& w( `! t5 n; \ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * N! ]! |/ H6 W- y
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 w$ U# g( }& `
[编辑本段]二、智猪博弈理论
% d# p% O' I' `' e) K9 N) C/ U 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " c/ E9 Q! l7 }
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( Z+ k! r$ B$ s8 b( s ~ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 r# Z8 L* E8 \, C8 C; A1 v
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " c& d% ?5 r, J2 C9 b/ n) L4 t: \( m
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' r' V2 J; n D$ c 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " H6 [" W5 S& b
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! B F+ P, b5 p
2 |' P9 q: i2 O" J三、关于企业价格策略6 U( C0 T3 N1 G, R
7 f! k) g, r, S3 F- N; J# A( p
A% F# N, q* L2 V! E) j 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 m% R) H7 A7 M: l. A3 m
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
@$ @6 G {8 J! b9 [6 I4 h" w 以下三个定义:
# F1 e5 ?8 H4 b9 v- y9 t+ C 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ `5 Z# H+ s" q6 S 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ u: n- `; b2 i+ ^8 F9 Q
所谓的双方优势策略则是指双方利益总和最大的策略。 & Q" F) y* Y+ z3 F. Z8 |' L* ?$ P/ g# f
[编辑本段]严格优势策略举例分析
2 r% N* t, j: E! V6 z+ ?% W7 ] 一、经典的囚徒困境 3 ~0 S* a1 W* ~9 h3 {# s$ q3 b5 \! k
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % x7 m4 R$ m' w0 W
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 c0 H' }! {6 [. ?3 z3 s" Z$ x- v 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) i1 Z# t5 n1 E. g3 V, e8 P 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 f d; L5 r0 q, a) a r) u
若二人都互相检举(互相“背叛”),则二人同样判监2年。
% }, N( z; P$ b% l/ ]4 U: q K
2 i j: v2 \* P用表格概述如下:8 ^7 T- w( I8 z9 [+ ]
6 A" F. L) o6 ~
甲沉默(合作) 甲认罪(背叛) * O* f! R% J2 C9 j
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% o8 l9 ~) ^2 Y) r; t7 x乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 A w [: ^0 e8 V7 T3 L! j8 }/ w
# c0 b6 ^* l5 s: w' u/ T 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , h1 b* d- V# O# |8 e
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( o2 k) [- H0 O L1 f 若对方沉默、背叛会让我获释,所以会选择背叛。 & M$ y" C6 q' C) v$ d
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' I+ {# j" V) a- s& D2 ]0 x9 [8 O3 x+ ^3 o
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( v( h4 r5 O! t5 x$ a. U 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 k1 @+ ?7 s+ W0 H {1 A, _
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% W8 B- g$ _7 k# r7 V[编辑本段]二、智猪博弈理论. j; C& q! m- P3 b
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: Y- k1 ^* b. N0 d( W. y5 c 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
# N+ T6 \) y' C5 `% q& | 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 w h# k$ x5 d3 G b
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % X4 h$ B# E" j9 j$ |+ P: V
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + o3 Z$ L! F' \: E: u, F
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( r! Z; Q! c7 a( t' @' h
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& r' F1 L8 x+ e3 p
. A! w# M2 S9 z) x三、关于企业价格策略$ F, k7 F. X, Y- Y$ n7 u& \ ?& @
& O& }7 D: }4 F
! W' X# Z0 U/ M1 ~( J1 L 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ ^5 }% t k' E6 w
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |