本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
3 K& Y2 w" x$ N" ?) E5 A: R% K* K/ j# Q y5 a3 e$ O3 u+ D& O' D
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);* ]+ j: X5 F' q" Z4 U |+ d" }
以下三个定义:! S+ w9 f9 Y* z }% K/ `/ F8 X
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
) @' d8 m4 m( s W" _1 ~6 ^0 e; e 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) W/ v* w0 {- S
所谓的双方优势策略则是指双方利益总和最大的策略。 - @8 V7 c! C" O7 a# r. w
[编辑本段]严格优势策略举例分析6 b# q1 T& c2 s/ `8 C) c
一、经典的囚徒困境 , w* K- G( c+ ]* U3 T; z$ u: l
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ G1 U+ U+ x4 m, W 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 W: b. K1 i: H( H* `( n1 O 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
/ W# g9 q8 h' l2 k 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 v4 ?9 f1 B' i# ^2 |! J 若二人都互相检举(互相“背叛”),则二人同样判监2年。0 Y8 h& B: `4 N( p P
) P8 Q! i4 c# {7 M5 K b6 M
用表格概述如下:
, a& Y, w* V* M: L0 s9 d8 |) s8 n! _5 J/ a$ I1 T" y
甲沉默(合作) 甲认罪(背叛) 4 ~3 o/ a$ O5 L: D# _ w7 v) s
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
& l0 g! i: f" H, f; U乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
: n$ s# C* h2 {6 d+ k& q! H8 v
@; @8 H0 t! _' ]1 ^ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! {; D; M& \- S% P$ {% W& D% T
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: $ t1 i/ \% s' Z
若对方沉默、背叛会让我获释,所以会选择背叛。
: ~! [) }! Y' B: q) `: j: S 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 E7 d T' m. o) F
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - W8 ^/ w* e$ l F% }
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# _( t6 @& z( e 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ e/ p* j, {3 x7 W[编辑本段]二、智猪博弈理论7 X' m; b+ A; t1 X
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ z; |$ Y& u( x% `- t+ A 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 6 z2 d* A; m# G) g' c- H2 a
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 m$ P" F s9 T8 O1 c 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' I% s; U" ]9 ^' O) p4 a6 l1 o
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 s6 V6 e. u0 u0 f3 `7 u/ }, u
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; O# j# m2 V2 G8 I( X: q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: R* Q! @& `8 R! N: \+ q
+ ~9 v8 J. Y, U8 X1 m三、关于企业价格策略
% f8 y- E! ^. N% W: ^; a; k2 \0 F/ l3 ?# d1 D. \# V6 W
, v0 N9 D5 X$ F* n8 ?# E 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ d2 i. V7 o; v% U- _6 H% j# [ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# N O7 n! ~* E g, c7 G7 Z* s0 m 以下三个定义:6 X2 H b# }2 ]8 V3 o n0 c4 y
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 ?: `4 E. S6 Q
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: V: I/ q4 H* u 所谓的双方优势策略则是指双方利益总和最大的策略。 ; U5 _5 a! R1 {) j5 m
[编辑本段]严格优势策略举例分析9 f( k! X" S; V3 U/ F. Y
一、经典的囚徒困境
* ?/ P& T; |+ G5 Q6 z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! Y2 u( u# i4 W% z/ `8 V
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( }7 @7 @$ G& l$ x- P" ]3 A' J% c
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 }/ L) P& Q+ _0 V% k' z 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 m* e% f# _& p! M( G s r, F 若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 o9 L. a. t0 I% `' _1 E' i0 g+ a+ V) n ' a' q) @* D$ r9 a, a5 E
用表格概述如下:
% F3 W2 T# I1 Z& E- \( u2 x2 r. v' `. T- C W# T4 {
甲沉默(合作) 甲认罪(背叛)
/ ?3 O! Y4 O X& j3 ^乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
- l7 G# Q) |* `$ A1 T乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ; W3 @1 Z* M$ J$ k
: q6 I% _9 N6 Z
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 " u+ _( F1 k# t! R# i
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
& b# k' r* ~1 f \1 w+ t% W 若对方沉默、背叛会让我获释,所以会选择背叛。
# Y2 A6 E; {4 X( A8 u- \8 ` 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 h. S9 Q+ @4 K0 Y0 B, L* k" z 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 M M0 E* S m2 s4 |: X# N! _
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
) X" t! ~! M* p( ^) F/ V: e 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ q# K* h' f, s8 j7 ?9 X[编辑本段]二、智猪博弈理论6 {! K2 J$ B# x! V) w1 x* ^% H2 x
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : I9 A7 B' y) I e d" t" N+ ^
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / ?% R3 [* z; N1 o2 P f
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( B7 K1 @$ Q' E0 f9 p2 u( J. }
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
* @7 \' I/ O/ H% r. Y& N “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 R: T" b$ W% }8 j8 d" M( i
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
2 V) o* h1 U# U* V 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 ~/ D S' j* W/ M2 ^4 z! S2 m9 u" p
; R4 @( s, ~: G/ C. ?6 s+ R Q三、关于企业价格策略3 r* W% M1 b- L) q+ e; Z
+ _ ]6 W, Q0 M$ l% b: D1 P
0 s4 s7 D2 f! a6 y7 z# E& ^
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , U$ m; \9 e1 H0 l3 b. @3 l5 R
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: s7 [# H( f. ]/ O) ^7 A+ [3 G) ^ 以下三个定义:) o6 L& h- r. K; w( E6 z' R
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' B' G3 D8 p1 ?9 D: M 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# a5 E% P: ~! q8 g) k2 _ 所谓的双方优势策略则是指双方利益总和最大的策略。 ; H+ |% `: \7 @+ Q# P
[编辑本段]严格优势策略举例分析$ W) D4 v9 D4 U, Q3 T
一、经典的囚徒困境 $ b& T- s% D. c: `2 F/ @
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
K# g; r( ]6 J) b 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 r9 c0 B; Z7 n, K; m9 ~ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # e2 U% R! ^/ o* W. W6 D" H
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : {& P. U9 R- o4 ^( m: B+ c
若二人都互相检举(互相“背叛”),则二人同样判监2年。* g0 |% m3 s; O
- V( ~( Y- t* I$ _+ _% p
用表格概述如下:% U0 a7 i1 a& b! ~2 q
4 i7 Z3 r+ o% K! E0 T; z, ~
甲沉默(合作) 甲认罪(背叛)
4 p8 {; K9 Y7 D* i" b' T乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; S8 v( d0 q2 P' I. q, s3 h
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 5 U+ B$ Z) i- s2 ?9 [/ o! V
& S: [1 E2 f: f8 A$ x
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# u7 n: i, D0 C' t- N 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 2 A+ k8 v+ n2 G2 X) ~
若对方沉默、背叛会让我获释,所以会选择背叛。
3 y1 \' e, o( m 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 w2 C' ?+ A7 t+ `9 i6 s2 P 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 J$ X8 B$ L6 o' U# M. H- p" k- r
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 - I, x4 p$ x6 s: C# ~
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 Z% D; O& v7 ]; z- r
[编辑本段]二、智猪博弈理论7 \" p! }% E1 I1 ~
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
1 p/ [$ F G5 D R: F3 B* e6 X 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . Z7 J* u5 S; X# {( _2 d
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 `+ r3 j4 s) y
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; v2 X8 p$ n4 y3 c
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / L9 a1 d4 a# U* H3 ~$ L
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 l5 T6 V& f, h' Z, q% ~ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. p& F2 H$ i* U* x" ?( d
* a; E8 h. F# u: t- e三、关于企业价格策略: m2 `9 D7 B/ z" r* b% g
4 g# Q |) T/ V& e6 c( @ 5 z e" K8 \9 A
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& M( S) Q5 T3 q/ O* R* c: M0 h7 v 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 _6 `* Y3 ~" ^ 以下三个定义:. j8 O$ `+ c) \* k( T
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( m5 K' w: R6 e- O. J3 T* a 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 y7 _+ v. K/ r 所谓的双方优势策略则是指双方利益总和最大的策略。 : i$ m+ n2 g# `9 \
[编辑本段]严格优势策略举例分析& Y6 ]1 f, N) P$ O& ~! I
一、经典的囚徒困境
. y. ~: o/ s9 O 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 H4 [/ e4 ]# A' A; B
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 x1 ?8 x' F6 z% Z" M
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! P- T( g5 V+ C7 N( y 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: {$ Z+ z) X( ?! U* r9 u3 [" m! w 若二人都互相检举(互相“背叛”),则二人同样判监2年。0 T$ v1 h9 @. E% U3 `
" R/ U5 z; j; J' W2 y用表格概述如下:7 Z) A5 H7 \, w, U ?: [' \
1 i5 d/ o5 a6 \& L( n 甲沉默(合作) 甲认罪(背叛) ; y1 S9 S# s1 u( Y6 y* g6 [
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; F# U8 [( r8 F& w: @/ {" M
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 a% V, z- D" \5 }! N/ C- ^$ K: g) ~" |- k
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 * A- A# |* R a, k& `7 l9 ^* a: i
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( V% [2 @' d! M# ^: p4 {' S 若对方沉默、背叛会让我获释,所以会选择背叛。 6 t) I. w T, n" h( p. {8 B
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , F# J- t/ z6 R% R% u9 F
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( R$ _: K: m! I, X9 {. r/ n4 S 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 / c/ V& r8 Q9 c3 u$ h
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 Z7 D; e. }! n# e9 T9 p9 J
[编辑本段]二、智猪博弈理论
; ?6 K3 S. _! H 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 M O, [: t" X1 N( E- c, ^
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 m4 d3 |% C0 |& [. ` 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 7 F9 o d1 y6 ~7 l+ B* Y! b! N
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 , A" G, t; C4 q' m# ^% d, F4 v( x- y
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 8 p) g; @( a' T* B+ O
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 3 [+ x/ ]" S* X( A% l3 T
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 h% y p L- M9 N
/ Z' w5 v4 x, q, A! e3 a4 Y
三、关于企业价格策略" f5 ~ T5 A' z. A1 C
, w1 K, @# |) B) @ R
, f# i+ {5 ]3 f9 u! k5 O: \
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 ~9 t) _% D3 F7 m 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |