本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 ; D; L3 K$ e: Q0 k8 r1 m# _
% ]7 V6 n( L7 p# }# Y! m6 E; ]严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& u" y, E& s. p 以下三个定义:
, w" \: R: I* E' [7 x* H 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
0 l5 F% n6 h, | 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
g0 m9 E+ ~: L2 Z6 p' i 所谓的双方优势策略则是指双方利益总和最大的策略。
: Q# I. @6 a2 y+ q# Y8 I( B[编辑本段]严格优势策略举例分析5 V5 w: i0 H. M+ Q$ Y
一、经典的囚徒困境 % g' Q/ j1 b3 J0 t7 _
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 Q8 c9 B4 l, A6 K4 L 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
3 x* ^; b8 t1 M+ s- b) d 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; j7 x" Q9 H- Z j$ _4 }# M( k 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 p: f( h5 K" }' Y* v9 W5 z 若二人都互相检举(互相“背叛”),则二人同样判监2年。
' R: z0 ^% I* a( O' Y 1 ]5 u2 ?! I! M+ j- i
用表格概述如下:: X9 D3 m" ` y4 _! ]/ C
7 n4 S0 ^' L3 i8 I3 a/ t
甲沉默(合作) 甲认罪(背叛)
; L2 t) x% d3 U: N) ` g乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ! j1 \' Y# F' L4 H
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 & O& l. D' C8 A+ |
/ ^ \$ g/ e! |; S" E0 p Z6 F 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 |9 O8 R* ?) @! d+ l7 d0 j
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 p$ \5 e, ?6 {# Q 若对方沉默、背叛会让我获释,所以会选择背叛。
0 a% R1 |; z2 ?& g$ I 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + M( G6 I4 C& U8 K& m9 p
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # @9 N( u+ P! o9 t
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! ]6 ?7 d! u9 _9 ?
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
3 t2 n' J) U. t7 h6 J7 f$ K[编辑本段]二、智猪博弈理论9 a7 }- D; I6 b1 K7 f
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 p* q. ~2 \1 Z6 q7 p* x; j. L
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ S2 j1 G2 o0 e% N" f 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
) v9 u9 z/ f: k 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
5 _9 O' k+ ]" ~) y “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * @0 @7 w3 ] {6 o ]2 p3 N; p2 H
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % F7 y: _/ W/ X5 |
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 p' H& g4 |# d3 z
, T# s' I+ S' d3 O0 \: U0 J
三、关于企业价格策略
" R2 j3 c, I" h1 G1 i' o9 m& Y2 a+ C+ }
& `" p! x" [( a# D1 S6 G 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
! y0 D5 N5 _" ^- c 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% m" b7 s5 ~6 S
以下三个定义:
( _- V6 Y0 h0 K5 N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 S4 k' q$ t$ N( V2 E! H B
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 T% F# _6 N) A7 v/ Q6 T 所谓的双方优势策略则是指双方利益总和最大的策略。
, D- u9 T. T3 _- P/ M. Q[编辑本段]严格优势策略举例分析
% T4 Z/ _" s( H1 S2 P& M 一、经典的囚徒困境
9 J5 z% W% A# Y( i 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. {; |7 l- R! H( F- r1 y& S 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* L8 V! ?- ^, [ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 `# ^' d1 A5 {4 f
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* h/ j/ m" x/ F/ l. B 若二人都互相检举(互相“背叛”),则二人同样判监2年。7 i& E( d- w+ V2 {& y# M! B% m% U
L3 Z8 |' D- o, G* N# Z
用表格概述如下:
1 q# _0 Y4 Z r" t
, ^6 L: A0 Q i2 y1 W. p 甲沉默(合作) 甲认罪(背叛) * O# B, ~$ |" |! s/ y
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 . ]& N# T$ E. J C. J
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ k3 N" _- g& f5 i* N4 M# H! m1 Q7 k( U- ?9 ?+ G$ D) h
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, _+ z% r5 T, v6 o! ` 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 ]9 }2 k I: x; o 若对方沉默、背叛会让我获释,所以会选择背叛。 6 h @2 Z3 u5 v" i+ v: e" j: L- P+ ^
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) a' U: r% s' U 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * ?. F" P, t2 c( y8 D" v& c5 Z
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& ^3 D2 u- c# I3 W! e7 y) c0 [ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 \; r) X/ Z$ S! c: _[编辑本段]二、智猪博弈理论7 K. b3 w- D4 e; p* z
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 v4 |5 c+ {9 } C& }0 P- w8 O 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , G# t- X" O) _# x/ x
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' I7 h6 i7 ]* z& P" s9 {) ] 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; p% b, B9 D! }0 a2 q
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / |6 a# I3 d2 {, h: j: z( E
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 4 G, P1 `. G7 m: z0 b( m/ q$ r
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 }3 G. o3 ? H4 e# N9 j
# ^! `* H# P! X& _% }5 l T% X三、关于企业价格策略
/ Z& M+ C& I3 [7 E! N$ n& P
" P7 M1 b" U1 f; J% {: \ 9 e6 \, y' e7 |# c/ J5 I, J
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , P: L. H1 k" M# I
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% [9 \4 a ~7 j3 G 以下三个定义:3 @' |! c( ~9 ~; k# M
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ! _. ^# @, |) l. t) f" f" H
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * f4 X; V |: t# \( Y
所谓的双方优势策略则是指双方利益总和最大的策略。 $ r! b, i9 }1 l! `7 J: v4 g
[编辑本段]严格优势策略举例分析
" z' t! b2 r% e) h6 @" _+ ?$ _9 Q 一、经典的囚徒困境
; W' C2 t. {1 Q0 ^( w' w 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , ~5 g- ^! T4 U, g
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: , A! c) E2 v% k( }
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( D& G |+ J% N" T3 _ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
, b5 B/ b k, |5 H3 D- d 若二人都互相检举(互相“背叛”),则二人同样判监2年。
D' z+ b( c; U$ [! e
. Q0 x1 r* R1 J$ X( l+ x. T- n用表格概述如下:; Z+ i- @! a4 A
0 S; N1 `2 `. x; ^
甲沉默(合作) 甲认罪(背叛) % q8 | y) W" j" d! g0 G
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 + t, g" N8 e5 ^( d+ R F$ O
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
% P/ V( l# d8 u& K* Z' A% G
3 i9 n$ J/ H" i" Q 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
0 ~; O: Q- X/ s3 e) ] 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
# K1 a, p7 ]# p. y4 V0 A( C 若对方沉默、背叛会让我获释,所以会选择背叛。 ' b3 _# m( z: R9 `3 l
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 N5 [0 }3 \6 B9 e9 w1 [9 q$ G 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
. m2 x. y; e% T 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 7 ?6 t, `( ]. K
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 b8 g8 D$ ^. `
[编辑本段]二、智猪博弈理论$ t. Q# g& {! U7 M
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
1 z+ R) [9 o- K5 p& c5 l 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 d& r3 h0 u6 o* \; K
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: z- A Q# `+ g8 Y 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % q7 Z( D- U! w% L( Z' Y8 ^
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + l+ ~5 F9 K$ ^& p
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( J. B+ d! D) O! ?0 `
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. J3 u, q1 r# H8 K5 c$ ^3 h
8 _ j% q4 K* M4 M- G& j
三、关于企业价格策略
% ~5 v6 B5 T' o4 p( u1 A, q. F% v* H- h( U! ^4 d$ z
% n& T) T) _1 n
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ; E" L: [ t+ q& S+ b6 m. u% h
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 Q1 a, }1 F# Z F
以下三个定义:
" _- H4 V7 u. q( r 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 k/ @6 F# `; ]" B! [" E& P 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . W- C: t, L* @- w$ n# O |/ P
所谓的双方优势策略则是指双方利益总和最大的策略。
7 a9 a4 K) b, s! z2 Z- \ X. Z. u! E[编辑本段]严格优势策略举例分析+ [6 Q6 g7 ^' Z3 [4 z
一、经典的囚徒困境 % S7 x; g) V D1 M9 t$ l6 Y! q2 `
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 J) b$ O4 O% _# ^ ~ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: , K- m5 y, }6 j# q
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; F* G" b4 p# K 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
7 m: ]/ P8 T& c1 H 若二人都互相检举(互相“背叛”),则二人同样判监2年。! v, b! a7 `( o6 _# f
( j" q0 B2 @( l4 f. w$ V1 I* w* ~
用表格概述如下:
& w; A1 z/ _! D* U! ]; O
. D' Q+ M- }( _0 ]0 ? 甲沉默(合作) 甲认罪(背叛)
! @6 P" E+ \: ]- Z: L) e乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" S" v+ l. w! }乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
) X6 C3 U2 v. T& U* K5 V5 S/ T
) o4 t0 w" q+ ^- k/ { 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; l' }; a! }5 w3 Y m f: v( r. X2 ^7 y
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 4 ], |8 c% r! P
若对方沉默、背叛会让我获释,所以会选择背叛。
- b5 _# l5 l, m7 x# ^2 O1 T$ R 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 O) g1 ^+ R2 p: i! Y
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ ?8 g# y# A" Z' a! m e 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 n# o9 k m9 a; [8 S/ k1 S, e; r
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" T) ~1 b# {% {. ?8 u& T[编辑本段]二、智猪博弈理论4 g4 D# H' i* b3 F& t0 j, T. \1 V: c
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
7 l H( {$ V+ Y: y6 w 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + E" S: Q9 p) S& }2 {1 H2 f. p; g1 I
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 ?- @. ~: N3 t$ Z5 U; }
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' }' R$ |4 L+ ^$ B2 x
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * |9 q7 _( e# ?/ e( H
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & p% `% ~, ~2 g8 Q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 ^' A1 Y9 y Q2 K
* i5 z- E9 q' Y" Q) `6 }+ f. D, a三、关于企业价格策略
% U4 `9 F* q6 R8 q- B/ o. z) D
; v1 w$ F) U8 v) \1 ` / u8 |# V* Z' n
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 e- m. D/ B4 N) Q
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |