本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 " O/ @/ N+ @, r0 Z: `+ T/ v
* l+ H% }, a# F/ f4 n严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 a+ x$ \* M$ `! g, Z( U
以下三个定义:! C$ x4 @+ e3 W4 o" p4 E
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 C& Y" j$ S0 l3 W# i* T+ [! \ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 v$ | {' C* S 所谓的双方优势策略则是指双方利益总和最大的策略。 6 ~. `! L4 f5 H9 w5 i1 ~9 E
[编辑本段]严格优势策略举例分析5 g' A) }, S/ u% u+ ?
一、经典的囚徒困境 M1 Z$ ?& `8 ^; U' r1 J- y
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + F7 ^0 P4 u- d
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
" m# ~! ~$ o* \: r' v# a 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 e* j0 }+ p6 V2 e1 j 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " o" F; R* I4 M
若二人都互相检举(互相“背叛”),则二人同样判监2年。$ Z S5 R% y" \6 H# V
: a, p- P6 r0 S7 ^2 @. s( l7 Z1 k a5 j
用表格概述如下:& h* M; Z8 J( u3 M5 u3 u' j
0 N' i }% |$ _5 z 甲沉默(合作) 甲认罪(背叛)
% p3 O I/ G" v0 q1 @" V乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
8 C/ j" ?3 K7 e# Q! B* u% g乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
* v( x+ t* k+ `; M i1 e- ]; n" u
- K C0 A0 m4 }& u- N4 g 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, v6 _3 R9 q1 R( E5 P 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 H% |; Y" w7 H, ^- ?, R
若对方沉默、背叛会让我获释,所以会选择背叛。 9 g1 O$ o1 i* M: R
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; b _ U @# C0 D, N2 d 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; i7 _; D+ ?% q
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 Q8 J3 ]( E8 ^) W
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' e% F6 c* z/ Q7 a) J/ ~2 C1 ?; V[编辑本段]二、智猪博弈理论
/ F( x+ w+ e7 r0 ?9 N2 i 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 3 v. D7 Y$ g) E/ f0 e# S
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& f2 t, _" c: f2 W( O3 c/ m 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# l+ _9 J& h4 a- Y 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 F3 V4 e0 p1 ^- F5 T: w- m
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 t5 K* k; l2 K4 z: W' j- Y 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ t8 |3 l' H5 T' X# P* X3 V 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。: p' T5 D- w* l! I' V. a( c: ]1 u2 E
' i: X' B0 h4 ^三、关于企业价格策略6 M- |1 d& [( ?
5 c7 t. _8 V2 h: v7 d: N2 E8 e, t 0 m; I6 [+ `) l% q$ E
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
# c+ v; f; ^" c. o6 O3 c, `: u 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ w+ l. {6 I' {# j1 W 以下三个定义:+ d- a) V& Z3 d! s
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * y _& e) D: Y# {) H
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 {4 ?. w/ l6 m. w i 所谓的双方优势策略则是指双方利益总和最大的策略。 2 p, d- m7 W5 ^! C8 @0 u
[编辑本段]严格优势策略举例分析+ i ]% H; W7 v! f: i4 B" f
一、经典的囚徒困境
* A5 Q. t- n- k" G9 h7 ~4 [ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: & }+ f8 M7 |+ l2 Y" e$ z
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & Z- x4 o! C# ^- ^3 J d- L
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . [! }# z) x0 g3 Y; `8 |7 J, B
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 % f+ C3 \6 f$ _# ?* h3 `
若二人都互相检举(互相“背叛”),则二人同样判监2年。( _) h) ?; Z/ x& S; } B1 u) k
$ F5 ]3 a J* [& U& ~% z) A4 s用表格概述如下:
7 }7 G- u$ q. Y. H( y# m4 ^3 b. L) W4 V$ p! e" h; G
甲沉默(合作) 甲认罪(背叛)
/ v) Q) H3 ]: P# o乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
5 g4 s( {2 T* w乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
r2 d C6 h! S$ k" n$ f+ J
1 L; N9 ?, Z; o: p1 b5 m4 d/ T 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; r! _4 F/ F1 } ^ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
1 x4 ~$ M4 }0 D* c/ E. s% N7 f 若对方沉默、背叛会让我获释,所以会选择背叛。 0 t" G* A. d2 R
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 # a* m! M6 u( k" W% O$ M7 m
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, @! q" [' m/ I 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 w/ c: X& V# c/ T2 ] 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 q3 }, X" y7 c h
[编辑本段]二、智猪博弈理论
6 e3 B: j9 [4 I1 m5 ]# \' g 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# g" k: b3 s8 } 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 J5 w( T9 t8 S7 U' w 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* {' ?) Q" N( g) Z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 e( S9 K/ { j* `/ O! q “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 j3 _6 [: Q, W 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ }# X* D5 T' S3 Y; U5 z
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* O, q& n2 v5 A; t' @! {# r 3 B3 w) m8 e1 C- \5 i
三、关于企业价格策略
7 F0 v3 Y. z1 T2 m7 d: `% y# F1 l' I! P" y0 P: `* Q
- n& q1 L* S6 }' [8 I
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 p- d; A, N* p" ] h, g 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 w! h, K, p h( ^4 R5 q
以下三个定义:
' ~# R1 M& k( _ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 3 R+ `& l: G( ^% e/ m
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. c+ e! R4 r# O4 L 所谓的双方优势策略则是指双方利益总和最大的策略。 6 T# ?# T! U3 I8 R0 P, R* y
[编辑本段]严格优势策略举例分析
. G V4 w% t+ Y 一、经典的囚徒困境 5 o% Y2 z' E1 n, D7 ^4 K( L
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
% r$ f2 M) e' a$ |6 x5 H( S 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + h( {) Z. [+ m! U4 o# e7 I
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; w4 R( `- h+ F. d' C. ^7 c- W/ v 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; d. y8 \7 M" g5 n' I7 B1 W 若二人都互相检举(互相“背叛”),则二人同样判监2年。9 w, \3 V1 R% H0 t0 T( r) W
, t0 U3 [( O" a% k+ L: z4 e用表格概述如下:" k; w( `4 ~, E/ u1 o) l
% g' I- E( Y; {! g
甲沉默(合作) 甲认罪(背叛) 1 P! s8 ]5 i! r/ a
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 " n, W) J' q7 T# z p- ~
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + s8 b6 I; R- L4 J+ B
( S, i, S' D7 ~' u2 x
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 C3 v8 f$ u9 Z8 f! K( X f 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' d, v$ p9 ?5 L" C 若对方沉默、背叛会让我获释,所以会选择背叛。 , E- X8 {# d9 s% c' w2 k3 o! W
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 y# N! S n: Z0 v L1 g 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
5 ]6 a2 H1 r* ?7 M 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# _" E) C' e1 }& z$ k/ W 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。. T7 X! p+ V( t5 F+ S
[编辑本段]二、智猪博弈理论* C/ ]( _& w, Q; ~, S
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# ~$ p5 X( W) n% W* S; y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 N& a2 U4 W2 M f' u3 U 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 # s6 S! b0 g) H1 X3 [9 t9 @2 R
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# L+ U! \, Z/ {! _ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * d( O# f3 B1 j: A! l9 B/ c
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 i9 F# K5 I- b 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。; r( F% R v& v/ n' J5 M
5 f9 B7 p- \$ ]/ M( b三、关于企业价格策略0 `6 L8 p6 w+ t! F- P8 t; H
9 V2 R) ~3 c. u
$ o& z! h3 p8 N
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
1 r/ i5 l+ E- }5 d! k 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);( R: _: n( _- e
以下三个定义:
) a9 K2 t* ^4 I! t3 Y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ K5 ?$ v# U! e! s& Y 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 / q8 v% i4 k# U
所谓的双方优势策略则是指双方利益总和最大的策略。
2 e: q3 r9 t$ n2 I/ l[编辑本段]严格优势策略举例分析
9 k8 K& w! @' A7 {1 k! b 一、经典的囚徒困境
( J* ~$ b M3 h8 Y5 L5 ^ d 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ ?( }. |# _! _7 z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
" m* j' W: K8 h9 J, G" K& ?! f& ]- z 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 * U8 g, Z2 H* V# g; D) |4 w
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 v; Z' j% V6 i) G( c0 X9 H7 H
若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 f3 S" [" e$ E' i9 U
6 W& ?, B; y9 r) `) q用表格概述如下:
# @% E1 d5 B; \; ~# G& N' m; }9 I+ m9 J$ Y
甲沉默(合作) 甲认罪(背叛)
) T2 ^, f! Q P) p乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 * v$ z/ {( E- b4 }
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
Z& f. Y7 z$ @; X1 w& h
) J2 u8 B7 d$ Q 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 g/ ~+ e9 ~) c! |( p$ ~ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: - B/ ]1 V" m; C% i" h* x' X
若对方沉默、背叛会让我获释,所以会选择背叛。 0 ]) R5 ^' N( l: b) N
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ! i B0 s( ]7 R
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
3 x; R1 X+ B; u, \( Q 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 H N) ~2 R$ x0 t9 h 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; g( D @! q! S( {7 U[编辑本段]二、智猪博弈理论3 }. ~* i- s! }! k+ o7 \! n
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* y' L0 ^* N3 u" R: Q4 I 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( ^1 M+ F1 I, M* q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% T- r @2 Q+ ]8 T, U3 P: v, z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 7 H: C! {' g; a. D
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 " W$ W+ d/ l' z" m
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; P5 B5 r9 C V9 G
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! O3 T; [; K9 ]3 A/ A
- f8 f9 M' r( K! x
三、关于企业价格策略
7 d- _3 Y" k3 y) i& J, z& `, N f2 h/ I" i2 y
- T5 ]. `, T+ A+ W
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) w3 M1 F. R7 `; y" [2 Q" m* i 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |