本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 - u& r: K, J9 k3 O
4 B2 P' B* a/ M
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 M. Z* q1 q* e0 W# X
以下三个定义:' }4 j0 y5 f7 T: a! `% i
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; J1 K) h: C+ c! q% Y8 w# V
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& [! Q' L& o1 f2 l 所谓的双方优势策略则是指双方利益总和最大的策略。 " Y2 y' {' |8 V7 a9 L2 |4 L5 N4 k. M
[编辑本段]严格优势策略举例分析
; \, a* d5 v+ r 一、经典的囚徒困境 9 F# e r1 f9 I, w" ]! Z
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. C1 M. o# x: `1 }! R) X 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% f3 N6 h9 t4 ~7 b$ `3 K& a 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + i) m- W' w& {' y
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 `3 N8 K2 ^3 |3 r 若二人都互相检举(互相“背叛”),则二人同样判监2年。; ?9 v$ N: I( H) g/ u
5 k; k" {7 D3 X! v8 T
用表格概述如下:4 z0 R$ R! W5 j' M- A' S1 y
/ O( V: V. `8 g. `- l 甲沉默(合作) 甲认罪(背叛) $ E5 Q1 j ?: Y( n# {9 u
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 8 k$ M# m+ h. y* e! k+ @3 ? j
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 d* R: S( V0 {0 o) z5 F: A' y& Y' H: t5 Z' Y
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% u; D2 b/ H$ `" P+ h6 z 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' Q: ?/ V+ J0 @" S% b; Y4 f
若对方沉默、背叛会让我获释,所以会选择背叛。 . h9 B1 z( y1 T- p& r
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + K) I9 i! \" t( C" X, v' m" Z
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 H& }. `0 J: V, `" h7 ?$ T! H
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# i; a$ ^! @; t A* _) p0 r) n 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
' E! e( R: ?9 S4 R' ^+ G. H[编辑本段]二、智猪博弈理论7 A7 e6 O% z" Q4 W8 j) z. v
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + n7 ?! j7 g0 A4 k
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! y8 {; j" H, F; Z$ u6 U. U6 ~
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! r- {/ {: Y8 T X( A- O2 G 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
* s( P& V9 ?5 Q8 c# m- I9 }! i, o: Z “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 5 W$ a' r# O+ o5 J C' U
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " J' i. U+ m) ?5 `
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( H5 V# j7 W3 C" A; N5 B0 p0 n4 |. s+ M
) s5 \, Y8 V0 v- P/ W5 Y
三、关于企业价格策略
( ~% i5 I6 ?/ W; g1 C: d/ @/ a% p1 O, w" n3 @& y
3 j4 _6 e& N1 ^2 O. L3 n 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? - d1 m" {- L6 {- h5 |! Z9 d8 j
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
* s7 y% T4 a2 @* F 以下三个定义:
6 A* B; b& v0 Q$ U5 a 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 Q; s0 \0 D! Y' r; S7 v
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 + c7 I, |1 @. t. p# K$ c3 {
所谓的双方优势策略则是指双方利益总和最大的策略。
k5 @$ @& S- ?& G6 z$ t[编辑本段]严格优势策略举例分析. f0 `5 Z+ l8 B8 o; d
一、经典的囚徒困境
0 U. P i* }* @- r 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. p: U5 v t+ ~: U! y 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 5 t, v; F I' U$ R) ^; v
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 z8 L* \. w; l2 Z: p d
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 U F6 f! R; Y8 P1 l/ f0 z 若二人都互相检举(互相“背叛”),则二人同样判监2年。9 i+ ?6 o, S0 l% d+ i
/ L# o q" x' ?6 `- a$ o
用表格概述如下:
6 O& y5 z7 X6 Y! G
, Z1 M; _, B" {1 G 甲沉默(合作) 甲认罪(背叛) 7 h" w( P' X0 X' J, P
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! B, F2 [4 L0 z- A5 _& s乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
2 s) U( z5 T+ _1 J( c
$ o( C' u7 S* n6 i% P6 ` 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : E- X' E4 W6 s* `. {
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' F# w2 D$ x5 D5 u z7 H 若对方沉默、背叛会让我获释,所以会选择背叛。 7 \! d% y9 H( x* {# K
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
A9 _6 c8 E6 |' K$ V8 T 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# J7 M" H9 z( f6 k 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 $ R7 @& r; k, f) S% U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 B7 `# [* t9 f7 ?1 R6 d* Y% |[编辑本段]二、智猪博弈理论' } _" W1 `4 L1 B
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % K+ ]5 F8 Z' W( T" [+ J r
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + }) |) i, Q7 l# I+ P' O+ {5 r
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
& j# j* q2 |3 _4 R. h! j 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 ]# N6 R+ k$ w/ U/ _$ a9 r
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 K" ]' j) k5 E9 h& W4 @5 [' U 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + B. T/ B1 n* D7 J! [$ c' X
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: }/ w! u& T8 l$ ~ : r* I* @% ]0 [( s5 `5 m2 `; m, Z9 ~; o( `4 r
三、关于企业价格策略: n: f a7 j# h5 C
9 s$ g) b' V+ q) I# ]! o: q( ^
! j' a$ p* V) U P 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
2 W4 ~" L3 @* u+ T 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
. H+ k, T: y- v) W 以下三个定义:
4 k: z: N: D* ^9 F 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 9 h* q7 P- @1 t2 `6 | ~ Y
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ; U* @, e- o+ o% j3 |
所谓的双方优势策略则是指双方利益总和最大的策略。
5 C: R5 c: c' \% E0 i3 P9 y[编辑本段]严格优势策略举例分析
) y5 o, U6 B0 m q 一、经典的囚徒困境
7 _. ?/ u% l; L/ Q: b+ m0 z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ h9 \+ K; O( E: Z0 ^# w 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: $ H0 y6 y# P9 K% w9 z$ m
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 Z% k7 l% T$ N9 ]
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; _, n- r2 k% _- t+ \ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 \! M/ M! g$ M1 e 1 _# t6 e% z7 {. q* r$ O! v( N
用表格概述如下:
* E- B- [/ ?) R7 I8 q/ h& {- c& _* O+ r" F3 c' r2 R
甲沉默(合作) 甲认罪(背叛)
4 _0 u! I! k m6 y5 j$ u乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ) O; A+ N$ I6 D' p5 v* C
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
3 _ {3 S9 ~ {+ E" S" ]6 v/ @ U5 { u7 C- a: e2 t
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 z! e9 S! D: ^ o* h: L- X. I
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 0 a4 C7 I; _! z5 O9 i; W
若对方沉默、背叛会让我获释,所以会选择背叛。
3 r2 ^- ~4 y8 `1 \ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 * l/ T" u2 e( F% Y/ [$ @* W3 N
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # H( M R9 L: A' C. i, X& a" m
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
$ q$ W( s& r# l1 a. ] 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; l3 F& S* J* u3 q( ~+ b: k% O1 C[编辑本段]二、智猪博弈理论, d, |* L/ p: O9 H+ C
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
8 T8 ?7 K' P% v; a. L, S 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . O; T/ j! V4 c4 O" U
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 `0 G! Q8 q) j+ K 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 . K8 d3 W M& S* o `. W0 q/ }9 |/ e
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
B5 \' M$ X" @ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; r4 I% y( P! e" l% e9 U- Q 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 |6 P. }( S1 b* H3 @
3 v( {/ x/ y; p1 L$ A& T! R: J% J三、关于企业价格策略( t) |& ]4 ]7 C# ~
4 A8 X& u: t/ }/ @2 r8 Z" _
# @) U6 U& H% a" b0 [ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 Q& N, y& v2 }
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 D2 s1 X8 u4 \" B7 T7 _ 以下三个定义:
, E6 Y7 A# ^5 N/ W0 K* q$ A+ k; @! @! S 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
) |5 ?, U: r- _9 i+ W. T 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 B$ g4 N9 |) ?5 V& ^9 }7 F' Q; W 所谓的双方优势策略则是指双方利益总和最大的策略。 ( i& K0 M: p8 h# s) G
[编辑本段]严格优势策略举例分析
2 R& f) B+ @ Z; {1 c) \0 r2 ?3 U. B 一、经典的囚徒困境 ) ~3 H: s" {. @- I/ P K, {6 H# w
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: ?5 a4 {9 Q/ v# B 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ U, x" j3 `$ Y1 x. z9 V 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 Z7 k5 c1 i. C/ f" \
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 o0 W" r4 T t0 L3 f9 d; u! e% ^: A 若二人都互相检举(互相“背叛”),则二人同样判监2年。
, o( e$ n/ d: [5 g% X) e : M5 M' L8 u2 F3 n# J3 z
用表格概述如下:& S0 w0 Y$ Q/ F" ?2 P$ P
/ i# Y! c9 d1 }/ | z
甲沉默(合作) 甲认罪(背叛) 2 j* s/ X7 p) e4 f% g! y% e
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 - B, B( `! |: M# K; ^
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ' S [5 N$ m! ?9 f
) _2 c$ T1 Q: `( v# n2 [
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, S: n* g" B5 y! I) @ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' F7 j5 P: g* c0 \ y$ J+ w' k
若对方沉默、背叛会让我获释,所以会选择背叛。 3 W! D" D' T' G+ R
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' Z- g% j9 |# S' s. E% u
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# \' t2 y8 b& y4 K# g$ O 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
$ v$ Z: F" d5 X/ ^2 w# j 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* P* y; X, C4 s! a[编辑本段]二、智猪博弈理论" t6 G E, w; ?9 ~! @
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 i2 }( M2 y" k. J8 Y6 a 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 Z2 ]8 w# X& a( l' ] 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 ~" {& \6 M5 ~, m& f) {
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! o6 h( k0 V. v9 A
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % |$ k7 k5 p* n) q, Z9 z! z# K
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 @: c: h0 C; S& u 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( o! I8 ?1 f# C+ d( i# n
' X; ~$ U3 j% k6 i三、关于企业价格策略
2 m2 X9 I* x$ R8 b2 N: Y( k, l% \6 k% ?+ g6 B
2 t0 }3 s. p$ y6 Y: ^ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ) H0 x; H$ {) A+ b
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |