本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
2 q- B$ e9 Q$ H1 D' Q! h% A/ k/ o4 m9 v9 t7 m U- t4 B
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 X9 l' q8 {* K( t5 _ 以下三个定义:. x3 t% Z! t: ^% @ S. y! c
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 r& N# y- r6 q7 O U7 A8 m. I 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! I! _$ G6 r0 V 所谓的双方优势策略则是指双方利益总和最大的策略。 : Y9 _. u5 e: b0 e( L k7 X
[编辑本段]严格优势策略举例分析 Y. l1 b- K e' Q
一、经典的囚徒困境
9 F' ?3 M9 `/ L( E 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / I; c" n" ^6 R
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : q0 X, j6 N2 Q4 f4 F
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 R4 Q8 h3 {; F
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 m$ U- j: a' V1 p3 H5 a, _1 P 若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 h6 a, n- F- q+ o
" O, H0 h% s1 {) m; Z, d: ]" v用表格概述如下:( P" n' _4 g) j e# D
' j: }, ]# g, r: v! N+ o 甲沉默(合作) 甲认罪(背叛)
; @8 i" `4 k6 H4 Q+ m) }乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% l: o9 Z. ~4 M$ e9 b乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& i( n3 a0 k& W' Y4 `- z3 r* h
' a& i; S& n& u( {" | 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 x% V( {: p# o2 b. m. S
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ B! v! m6 Q; D" x i 若对方沉默、背叛会让我获释,所以会选择背叛。 : z6 w* V. q. k6 c; p
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; L9 `/ S5 D Y `3 D% U6 i
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 " U0 B2 K c @
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: n: ^- G2 N0 T. i3 [. ? 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 f1 m/ b+ f' [/ v% A
[编辑本段]二、智猪博弈理论
& ], C/ h' ?7 o* J 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 z2 Y2 }/ s6 B9 M' N& f
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( v4 o( ?7 Z. S0 E 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! Z) n4 U* k1 R+ s" W" Y. X$ z2 Y 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ v! R4 n4 _; R8 q" F! L* I" y “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( g3 O& N3 Q; O+ O. U- r. z2 x 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ X- C% U( _, V 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
7 |/ j6 l. `2 B, e) _
! Q8 c1 V. T& |三、关于企业价格策略1 u; i N$ \! p( S$ y
: O( X2 N3 W' `4 F/ n7 s$ G 5 x0 ^3 }7 A& m' M8 X9 _1 E
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % m& _; A% _ R* i% T
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);# Z5 {0 F! j5 T3 `& {+ I0 s
以下三个定义:9 d$ ^. c- ~( l1 ^! m( f
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* Y* A" I. H9 R# m& u w 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; W3 N2 g5 c8 S0 b3 Y 所谓的双方优势策略则是指双方利益总和最大的策略。
% a. T$ Z2 Y9 O" N( g[编辑本段]严格优势策略举例分析( J! L0 J! d9 V, y) g
一、经典的囚徒困境 2 H- W$ W: c) ]9 g" v
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 |- u, A4 ~' G. J" t/ C; r 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% A/ e- P" a* B$ W) |+ [: O: P 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( X+ M. u- v" l/ L$ n
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & V& `/ t5 s2 J4 }9 x# @1 c
若二人都互相检举(互相“背叛”),则二人同样判监2年。/ |2 w* o, ? W" T
) @: v) D' \- u# `0 N
用表格概述如下:
; h7 ~8 r: J# i" `0 E$ j* m2 w2 E* f* A" D
甲沉默(合作) 甲认罪(背叛) ) t+ c* U4 X( C" D) r
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 * }) a. w" m& k: N# E
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ; x" q! J c: b' E) R, N; Y
3 g& y- n: t W# h$ Z8 z' i
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % C) G! o& G: l, e8 z& n
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; R9 M' h: C& r4 B: k
若对方沉默、背叛会让我获释,所以会选择背叛。 : n, J, C& z: n/ _5 j4 H
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 1 I6 e& W! e6 d7 O: f
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
/ U2 P8 c4 ~( n }' A 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ' s: g7 z$ i" C4 e/ \+ N6 ]
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。$ Q+ T' a5 x: w
[编辑本段]二、智猪博弈理论
- r6 K- c: @4 I 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
! C( G" I1 ^% G" ~; W4 D2 I! h 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 d0 v+ K* p3 ?4 B( j! C
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ m, Q E4 H+ s 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
/ V! B4 ~* L5 s6 D# k/ p8 _- } “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% T5 _$ R6 n1 R 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 `% q4 f. V, r* ?5 ` 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, }8 k* m- Y5 s; Y$ }' k3 S3 u) ^ % W5 r: Z" J% A8 l! y
三、关于企业价格策略
; l0 @- I/ W! L% t- S
8 b1 S7 J. V! {
* S' ^' W8 d/ ~% c 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( r) q5 [ w8 n* P! c; I; e
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 \3 |+ C# D$ q0 f 以下三个定义:
# ]' [9 h5 s# k6 o$ Z$ g. g) S- ` 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ P8 }. u" h4 d& D
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 3 F9 U0 W! R% [; r8 z$ J
所谓的双方优势策略则是指双方利益总和最大的策略。
8 C8 p9 K7 ~8 g" p% }3 i[编辑本段]严格优势策略举例分析
7 d( a; @' h5 }; h: y R. c+ x5 q$ A; \; c 一、经典的囚徒困境 - {- a+ N4 k# M1 A: o
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: p6 S0 G% [' M 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; t( R; R& G: J* L
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( L6 D' T. r# |- J% c# @ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 @8 O# c. C& _4 q) \4 [
若二人都互相检举(互相“背叛”),则二人同样判监2年。" z) P0 ?! b- P2 K% k6 |
7 N4 }0 F" r' n/ S用表格概述如下:
' i5 \+ {) J( {8 j) z" P+ n
% [2 s h" P+ q/ S9 B 甲沉默(合作) 甲认罪(背叛) A1 e+ A0 E# Z6 _6 o" o" d3 V) f1 b
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
/ ?% j9 O4 L! a% E5 n% S乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
# J+ o4 ]: G4 k& m) L( m& W
7 h; f/ \2 t; A6 a' \ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 k* u) h- ~+ S+ E. T: ~) u
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 A R: J# l' ?. j& K; I' N 若对方沉默、背叛会让我获释,所以会选择背叛。 Z$ _1 F9 I) L4 F% M
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
/ E- l7 A. g$ V, ]1 V& J9 W4 u 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! x7 i8 z+ {1 ^8 F s8 R- u6 z 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : {% P6 j3 L) s" U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
3 d1 `: {& g p! n) i8 z. H[编辑本段]二、智猪博弈理论
Q. Y' K6 F3 g8 B 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " A+ W( G; R7 C% E+ q
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 9 T0 q# F3 Q% o6 t% c* l
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 P) N6 K0 r$ r7 X6 T" K. q' B- d
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" b. h7 T1 x$ t& |% { “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 @6 ]4 q* u6 P# m9 L+ J 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 / A9 ~0 Q* n/ K9 I7 v: e* ?0 D
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 Y- y: m" v; J: s) Z2 n
6 i, }! N' D6 Q三、关于企业价格策略1 `8 B) j' J9 X m/ |( X7 S, I
( r! _# ?, o" c! l$ q6 ]4 c, n
n8 e" `: g. X- S 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 a S+ }' v' W) {4 _: o: V* a
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' b. a) |3 O# x0 {+ J* }+ j7 | 以下三个定义:" [$ O! [$ r R1 Q: N
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & D4 w7 r! e2 J. O& N: b# q
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 l7 v: U8 }( q 所谓的双方优势策略则是指双方利益总和最大的策略。 + Z- p b6 r/ J+ P/ t A
[编辑本段]严格优势策略举例分析
$ W9 I/ R# {5 g' J 一、经典的囚徒困境 / {4 Q/ M7 r" X( Z5 O
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
% s" V5 N/ q. z7 Q 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& _4 z0 T2 O, \/ i 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / R* x6 u. W; J% ?
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 L5 \! b* ]- p2 z8 X0 o: v* _
若二人都互相检举(互相“背叛”),则二人同样判监2年。
b( R O! e$ S
! k; [; p* u. v% s# E用表格概述如下:
3 u# ^: n4 q) z4 k/ O
0 y, ^2 p* ]- b' }& U7 X$ T 甲沉默(合作) 甲认罪(背叛)
9 F% T, T& \' b7 F. F7 p/ X" V1 p& x乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
& |. _$ Y" ?8 ]% o- x' u乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
( s! L* O5 a& F. L7 Q1 V5 d; n# N
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# P; Q* G4 Q4 Q @ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; `" B( k, x4 O! W& [: X1 X 若对方沉默、背叛会让我获释,所以会选择背叛。
0 V' v, t$ } U2 z7 H$ [ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 0 Z0 O. m+ k. F8 w# v% Z
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- c0 h- e9 D$ U' g7 q! B 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 7 @: r- m" R0 S7 Z1 M5 P4 A
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" J' u& k. e N! K% J8 D& G
[编辑本段]二、智猪博弈理论; T X. B5 E. j' P
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 b8 P3 o9 Z* _ U7 z9 Y
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( w* [4 A5 _3 ^6 @1 B) T
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( v& x; ?3 S4 O
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 G# ^& [; M, {3 n) H8 z. S
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) r O. V1 p% S9 u+ D" b, K
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 7 J' E% X, D3 C' S2 C; D* W
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 F! f0 V" L' V6 w5 Y" d
, Y; u( Q& V# |: Q- I4 A$ p$ P三、关于企业价格策略
6 a4 X/ I; H) a7 x2 t2 R9 e7 H a J3 K
* h+ N8 q* ~$ L9 |4 m
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: R3 G6 h- j- {" r8 | 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |