老秘网_材夜思范文
标题:
人生有许多无耐
[打印本页]
作者:
lzqggg
时间:
2015-12-31 11:31
标题:
人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
! V3 s- j- a0 k* `9 z8 w! J
! [% B# N$ k" A! {! N: o
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: s* p% m5 E" H& ]$ {
以下三个定义:
5 ?6 r% J7 I0 i; z! i1 i
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 E$ T" a) Q$ @1 A6 X, N+ k- q
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% c+ s3 b. c7 q, W$ S: I k! z
所谓的双方优势策略则是指双方利益总和最大的策略。
2 M& K$ [' Y- E- s; l
[编辑本段]严格优势策略举例分析
8 ]5 A- ^7 A( R+ @$ |
一、经典的囚徒困境
% _/ i" x+ P ~, F s. |
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 ]6 H/ L: b! y" W- J+ {0 H: x W
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ U$ O+ o/ f& U! ?/ Y1 c
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
/ b! V6 ?" ~+ x5 F3 ~6 W
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
" d! D8 S! f: l4 ~9 o
若二人都互相检举(互相“背叛”),则二人同样判监2年。
: p" z. S5 G9 d$ g+ b7 l4 Y/ a
' E/ \0 y3 p. n+ C; h
用表格概述如下:
2 s' U ~( |& h% k7 D8 [4 L0 B
5 w/ R/ ~! v) `" B
甲沉默(合作) 甲认罪(背叛)
" C( h9 K1 L5 }* F; U
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
7 h5 C' c( u/ e0 d3 T
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
9 P# J5 G+ L- g/ e+ U& p/ @( N' e& i
4 ~( h2 l" g& f" B$ k6 l7 q
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 A) X$ }0 y0 J+ [
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ p6 _( P* x( J0 p
若对方沉默、背叛会让我获释,所以会选择背叛。
G. ^2 g& J( F4 ?( z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 t/ X; H2 v! O. L+ y9 I: ^
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 B) T1 `. }3 y, ~: S
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 O s9 l i: `' K' N" ]# b w
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 }7 W6 N+ b+ }$ Z, { G" n
[编辑本段]二、智猪博弈理论
# d, d5 \8 H8 w& G9 v
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
D2 n; s1 L" e! c+ K2 g
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& e+ V$ v c: h
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 Y! C' B- o. a
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 G! |- J9 ?# F, G% v, z; t
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 r: _1 b2 P" M+ y) F
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 X, o: S6 y4 h) V4 [2 d' F
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
( H$ M) Q0 g. j2 O1 G' T
: c3 F& y( X2 w, o, K' J
三、关于企业价格策略
( k8 i* d4 d. Q+ ]2 X& I) o' {+ ]
! p7 U# W f& Z
! x& q6 G$ ?6 O. z! v+ `& c$ I
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
|1 G+ \4 q# ?- q) B
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ o M2 h) k, g
以下三个定义:
6 L6 c4 p( y3 X) b# o1 V
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( e" |) e8 C' K2 C* ?* V
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
/ c! ]/ m! c5 Q# X3 H
所谓的双方优势策略则是指双方利益总和最大的策略。
8 j* e) x% S/ z4 T
[编辑本段]严格优势策略举例分析
) z+ N' e2 _' y# D+ w
一、经典的囚徒困境
1 _- H$ P5 d8 z6 I
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 M7 t+ r. O4 A" r' r& V X4 J$ `
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
- A) x; o$ p3 U8 F7 i. v
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* i# F) P; X' w+ B: E
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# m* @( f) o6 Y& f3 Z$ W
若二人都互相检举(互相“背叛”),则二人同样判监2年。
( \/ N- n `1 Z3 k1 C% M8 M0 f
/ e o7 P4 E/ Z3 ^/ r" w" P
用表格概述如下:
# t' o: V' y9 |
% e. W4 y$ ~5 F1 F3 A1 `
甲沉默(合作) 甲认罪(背叛)
! ^% o8 t$ Y; _9 f
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
: A# {! L0 G2 _! P! k2 n& B- @
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
9 l b3 Z+ h: c
: w. a. j5 } C
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ f( r" `" g& ?, r1 \
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
. I* u; E+ g- V2 S) u0 I
若对方沉默、背叛会让我获释,所以会选择背叛。
+ W$ X4 @. Y5 l% d/ Y& f" {: f9 h- \
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; U M7 r3 ~1 D" d% Y
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* @+ L# _, Y7 A2 y
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 y( r) f/ W1 I
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 S: y$ r. y9 D8 h# u' A! m
[编辑本段]二、智猪博弈理论
' U/ O( m6 J. ]! _
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
?) T' a! G G- N8 U
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! L" [ t+ M! @% \; {) P
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' o& [% S. J2 x, b- y
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 x: M! J. x8 q4 Z+ o
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
4 O% H0 r3 ] P+ n8 _( [" I
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 X) o2 o$ ~3 P- K
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
- ?3 m; P1 [$ L5 R$ I; k
0 T5 R' A: ^6 T/ g9 w/ L
三、关于企业价格策略
3 r* i' p( s5 U1 T. ^0 d
+ A; E9 N& r- @) M8 |+ f
6 j" i* C" V4 |% g5 _
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
C$ o* Y1 O" a! a- E) p. V9 @. f% l
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' x1 y2 Q( `8 g& k
以下三个定义:
# l0 u( P7 [: N1 v2 D$ |% {
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' G+ k. Z7 X- q8 n4 b
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
$ k+ N0 {3 m7 u3 t/ G- ]
所谓的双方优势策略则是指双方利益总和最大的策略。
+ W& H5 Q, l) ]4 B+ ^
[编辑本段]严格优势策略举例分析
+ r E5 D& W/ e' }& E
一、经典的囚徒困境
, B+ c" A7 Y0 ^
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. h P) E9 `' g" Y6 \. I
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 M; E- n6 q9 w$ \. g. c
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
5 ]9 f3 W q! b, |! U# e
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
s+ C5 a4 r2 v
若二人都互相检举(互相“背叛”),则二人同样判监2年。
' q# J% Y) `7 ?% N
$ u% H2 W& d" O/ y: t) t
用表格概述如下:
6 D9 x" M; ^& G
& Z7 Y3 `. t M2 S1 i8 i
甲沉默(合作) 甲认罪(背叛)
, c% _9 ^5 J9 ?* B" ^2 n
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
: \6 t+ R$ n- Z
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
5 A' ^. R0 L0 b9 o5 T1 Q- a5 a
; w. p% h1 n$ Y$ t
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
! J3 M& A/ B+ J- I2 S
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 c. u! ?! |- `" U4 b: U1 @7 u; I
若对方沉默、背叛会让我获释,所以会选择背叛。
' f3 ~8 u5 q" \% {& i
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ ?3 Q3 }! ?+ s1 r
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" f0 Y9 h; T b2 L: e. r* c
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; H, t9 e# m! J5 _1 ]7 b+ {
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 [& C: r' ~/ k) W; I
[编辑本段]二、智猪博弈理论
6 p/ P- J/ j- S6 X# f
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
`9 m$ P. z& x) Y! p+ }
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
" ?/ q, u4 n4 I# j
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- C6 s( g) Z) b& A! ~' }3 S
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
$ ^% c5 ]( y6 ]2 v" p1 c
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
. p( l" G* X* o$ R
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ ~- x. e0 }* O3 n) Z! g" D& f) W
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* W- z7 o2 z% K8 \; J
! h/ f( K* v$ A
三、关于企业价格策略
- y- W) E0 Y4 v9 H
" d. G' a+ y9 k! L& j/ x D
: o0 C0 v4 V$ O% i' m, ]5 F
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& m. g0 {# e1 f7 X, m; _
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- K3 b/ H, i6 V6 M" v' [) ^8 p
以下三个定义:
. B1 V( g9 d8 g/ h9 z3 \
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 r9 \+ L9 o. n8 P- {% L( S4 C
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
" Y9 r& U! ]% {* ~# r8 s
所谓的双方优势策略则是指双方利益总和最大的策略。
9 q7 I2 S+ d# ~' @" [0 l# O {
[编辑本段]严格优势策略举例分析
/ a+ Y* Q- i2 C1 `
一、经典的囚徒困境
+ w N2 I7 ~8 \- X# W# C# X
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 i. m) F# ?: a
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 F; {$ n3 F5 F% }2 B, I+ H+ A& m
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 F" \* m) X9 b( J
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 {3 ?( E- R8 O" G8 }+ K9 m
若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 N# ^* V! R. @1 J
( o9 n+ I. J- I. A6 G. e1 _4 E
用表格概述如下:
' D1 Y: m/ @$ J# K/ I
# W" i) f' U( G
甲沉默(合作) 甲认罪(背叛)
. A. _0 S: a- y* C( [
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! Q; U6 {' F u- _" |
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
* y3 r* `/ }: y: c# ]
1 Z/ d& W$ l5 s0 Q) u6 u9 i
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: f" _( |4 Y% o% S' F3 J7 M
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 B, ]! H$ }2 j/ E; B/ g
若对方沉默、背叛会让我获释,所以会选择背叛。
8 F/ Z( A: L3 B. I
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( g& q: K- _" S- E" d4 ?
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& L% W [: K0 V5 I
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
, D- `, @5 f( j$ Z
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% }5 T3 i! Y, Q) \ ^$ y
[编辑本段]二、智猪博弈理论
% V2 @. E: P5 g' M3 |2 \
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 J" o! a& f) d
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- f$ W6 G, n$ S& ?# m }
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; {: l: j. _9 A# r2 d+ v- Z; [
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 S* m; ^8 D% ^
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
4 t" X$ }, B0 N8 u& f$ t
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ w: N' I" T0 L7 n% E2 O
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: e6 r' p2 H G& f$ \: z
# H2 ?( l% E$ ]' b/ e. M4 A
三、关于企业价格策略
2 j/ z! D* |4 U/ }9 o' \9 K% [
( z( C! u; [% v
. O `6 L/ h: h7 m% }" r- p5 w' {
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* D4 l2 i& [, o$ N+ z- U
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
欢迎光临 老秘网_材夜思范文 (https://www.laomiw.com/)
Powered by Discuz! X3.4