老秘网_材夜思范文
标题:
人生有许多无耐
[打印本页]
作者:
lzqggg
时间:
2015-12-31 11:31
标题:
人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
7 ]; Z$ q+ R" D; ^$ d6 Y1 ]) U5 o
# o Y" [8 ?/ v% {0 f
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
9 @/ ^" k. d2 O% R; w0 U. Z
以下三个定义:
! c2 n0 P0 j9 X
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* U$ }( E8 t2 m/ o* x& g( {
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
/ A1 g. \9 \! L- e
所谓的双方优势策略则是指双方利益总和最大的策略。
7 O d* A+ V2 S; T2 n) h
[编辑本段]严格优势策略举例分析
+ W$ a9 p8 c2 n/ }) A7 H! W
一、经典的囚徒困境
6 j2 P% N" x; T, \/ W+ l# ?
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 j) N' e0 J2 A/ X. Z3 x' s
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; D: i8 Y; U* A J
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
+ | R; A3 h; g2 C' V3 ]6 o$ w8 y
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
" f; `8 f% Z P& F% y
若二人都互相检举(互相“背叛”),则二人同样判监2年。
& m! g& x/ a& @
7 N2 t* `% r1 g* \; G
用表格概述如下:
3 _5 N6 d- h; ]3 u% D
2 b* _* z! o( V, w7 C7 a) ?% l
甲沉默(合作) 甲认罪(背叛)
2 x3 V+ I$ N" E$ A$ g6 c. n5 Q( X
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
- T5 ]$ d- K' O4 Y, l. `
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
+ X" _5 C9 l! I4 k# t; H- K# Z( V% C( N3 c
0 W7 n& t0 W$ n% k; N
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
0 X7 Q% B8 C/ k1 ]; S
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
, b+ P& z7 z) {, K ]' l$ b3 R
若对方沉默、背叛会让我获释,所以会选择背叛。
4 l) y* R' a$ f
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 k. B: r* k& w* n/ L m
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, y& K5 A5 w: i7 D. }& ^
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 I4 l" s" W; X. R
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 M& ?, }, ^9 i. \8 D1 l
[编辑本段]二、智猪博弈理论
$ K7 L- S, P; N& ~
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ N/ J, G5 u' t( v3 t3 A
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
$ v" j0 p! @1 p, B' u1 k' U
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 }4 U* J( ^, k0 U
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 i! [. Y( X2 m
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% F0 R+ ~6 M+ f6 K
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
Y0 C3 J0 L! W8 W9 N2 H
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% y) [; l: o4 F; x" b* l
! X+ O" u0 T. n- u) c2 h+ g5 K
三、关于企业价格策略
3 A* {( P& C; A$ q, h
4 [. {/ _9 x/ {$ ?4 i
" N u; n& _9 I0 V( t; A% V
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* h$ Q8 m6 Z" Y N
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 e) k/ ^& p7 o& d* Z% W
以下三个定义:
2 g) S' Q4 ] X2 r K( Q
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* p6 n R$ M, n `6 p( h
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 f& w# Z3 m2 d5 g+ q" b
所谓的双方优势策略则是指双方利益总和最大的策略。
0 e6 h% Z. Y5 O' w4 B: t' O
[编辑本段]严格优势策略举例分析
6 J( `1 ]1 \3 V( b
一、经典的囚徒困境
4 e* i7 I9 S; [! ?! y/ ?0 P# u
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 L- @3 C6 K; z9 I" [+ F
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* E! B2 {2 j- q7 b4 W
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 `8 n! q) k1 Y; l
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 N6 l/ ?1 H( ^5 z- _" g
若二人都互相检举(互相“背叛”),则二人同样判监2年。
. `' [! f5 y4 S6 s* X0 o- {6 Z
" q1 |9 s' ~8 J# m: D
用表格概述如下:
7 n; F+ h$ l" S% o1 E2 _/ U
9 w$ l0 u0 r$ k# m/ N$ S
甲沉默(合作) 甲认罪(背叛)
$ W4 ?9 g Z5 n, k* G/ Z- n
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
1 B' V/ J' e7 j5 ?& @
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& ~2 c- x; m' ?. N
; D; d* u0 b; r6 M
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 u) C: o1 F6 P
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 f4 ~' G2 R' g8 M5 V. i+ R
若对方沉默、背叛会让我获释,所以会选择背叛。
. S3 ?9 D* f! B
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" q3 Y: B* d3 E2 M$ A( p# F
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ W3 H8 O) a4 l1 k9 j
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" m; a5 K' I+ h3 E
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 \8 A* K& C& M8 e
[编辑本段]二、智猪博弈理论
1 E- S9 r/ F1 v1 h: _
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; J5 u/ ~: o' p) J6 I- N
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( b, Y4 d Y8 [. e o) D
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# d3 e/ i! L+ d" L: L
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# P$ r/ w# F+ q* h7 w1 T
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 S$ u. W5 }1 M: W' Y
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( I4 O: V7 O2 D+ T' c/ T& P7 x
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: f( g- W# y! n, V+ W
. j* i2 d! Q% V7 t. R
三、关于企业价格策略
, w+ Y X8 x8 v; I* f1 X% B' |) \3 |
* e5 V4 o$ t: S8 \
" j, E: e r! F+ ]$ C4 v+ @+ Y
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
- d2 O; Z& C8 S* H2 x4 `% {& B" p
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- [. S0 }' l/ K+ `
以下三个定义:
! h: o( c% q) P, U/ z* r
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- V9 m8 M7 z& ~; C1 e
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; W7 h" j; P0 _+ {0 `; @) A7 t
所谓的双方优势策略则是指双方利益总和最大的策略。
( T7 O% y/ O8 z; [! Y4 w1 \) O
[编辑本段]严格优势策略举例分析
( B! |/ `! B( g$ U6 s a" D: q
一、经典的囚徒困境
! e4 O, A2 l" x8 x
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 B( O7 d- c8 b8 B
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 A1 k. J2 g0 C$ k
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 m* \2 Z. K+ L
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 Z2 M. |. I/ G1 ]/ ]) T
若二人都互相检举(互相“背叛”),则二人同样判监2年。
- Q8 [: ~6 F* h& m3 ]; n6 O
+ L& L$ G" O+ V' s- E0 W6 ?0 e) M/ m
用表格概述如下:
q- [! i" N0 }) ~
8 X3 [: W0 D& y# h
甲沉默(合作) 甲认罪(背叛)
+ g0 A: g% C8 T- \( P' f
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
( I1 j. u p& x3 x
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
1 u t- m( M, U1 n7 ?: W3 \
; z, E& a: G/ J1 I* z+ m4 j, o
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
N+ y5 g+ {8 Y
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 \. T$ j9 g. k# D$ O: \. s4 T$ M
若对方沉默、背叛会让我获释,所以会选择背叛。
) k% K! B2 A4 g0 ?
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 s8 j$ A1 r6 [' k5 z9 ~# `
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 p* G! U7 J& y& o$ g4 X$ ]6 T! A8 a
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" R% _9 G. P* @; k7 `
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 ^* r0 f9 a- Q$ ~/ C
[编辑本段]二、智猪博弈理论
9 U. p7 |/ [/ Y. t; n5 A" f
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 m3 p8 S2 _& N* U* Y( ]# g' w
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! {3 L& o. F9 a% U1 g) b
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 ]& P( g& ?3 S ^$ t; ^- r
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
j* Q& b8 o: L/ Y. h1 X
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# V' c( R# V s. t7 t, f+ D
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
6 P$ g X6 h0 `" `3 i2 j& G, H3 B# ]
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' a2 H% z" M w6 ]6 M' f$ q! \
' w. j0 W5 ~( S; a8 L2 O
三、关于企业价格策略
" R9 U) [$ q% ~
8 U% u) R0 \: U5 z; B% a( l( L. q
0 P' ]: M" L+ Z! V! y7 f& e8 h7 y$ e
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ C/ B( Y! V. x
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
8 I0 B1 @! J- I' u
以下三个定义:
$ v* K3 I5 e8 R1 q
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; i/ \# u& z- K6 v
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& d0 y# H c7 ?
所谓的双方优势策略则是指双方利益总和最大的策略。
# m& N$ H2 [7 w e9 w( x' A
[编辑本段]严格优势策略举例分析
0 B8 j1 N5 ]4 \: O6 K/ {3 U
一、经典的囚徒困境
# j5 D% \. e& y
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 _8 c: c$ v& R* j: b
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ K0 n3 q2 b0 L' `! n
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
. l4 n, K* t5 L5 ?
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ c' D/ V" `4 [8 _
若二人都互相检举(互相“背叛”),则二人同样判监2年。
# W8 a" B$ o$ @ S$ o2 a
* Z- l; i! `* u$ i5 Q* L1 M9 c( X
用表格概述如下:
. y5 ~! f) `3 X: S. w
$ @! _3 n1 Q/ B# Y, y- d
甲沉默(合作) 甲认罪(背叛)
% c; m& ?- O8 K1 s r
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
9 l3 J+ O. q$ M3 t; ]0 ^
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ q S9 ?9 b" ?
# j" N& K1 g- [ b8 X" V
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 h/ n$ x6 P' j, n
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
1 o& d. f' P7 I+ _3 Z8 L2 T. q% J
若对方沉默、背叛会让我获释,所以会选择背叛。
5 b( E! {% @/ e
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
+ R: `3 a1 _* u1 l/ T9 B5 Y2 v6 ~
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% G9 y; {4 Y4 J
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 r0 R5 e3 ?8 T' w; I+ p3 Q- l
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 r# a! O( _4 c0 b( Z' ?7 M( F
[编辑本段]二、智猪博弈理论
$ t: _3 J/ c8 _
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* t$ I% c# G% r+ m% W& L' M
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
, `& F! Z/ l0 {& P9 D% u" j' u# J
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 h: l3 N8 W4 c: k% V" P- w! M
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- ~1 r7 l" `" Y6 P
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% W9 g' m7 H1 X* G- ^- X$ r7 T( r
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: O% U: Z( I% s
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
. m, ]" G. t0 ~( H
+ g% ~6 E$ `- U
三、关于企业价格策略
7 U& Q# L/ E" F. C
9 Y3 _% w5 F7 I3 _
, M/ z* U3 M: u J
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% Z: [3 L+ a" w9 u
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
欢迎光临 老秘网_材夜思范文 (http://www.laomiw.com/)
Powered by Discuz! X3.4