老秘网_材夜思范文
标题:
人生有许多无耐
[打印本页]
作者:
lzqggg
时间:
2015-12-31 11:31
标题:
人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
% Z; d$ @/ [/ S" M" Q5 h# P% L8 d
/ N$ _5 [5 ~; O! M+ S& A
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
/ V$ p- \9 l& f1 `- ^
以下三个定义:
+ D9 |# L, h) H8 h4 l* o- T: Z
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 _4 s6 c# `" S3 f+ e
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ \6 r; I6 u' w+ y
所谓的双方优势策略则是指双方利益总和最大的策略。
- `! O+ F7 a P! W+ y) l1 |
[编辑本段]严格优势策略举例分析
6 _5 d4 ~! x6 c/ O! g s
一、经典的囚徒困境
1 u6 _ [6 C5 T) T9 g
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
# G) s7 z) `9 k" }3 n
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( c# h% N! X* m
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
- U k& @ [8 G! s! ]% _
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
. Z: H \% N5 H
若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 K$ n/ [. M5 U
$ _6 ]' z3 K5 ^- K
用表格概述如下:
# c/ j$ D0 S" v
( o& F+ U+ J1 o3 ^% r% `
甲沉默(合作) 甲认罪(背叛)
* u+ c" q6 _# G! X" w6 g& k
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
* `0 @% @; @/ N# j
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 q( Y. r) x* }' k' L% g2 k* S
5 W& k0 i6 x; R% T6 J
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( k$ G! ^, A2 v5 P1 E1 j/ Y
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" ` D& t8 ?9 Y7 t5 u6 K
若对方沉默、背叛会让我获释,所以会选择背叛。
; V$ C; p; ?/ ~2 X; h( R; i/ t
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, S4 s5 ?& q6 [, J! S
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& U8 C/ k8 Z% N) s
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 \+ d4 B! W, `* y6 m/ Q
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 Q2 h& r: q1 D( I8 q1 z
[编辑本段]二、智猪博弈理论
$ y. b$ ?5 Q0 v$ o7 y+ u M- e: [
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. _. y5 O, Z2 ?) G8 G0 c4 R
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
$ N$ e/ D/ Y, J7 W ]' M* V- _
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' _& ~: f K) Q0 E. l$ h" u5 v% u1 C
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, O6 q8 x4 e3 ]1 f+ i
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 I8 V9 ~* r# t- q# A7 [4 j
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( |- p0 P) ]# u* Z5 i0 }
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% y" P |/ x' e! X- |' R( v
% L$ g Y* `, _* }
三、关于企业价格策略
9 K: r$ C7 O' F: {* I2 y
' W8 w6 q5 o+ h7 a, Y
6 g9 E6 l$ o% t. e0 R1 H
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: v. F- G' g# K/ t6 ?1 ]6 j* Z
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& q7 m' q9 y/ p( m) H0 k( {: [! P
以下三个定义:
0 R) ?8 V% V& e- p: j; V# j
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
: D/ s: l% Y9 `! P# e
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 c0 I n' {9 w' m& n
所谓的双方优势策略则是指双方利益总和最大的策略。
) ]6 e: N, x5 ?8 t) x" t n& H
[编辑本段]严格优势策略举例分析
: R- G# k5 S9 z7 u0 k+ V8 {
一、经典的囚徒困境
1 G3 _5 q! `3 o& p- E8 q6 [
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
& c3 P( M% @# O( e; N5 j4 X0 X- M
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: \6 U/ I) U6 d
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 a4 u+ r( n* O% m. X) U8 i2 t5 ^
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# R7 \% N5 z8 V; h+ B# Q b
若二人都互相检举(互相“背叛”),则二人同样判监2年。
. B& c! `" U. [+ v
@9 s9 \2 F% y# X W1 \- q
用表格概述如下:
4 _1 J2 R/ U X
1 `1 H# Z! g* R2 r
甲沉默(合作) 甲认罪(背叛)
' w7 i! q% ~' u' J$ q2 y
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
' w9 N p6 R0 @8 n9 P9 P$ f
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
5 Z. I+ B1 _: w
0 V% _+ L9 }2 a
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 Q9 j4 Z5 C- [- E: E
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
2 W+ [9 o7 {8 u" b
若对方沉默、背叛会让我获释,所以会选择背叛。
, e8 T0 ~& j. T% Z4 @( n
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- o) m2 m# G0 L# r
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ H* I3 L7 D1 A% B8 J
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 G& r; }! M4 a3 ~9 J
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
! h4 l6 t/ U) h# x K
[编辑本段]二、智猪博弈理论
7 n- Z0 a" K' w" T
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( a# I! Q p( K6 B: a) `
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
' v" R9 {$ o/ S, p! E$ f
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 i! i' m- a; y% U, m2 f: ~) E
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; v9 J- I. I" z0 P0 o& W
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* T% z9 X$ j# ]. T$ o2 C8 i; H
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 J7 ^% N8 {7 F% T) ^$ X" Z6 \+ l
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 `- T1 ?3 `9 k& x4 E1 v
1 }! L7 `3 r" B7 b1 O! ^
三、关于企业价格策略
) W0 t+ l5 J# K
+ \+ C4 e, W% ~3 _, ]* ]0 P. I) D3 J
; ]" z ]6 O; _5 o J8 @- C
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, D6 U$ x# a1 X' e( p v* P
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 u" K4 t! J+ \4 V5 d. c
以下三个定义:
& D; [0 a2 X5 V+ U
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; w0 j+ s4 [/ _# Z
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 n" b* u# X' M/ |: L6 d
所谓的双方优势策略则是指双方利益总和最大的策略。
; l- P4 C8 Q* z$ K& F) k/ u/ c; V
[编辑本段]严格优势策略举例分析
; u: {. T3 Z) o
一、经典的囚徒困境
7 n' ^7 s! _, S' P- H, X% h; k
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! h+ w) o% j2 h
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, v; O6 i7 g7 M0 d' o$ V
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 y% R( q7 f* Z
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
8 B9 q! l4 ?3 ^
若二人都互相检举(互相“背叛”),则二人同样判监2年。
: ?7 v0 ]( r8 F# _, z2 e: s5 a+ I/ Y
" V* p+ q8 s1 g1 W0 L
用表格概述如下:
, m5 y$ a1 x! }% @( k
: ] o- I: l4 S' I% X: ]
甲沉默(合作) 甲认罪(背叛)
- ^8 X' b! F& _; ?' _' V! I2 f& J
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
2 F/ d& i) O; T& t
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
, ^/ b. j/ V8 a$ u, k$ a
7 r- y" `0 X* ]- t. |6 X6 e* q* Z
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 m- U7 `4 Y% [
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: B9 t/ n0 Z. [/ v8 h$ r
若对方沉默、背叛会让我获释,所以会选择背叛。
6 [5 P \/ H2 w7 w8 X8 K0 X& E
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
4 `8 K3 J, X; P% r1 y
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 I8 t/ `$ V* Z% c: _9 Z& Z6 N: T
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* J0 g5 N n. t% ~6 Z
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
) n" G) S. }. P/ s) i
[编辑本段]二、智猪博弈理论
% V5 I8 E2 d7 E1 h; f- w8 v% R
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 g b4 H( W8 a, x1 Z4 f
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
L% H2 w0 g3 m" R3 o7 h" r I/ t! L
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; i4 F, e: n& R
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- T9 K& N6 ~" j& E; D) U
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ ?& {# ?3 S5 s1 ~
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. {# }- w& {3 @( `
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
) D( `2 y4 S* v3 U' D$ ^
3 l3 D& U& N) C9 x
三、关于企业价格策略
1 R! M, ]: s1 Y1 o# X
$ o7 b/ c! `4 f3 b2 [
8 K) Y* H1 y7 ]) k) P
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. c0 t5 U- z* Y$ f: Q! l/ }' v7 @
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 A$ @3 H) h: }0 Z' |; f
以下三个定义:
' r7 v! _: K' d& ~8 ^
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* J* N( T, o8 e$ n7 {9 o
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* k2 Z0 a6 \6 X0 @6 v; {
所谓的双方优势策略则是指双方利益总和最大的策略。
! c' w. W3 ~7 f3 l+ t8 `
[编辑本段]严格优势策略举例分析
! G# Y0 j" B q+ o$ p& r
一、经典的囚徒困境
: i' M' [7 ]; O: ^9 g6 F
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 A. z8 B9 Y2 J; |- q6 K& U
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 o* [+ Z) G% O; B' ]* N! p" n6 S
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( s; M2 \8 G% j$ Y r5 t
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# U( @7 j9 R' B6 S- p3 g6 c
若二人都互相检举(互相“背叛”),则二人同样判监2年。
) L5 y8 j4 ]& L4 o
4 ^- K$ n/ @1 h% J. v- @0 S/ K- l
用表格概述如下:
3 e5 G. z% S; @
0 @/ b/ c. c. E1 X1 H0 n p
甲沉默(合作) 甲认罪(背叛)
, e. u5 _7 `( x! _, J
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
$ `/ l. j& [6 L- I+ \
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
" F* q0 f% G. O5 a
4 r! A: A& u9 `5 S' {
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
6 P9 _7 q0 I4 Z7 G& u. J. T/ v( p
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ I* ^; Q9 w4 @7 A9 Y
若对方沉默、背叛会让我获释,所以会选择背叛。
7 M4 l5 t r' ~
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
% L$ K5 u0 p7 e
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 M. } S, U& n4 K" r: {) K' |, T8 h
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
: U# O+ ` E8 C+ m
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 c4 v" l. A: @: A/ ^' Z* M O
[编辑本段]二、智猪博弈理论
9 g: z' t7 K7 f9 i' x" g" n( B- s5 \
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 w% ]/ B: p5 X( r. F0 C# z4 W
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 f3 P$ ^2 H! `. i% k: t4 [
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% M/ X$ ^( A- V, x
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" }2 r. V8 v9 W5 O5 I5 l, g/ F
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 e6 S- M# \0 Y1 j1 m3 }, v$ I7 c( s! K
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
# s; h( V/ V3 C, I, q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
. F! _7 c: L1 h3 E; M* y1 D
Q- @9 g! }4 z6 S( R; R
三、关于企业价格策略
& N; H( c2 ^( Y- N
3 `0 z7 ^5 ?+ z2 |
* |' ~) O& v. M: E v# t
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" r0 Y; C7 k* a5 [6 ^; {- z5 s
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
欢迎光临 老秘网_材夜思范文 (http://www.laomiw.com/)
Powered by Discuz! X3.4