关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
! P" L! U# p# B( z$ Z- u  Y( q& y2 e! M( t+ Y
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);  y& J0 F0 T6 }/ W
  以下三个定义:
8 S9 P3 B$ k0 ^  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& f+ \# @6 \9 r3 I+ b2 e  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
$ x' A/ x+ h1 k; c- N5 B0 [& C  所谓的双方优势策略则是指双方利益总和最大的策略。  * y/ h$ O" e/ H# M. O
[编辑本段]严格优势策略举例分析: b  l8 z* s. c# A6 Z$ X
  一、经典的囚徒困境
" \. ~$ ~* W$ i8 T( u" ]. w" X  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + c# G5 P; B1 Y( H
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: * a3 r* R1 s# y6 s
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ d  W( H% u  z  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 - [1 s) J, v9 {. d; \7 T
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 }6 v8 U7 B- M. C1 F# z  3 R6 M8 t' d8 h9 v3 F  L3 V
用表格概述如下:( _. M. z: u9 s9 J+ W) z
6 S+ Z9 P4 G* j! e- s" G! M+ h
    甲沉默(合作)  甲认罪(背叛)  , |4 O& U/ \1 x  @( {
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; Y7 K. ^. F% P; ~! l8 S
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ) M& r: z3 J8 _. H  O

! i) V7 p, e% M/ l7 Q  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。   c6 m, n. s7 B2 w4 |- c
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 q! U1 C" r; B1 Q5 w. \  若对方沉默、背叛会让我获释,所以会选择背叛。 ; r, T6 I, u; Y; w( A
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 T) x- l- g: q4 ?6 ~$ s  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# g. f7 I2 y5 `  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 & P/ V# Y3 q! v' p: }
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 t0 J# X2 v1 e. j  n$ m' ~[编辑本段]二、智猪博弈理论
: |6 A* c6 Q, m2 ~; H  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# C! J1 M# }+ g# C! X1 N  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& Y6 r) @7 U2 I- \; z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - e) Z. \1 M3 N+ ~
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' h9 }( R; c/ h( `" E2 X: E
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 W! J; V" F7 B: y7 K4 h  S
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + [. Z8 A5 M7 l  l1 o! f- p
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
6 O4 m% j. q2 ^/ A$ _, R  \  ) E; G4 |1 Q8 ~* u; f# v2 ?
三、关于企业价格策略
' ?0 O" C4 @/ c1 x" p/ q" x5 F9 h, K# {7 j# u' T2 ~9 ]! a' u9 }- c
  
5 Z" n0 h: d6 W+ q) a1 e5 I  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( Z! y- F" A2 G
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 S1 V. h& ^+ Y1 R8 W2 M  以下三个定义:
: G  R6 D6 L6 k* @( W* Z$ |  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. @- X* P- W2 A2 N, Y, X  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 D9 @( D1 s1 I- [+ i  o
  所谓的双方优势策略则是指双方利益总和最大的策略。  
1 j9 g( P- T3 v8 J[编辑本段]严格优势策略举例分析
. ?" y5 P: O; j1 ~  一、经典的囚徒困境 9 Z2 {/ Q+ A7 _# S4 z( o
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 W% q$ z! I6 v+ O+ X+ k/ ~  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 ~3 p9 @6 q. G7 U: e
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ; G4 S: ?# g  R# \
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ Z% Z( h) ?* k: l; k  若二人都互相检举(互相“背叛”),则二人同样判监2年。
! @- ~- x4 R! z. |9 d+ q  
! m7 N4 _* v! d+ ]/ e用表格概述如下:
' n# ^) B1 E3 J+ ^  X5 F( A- d* L" t: R5 X4 e
    甲沉默(合作)  甲认罪(背叛)  
: w9 [+ B0 Q2 |5 k- @' a乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ' A* @: V3 [% C
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  1 [6 `- h7 g/ C$ _& c8 R& A, K9 U

# [; W* u6 a1 O$ d) q  Z  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ ?3 l. w+ r1 G! b
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 [/ M# t; Y% [* M) F
  若对方沉默、背叛会让我获释,所以会选择背叛。 $ v! ?; x; H" \
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 v! ?: I, R/ J; M$ Q  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 Y) d+ ]) j% v% D
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 c* ?: w. c/ L$ J* o  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 j- I. Z; w; f2 M  d[编辑本段]二、智猪博弈理论
0 ?3 i3 V6 o/ t  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 b( u" I6 S/ J' ^- d- [! W
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) p9 r: q# Y7 w6 g9 g
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 }' X# c2 h. e1 Z" o8 }: H  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' c5 v+ p- c1 g; t! ?  r  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + u" H' Q" J, A6 J1 i8 m
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
7 K$ C" A* Z% X  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ O$ l# B0 t& w/ A/ ^( f  / C$ H, R5 h% o8 B, \% v$ Y
三、关于企业价格策略
9 v" m% Z4 {$ U+ N8 ^1 M! k6 _& G+ V# x; ~. l, [# h
  8 E9 h, B, S& y% L1 ~+ P
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 Q3 l( N+ c9 Q: I" }$ V! j4 x  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);- Y: B, F! S: X! `
  以下三个定义:
/ t' p$ Z; d% l( l( P  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 g8 i% o- {, h5 Q$ x8 C# v" o
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 r9 X& i( }% V  所谓的双方优势策略则是指双方利益总和最大的策略。  
: y9 u7 r/ z- E0 U, K1 y1 L[编辑本段]严格优势策略举例分析
: L8 K4 H4 s0 N5 L  一、经典的囚徒困境 ( }7 \  N% w. G# u3 X: C
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:   s% o) y4 a1 ]: D
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 C$ O5 d% l5 r( d8 q: B  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ; N: j- h- O) j
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 m/ ?1 h; e5 G) u/ E. A  若二人都互相检举(互相“背叛”),则二人同样判监2年。: [" H- M! k/ Q7 U7 L
  6 V* P8 q4 d: N# N% _1 I2 f
用表格概述如下:$ v6 r; A3 |. R; L) f: Y

% V# Y: R8 ]9 _2 ^6 E    甲沉默(合作)  甲认罪(背叛)  
$ s3 ]/ G' }, B. g) y3 ~$ P- S乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
2 X6 v: H) O# v/ V& C0 A乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
- ]- _: i3 n% @: m
7 `+ I$ C' m! k  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 7 J8 ?1 S8 w& w$ t$ D
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * q% |5 J8 ~7 w5 J4 I) C9 _
  若对方沉默、背叛会让我获释,所以会选择背叛。 ; y; D7 ?" J( U& K
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 \3 X! a" V5 T5 B. _( ^  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 8 l' D0 C4 t3 S, p
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
/ G. j% ^$ y/ R  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 W  z) }0 {5 E1 J9 P2 h
[编辑本段]二、智猪博弈理论
" R$ z, }- |- j, i2 M& ~  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ U: r+ f( d3 {+ U% K  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # J: `% m" c7 x2 i) W% s
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 I8 ^; ]6 \) d2 E8 x  Q9 S( g  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 F& b# \6 h+ P. x' k+ A
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
  S9 x9 k/ t' s: a7 ]  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 . \. K; U/ D0 G# L$ b
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 r1 ^% |7 [. _5 [
  ! \1 ~  j5 \, Z1 Z
三、关于企业价格策略" l- `4 C; ]$ B& O

! r9 S. Y9 u1 ?5 j8 G6 i- j3 h  
1 l3 t% [  u. }# s  r, a4 K5 a# a* W  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 C4 ^. O8 M# ~% a' Z
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ k8 {. z" j+ T5 U' B
  以下三个定义:
# [& {' ?& E5 q; T  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。   S$ ]) a* y( A0 P0 w$ }6 y
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * M  P7 V" Y6 v, P
  所谓的双方优势策略则是指双方利益总和最大的策略。  ; h! N0 ~: e: E* V3 f1 @1 y7 E7 [9 U
[编辑本段]严格优势策略举例分析
0 c5 |7 U1 `0 [6 z! s% s  一、经典的囚徒困境
8 [* s% W! u5 j, N; g+ o2 v  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / W) w7 z# `- E
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 9 o# `0 x/ x. }* V& s. q" C
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) C3 `' f# X  k; ^: t; `
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . j2 F; x8 A# K" d9 ?2 {3 a
  若二人都互相检举(互相“背叛”),则二人同样判监2年。0 g3 [, d' O$ L/ h) T1 {
  
4 {& C1 ^4 M) B2 H: ]# }3 n用表格概述如下:; n) V0 Y' U6 p
1 m/ `' ^& b/ d! f5 q
    甲沉默(合作)  甲认罪(背叛)  6 K' W2 I. z+ U3 V
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  & s4 R$ L% B/ S  O% n
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  , J! s* r* g7 v# G/ z2 Y5 `0 g
/ B: h+ w& \- j9 E( a$ U
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ' E6 t2 a1 A; B& F! H) e6 N
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # E3 t* Q8 F; x% E! Z9 z& S) n
  若对方沉默、背叛会让我获释,所以会选择背叛。 ' m  {' ?. e/ H. I7 Y: ?
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- t) f- X5 I; k1 ~0 @5 T) o: [3 F  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( {! L' B! p$ c. H/ K4 g/ X  V
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 c* a7 h% o# e  {3 M- R# M
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
/ m7 {/ ^6 x# N7 u- n[编辑本段]二、智猪博弈理论9 }  c$ E6 C$ J' s/ b
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 D8 n6 E: D, r2 K( b* M7 x# h  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 x& i" A2 \6 x: x' D' r
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
$ V+ ~5 K% O- h9 S$ J) t3 Z  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
/ n2 p, I+ W8 |) j! W* b3 e4 w3 G0 N  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' A9 E$ U& U% F) V8 S2 y4 n( Q3 g$ T, u" @  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。   |  u1 G' c$ Q2 e+ X
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
7 G# G* g( H- P  }3 M+ _  
8 E+ l1 ~& x& s三、关于企业价格策略6 _& k$ z7 g2 ~8 P7 |# }
1 W% M; I6 r3 Q) t3 b
  8 v0 V2 ]7 k6 J3 b- |2 b+ }4 z
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 h0 S. R0 L1 E1 ^- f* \  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )