关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 # G6 f2 Y* F- e/ Q* K

2 B/ E+ g( r7 ?0 O! l" N6 a% ~严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);: i- J7 B/ ?5 _# @
  以下三个定义:
; K* F# j5 G' U2 Z! R$ f# a  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. g9 y: w9 _/ `$ X% b, E6 x1 I  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , A  R! x2 h3 L; x5 J$ N+ }9 [/ V3 H
  所谓的双方优势策略则是指双方利益总和最大的策略。  
1 s% }& }1 j+ Z, Y7 }[编辑本段]严格优势策略举例分析3 q$ }$ \0 ^* H: ]2 x
  一、经典的囚徒困境 3 ]; S5 x  @0 C, Q8 v
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 _! r" \5 d* |5 k) b
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; U! b% {- U1 d* q' Z6 F/ u+ ?
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! ?" r' x# _7 _, {$ X  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。   s/ k: M6 g, W, `. Z8 B  Q8 l
  若二人都互相检举(互相“背叛”),则二人同样判监2年。2 S5 J* Y5 V% m3 m( z9 q  G9 @
  - h& c$ k# q$ q* y0 x; W
用表格概述如下:
9 K% n& O1 r. S% S) j) E" I$ t1 u. e' X
    甲沉默(合作)  甲认罪(背叛)  
$ ^  G+ W# C: p- ]( k乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  9 V/ |7 ~+ p# m/ D
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
8 P( D1 H. Z6 L" k
% p( c/ s9 f  K1 P6 ?/ t  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! p1 B5 i( L4 @5 F8 C! z" k
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / k( j" @" P$ s* {) _
  若对方沉默、背叛会让我获释,所以会选择背叛。 * f& G, ~/ @+ d! |  i
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
& b( x/ t* c$ g% t) P/ O7 u" f  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 |' a  m2 d- U' r; d
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . H% Z& w, ]2 E8 @
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 {6 p+ `8 x  _
[编辑本段]二、智猪博弈理论
: {: _% E, h+ D3 P, g4 o( j  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# @% \) N. a2 q; ~# p  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
1 p: U& A2 f6 h, y  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! ^1 T& G& D5 C- W  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 \; Y, L* Q2 A  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
) r+ t: z( U9 s' [7 [  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % U% |4 \8 X* d$ X( P  g
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. J  m# @, T/ W
  
" M- c, P+ Z, d0 h* Q三、关于企业价格策略1 D2 |" q. }6 W' ]) V

- u4 U! L; M3 f% Q  
! n- K6 F3 V0 q. m! O  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
- F( z5 j, S/ p, I6 g+ y+ Q8 u  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 V! L7 _' v1 M1 e  以下三个定义:
9 ^3 a, L- A+ z% x( Y7 C  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 G% _! o& p: j) n. p8 y% v
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 y# i) b  Y( }  B5 d% V
  所谓的双方优势策略则是指双方利益总和最大的策略。  4 J) E* J5 N7 Z
[编辑本段]严格优势策略举例分析/ L& R, E- d* |
  一、经典的囚徒困境
/ k; P) V9 q3 l  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 g5 ]* A& C. q9 P* p
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 r" F; g$ [& K  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) I. X' T- n* b# n5 L0 s  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 : U- r: U4 k( y/ n
  若二人都互相检举(互相“背叛”),则二人同样判监2年。! Z" ~2 F! W% c& C" d. G5 y( }
  , h' o3 z, b+ C# u! l# }: X
用表格概述如下:
! V8 d/ J9 M# j, D( [7 k3 @6 l2 Q% y
8 r5 ~" y6 {4 a    甲沉默(合作)  甲认罪(背叛)  
: Z. R' Q5 a2 U9 ^" g) j! f乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; ~. |7 \: s9 w  D1 Y$ O- v
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
; R+ m4 D+ r+ K  d" R0 [, H( A3 u5 k5 x. h
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: F. o% B1 Q9 D5 l  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 s3 i0 Q7 B" j- i" x- j# ^  若对方沉默、背叛会让我获释,所以会选择背叛。
, m3 V* Z7 E6 r; v  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; Y0 I# U! D4 _* Q- M
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 R( Y2 W6 ]! t9 o% H5 h* }
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) L! j; [3 u8 C7 E* L% O  a; H
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. o* w/ k" Q5 K& E( h9 N6 U) W[编辑本段]二、智猪博弈理论1 L: c1 t7 |( v  p! T
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; F. h5 w+ V" B% f0 S. N! g/ |
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( F2 a- M/ V0 _2 j7 Y+ k  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 c% ^5 R6 }) m, v- p; S  A
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# }- u) u' h6 d- }  j5 t3 I  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : u/ w& A6 [4 k! `
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
7 G" W0 A' L& A3 E. E3 [" h  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 ^0 o! B3 C7 v
  
% t/ R1 m2 E3 }1 G三、关于企业价格策略& Q6 V* e8 w9 f( D
# J1 B: |' P5 o1 I6 l
  ( G0 X( E" m6 M7 @* g& I
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! [$ N0 n8 o; z9 i/ q+ z
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! W2 @- N. l3 D  以下三个定义:
( x4 D- ^+ A1 c& b& G* p. F( {3 Z  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。   b* I" `: E2 F
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 v7 R# p2 a$ T+ ?" c$ ?4 D  o
  所谓的双方优势策略则是指双方利益总和最大的策略。  ; a" A- `4 c* q* B0 |/ C2 v
[编辑本段]严格优势策略举例分析
) Z: Z( F. u/ `  一、经典的囚徒困境 4 ^$ b- t/ q# }3 Z2 R  @
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + R: \, L( P8 g- B9 e  a" {0 R
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& n( o  l- f7 F; t  a+ T  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 e0 A7 @" p3 w' y' y( Q* P% y
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 9 \9 V: g3 S* U; W. A* O/ r
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
* T/ s- S4 p6 K& d9 A  ) U. ^8 I1 Z% B" q' F) F* @1 x$ I) b) A
用表格概述如下:
& I$ m4 ~% q3 m
* A1 [* K# `5 E( j. p% E    甲沉默(合作)  甲认罪(背叛)  ( k+ c9 @* F- Y2 T. Z! [/ Z
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
9 V" K' m! V+ ~- Y& \乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ; `7 a: D+ A9 W  ]0 j, k0 \

' H" G7 z3 }) h6 o; [( {) j  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( w1 e8 u8 j2 i0 G. G0 `  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: " F6 c3 B* k$ t3 l1 ]) z8 Q
  若对方沉默、背叛会让我获释,所以会选择背叛。
& I+ H7 K) J( D* j" M  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 Q6 d( w, }6 o! Z$ h7 B. D% T1 m
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ k6 |9 N& c3 o' A; G1 \/ K+ H  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 [& S! c- j# B7 S/ q: y0 ~  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 o8 m* l$ z& t' \+ b- t
[编辑本段]二、智猪博弈理论/ C9 c3 f" i  p& _: g: Q
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
  }3 S7 h' I7 s8 Q* q  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 `: b& U: a- U
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 m/ b" ]/ d  O
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
* w4 E' w) `! C0 _- C" Q; ~  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( o9 ]' q6 o+ K) E1 t$ I3 M  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 x0 ~8 w) n) ]# C2 I4 E
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! R6 V( d6 U! V3 b0 z  
  E. S+ D/ ~. B+ Y: s3 x三、关于企业价格策略$ d8 J" m- c  U, w' A6 B

0 l" s) t( x; @9 I' L  7 X5 g& v6 j# L. H
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' X! }# n$ P6 l: z) ?
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; k# d0 M+ ^  Z. c. u  b" a$ l! d/ X/ [
  以下三个定义:6 f. l0 j$ c, K. }% C+ a
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 % @2 H) P8 F! \9 z& u; N$ L
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
6 _/ E1 |! O, E: ]; E/ O  所谓的双方优势策略则是指双方利益总和最大的策略。  
& h* D7 }$ ~$ l( X1 H$ G; e2 A[编辑本段]严格优势策略举例分析, x( r9 ~5 [+ T$ ]. g; `, p6 S+ F2 r
  一、经典的囚徒困境
7 Y( N" e7 }! {1 E4 U3 E1 f% k% y  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: ?/ m" @. M& A2 ~  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + a5 o: b2 ~1 M3 `7 h: g
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; W5 t0 f' i' F  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 z8 O& v5 ^+ D7 g' Q& b* f! C# G( F
  若二人都互相检举(互相“背叛”),则二人同样判监2年。. p) r: ~8 k9 l, h
  
/ r; A9 ~5 U1 u+ {1 z0 M+ ?+ a% r用表格概述如下:
' P+ H/ ?8 d& d4 |* E
% e3 `& }! c, |- X    甲沉默(合作)  甲认罪(背叛)  
: l1 `% N6 H0 o$ g$ C( n1 \3 x* t乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
. O! s/ B& G$ N6 d5 B8 D5 O乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  5 x4 V6 f/ x( q( g
: `. \; `' Q4 H% o$ D7 q
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 t2 _( d+ D6 @$ A/ Q0 t* e. C7 n  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , t1 @' y- {1 i$ y% y8 k; z
  若对方沉默、背叛会让我获释,所以会选择背叛。
0 X' r+ U+ [# K; Q0 A1 V  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 h& G% H: _) t8 y( i  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ ]: A/ f1 M" p) N5 W9 l2 B  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* X9 |/ l- b1 f) E" \  K  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 i7 P( ~7 ^( m, U% k# C
[编辑本段]二、智猪博弈理论. X2 f) @9 o  X9 c$ S3 T6 M
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / T$ g7 N3 M+ K( p% V
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
1 ?" B+ W$ {9 i: H( o' t  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 B" g* E; |9 u7 X" D  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 7 m, M5 f' u2 h+ l+ g- I
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' p1 ]$ i' @1 e' P1 b& o# {  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - m8 M# U8 K; ~7 I  A( X0 [9 {' F& e
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 u9 N3 w8 Y7 s8 J, o
  
7 F$ d7 U  [2 ]. i4 C6 {% m三、关于企业价格策略
, w% v/ H: [% }; `4 O
+ k0 H% h+ L, s/ a' q  
7 a0 `( p% N3 u; ^  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 v& D. o' z9 f1 y
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )