关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
6 |( |4 w* V) o1 p' x9 b, x0 A' W! I7 |2 r' M8 ?) S
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: g; k# |; w9 F$ @0 N5 {& A  以下三个定义:, R0 b& `; H1 k/ ~- X9 h
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
  T, ~- g6 ?& L4 e, v& C8 J4 |: d  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 n  L6 ~$ H2 w7 u& Z) Q  所谓的双方优势策略则是指双方利益总和最大的策略。  8 U& q) H3 w9 U
[编辑本段]严格优势策略举例分析
' t" y( X" W9 T0 t5 H  一、经典的囚徒困境
+ U9 U' H. }7 G0 K  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 v- |0 ?( k/ j% z  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 w) T5 r0 r- J! E$ B  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
  w. _1 i; ]' C" y5 A, o  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; v* S2 ^  X; D7 f' F  若二人都互相检举(互相“背叛”),则二人同样判监2年。2 C0 e3 Z9 O9 D7 ]
  
( I/ C, p" }; ^2 f( {) L/ U用表格概述如下:5 X; y# S- F# ?' |

+ s7 }+ q. d1 s. s3 L    甲沉默(合作)  甲认罪(背叛)  
6 y8 f$ y5 `8 m0 i乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  " _$ x( t4 h2 v1 V, e
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
1 b3 a7 \. b8 @2 U! }; R# ]! J$ c
% K; Y- R3 v7 y) Q* b4 V) J  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, x- H+ K$ d% C. `( g: D$ N4 K  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
  e2 y8 _8 q& d3 E% u9 Y  若对方沉默、背叛会让我获释,所以会选择背叛。
3 }# _+ {8 r. A( H  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ E5 o7 D4 Y8 }9 s+ r) h' P
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & T. V4 i. V+ h
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
) _- a4 N$ m- J: K' \( j8 d  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- ]8 K! x* v, J" A$ x1 [5 V[编辑本段]二、智猪博弈理论
6 G, q4 w$ L  t* E6 v' Z1 z  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; s+ f& H! G) G7 h4 s# b
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 x4 _" L) g# I4 h  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 ^8 J3 e4 c5 C$ D( b8 H  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; X& c* M7 j% y" Z9 A$ H
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - u( t6 T! D& Q$ S$ X" a+ Z
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 I: }, g9 S! m  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* ?, A  i+ ?' k1 E, e  9 p& k$ a. [! M) m. I
三、关于企业价格策略) \( B8 P$ m/ y5 n
2 t* ?8 n! n: `; [* v1 i
  
/ d7 k. p& Z+ E, u  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' s, I3 U$ f! R  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ x3 F# r! J! h) V8 l- g( [  以下三个定义:
' E/ h- }+ U$ A5 a! O4 p  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 J, v* i8 g. n% j: x1 L( g; I  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。   Z1 b% l6 O0 M8 s8 i) o- e& {
  所谓的双方优势策略则是指双方利益总和最大的策略。  
* U2 i5 e! O+ u* c" D2 M[编辑本段]严格优势策略举例分析
- g. G# u6 \/ H0 q. l  y* I- m  一、经典的囚徒困境
# V& X. U5 I0 j: I5 m  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ( |* \' b: Z: f" a: G+ Z
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 3 ?* [% O9 Y9 L4 u* x7 r  _2 w: C
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) _8 h* G& [) [6 v- X, t1 @  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' d+ Z$ _  P2 c  T2 u
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
& j% H* t* D2 w! I( u" K  , G% u' O2 v8 ?4 H" V0 `" c
用表格概述如下:) s, I1 T5 |# s! M% B! l5 K; F

8 }3 L: W. X/ W0 d! P    甲沉默(合作)  甲认罪(背叛)  % n5 O. K2 E+ @
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
! G( S# Y% g( t. K乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
% c& j9 u/ }4 y
0 O: {( S0 c' B; b0 Y0 \- x  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 # ~) ]9 z! l: a4 H4 f
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: r1 A" G8 {' \4 E, k4 i! W  若对方沉默、背叛会让我获释,所以会选择背叛。
1 U( a6 m0 b9 ^0 y- B  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. ]2 K9 D$ i7 }  m  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
) P: y+ R: M# ^/ {3 M0 [' M  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
! G6 x6 V9 s8 e  v0 P, D& `  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% [8 ^( t+ C  `9 F  M. D[编辑本段]二、智猪博弈理论  c  F6 ?' ^- W" T- R0 P
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 C2 C0 |/ j0 u2 `/ T
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 & l+ f: B7 ~! n  W* ~0 V! Z
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; L1 Q- a0 {. W, B9 `/ P2 {
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. b) `7 ^0 e/ U* C; I1 ]; i! Q  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * s& [% o; O7 V
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" }4 h9 z% z; @7 R+ [. |6 k  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! T5 |% }+ [# k! C    X- C1 N0 q( N  {9 W5 @
三、关于企业价格策略' `6 N5 F! Y4 }5 }

9 r1 A* t5 o  B/ i1 V. ]  " h2 n" J; x2 }
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 7 `5 f7 @" w+ c, v4 N( S+ y
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 z: e5 ^/ i6 V" m/ `
  以下三个定义:7 }, ]' a3 S. B* b5 f
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 . Y9 f) J9 E% Z0 n
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 F3 a. t) R2 r7 m  所谓的双方优势策略则是指双方利益总和最大的策略。  . P! H$ w9 U$ C0 D9 q1 k
[编辑本段]严格优势策略举例分析& d( E( e. x+ ?
  一、经典的囚徒困境 7 n2 D1 @. S8 l7 X" _
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' [+ x" h& y: W% ]  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% L* U) M+ F+ ^# {; r* G6 E! i; f$ G  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 v/ H7 ]* G, _+ F+ y* i) b( Y  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 5 I+ |1 ~7 V  D
  若二人都互相检举(互相“背叛”),则二人同样判监2年。: A- B5 {3 T: ~; ~
  
- O. N$ W1 Y5 c  |: _* C. j( O  V用表格概述如下:
$ H* T$ @5 X4 d6 H2 A% U; B! s( a: e  |
2 T9 q& m# H- i    甲沉默(合作)  甲认罪(背叛)  
  G) Q$ |& X( J! p乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
0 L: S  h; s; E8 @乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
. J$ |- l$ `( f9 x/ d9 j" z. W; R6 c
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# h2 b. ^, ?: s. v9 \7 T  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 \( \1 t% |7 z  W  若对方沉默、背叛会让我获释,所以会选择背叛。
& N# c( e5 v) _; x: X6 U  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ T; C0 d0 o+ \) k0 Z: l
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; T( U/ y; Y4 ^; q7 m  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; n& c# C7 `% w7 _3 p  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ J* F& q! ~( |: b  R
[编辑本段]二、智猪博弈理论
+ I* y% l4 m2 X3 e: C  s, Z  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 z& f% {* h/ W" K' X& w' ]
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 C; U; Y  j6 D9 ]; d. m  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 g8 r! t9 T$ w
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ K7 P; n: B# J- @& w# I
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; `3 T* M, a) Q3 X  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 w: z, p% z) v# j7 `
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 ^8 F9 R! H3 p: A4 k% o  ) U% Q4 E; L. Z; l+ X0 Z
三、关于企业价格策略* A- f! [6 S1 C; H

; m' K+ I. m% h& p* U2 [  
2 u% \2 U) L5 {* S8 a. b; L  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " k0 E) S/ n8 A, T- l8 k# b' M+ |
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 i1 a! F2 }  s- M8 e
  以下三个定义:
$ }- M& |6 C' C. d- C8 W# k: J% h5 g  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# b/ i9 O/ }% d; X( {  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; B- M+ b  f  M  所谓的双方优势策略则是指双方利益总和最大的策略。  
" z3 ?! {3 y8 X# J$ q5 n[编辑本段]严格优势策略举例分析
  S% j# O) ^3 `% Q1 [+ w5 {! Q  一、经典的囚徒困境 : ~3 D# j$ Y, u$ N2 w# Z0 J
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 B( X2 s5 l4 c% g- {# ^5 K- ?( f
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, Y, S. @+ ]; h6 W/ k2 }6 s  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 X3 b# T5 v3 @  S2 x  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * C7 r! F4 S2 c- Q6 Y0 \4 g
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
) {3 w) K: O2 x  
! v) }6 E+ t+ L用表格概述如下:
% s% m! Y% r. A0 a+ I0 `  s$ e
9 x8 b0 E, S  j; k9 e- [2 l  N  B    甲沉默(合作)  甲认罪(背叛)  
4 @; ~0 C' N, R% j. A. j4 w3 \乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
% E) U% u  x! m" |2 O乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  $ i! e. C4 @) d5 A' O  o

; X7 T: u2 R& V' \! {  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. S9 j4 h  e" u) F  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % d% b) d7 H' c, E. f$ u
  若对方沉默、背叛会让我获释,所以会选择背叛。
  ]8 Z1 ~& S3 o3 s1 z  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 E9 n5 \0 I/ D: E
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) \4 \# Y; p. U# s
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 O4 P; _5 A2 K8 }7 l
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 I# n1 i8 V3 G' z6 m: v, B1 {( W% N1 @- @[编辑本段]二、智猪博弈理论6 P6 y8 D" R7 i6 [5 w6 h- B3 w5 V
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " y. t# r( T) d; M3 M0 T$ K) N
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 y, i* i" x* s* X% R$ |  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( L( Z1 v- u* N0 q
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ h! D2 G2 t0 N- H; P  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . J' r9 f; T7 D2 I* I" r  c
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
2 O6 m+ s3 ]/ a  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ R: X4 G6 a& [( M$ i1 Y  0 ]7 M, M& v0 M" k8 {
三、关于企业价格策略9 D3 z/ ]' }( [8 m- N4 }
) t) Q" @7 a, R3 }
  * L/ s3 v4 z" c* F# J5 o$ V
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! u$ x2 Z3 {5 ?9 y8 w
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )