关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
" o8 s# B  m8 _. w4 W. f" E; M- q9 m1 O
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, B" J  T) m0 F9 Q6 \
  以下三个定义:
9 O' J8 S) q% \9 f" z# A  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & j% l5 Y/ j- j- ^( I
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 5 {' A% Z2 b8 ^" F/ w
  所谓的双方优势策略则是指双方利益总和最大的策略。  * f( x+ ?# N' M2 u" l6 @
[编辑本段]严格优势策略举例分析+ r2 y" E9 I4 K7 u$ H# ]6 A
  一、经典的囚徒困境 . M; a4 o9 I+ q+ J0 o2 j+ s
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! j, J1 h1 ]: O4 @  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ! |8 d4 Z- ?! U; [; S: l. e
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* l$ c/ a$ `% U$ b$ E  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
' u, x& @- h) j, [& `7 O  若二人都互相检举(互相“背叛”),则二人同样判监2年。; j, {/ K+ Q+ Z% ^
  
8 s, I: {2 d; d  d; P用表格概述如下:% c* A4 w  k# ^! W) _
4 z2 o4 M3 d) G8 w  c
    甲沉默(合作)  甲认罪(背叛)  % i0 S  j) w3 h' n' v5 b
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
$ k/ |. @' v5 \# O& i& Y; ]乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
/ u/ ^4 f+ h! n" T. ^
+ d' n/ z' I' x& t& c  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" k7 R! _) E( i. i0 i  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
. Z# c+ x- w; @  若对方沉默、背叛会让我获释,所以会选择背叛。 : e$ u' e) _+ k* H# D
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. T: x8 c. U9 B" n+ N, v  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" D0 T! m, i& }  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& ]3 {& V3 K( v  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- E" ~# t8 T3 s' q- M+ ]7 _3 {[编辑本段]二、智猪博弈理论! o  n' _4 G) l. b0 Q. {/ a/ @
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 / v/ w" l& B  N2 e! O  }
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . N4 h0 ^, ^  u- O7 `! Z" |0 M
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
1 Q' a# p7 A7 g. g2 o  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ) V- j- J, k+ {! R' p
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . x' l! b2 B: a
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
% C$ o: N3 X2 B: T' u  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
* p+ ^6 W: K0 @2 s/ p, Q, n. k: z# {  
5 o1 b, L% \8 i8 A; {. D: y三、关于企业价格策略
& G3 i' Z8 i) @( i$ n* Q# A5 ~6 w1 Z- x4 [1 L5 k  i( b
  4 T( k6 L. Q/ H
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ U% P! F4 t1 b4 A- n/ e5 w. B) ~
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" i9 A4 T. N& G8 ^4 n
  以下三个定义:
5 x7 N; _  Q4 r9 W8 \  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 u) V9 i- a% ^6 m5 n* e' e  c  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ; ^+ x3 U/ X) C* x
  所谓的双方优势策略则是指双方利益总和最大的策略。  6 x7 N% v1 ~+ J0 ]- g2 M
[编辑本段]严格优势策略举例分析
( h( Y# i9 v7 {4 \; A1 P  一、经典的囚徒困境
. {+ g$ D& X% s4 b% }  ^- r  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % C  y+ j; C/ o
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
0 c2 y0 B3 {- x4 u( g& f  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
- j8 @& z1 d' ?* t- m  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& n) }9 M8 c, `  若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 [' w8 W9 ~( U7 R" d# g  
# d& v' Y5 c) P% Q用表格概述如下:
; \. j0 G: i: I4 S& {
' U  g. m1 o+ D7 e! m- v/ h+ z7 \: m: s    甲沉默(合作)  甲认罪(背叛)  # f: ?1 m. }0 r9 D+ \
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
) D2 y/ P7 a! f  c* s# j2 X乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
: R/ G0 O0 c, d) Q: _. X1 d4 D1 X! ^% w( ]( A& P
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 w+ T! I+ w* p& ~: a2 o
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 R) o- n" ]. g
  若对方沉默、背叛会让我获释,所以会选择背叛。 2 B/ w5 x) j# W5 T! Y: T' M
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 1 s2 E% O# e0 s& Q: k/ T! f9 T1 W
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 L4 R$ ?3 J1 s! ]  D- g+ Q3 N" ^  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * x6 k: N7 l4 l& Z6 i3 u: @
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
) K+ F2 R1 i! _[编辑本段]二、智猪博弈理论
! j9 @) z& r9 E: k/ D2 S  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; @$ ?9 J, ]7 W. N
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 C& L) V) X7 v! N3 W: `  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。   w1 b8 h4 H3 t2 Q
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. Y7 J, {4 ]7 T' o, L  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' t9 L3 A" v; E0 \+ }9 J  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ! J4 L4 G4 p- Y1 K2 H7 x- J' k
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。2 y7 Q% \1 `9 V
  % X. u* X" M) d. S
三、关于企业价格策略
9 o. q8 l; O+ t% f. N
$ Z- T5 Y* d7 l3 X; w  
, k$ k* j, b3 x- c6 ?: v  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; E* s, I7 f, @  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
  {" m& F' w5 s" ]2 k  以下三个定义:$ R  A# {" T  l5 n4 H8 |
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 g% p, J2 Q- T& o4 K' f2 p
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 / Q' B6 D* p( t7 b- n4 y
  所谓的双方优势策略则是指双方利益总和最大的策略。  . j' l( C& ]3 `- {& d
[编辑本段]严格优势策略举例分析
/ M6 P  D" c# c! ~  一、经典的囚徒困境
: e2 H$ ^8 _- z5 o7 x; b1 c; o  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * D- H& r+ Z+ s2 d1 [
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
+ P- R, C  _9 v  o$ a  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
6 T. @3 x* U" `( x" h  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# ~( a; f: Z, q7 c+ H  若二人都互相检举(互相“背叛”),则二人同样判监2年。. W, B3 J" d2 f) ]* g* [) z8 d
  
( q6 Y3 e: R4 y, S( k9 r7 T! a用表格概述如下:$ H' _8 v1 t: k) b2 u
" K1 P5 {" h$ O- h6 e1 d
    甲沉默(合作)  甲认罪(背叛)  
+ s, |/ H. v( [6 H1 U乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  6 |6 a& I- ?2 n3 q3 Y# Y3 Y
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
! |9 f" X; a/ m' ]( `& h
4 c+ o$ |9 d' ^& D2 i  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 W( o* f0 u0 n! y
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: & G3 L1 Y2 H8 s, q9 }
  若对方沉默、背叛会让我获释,所以会选择背叛。
, w" ^$ z& g8 ~4 l5 q, C  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 . g5 ]# I9 S5 l( t) p9 L1 d5 z" X
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( j$ g$ q+ H+ \! m9 b8 @  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( b: j  u- n- x* u% J/ d
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。; L/ {7 v% h: {% o# }+ P
[编辑本段]二、智猪博弈理论+ f- \6 c! h( l) W) ~  j3 N5 ^8 k5 Q9 I
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 v; L& U  }. u1 b7 |/ s  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- X' X7 I& N; o# q  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" U8 |. {  f- s$ a. n  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 T: y$ D4 n: c
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 $ `+ j' [& Q/ [' |
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- h/ _  g, n" @; }  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
  T1 o1 Q; ^2 U3 E, z% R4 }  0 U0 _' L& W/ T$ C4 {& {2 i
三、关于企业价格策略0 D. T6 x0 e1 I) ]' Z) S0 E
8 T) e( U9 x- ?9 E+ W! e
  
; S3 k: P' _/ A& a5 A  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? & Q1 b, z" n; e( D- ?) b4 n) L
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
( Q* I/ c8 s1 R( c" C+ v  以下三个定义:
$ Z$ P+ y+ D0 h  v4 l0 l8 i- c/ g  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
) ?, n& [% o' G/ T  q  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 " O- M; X# D- B7 Y$ b3 _
  所谓的双方优势策略则是指双方利益总和最大的策略。  
+ G& b1 j  {6 B5 N: M" F/ z, F: ]+ n[编辑本段]严格优势策略举例分析
  e/ J, Q5 q1 c$ Y3 o9 v  一、经典的囚徒困境 , o9 Z+ f2 ?" k2 [' k6 Q4 Z
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 u% N3 `9 Y% E; n- f! T7 \  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( K7 }& q! l9 @# A  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! Q# x- ~( ]2 Y- x( }( ]- K. ^+ c7 ?
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 m1 z) P* s, _0 K2 J  若二人都互相检举(互相“背叛”),则二人同样判监2年。& w) F7 M# h9 S2 Z. |; V# t
  ) m& E& g+ D1 f/ m
用表格概述如下:, H: S& c$ `- d' @# d
) t6 U  J/ \0 |- H1 w3 F- _" D
    甲沉默(合作)  甲认罪(背叛)  
* u1 k: c! |5 u4 X) x- Q4 {乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; N) Q( K6 O' h5 E. _+ r4 D
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
, I' `7 @4 P; J
1 w9 ?& j( d/ k* T4 O. t  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 ]5 ?4 F: C+ H  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' u( V/ @2 g. i4 [1 m
  若对方沉默、背叛会让我获释,所以会选择背叛。 ' x* j. L  A9 }1 v& m. Q' ~; S* h
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
  R; C5 M6 p; y! s1 b  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! X% x) ?$ C+ P
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 J% R. h8 ~# L8 l7 B4 v  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 v% ^. l0 ^3 c* q5 n6 T+ F
[编辑本段]二、智猪博弈理论* \+ l, P9 X  @/ `# L: y
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 # z# l# n0 o3 z$ P. C! H  ~* H9 j
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. d7 w6 G3 s' |' B' Y$ V  N  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( h+ f6 h2 _( a+ b  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
3 M/ W; W5 N1 y  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
9 b# @" D, Q8 p. @2 f  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
, Z+ q! v. p' S7 G  \0 R# h' W% S  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 H4 v$ F2 {( P
  
1 J+ O: \" T$ ?, B$ {. v三、关于企业价格策略" u$ R3 J% |/ D5 Y+ Y2 [
& d8 l* P+ d6 \
    o+ v4 t" o8 y1 _" K- x) V9 K7 u
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % O' i" j/ m/ |! I/ ]- p# h
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )