关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
: q/ k) z+ k( [8 _" j2 B1 v+ r3 {2 `& a, F; d0 j
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
  w! `, C. y$ i0 g  以下三个定义:" p* y$ Y5 o% i9 b: g" V
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 s3 k4 O- _0 K, s: b
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 P- e2 h* C/ K2 j8 C9 r. X$ \
  所谓的双方优势策略则是指双方利益总和最大的策略。  
* Z+ b# k  W; O0 n( }[编辑本段]严格优势策略举例分析
! G' Z# j! w* u* |: p! Z  一、经典的囚徒困境 # E# _5 e6 W4 T! y/ ]% Q
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, k( I, O9 u8 l2 h  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. @$ A3 i) H; i2 w! U  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 x) t- N( x/ v! h
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- d8 K9 i' A$ m/ c1 S7 O2 Y1 s  若二人都互相检举(互相“背叛”),则二人同样判监2年。+ N' \4 G! q/ q8 O7 a! e4 T
  9 J6 h& c8 o' I, n# R
用表格概述如下:5 o* q( I9 S" H
  @5 I& ^5 R' \2 f/ }
    甲沉默(合作)  甲认罪(背叛)  
! }' V8 `5 R6 B9 K乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  6 J' P% S/ U1 h* ]3 S4 ]2 v. y
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
- i/ W; a2 k; I! N& z2 z2 J' ]- u' h5 k- e8 R
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 & |% [' L5 [1 ~0 ^: m8 D* y, S9 O6 I
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , h6 G4 O6 u6 f5 ]/ X! v" ^4 P; C6 b. F
  若对方沉默、背叛会让我获释,所以会选择背叛。
+ b$ R8 f/ a7 F  i7 d! i( S  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) g( b' P  I9 E& }6 O
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 n! n1 _) a2 w5 x8 s: ^! g
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; {4 U3 O9 A/ r# m) {9 `9 c% U  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ L/ g8 d, o0 \
[编辑本段]二、智猪博弈理论
9 H# B- Q9 T$ h/ j; ~  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
, }) s9 F2 u- R& e: S  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! }/ B) ~0 _& L+ c; ~' E, M) a9 F; C
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 t- k" t% N# k& L+ \  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 , X5 N2 X* e5 k1 e/ X
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
, u  u6 m8 O; M" b  ^' M8 b  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; r$ f. u1 E- j( ?- L& L( B
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 M" X8 I3 ]4 ~1 Z# u, W9 v* ~- g  ; X' s- J" k  u1 m" }) w
三、关于企业价格策略( t0 Y% |( ~2 {# V8 @" b3 n
' m, y$ m( I+ D5 j& _
  & C4 b% g) M' L& I+ O8 J
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! t* R5 j, Y0 L0 U8 y- ~
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ a' `& _& b, ]4 ~& x3 n% I9 t. p
  以下三个定义:
7 g. g8 }# _2 G- {. r9 N8 B  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% L1 B8 x# o! Q2 ]  s  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
7 Q5 \% f# z3 T- c( E  所谓的双方优势策略则是指双方利益总和最大的策略。  
# k$ |1 G) N+ e! Q* R[编辑本段]严格优势策略举例分析! d- V( K6 i% c% {( `- `; \
  一、经典的囚徒困境 & i! |8 y6 m4 c9 O
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ; u- I3 j/ l2 ~6 V
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # \, u1 A$ f1 J, q" z3 X* G' M; ?( F
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* L$ y7 A+ T  w6 U& {, x  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 I* W6 e+ c& m# Z! H
  若二人都互相检举(互相“背叛”),则二人同样判监2年。5 o! S* M- X5 l  z
  
; ~# Y# A* @+ d* N6 c: _6 Q用表格概述如下:" i/ M; m  E9 }! f! c* }
6 C; d4 o9 X  T" a2 c: l
    甲沉默(合作)  甲认罪(背叛)  ) Y. ]# X5 L' r  r4 r4 r
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
; ]8 \: v& e3 k, B- C% K5 M4 y乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
9 @0 S# l* o3 f! t+ c  }+ ~3 {" e, I6 g; [5 t& F: x6 U2 X# S
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 t* m/ g" D, l3 [2 v  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 j; M3 t. j0 r/ ~0 Q+ K  若对方沉默、背叛会让我获释,所以会选择背叛。
1 D. Y$ R4 r# d. \  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; p, f" f& [$ r8 c% S  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 r6 O& A2 I6 M" y$ w& A8 N  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% K7 c) V% c8 D. H- ?; o3 W  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 v- n7 T# C. x[编辑本段]二、智猪博弈理论+ W% ?/ v, I, k3 y, c: ^
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* ^& j% G! z/ u+ a% P1 b0 r+ U  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
4 o9 t" q; @  ]; V0 j  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 [1 T% D: l. u$ n  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % |$ _: s( H, M5 J$ v& r
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
. V8 Z" ^! s5 q. g' W' k0 {/ E- @& h  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - Q/ C" K: o& @# V( y
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ F: h( e6 Y( `* F9 t  
7 |  i. j: r, g: t三、关于企业价格策略; ?: {0 }0 |2 L$ m4 g( z

. [! [8 q2 P' Q/ ^8 i  
$ F) K: T) P" h6 d/ i, u; S* z  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 ?: X9 d% e; H, i; Z4 }( H  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ H2 {4 d+ e/ k  以下三个定义:
: a, T" L! V" f2 ]  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 `% b1 p+ |! M+ ~- m* Z( e8 W
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 5 s) g+ n9 [( M+ d& u6 n, T
  所谓的双方优势策略则是指双方利益总和最大的策略。  
# }5 x5 h/ |) _4 @3 Y* H[编辑本段]严格优势策略举例分析
- a7 o1 x7 x" I% t1 K& u  一、经典的囚徒困境
7 H. T# z. o3 r( G  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: . v+ u9 j2 H( }& D3 v* y  B
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; E" N' ?6 ^+ b6 q4 C& m4 w6 |* `7 @
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ' H" {7 O! a% r
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ( T7 _1 |" l6 m
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ i: C7 w' s" l/ _4 f- A7 V3 Y& ~  $ U. k* F  f5 Y
用表格概述如下:2 B8 ]0 _) d! b% _
0 ^" b" L  L6 n. x4 M- U
    甲沉默(合作)  甲认罪(背叛)  3 b( m" l/ U6 h" Z& z$ m5 [
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
! X- F- R! \) P乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  $ V; Q  G* d4 N3 i
" |" t' y0 w: L1 D
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
  Q& l' y0 x( p) @  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: . m: A: A$ S% {
  若对方沉默、背叛会让我获释,所以会选择背叛。 3 o7 U1 [% s4 k4 d
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ B" M! b8 H9 |' X/ U8 `  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; H) B3 h5 E+ z" S- E7 v3 f" I+ O' \
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 R7 f5 H' T. h- Z6 {  v3 W" L
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 b$ l$ T$ P( M$ t+ T[编辑本段]二、智猪博弈理论
  c" }" S8 n2 N  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ) b' k2 t  l4 a
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 ~# q3 M9 B' y- y4 m: y
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ i$ P! x+ ?1 a/ I( h  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. E4 S$ g( B+ V% t4 F6 b  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# \8 h& n  J1 i5 P8 J! M- ?8 V  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 [3 ~; Z; b2 b* f/ |9 Q6 P  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' T" }* I2 N( w" m8 k2 C3 [! X  ; e( }; m" r4 x: z' m
三、关于企业价格策略
7 W/ `  l! D% Y! @
) Z0 m7 i, y2 [$ P  
2 `! _% T( Y: k  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 `! F" Q3 \; c* y, ?3 O% m0 c1 n
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 p* ~. P6 q1 P9 h3 L; c
  以下三个定义:
$ [" a, C; P; |; h: N' V. |5 K9 e+ L  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 K" n6 v, l' u( q8 U0 B2 D6 D1 D
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
) r9 Z( E7 r. k. v  所谓的双方优势策略则是指双方利益总和最大的策略。  1 k! T+ Y! R- s5 b, t
[编辑本段]严格优势策略举例分析& i6 H4 x: D, h* j8 X
  一、经典的囚徒困境
) N% M) e1 Z6 C0 J5 R' D2 _  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 _: b+ k/ T7 K9 K: h, D& x- |5 g( z
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. h' j' M- M6 P4 i1 r; @# n3 }  e  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
  w; ~1 V3 G8 |  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , I- m' u% ?! M( [' W7 H: L" g
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
+ W! e4 _4 |% |  k- N* @  / [4 [4 z/ |9 U% V- g# q: X, _9 W8 s
用表格概述如下:% ?4 v3 j' }8 {( Y

4 |" W2 e- W" }    甲沉默(合作)  甲认罪(背叛)  / l6 b9 Z7 X: e) S: d& [
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  9 O8 G6 M0 r' \- @2 n5 r
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  4 a# J" Y% E9 ~! a. G

  I: g" ?/ [: D# I' @9 l  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % Y6 J4 C) g4 j
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
' c8 a5 ?  B, }9 l5 q  若对方沉默、背叛会让我获释,所以会选择背叛。
0 a1 e8 ^- g" n5 n. d* m  g0 H9 X; O1 d  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
: O5 A" o( M1 W! X# E  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, t6 Q- L  c, ]! v# J  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
' i/ S, s0 l8 r: \8 O  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。' a: V! h) c! j7 P! y
[编辑本段]二、智猪博弈理论, V5 V& w, j$ p1 v  W
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 n; q- j5 w# m7 U$ ], g1 y  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; J( n9 s8 J7 l  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ j4 b0 Q' I. ]3 e% @- y( r4 P  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; H: l. T" I$ @4 W5 u' ]# x  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 R1 w8 c2 ~5 s- {  v  s  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " X# l5 p* U  D6 D% @
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) |7 E) g0 k( L2 H% K' {- `/ y
  
2 l1 J: o: M, x+ l5 X三、关于企业价格策略% E0 j% A. T% P
: o0 Z- d0 ?' A8 b4 v% H
  
* N1 A  V, {8 W0 g6 g  c. v  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" m, ]4 g4 `) \4 e  w% f2 x7 H( H  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )