老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
/ v' p0 o) {7 v0 s; `) N+ O6 j* J; f: M" B
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 k$ n4 y" s1 ?9 [  以下三个定义:
! k2 I0 F4 _) v$ D  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。   }" k' [/ o% s0 j/ e" h
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! {! @/ Z5 C* {0 b$ b1 F5 x
  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ U3 g4 v+ B: g/ t[编辑本段]严格优势策略举例分析
; D  q8 g" _4 b  q5 c6 H/ Q0 F  一、经典的囚徒困境 # ~1 v( M' ?' g7 l  U- I$ w
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) ^7 e8 A" B2 y( s: X4 @  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) ]$ N% C2 v8 `( X; b& y! `" H% c2 s
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 d$ w! Q  P9 t1 i
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
  m' i& F$ X7 k& D3 `  B6 }  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 u+ s* I% Y; G- n0 ~  
- T6 D5 S6 N( I. j" W$ c用表格概述如下:
, P: w9 q9 H. l6 o2 [  R5 h' e9 ^. y- X7 N* F7 ?
    甲沉默(合作)  甲认罪(背叛)  
" ^6 K. i" X7 P7 ~: g! n乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
( `- w5 X9 C& P1 K2 j乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
" b7 `. v/ j+ A* r
; b" U- R! l! S- G, H' s( q( L1 e  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 c2 u( e- I2 I
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ u0 q8 Y0 n. {8 E, q' g  若对方沉默、背叛会让我获释,所以会选择背叛。 3 ?) ^7 w6 `' i! i- O
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; f5 {4 ?9 o7 s/ q6 V
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 " B/ J3 C! c* T1 o
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) ~4 z; x$ w+ S# D
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- ~/ Q& O- ^( F  K[编辑本段]二、智猪博弈理论
6 K! N. K% M. E) h  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % T; y5 F0 N# u0 M6 c
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # n  H8 A; g. p* L
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- ?, J1 ?4 U: X4 G) A7 A5 Z  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, C$ P$ B# |1 v4 \9 I  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
/ z; z  y- U5 A1 c  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % z( X! Q5 J/ u) T% k% n
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。, a- @6 Y4 ]! F4 g
  
5 V- q) a/ M6 q. b+ y/ ~0 _/ R三、关于企业价格策略* F# j* ^: H/ S: @( W* i( k
* y! n$ Y' i' Z
  : h  w  P3 B  ^+ `) G* W8 M
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( U: x' i1 o% u+ P( H1 U7 F  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ ]: F, ]! c' _
  以下三个定义:
( e$ G+ n& N8 p( B6 F* H7 w) [% C5 I, X  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 a5 U4 X6 I$ Z) [$ G1 ~; v
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 C9 D/ j4 C; ]0 A  所谓的双方优势策略则是指双方利益总和最大的策略。  
. B4 [9 @  X, J& d* y# F7 G[编辑本段]严格优势策略举例分析5 t) |0 `/ A$ \% E* p1 I. w) V& ^& E7 E
  一、经典的囚徒困境 8 ~) b5 Z/ J5 F. ]
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , t0 L+ k  W6 j7 C& Y) ~
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( ~2 }4 n* L+ w" d1 A
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : W7 _/ L' Y" Y' L8 T8 A
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 + E& K- S& g: D% k  s* Y9 H2 {
  若二人都互相检举(互相“背叛”),则二人同样判监2年。5 u. A  u/ v& h( Z3 u
  
, J0 J0 T1 S; ?' m, q, T用表格概述如下:+ e' K2 a) U* Y
# ]. E; A" s/ r3 O5 [
    甲沉默(合作)  甲认罪(背叛)  * z% T. \( \0 p/ }: W7 K  k
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
" M9 m6 G; P! C/ x. P乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
: e9 X! H; X. k3 J' S6 m$ h  ]8 t( {& Q8 Q  v1 k8 A
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" n, i& p0 q2 u0 z2 k  {$ H  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 K0 d, I* @7 H( H8 |) E: U
  若对方沉默、背叛会让我获释,所以会选择背叛。
9 Q4 b4 ^* C) Q- }2 F$ ]  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. {  ~' m# K3 v! H+ g  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) S" h' T3 l$ T/ p3 Z4 C
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 e3 k0 p0 b# y- c+ l  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* s, X' F* `& T2 o  N
[编辑本段]二、智猪博弈理论8 O) l# X6 z2 Z) D/ q3 S! C: B! u' K
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
. A4 H3 i" x7 g( u& J; `  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 - }4 Q$ ~( V/ f+ S9 f  k4 F$ x
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
/ ~9 R: @$ P1 ~+ a1 \  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) @* a3 t) n5 ?  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
- \5 J1 m. ~5 U4 @- u! v: b& G  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
- P2 v3 n. e; _( M  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 Y* k. L8 i& V  ]4 `( u  
) }5 }& x' S" C( j+ i) o# Y三、关于企业价格策略
2 o, Y" `! z# Q: ]. n
% x! u! s1 n$ m9 q4 F5 U7 n$ i  
8 P8 H  t( f" A; i# D! V; O% W  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' y( E: M( y) h# ?8 ~1 q+ q6 K  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
. L+ W# S) d7 r& h. R  以下三个定义:. C" Y% v; |4 G% P( d
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 l; {4 x5 Y6 w, X$ v0 W  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 c9 h6 M. Q6 d8 @( o2 J
  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ b) W- y6 W% ~. u[编辑本段]严格优势策略举例分析% h/ T" V9 q( G4 `: h( q
  一、经典的囚徒困境
$ W! _6 b& u! t4 u  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ d" e3 L+ S1 T; }/ Y. j# u  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 R% V3 S( a; X, `5 V/ [  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # ]: Z0 `$ l) D& v; b7 ~- N
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
  o7 e1 N$ U# \$ k  E( i$ \/ \3 k  若二人都互相检举(互相“背叛”),则二人同样判监2年。
% {; x! S( K8 ~% n& D  h    C1 @2 |% k, e% ^$ i5 O
用表格概述如下:  f4 Z$ M4 \: N4 `3 O" k
) s) W% ~, T" q5 C4 w3 q8 j
    甲沉默(合作)  甲认罪(背叛)  
" ^. J: ~& K2 H6 m3 a/ Z乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  / r' U& b3 a1 b7 x  H
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
8 e* a! }5 u- C" a6 d( P1 D" ^/ a; h0 r  H4 u+ s* Y
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
  s' u+ E7 t& v8 ?7 k+ i# ~0 }- j  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + i+ v0 U8 e. w7 q* z
  若对方沉默、背叛会让我获释,所以会选择背叛。 ! i- V* i% J% Q7 `- z, b
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 V' x- [4 q. \$ @1 C  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' R5 q- t$ b6 G
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& `% ~' F3 s  w, K  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 k' V9 {: O4 j$ T- x& x[编辑本段]二、智猪博弈理论
' |; }; {  I2 y- |% D: T  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 l; s. P! L% m4 X; s
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; `2 l  G( J  E* v$ p* U) _# i
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 a8 f4 U5 @% z
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - \' p7 T7 s1 N
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* l. d  }) i0 M- G7 }6 [$ e  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 O; M# {5 }  Y8 a* r2 |
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, l" `7 w2 S. L  " v0 ^8 |8 {: P, y) j$ L$ h
三、关于企业价格策略/ n4 o# B6 z  _2 ]( ]1 s& x/ t& @) q

- z. b% A$ s$ ^5 a. v  
1 C: q  F' M/ V  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " t9 p3 o8 a1 a. n
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; \3 R( H1 U' d
  以下三个定义:
) V! z, w" u) [5 X9 J# k  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
  L0 B) i- |* k  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& l) Y7 M: V# `3 z! R: @6 I  所谓的双方优势策略则是指双方利益总和最大的策略。  ' m* \/ ^: e+ {7 p/ o
[编辑本段]严格优势策略举例分析
" c7 w: F) S8 Z% y8 h8 Q" O% t+ F+ v; n  一、经典的囚徒困境 + W' u# ^: ~7 k$ ]( j. Y# _
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % l0 A: p7 b) p8 s7 A6 v
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( {' W$ r' a  b
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& [# f" v2 y1 J" q; h( V  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ; K, d. e2 i- ?& ^* a
  若二人都互相检举(互相“背叛”),则二人同样判监2年。8 L% E0 y' j8 w2 Z' l& B! N
  
' L+ g3 d& e3 @: A3 f用表格概述如下:
7 K  }7 w& \% [, ~
% ^* u5 m% {2 V% s5 q$ Z    甲沉默(合作)  甲认罪(背叛)  
% J; O  L' g" m- b1 [" {- H乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
8 u/ U4 T* w  |, V# ?& V" o乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
+ v' M) k. f; ?+ ~: [& J/ p/ X3 r7 T) }# ~
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
& F" _5 D; [/ A" J6 o2 a/ l  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' J3 r# _2 _4 e7 [3 }/ U) e4 J
  若对方沉默、背叛会让我获释,所以会选择背叛。
$ |; U! h" f1 F, x8 [  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* B8 a4 C! r  G$ O! M) f  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' x0 ~# Z- f0 R+ z6 Y8 Z) \  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 Z4 h9 J& f% @4 ~! [4 l
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ u% h7 ?* y" g% {# g2 a' \[编辑本段]二、智猪博弈理论
( K  N5 T. F, N7 N# N4 w  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 5 h1 d8 E7 W4 w
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
' Y( S0 t& t$ a- ]2 j9 M  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , [. z* h0 I. ~( U$ W+ L! A
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( d8 V( y: v, W  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 , }% S, G4 c. q9 U1 g
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) y4 [0 d9 R2 _) p$ j9 G. p  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
4 x5 r. N+ ]! J) F; x5 a: Q  
8 \. b! x$ e3 _; j三、关于企业价格策略
- Y, a/ S' W- T& g: |) W" H: `0 B* C3 b' O8 d0 c  g& v
  % [( p8 }% C  I' E  U7 b# `( c
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' @3 {' l+ p4 j! C: x! {4 L  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (https://www.laomiw.com/) Powered by Discuz! X3.4