老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
% Z; d$ @/ [/ S" M" Q5 h# P% L8 d/ N$ _5 [5 ~; O! M+ S& A
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
/ V$ p- \9 l& f1 `- ^  以下三个定义:
+ D9 |# L, h) H8 h4 l* o- T: Z  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 _4 s6 c# `" S3 f+ e
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
+ \6 r; I6 u' w+ y  所谓的双方优势策略则是指双方利益总和最大的策略。  - `! O+ F7 a  P! W+ y) l1 |
[编辑本段]严格优势策略举例分析
6 _5 d4 ~! x6 c/ O! g  s  一、经典的囚徒困境
1 u6 _  [6 C5 T) T9 g  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
# G) s7 z) `9 k" }3 n  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( c# h% N! X* m
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - U  k& @  [8 G! s! ]% _
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 . Z: H  \% N5 H
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 K$ n/ [. M5 U  
$ _6 ]' z3 K5 ^- K用表格概述如下:
# c/ j$ D0 S" v( o& F+ U+ J1 o3 ^% r% `
    甲沉默(合作)  甲认罪(背叛)  * u+ c" q6 _# G! X" w6 g& k
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  * `0 @% @; @/ N# j
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
4 q( Y. r) x* }' k' L% g2 k* S
5 W& k0 i6 x; R% T6 J  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( k$ G! ^, A2 v5 P1 E1 j/ Y  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: " `  D& t8 ?9 Y7 t5 u6 K
  若对方沉默、背叛会让我获释,所以会选择背叛。 ; V$ C; p; ?/ ~2 X; h( R; i/ t
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, S4 s5 ?& q6 [, J! S  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& U8 C/ k8 Z% N) s  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 \+ d4 B! W, `* y6 m/ Q  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 Q2 h& r: q1 D( I8 q1 z
[编辑本段]二、智猪博弈理论
$ y. b$ ?5 Q0 v$ o7 y+ u  M- e: [  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 . _. y5 O, Z2 ?) G8 G0 c4 R
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 $ N$ e/ D/ Y, J7 W  ]' M* V- _
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' _& ~: f  K) Q0 E. l$ h" u5 v% u1 C  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
, O6 q8 x4 e3 ]1 f+ i  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 6 I8 V9 ~* r# t- q# A7 [4 j
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( |- p0 P) ]# u* Z5 i0 }
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% y" P  |/ x' e! X- |' R( v
  % L$ g  Y* `, _* }
三、关于企业价格策略
9 K: r$ C7 O' F: {* I2 y' W8 w6 q5 o+ h7 a, Y
  
6 g9 E6 l$ o% t. e0 R1 H  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: v. F- G' g# K/ t6 ?1 ]6 j* Z  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);& q7 m' q9 y/ p( m) H0 k( {: [! P
  以下三个定义:0 R) ?8 V% V& e- p: j; V# j
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : D/ s: l% Y9 `! P# e
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 c0 I  n' {9 w' m& n
  所谓的双方优势策略则是指双方利益总和最大的策略。  ) ]6 e: N, x5 ?8 t) x" t  n& H
[编辑本段]严格优势策略举例分析
: R- G# k5 S9 z7 u0 k+ V8 {  一、经典的囚徒困境 1 G3 _5 q! `3 o& p- E8 q6 [
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
& c3 P( M% @# O( e; N5 j4 X0 X- M  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : \6 U/ I) U6 d
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 a4 u+ r( n* O% m. X) U8 i2 t5 ^
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# R7 \% N5 z8 V; h+ B# Q  b  若二人都互相检举(互相“背叛”),则二人同样判监2年。
. B& c! `" U. [+ v  
  @9 s9 \2 F% y# X  W1 \- q用表格概述如下:
4 _1 J2 R/ U  X
1 `1 H# Z! g* R2 r    甲沉默(合作)  甲认罪(背叛)  
' w7 i! q% ~' u' J$ q2 y乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
' w9 N  p6 R0 @8 n9 P9 P$ f乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
5 Z. I+ B1 _: w0 V% _+ L9 }2 a
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 Q9 j4 Z5 C- [- E: E  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 2 W+ [9 o7 {8 u" b
  若对方沉默、背叛会让我获释,所以会选择背叛。
, e8 T0 ~& j. T% Z4 @( n  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 - o) m2 m# G0 L# r
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ H* I3 L7 D1 A% B8 J  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 2 G& r; }! M4 a3 ~9 J
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
! h4 l6 t/ U) h# x  K[编辑本段]二、智猪博弈理论
7 n- Z0 a" K' w" T  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( a# I! Q  p( K6 B: a) `
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' v" R9 {$ o/ S, p! E$ f
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 i! i' m- a; y% U, m2 f: ~) E  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; v9 J- I. I" z0 P0 o& W  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* T% z9 X$ j# ]. T$ o2 C8 i; H  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 J7 ^% N8 {7 F% T) ^$ X" Z6 \+ l  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 `- T1 ?3 `9 k& x4 E1 v
  1 }! L7 `3 r" B7 b1 O! ^
三、关于企业价格策略
) W0 t+ l5 J# K
+ \+ C4 e, W% ~3 _, ]* ]0 P. I) D3 J  
; ]" z  ]6 O; _5 o  J8 @- C  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, D6 U$ x# a1 X' e( p  v* P  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 u" K4 t! J+ \4 V5 d. c  以下三个定义:
& D; [0 a2 X5 V+ U  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; w0 j+ s4 [/ _# Z
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 n" b* u# X' M/ |: L6 d  所谓的双方优势策略则是指双方利益总和最大的策略。  
; l- P4 C8 Q* z$ K& F) k/ u/ c; V[编辑本段]严格优势策略举例分析
; u: {. T3 Z) o  一、经典的囚徒困境
7 n' ^7 s! _, S' P- H, X% h; k  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! h+ w) o% j2 h  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: , v; O6 i7 g7 M0 d' o$ V
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
0 y% R( q7 f* Z  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 B9 q! l4 ?3 ^
  若二人都互相检举(互相“背叛”),则二人同样判监2年。: ?7 v0 ]( r8 F# _, z2 e: s5 a+ I/ Y
  " V* p+ q8 s1 g1 W0 L
用表格概述如下:, m5 y$ a1 x! }% @( k
: ]  o- I: l4 S' I% X: ]
    甲沉默(合作)  甲认罪(背叛)  
- ^8 X' b! F& _; ?' _' V! I2 f& J乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  2 F/ d& i) O; T& t
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  , ^/ b. j/ V8 a$ u, k$ a

7 r- y" `0 X* ]- t. |6 X6 e* q* Z  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 m- U7 `4 Y% [  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: B9 t/ n0 Z. [/ v8 h$ r  若对方沉默、背叛会让我获释,所以会选择背叛。 6 [5 P  \/ H2 w7 w8 X8 K0 X& E
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
4 `8 K3 J, X; P% r1 y  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 I8 t/ `$ V* Z% c: _9 Z& Z6 N: T  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * J0 g5 N  n. t% ~6 Z
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) n" G) S. }. P/ s) i
[编辑本段]二、智猪博弈理论% V5 I8 E2 d7 E1 h; f- w8 v% R
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 g  b4 H( W8 a, x1 Z4 f
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。   L% H2 w0 g3 m" R3 o7 h" r  I/ t! L
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; i4 F, e: n& R  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- T9 K& N6 ~" j& E; D) U  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ ?& {# ?3 S5 s1 ~  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 . {# }- w& {3 @( `
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) D( `2 y4 S* v3 U' D$ ^
  
3 l3 D& U& N) C9 x三、关于企业价格策略1 R! M, ]: s1 Y1 o# X

$ o7 b/ c! `4 f3 b2 [  
8 K) Y* H1 y7 ]) k) P  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? . c0 t5 U- z* Y$ f: Q! l/ }' v7 @
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 A$ @3 H) h: }0 Z' |; f
  以下三个定义:
' r7 v! _: K' d& ~8 ^  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * J* N( T, o8 e$ n7 {9 o
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* k2 Z0 a6 \6 X0 @6 v; {  所谓的双方优势策略则是指双方利益总和最大的策略。  ! c' w. W3 ~7 f3 l+ t8 `
[编辑本段]严格优势策略举例分析
! G# Y0 j" B  q+ o$ p& r  一、经典的囚徒困境 : i' M' [7 ]; O: ^9 g6 F
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 A. z8 B9 Y2 J; |- q6 K& U
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 o* [+ Z) G% O; B' ]* N! p" n6 S  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( s; M2 \8 G% j$ Y  r5 t
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 # U( @7 j9 R' B6 S- p3 g6 c
  若二人都互相检举(互相“背叛”),则二人同样判监2年。) L5 y8 j4 ]& L4 o
  
4 ^- K$ n/ @1 h% J. v- @0 S/ K- l用表格概述如下:3 e5 G. z% S; @
0 @/ b/ c. c. E1 X1 H0 n  p
    甲沉默(合作)  甲认罪(背叛)  , e. u5 _7 `( x! _, J
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
$ `/ l. j& [6 L- I+ \乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
" F* q0 f% G. O5 a
4 r! A: A& u9 `5 S' {  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 P9 _7 q0 I4 Z7 G& u. J. T/ v( p
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ I* ^; Q9 w4 @7 A9 Y  若对方沉默、背叛会让我获释,所以会选择背叛。 7 M4 l5 t  r' ~
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 % L$ K5 u0 p7 e
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 M. }  S, U& n4 K" r: {) K' |, T8 h  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : U# O+ `  E8 C+ m
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 c4 v" l. A: @: A/ ^' Z* M  O
[编辑本段]二、智猪博弈理论9 g: z' t7 K7 f9 i' x" g" n( B- s5 \
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 6 w% ]/ B: p5 X( r. F0 C# z4 W
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 f3 P$ ^2 H! `. i% k: t4 [
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% M/ X$ ^( A- V, x  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" }2 r. V8 v9 W5 O5 I5 l, g/ F  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 e6 S- M# \0 Y1 j1 m3 }, v$ I7 c( s! K  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # s; h( V/ V3 C, I, q
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. F! _7 c: L1 h3 E; M* y1 D
    Q- @9 g! }4 z6 S( R; R
三、关于企业价格策略
& N; H( c2 ^( Y- N3 `0 z7 ^5 ?+ z2 |
  
* |' ~) O& v. M: E  v# t  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " r0 Y; C7 k* a5 [6 ^; {- z5 s
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (http://www.laomiw.com/) Powered by Discuz! X3.4