本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 8 e, d4 H' D* l/ m
+ U# w( [" p8 f5 o- b严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
# W* L) u- T1 \ 以下三个定义:! F. p B9 y; e- d( }
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
" `4 |" k% R9 z% C 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' H/ g( i7 P( r7 w 所谓的双方优势策略则是指双方利益总和最大的策略。
0 A6 M% o% x) \ m1 W[编辑本段]严格优势策略举例分析
) c4 {1 o) V! C 一、经典的囚徒困境
/ A- _+ }8 c% B) C6 M5 C 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + B! Q% J$ n A/ j" j
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 3 O, V* f3 V. J$ r
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* h- A* g$ {" l2 } 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* \4 f9 |8 m$ w, O) C8 ?& B 若二人都互相检举(互相“背叛”),则二人同样判监2年。
- z$ ` K" N( ]+ H
6 L+ v$ T' ] I ?用表格概述如下:" }! y/ C, V" Y" ]
* v/ a8 ?7 y0 M- E# K* _4 I; G 甲沉默(合作) 甲认罪(背叛) ! V& C' V5 ` V
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
+ g# A+ g" l' w; x2 d8 [乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 @" G! |. M1 I7 g: s" c$ g1 [
& O3 {1 T6 H/ a' T- } 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 " c5 t7 ^4 d# ?* E4 ?
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ) W) [/ |3 P. n6 @" V; _* M
若对方沉默、背叛会让我获释,所以会选择背叛。
$ Z- ^0 P! h- w& M& I- ` 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
r+ q* G6 W& A$ O6 L( T0 u! P4 S+ |/ o 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
% a* b+ {- l; k# m* |* ^7 l 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 I* U+ H4 z4 K- G6 G
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* y2 W9 Q8 @/ \ E& G3 Y
[编辑本段]二、智猪博弈理论
% `; R& t# c! k5 Q 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 # O4 W, |# U7 Z, L/ G3 S
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! l+ \6 D! F7 p 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 0 `4 }5 X! J) \) }% @+ e4 M
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( S k. C; R% ^. s8 I: H “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ R. J! ]8 O/ I. [: X 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 `9 g$ M8 t! ~) j# x8 L. l2 Z 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
1 G9 a1 h+ e5 c2 [+ \( X X$ w 8 i% e0 f* \; e5 z/ r+ s
三、关于企业价格策略; P9 A! g$ O! ?7 C! A$ r
% U* k( d: }. ~ " S2 ^% A8 m0 p1 u v( t) M
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % y; l# v5 a5 R& r" o+ J2 V
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 r; r2 k% s' G7 @" x
以下三个定义:
( z: V( Z# f, K _9 }% p! R* I 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
* @0 u" J5 W6 T9 I 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 C3 W& A/ n) A. p9 H/ `6 o 所谓的双方优势策略则是指双方利益总和最大的策略。 : w! c$ V. M# E, [) @
[编辑本段]严格优势策略举例分析7 f/ d3 H% d7 f- z% _* p/ C) [
一、经典的囚徒困境
s) Y1 J- Y) p/ d2 e: l8 O Z 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 G C' x" b! A' y% g6 e" m9 b) t
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' y: L9 U( e8 i
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 * [* C1 ~- _5 G' n7 t C& R4 O% ~
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
7 M5 [% q: o" X: ^0 M; a 若二人都互相检举(互相“背叛”),则二人同样判监2年。5 P( Z8 s$ F# Q+ W6 z' |
; u: v7 A5 f) r6 ^+ }/ e3 n
用表格概述如下:2 d+ W9 X6 p! m s4 A
! G9 m6 A3 E2 j0 E) k 甲沉默(合作) 甲认罪(背叛)
; `0 E+ I( N- D% Z# ]0 C$ C" Z' ~乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
( ^0 x- A% d) ~' V4 V1 A; j* K乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 8 B1 C! }5 `# q0 x$ E) D
, F8 A4 Z! R4 P. ] 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* ]. K0 C) x/ a. U5 |& u 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * U- w9 u Y7 N( B3 F
若对方沉默、背叛会让我获释,所以会选择背叛。
8 d" T+ v5 J6 c4 C' g 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " H! g! k2 B, D7 i; K# G# p
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 8 g+ [7 h: M1 u: k+ d
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( ?. z* _ t# u/ V
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ ~7 F7 V; p( e1 L9 A8 U# W( A
[编辑本段]二、智猪博弈理论
R: V& W( q# A+ B 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 V9 ]0 `9 ]. E 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 Z5 \6 P# _4 a" |! }% Q+ w 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & o' Z, C' R- y8 \7 f, \
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 `+ @) L2 v* U/ R5 Q+ y: `
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - j% t4 c& U& l8 d0 k! ?1 Q7 f) Z
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 5 ?( m' {- b3 V) Z8 U
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' z$ ]% ^9 Y! r5 i
. C& C4 {7 y8 y( l$ b三、关于企业价格策略5 B* I7 v1 [1 _
& J% ?. j9 x( ^0 I$ g: y. u5 N
' z3 P: `3 u- W5 ^' L 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
& ^! F: H p4 Y4 [; k% j 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 e( p# `) `7 T" `5 N" N
以下三个定义:9 e I) @8 i1 v6 l/ i d
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # h6 O% Y6 b' e+ A
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* p" E w' g/ [ 所谓的双方优势策略则是指双方利益总和最大的策略。
7 P2 k, b7 l4 E8 z' q/ @5 q" |[编辑本段]严格优势策略举例分析
" T# l( Z* F! f7 V 一、经典的囚徒困境 $ r( t0 o. D/ S( ~7 N3 Z# e
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: # i. r+ a6 e, y% _
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. n% ?6 k3 |! S* Q 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 , G9 @/ {" \ e" o; V
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ]9 e" i" H5 i0 x# O' d$ d/ H- S
若二人都互相检举(互相“背叛”),则二人同样判监2年。
' m6 B+ l8 N: z' b# p1 q9 a; {
: e0 e A+ L+ A. c) v用表格概述如下:
# q/ M. h3 k' [0 Y! ]
& W1 f8 G! t5 L" o+ ^) g 甲沉默(合作) 甲认罪(背叛)
/ \) b( f' a& t乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; V8 l( u `0 n3 q$ a/ Y/ y乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 & x, V% }& j* m4 c6 g
4 R: M9 T4 F0 ?
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 4 F: |8 C' J& S: w
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * `. h% m: z& n
若对方沉默、背叛会让我获释,所以会选择背叛。 % S8 g. L6 G) J, g' G9 k: P2 `" `
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
. C: F' Y g* t; ~% n 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 A7 V& P( X5 ?4 F }+ d* x9 i# @
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 f" p% z5 Y: K4 J; B h& n
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" @( I7 q1 ~! x1 j" E* W' F
[编辑本段]二、智猪博弈理论
* ]- M f) Q( ~ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 + i( G- {0 U3 Y; w) G/ J
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 $ \5 n1 `/ r( O+ m9 ? F5 G
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" F5 `3 v, J7 U7 W2 @, x1 ~% P 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
4 i5 w* ?" k5 L# f' b “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
1 U; Z$ t; C) |7 T9 O7 D$ U* { 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ w5 f6 @' B% C* ]! z; \' i 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' g0 r1 m# O, m+ Z( U: L! f
4 H) @3 x* |1 l( t三、关于企业价格策略
) I& f7 n; U. W5 S) p" j& u
! Q% W9 t0 v$ l& i+ @% B N. c2 {3 x! ~$ n6 C- }: C
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
@4 f& f# T6 _; k: O S3 {# ` 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 K! I2 t. M! E- {
以下三个定义:5 m7 L% O4 V ?& l" L9 p7 }! G! a& x
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; V3 o# `4 H! E" h& `- p
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 5 p" \; r6 A, c8 p
所谓的双方优势策略则是指双方利益总和最大的策略。
2 ]. Q" \/ y* `+ K3 X7 q[编辑本段]严格优势策略举例分析7 h( U8 k4 M+ i- W! {
一、经典的囚徒困境
7 T5 b( d/ b' F+ o3 M 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 @( ~8 K4 `1 \ O" k* k+ n
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # f+ r0 c: F z! _. f
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 n9 _8 F, h: }) d; J. Q 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& h. G% Q5 w) T: m9 ^9 ^: [( R: S 若二人都互相检举(互相“背叛”),则二人同样判监2年。
% p; X+ j5 o' _' {# x- U- i
$ Z: B/ i4 u, u; l" h# \用表格概述如下:
% G3 [# D4 b/ D$ R3 i0 d* c5 `/ R! H; ]4 G2 n0 W
甲沉默(合作) 甲认罪(背叛)
/ X9 i& N$ a$ ]# p: R4 W乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% k, b0 K) i/ T. X乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 & t5 M: q+ }6 N6 S1 ]
$ t. t+ P( v3 |' w, R% `( p 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 # E: z! A- q: T, S4 h" W
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / y" y' [" T6 Q2 {
若对方沉默、背叛会让我获释,所以会选择背叛。 ! Q& d$ ]# r4 h+ y
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 d0 d5 f6 F7 u5 p+ _ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 % C- V# m! K$ ~3 u. S
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . z5 h* J2 l1 [
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 f. m/ N! R7 B h, K7 c7 e" v[编辑本段]二、智猪博弈理论
& ?$ N" g& V F: ]* L8 I 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 ~' L {" w, I' x0 d8 L: l
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 H, p" S: |8 _$ v) w. ` 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ F m. U; J$ C( {4 W q 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 {1 o2 j: m2 S1 U
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) C1 z0 p& G2 n/ Q+ Z
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 J9 a' F* m8 {! A/ D& ^ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, I, m u9 w' Z2 R1 F
* P& h3 P2 {9 @; a2 @) ^' u! {% F) Z三、关于企业价格策略9 Q9 K0 d4 c/ V( ]% w* B3 ?
; `% l; E& r% j: h
" W9 T. h x% \
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( w6 I$ t. x: h* c- b' W/ U
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |