本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 0 j D0 i) I4 `" y% s4 B8 W; i
8 \ M S6 M4 {8 M! ]# w9 B
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 {5 |8 G7 T3 p. s. A' s# O
以下三个定义:
4 i, n$ [3 `, {) M9 v 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & D8 v5 D# k0 U3 W. z) v% i
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 c1 H8 M5 s% c 所谓的双方优势策略则是指双方利益总和最大的策略。
+ g; o8 a+ K; F* E8 z/ B a[编辑本段]严格优势策略举例分析
! O; ~* F3 k( l, y7 B( s! r 一、经典的囚徒困境 ) u D; O* j8 [; ?
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: . @- b$ @( K7 |, i2 F/ c3 `% S
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % G6 T, a5 w: c
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& o5 G9 _0 z, s6 N 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " e- d* ?6 O3 V' U/ l
若二人都互相检举(互相“背叛”),则二人同样判监2年。
% T0 ] Q" O9 d3 g
% X5 i" q" e- _7 d& R3 I6 `) h用表格概述如下:
/ z% M/ J" o# m! W0 [7 B& W# X5 b) V' {: [' a! A; y! E
甲沉默(合作) 甲认罪(背叛)
9 n3 B( f3 T' } L- M3 b乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 - J$ z; F. f- s# h; y
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + M3 r5 N6 S' A( v' {
$ k) D! B r; E1 h
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 c2 ?+ N% s: ~* {! w
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( c9 L1 ?) ?( F& | 若对方沉默、背叛会让我获释,所以会选择背叛。
& ?; P8 C( j& H0 f 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
! b* Q/ ]3 i5 x5 U$ | 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 m5 j3 r! {9 o6 n 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 o1 v& w) o& r
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( K+ o0 O- V6 ~" M[编辑本段]二、智猪博弈理论
# g! u9 T& j! U( N3 r& p 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" Q; q* H! A# |- U3 S# ~! o 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 {" M f: p' x) s; N! f# v 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . A2 j" k; v8 J i. C/ u, t
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : O7 [0 ~7 K, j4 O2 B: ?8 p4 X g. S
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 5 v5 P- h9 v, a1 C! g( i# Z- F
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
* l O" K2 z" U 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 Y0 p4 N1 \- H2 R/ [1 m! L
; C; {2 s0 @2 r% F3 n) `. ]- D三、关于企业价格策略
$ |! q2 \- D: \1 N
P& m3 e: o3 B3 m( `, }' z
1 A/ a& \6 j% J9 D$ D' [. U 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 K3 b; B! G- e
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
9 @* A" \6 @& P% ?8 j/ X- Q 以下三个定义:
: V# v5 G1 W- j' [ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ) _7 w' \) K* W" S
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & @' k6 q9 t/ T
所谓的双方优势策略则是指双方利益总和最大的策略。
/ X- q. a0 M- K* r" o: e[编辑本段]严格优势策略举例分析$ k' F; Y/ j; i: w$ X, C
一、经典的囚徒困境 * L9 d U, d' l
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 1 M+ F3 a$ J& D$ P- i
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 S3 ~% M9 p; h" s4 i; W
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& X0 m4 `9 e2 q7 a" l) @ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
q% ^& X& j/ g 若二人都互相检举(互相“背叛”),则二人同样判监2年。
- j" P, l0 v8 g3 u' O ( U6 S5 Q; Z& W4 [
用表格概述如下:
5 Y6 T* }2 I9 G- z7 m# P2 E. @5 l- r6 T& \, O* n5 H
甲沉默(合作) 甲认罪(背叛) & A* _# y" f0 d) V) n2 G* Z2 r/ \
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
1 W5 L( g# j4 V3 {+ [2 D D# G乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
; Q4 g, D' S0 `* N) N& t; B) \, j: r) q1 X" I
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
! i. Z' e3 l ~' G2 U" x+ v" E 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
, ]3 Z) ~, i0 g$ I' x) E' R 若对方沉默、背叛会让我获释,所以会选择背叛。 ; w! B! x2 z; t$ r" F
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ! W5 V% P1 `7 e" e
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, a' @( y& Q F) I R 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ' c% r$ }9 U5 E. e) {. Y
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
) D2 B0 Q/ }) [) E/ y, m[编辑本段]二、智猪博弈理论
! u8 q0 G. M. m! T: N- Z 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# ^0 S/ ]: e$ i4 l$ C7 i& q2 p% E 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # r9 e) p1 W9 r
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 @; v+ i7 V, g' ]7 T
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ v/ z- q, ?7 C+ A; ?: A0 _
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 v6 Y7 g2 l+ O. [" W' w; H 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + i: L" L& t) p, X3 X
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' G8 p( n: h+ E% h! h/ ~4 Y! K
' z' I& K: y. |三、关于企业价格策略
1 N, w& c4 W- `% u/ U+ [- L/ i6 q1 `5 [1 Q
7 k+ {0 ^: y0 V% d
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: M) ^2 S% X8 p$ _ y 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 B$ Q% u; y9 g; m' _1 U
以下三个定义:: j9 O$ c: {$ n( E
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( V, ~' U1 w2 _# I4 p$ O7 \ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( j) F3 m4 u6 \
所谓的双方优势策略则是指双方利益总和最大的策略。
% I" g8 F0 h! u9 q- x/ \9 J- v[编辑本段]严格优势策略举例分析4 ?: k. g; A% W* }7 D: b
一、经典的囚徒困境
2 L& n( ` \' t- S3 p 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
: \9 u4 [ a5 Y% T 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' z2 E5 Q6 F0 L, ?' U7 ]
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' a8 W. e% ~% n, V7 p9 M) I 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , y# Y+ w/ @: S
若二人都互相检举(互相“背叛”),则二人同样判监2年。3 `5 s4 g" b* _1 x
7 ]! l6 z6 k7 ] g; D用表格概述如下:
( H2 \, s( ^1 N
/ y( e ?0 x0 ^" k$ S9 T+ z 甲沉默(合作) 甲认罪(背叛) 2 k. ?' \+ I, ^4 p5 W6 w
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 . ?1 B+ `. Q$ j/ K
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 f: R5 ^+ S* Z7 \0 \
+ O* b8 s' e8 g8 S( G+ B$ u) e
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 v& {' u2 r$ h8 t1 S5 c* N z
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: - ~% R. A0 s6 @4 W. I/ j, g+ k
若对方沉默、背叛会让我获释,所以会选择背叛。
5 k4 M& l* V3 \" o' n& L 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 e# x0 ]) {/ k/ D% x6 H 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 . Q, T0 q3 \: }7 s
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 " O7 P) p- Z% k: s: d
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) M; b: ~' I7 k
[编辑本段]二、智猪博弈理论, n1 |. {6 ~$ p/ s3 W
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 r3 w) ~6 N1 d: U5 z
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 $ A/ `9 w. ~$ Z( [2 _8 S4 H. [3 s3 `
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
& v2 j, I" s9 O5 ~# L6 I+ T' a+ r 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 J( I2 ~! u+ f- ~/ V% x/ G
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 h1 L4 W! g3 C+ D 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: l' d6 J. P9 v {- X. g 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
1 B* @$ C: J% F0 {9 C, `9 C ; A# C: J' L$ J' V0 z: D( `2 [9 [9 V
三、关于企业价格策略
+ X4 U* b% W6 g- v+ A Y4 T/ ]3 e2 L3 j
/ A$ e3 F. Y0 K6 s, {9 b 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! P$ J2 i. {; \. I: T9 }5 b
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) K) C; u1 \5 \# S- e% Q$ j/ ]
以下三个定义:
' ]9 d1 w. ^" z 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
2 A/ F, M+ E& M+ [ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; `4 G7 O( ~1 b+ ?( S8 o 所谓的双方优势策略则是指双方利益总和最大的策略。 ( h, K5 Z3 q# n$ b
[编辑本段]严格优势策略举例分析& s- h, b3 q) z; E7 Y2 V% e
一、经典的囚徒困境
8 M+ d, P! g& _5 H 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 ^0 R1 z/ k: Z1 E8 J7 k 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
3 a8 G+ N. F& P0 O- ] 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) v0 c+ m% u- _6 I$ n) k- l( f5 d6 o
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ ^; H! P, T6 l6 Y3 s* O 若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 `6 ?1 _2 q& H6 I7 ?9 J' j
[8 t* _4 Z3 @( ~, B' {, M3 D用表格概述如下:
- f8 n9 j* Z% c, w& J6 F- }0 [/ W% x
甲沉默(合作) 甲认罪(背叛) - \2 w4 h% n" e3 A9 J
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
- n. y: e; K! j* Y! @" {1 ^, y乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
6 K8 p6 ~7 n: Y! e/ \. e3 M7 S* E1 |9 J. S" P* |# P
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ' O- h5 b }6 g
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
1 M) j$ l, T J. U! R J5 b 若对方沉默、背叛会让我获释,所以会选择背叛。 ' x+ M( t* F' ^" T/ {" D$ n
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) m) w' q3 }$ x8 @/ w
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
1 f! e; r; l) q 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + W" d( t4 O `% x3 u! a1 U
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 d& V$ l( z: v& x* U! k[编辑本段]二、智猪博弈理论
8 P% Z, H# L; E+ t 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
1 m/ j# s# a5 ]4 @% r* U5 x 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 9 O$ G4 S: Z- x
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
7 _! K. \1 V, Z1 \; O% a 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 3 u9 b6 y( W5 ?( N! S* x
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . ], m& j8 h% B, m9 `! t/ ~2 g, V# H4 O* r
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 7 h: y- z0 M( E5 }6 @
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 v/ x4 F( K! i$ {0 b e( K
) [4 w. R1 }9 `7 A/ l% m& I" A" k% K三、关于企业价格策略
& U. W# e$ v M- [! ]3 l6 a8 |9 _! t/ q2 I4 d, `7 |' v
+ ], _/ a' A5 s 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. A# F! b7 J3 @4 y$ S* P$ } 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |