本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 - o0 L6 y# E) s- y1 Q5 o, ~1 l, I$ D' a
- Q- u/ o! u! K$ Z/ X/ _, z- x8 X5 p严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ I5 ^! B' o# v7 {8 U
以下三个定义:) \( N3 G( }, U& Z; ~% i y3 ]0 S
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% y3 o9 O( g( l 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * R) a) p$ }' {1 c8 B+ S, {. u( F
所谓的双方优势策略则是指双方利益总和最大的策略。
8 n! p7 u- R# [( ~2 p& c[编辑本段]严格优势策略举例分析! m# U- @6 d3 V$ @5 q6 C. H
一、经典的囚徒困境
) E* T/ J" c$ c( n( z. [ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, Z. \ k5 E% L$ U 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 L9 D! |. t+ F9 G 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 , m0 ?4 S7 p9 A+ s5 _5 t
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) o* p. O5 J# N) r: K
若二人都互相检举(互相“背叛”),则二人同样判监2年。* ], e3 @/ }7 U2 d/ }4 g! ~1 R6 E/ q
# U8 D& s; _! n- v* q+ |
用表格概述如下:
5 b$ K) [$ a* T& l/ U- n) [. E; s- K! H' [! ^$ G7 |3 U9 g
甲沉默(合作) 甲认罪(背叛) ) e; M8 `: K; E& m( q9 k8 u9 |
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 V6 q2 K0 K/ w' h乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
@0 _. B( e2 t& h4 H; N Z {. H1 ]
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 _- E8 \" i. W, P% c 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
5 {. j9 t5 x6 `0 U/ k 若对方沉默、背叛会让我获释,所以会选择背叛。
) p0 F+ [& e0 W: J) s; h 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 K( L' {- K( w8 o- |$ z" q8 M
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ i O3 i2 ~: r) v 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! h& D, D2 [* x: j! m" P7 q
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% }! d. n5 |. C5 Z[编辑本段]二、智猪博弈理论
7 S: n* J3 v) S. w5 X: Z6 R W7 } 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 f( G* G, _5 |0 \( j) V$ c 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 C6 }% X7 c# w* M) K2 j, b" z- } 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- c7 s) Z/ b5 A5 V5 K- c' O 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; ]5 s" j8 `+ B. L7 c
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % V4 Q6 _2 g, M6 o% d
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& b F2 {$ U: _4 E1 {+ Y/ _ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。* M% R: m4 i, I+ ]! e" m
8 M$ G" k: a# ^4 W$ Q- J
三、关于企业价格策略
+ T* S# ]7 l E* r/ ?4 v
2 f2 x) C9 X* v9 d4 X, P! E
# j5 f. K# V& ~+ l) J8 e 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% Q! q) E$ d; S' Z; [9 Z! l 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 M4 G/ z' A$ n: K) @; i
以下三个定义:
0 H# Y/ K) P3 x/ Q( [ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 g7 S" ?3 M, U# ]) j& @
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% Z: U/ E% t6 t! n) s 所谓的双方优势策略则是指双方利益总和最大的策略。 9 R$ q' m' W9 _4 W; O7 Y" w
[编辑本段]严格优势策略举例分析
; S2 d& d' R4 _& y I 一、经典的囚徒困境 , ?' i' _7 U; ]
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. M* H9 o& Y, _9 \2 O 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' _4 r M# i8 M Z' n9 w% V 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; Z: ~, ~* S' ^& j! Z 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 6 {) i# ^) c9 @, e
若二人都互相检举(互相“背叛”),则二人同样判监2年。
& a8 p% [2 O1 ~6 J6 a9 d
. L5 ]" z, O4 \1 V+ L用表格概述如下:
" [& J' R# `: f, S. Q; U1 O0 V6 k( |# \6 B, d
甲沉默(合作) 甲认罪(背叛)
& p. W |$ Z& ~' ~" k0 b乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
0 d1 R6 j) v9 d, Z% \乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 * g, B! h/ X9 d. S# i
1 p5 u" a) |5 P# `( h 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : G& v% \, F6 _. }7 W6 p) l
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
% G; \6 t# O* r 若对方沉默、背叛会让我获释,所以会选择背叛。
; s) [" Q& M6 v5 ? 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 Q1 C* K. M& a* s/ A
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& w; A: a C% o; L 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* ~# `- ]) j/ I- g) R1 o5 R: s; N 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
: Q( w1 e* B- y# L2 v" S[编辑本段]二、智猪博弈理论
: S1 h5 r5 B7 P% K6 q8 I( } 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " z: `" E) w6 J0 N
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 N! p" ?5 Y1 ?! h
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; ?! d2 p9 J3 d5 Y4 L8 x 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% Y0 v' Y0 {" k% T3 {1 v2 g “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 5 f# w: q8 {% H6 b+ g1 T
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 J5 S+ f5 n2 k5 O7 J
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
. s# f" P# Y, ^% e5 z5 W, u7 m
! L$ ~! c8 d4 }# Q) P- j; T三、关于企业价格策略" O) |( g$ R: y' @9 K& W
# b/ s$ z# J/ U5 L; `
, h5 a6 L6 D0 V! l: W1 v& q1 R 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% v. A) t# m. a/ a. G- } 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: c+ }% g' A6 t1 g4 F; ~1 a0 @" D 以下三个定义:* B5 b3 i2 z$ C7 I' L A. y8 o
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ F/ s) v' A4 }0 T3 x. G
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' e5 o/ ~& s' \9 d* k
所谓的双方优势策略则是指双方利益总和最大的策略。 $ I; d# F. N) e: z4 j! ]- i, \
[编辑本段]严格优势策略举例分析
. j" B& a7 p6 a% X 一、经典的囚徒困境 3 }" E+ i' v' g- `# {/ k
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 M3 b9 E9 q: B+ h 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 8 X" e7 F. B% {
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + v* {1 j* s6 S1 N" E8 f+ }
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ h4 e& U2 r+ H5 w. T 若二人都互相检举(互相“背叛”),则二人同样判监2年。. L3 E6 O% [& A7 H' I$ i
9 f" E. K& U6 `+ C2 F
用表格概述如下:
, L. i7 Y- {9 J9 @9 b
# K) D* x- v# Y- c g2 l0 c 甲沉默(合作) 甲认罪(背叛) 0 W* ~$ c' Y, j1 L$ \9 Y- |
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. D/ v. b2 K$ J3 i1 i: D! `4 `乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 + K! Z( y- u9 H# |
* f/ V* a7 c) B/ d Y( i. L7 W* n) e
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, K1 o l+ u# T( o) o 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 C% K6 j- n: e9 q; u
若对方沉默、背叛会让我获释,所以会选择背叛。 8 x- p! v& v! J6 D4 M
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
1 u) w, E' B. ] 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 " _1 `+ g j# v
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
) {1 C9 G: U! o* n 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。& i. @, H' n, Q4 s, x
[编辑本段]二、智猪博弈理论0 E8 z5 i9 T. g2 X
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
0 o+ y) C0 V0 u% _" P5 e- n) Z, o0 q 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
! f, J4 F# ?% C' C5 C, c 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# a" T# ` c' c! j3 j" k 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # T, g# n* W3 i `9 M" v, G' {
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 . m; v/ j/ n) F) E' o) v& S
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 D9 t) I) }: c; e1 K5 i+ C; d
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 u0 J1 w [5 x% `1 M% l5 r
2 ^) A: O2 b. T3 \& T4 s# k6 V三、关于企业价格策略+ \8 Q( p( e* j! Z- w! R) ^, G, n
. K! u0 M+ M" i. h7 N$ ? 8 {( }, k. A6 Y8 }( f2 |
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ S9 V% L! _0 J0 S1 Q
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 C3 e& q9 G% q% Y* J
以下三个定义:3 y& I5 X( c( M" z7 R C- W3 i G
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; r# M2 Y5 o& {1 R2 ^ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 3 G" ~. m! |' `* \/ N
所谓的双方优势策略则是指双方利益总和最大的策略。
5 g! A6 r4 g5 k4 m& s[编辑本段]严格优势策略举例分析
. n& b" P6 O! _# k& } t 一、经典的囚徒困境 9 _5 g/ ]! q8 F, Y! N" ~
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ Y# o7 `: Z+ I; P 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
+ X( b# w" d; g0 C* V 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + q. t+ N6 x+ A
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 K% P4 q5 f0 |, d" Z1 L
若二人都互相检举(互相“背叛”),则二人同样判监2年。' N+ q( @; r( Z% r5 E) Z1 `" h, t* A& j
3 A/ j3 ]4 o" e
用表格概述如下:
6 l# o: c8 S$ b: Y7 j# a P- u! ~$ b6 ^$ [- {
甲沉默(合作) 甲认罪(背叛) 5 Q# G" V% u0 f$ Y/ L: b0 q$ v
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 O4 W4 m9 [1 @. F( p/ D5 U6 \6 ?
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
" a; G0 V: J1 D! g% j
6 U) L) g' O% V( E8 Z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
+ ]6 F- p: d3 u2 D. }3 X 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 T* @ P6 d0 Y. d% f$ M 若对方沉默、背叛会让我获释,所以会选择背叛。
9 J1 @. i1 v: P& P* W! {! [! M5 P 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
( X; e. ]2 s9 q1 x( n: \( R, r 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 `7 Y6 Q1 N) I- E) Q& x3 Q
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
$ m5 M! D$ l% N3 G5 E 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 @* v0 E; F0 g, N1 H[编辑本段]二、智猪博弈理论
$ t& s0 r e* _& K6 s 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ s V9 G+ Q6 ^! K' e) U1 W2 P7 \ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ u% B# `2 B# O% C 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % \/ T2 l* Z3 G* D9 r9 o
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
8 x8 ]( F1 j6 q% w" `/ Q6 y5 b$ O& ^ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
+ T( s9 c6 V H- C* g7 q( k 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 k& v p0 e7 v4 L' k6 L
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。6 ^# n& L+ v( |1 g& J
6 S- [9 q& S( F/ V! ^, z! K
三、关于企业价格策略1 L; t @' [0 \* e" q0 p: d1 b8 B
; }) } u8 w5 o$ P
% O' v3 _8 e- D. P
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ) G) P- b4 O/ p, ^: M
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |