本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
5 k* C+ I; M6 _2 Q. D5 a; V- p& Z, M3 `) Z& l0 m8 c. y& \. w, m
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; H+ ^# z9 C7 _
以下三个定义:
) y5 G( K7 n7 \0 E 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
: G- t0 _' | R& ` 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 J, l7 u9 c/ I# Z+ X% H 所谓的双方优势策略则是指双方利益总和最大的策略。 . x1 o" { @, x) @( a: Q; P$ Y" N
[编辑本段]严格优势策略举例分析8 v/ R! [1 }3 V/ y1 |3 [ M+ [
一、经典的囚徒困境
/ F# i, `8 x5 Q2 Q 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + D$ S+ u7 @2 V- D
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' F/ U6 n. k% X" M: _2 N$ _ }' {* O
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 n! i7 S) H( n. l r 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
4 Q0 T/ b" { }6 N" c 若二人都互相检举(互相“背叛”),则二人同样判监2年。3 ]% ]. L1 j! A
# w L! G6 t9 P# Y- F* X用表格概述如下:
$ v# Z3 q4 D# @2 Z& @6 f% y- t
1 O0 f! }# A$ v. d' n8 V! r 甲沉默(合作) 甲认罪(背叛)
/ B- O9 E( [) C, b1 u乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. `* `4 W2 g" c/ l4 H6 p' d! p% |/ ?乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
/ V/ \8 G$ J! g# B+ Y0 Q
+ w: K! m3 t+ M, N, g 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 d' |+ G+ Z: b8 \0 b4 I 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 D4 c) M6 \; B( O: ^" e. @ 若对方沉默、背叛会让我获释,所以会选择背叛。 ! o* y( o4 a$ x2 c
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 G. k. v6 i; `8 `
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' D$ B1 E4 G% E7 l9 O
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 }9 D4 w" z& U, G; T2 X, q8 v6 V 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。: Y( Z/ k4 n% }( B
[编辑本段]二、智猪博弈理论4 R/ n# T) d5 H: M7 ^4 Y
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 * G- \/ H! ]9 S8 s6 W( x6 N: q- Z
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ I0 W! `% E) E5 R. T 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 7 Y$ U1 I- ] [ A5 V3 g
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! }% n. x& m& L
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 M9 ~# b6 h) b1 _. B& V
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 d$ Y f) v, v0 G+ C 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。# E2 N5 I# x( ?# d1 t3 Q4 h% P3 t
( X: F$ R1 x& b1 e' y三、关于企业价格策略
% q j' y3 |9 K0 r* X% H5 r H' x5 P0 T2 v, }2 F
! t8 E) T7 N% E1 w
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 s& M9 A" M+ a) p3 B' X 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 E* g" l# j; H
以下三个定义:
) U0 M7 q4 R0 z- T' F 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & B8 j, I; l, y
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( P' b' e N: z+ z2 v 所谓的双方优势策略则是指双方利益总和最大的策略。 _2 Q- O' ~. F6 g4 n
[编辑本段]严格优势策略举例分析
9 k, ^# Y6 N6 V$ C 一、经典的囚徒困境 A( M& v& b9 b; p% `0 c! ?* o2 ]: p
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 v; K/ L5 S3 P1 z8 S) c
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: , }' f: r: V/ @3 S: k
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 T+ T! |8 H% N4 ~" V. `& l
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 5 j- A0 D1 B0 r2 ~* J3 V* E* f
若二人都互相检举(互相“背叛”),则二人同样判监2年。7 x, i6 }1 g ]7 H! W( C; j
& ?% o8 I" l# K% w; k# A$ K1 U: b
用表格概述如下:& a6 v2 n( I) |: c% P
7 V' a5 v; n" h0 u
甲沉默(合作) 甲认罪(背叛) 4 U% V/ X" X; k% o2 y4 Q' e( T6 {
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ! L5 ]2 h3 E% A& U
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
) i2 K( P: N( i+ i' F, i; S" h5 C/ E Y8 s
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% c2 |3 H2 I9 [0 m% u, W3 }5 G 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: - }1 D5 U: s) D3 a* l' Q& `
若对方沉默、背叛会让我获释,所以会选择背叛。 0 J9 o1 B, a( V( }0 c# Z
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 [# @6 X: a8 l( x2 r: A 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 . f+ Z6 c: J- Y5 a2 i- D! u
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 # ?2 b; h" Q7 l1 m+ j0 J$ {
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; K; X8 A4 D: P4 ][编辑本段]二、智猪博弈理论
$ v5 ?7 L7 }9 j 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 # m7 P6 H0 T* t" M0 X& h
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
" F; F8 Z& A; H0 F8 D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; g* P+ ?9 u- q7 k 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 b9 U0 \2 `1 H* x+ M1 V8 H! Z
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; R* Z9 k. e1 _, @- I 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. i. C2 k; ?4 t$ n: V 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: s3 W1 W. g" j; F+ n& k' ? 1 V( @4 a" u5 Q6 i( ~ @/ j% G6 U
三、关于企业价格策略
+ I/ v2 C9 F0 o9 ?9 d* h: c1 q- K: a
$ F! x2 l/ k' E/ J+ i/ t1 l
7 N+ h7 U. U. N7 B 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? + M# E v- Z" K6 F; l2 n# ?* g8 O+ p
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ K; l0 n/ }* i& D0 f
以下三个定义:
: ]1 U: L4 c* y" y4 W 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 3 H( m7 r$ g# `/ w' H
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
" a# t- h0 r; E 所谓的双方优势策略则是指双方利益总和最大的策略。
- n# d2 B1 S0 q+ X. A6 ^[编辑本段]严格优势策略举例分析) o: X' X- ]/ `! S/ g, j6 B
一、经典的囚徒困境 i- P" r0 D0 q2 G5 a5 e" h- ^
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 Y( {" o \& ?/ ] 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' c9 Z& U, S2 q3 T, L% H 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 J3 ?6 C# c6 t# T& Y+ g( ] 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 i, L- m/ G) y) v0 Q
若二人都互相检举(互相“背叛”),则二人同样判监2年。
! K* M2 S, m5 s. ~& a 6 p/ J! ~. d4 |6 Z+ a; | m/ R
用表格概述如下:
/ D& Y5 a% z7 d- b; {; ~1 B% M- K0 }. l+ {7 Y
甲沉默(合作) 甲认罪(背叛)
; [( F$ a- ^0 R/ W乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 F: L; @% I2 n乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
. n3 I U3 t1 w1 Q9 z" H$ F! w' J$ E# @1 C
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' r# u! i4 R" k3 G/ \! s4 L: T2 ? 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # E7 O' e7 Z! Z6 w! J9 M
若对方沉默、背叛会让我获释,所以会选择背叛。 6 G6 o9 p0 x s$ K# T9 y) Y
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, D9 T: v- w0 u1 _& V9 ` 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 C. t V2 }0 e5 D% E+ c 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* A# |5 l0 a( r9 L% x 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。5 X" _* d6 v/ m5 @4 `
[编辑本段]二、智猪博弈理论6 [4 ~% i3 A0 v) r3 m* R- |
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
! ~2 F% ] Y3 M m# C% _ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
$ i: h7 H$ @! D5 Q: w 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 ?- t3 q" K9 Y8 [
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 I. r5 \8 [8 v$ z1 c: j
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
" Z1 R; M2 y r* X+ d& L 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
6 w! x9 h& R7 p3 h# V% L 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# I4 J& M- h" O/ \ " J7 x' V- A) E2 F# F# U+ G' z6 ^
三、关于企业价格策略: L# N4 n a3 x4 ]) X/ T; f
$ D/ T1 g' y: s6 P- P/ c; b9 Y, E
7 c$ x5 A8 c1 i- B# x( \% p$ k4 i
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ i6 J$ m/ }/ T 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 Y% E5 v0 O+ Y' b1 ` 以下三个定义:0 C1 }; a# g) U4 o: }% E9 J
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + ~4 Q8 ?4 K' ^
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * h* q2 r0 ~& w. d
所谓的双方优势策略则是指双方利益总和最大的策略。
9 ~0 M) H; k" }[编辑本段]严格优势策略举例分析
( d: s! m4 l# \" f& }, k5 P 一、经典的囚徒困境
: V! }3 ?, x) N3 m1 E. n H 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 G4 j9 k( C3 K+ x
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) M6 o. Z# P& T) k1 j
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 n- C/ g; f: S% e" J! }) m. a 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / W4 O. u0 ?- n1 r+ x
若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 [% X! V1 ?2 A3 X
, V3 B0 K+ l$ Z0 p) w用表格概述如下:0 m& g0 C! j# @
z/ I! y" k4 p* S3 d% {
甲沉默(合作) 甲认罪(背叛)
8 H: M" x6 I5 ]1 h/ M, B5 M- P乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; C1 F& @6 @/ S5 f/ J9 V. S& |$ t+ }
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
1 ]' x' j( f4 {* f% C: t, c0 j, W3 _# s w* w: Z
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 S! b, }$ O S
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 6 q/ c1 x' q" q
若对方沉默、背叛会让我获释,所以会选择背叛。
4 J; Q" [6 J, B- _$ N# u 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 D) u! e8 z, Y 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( {8 F& j. b6 k$ ?8 Y' C1 I4 c! y 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- B; ^* z) N% ~; ] B! b 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。8 Q! K, S! J! K) l3 U
[编辑本段]二、智猪博弈理论1 M u; g+ ~8 }% M& j& r
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
$ { k9 r5 b' d) | 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . W8 Z0 ?, n+ |9 t: Z
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
; N/ Q3 R# T7 Y8 J7 m, c 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
; u) ~* b. R1 f; }1 l" T9 r “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 {- t( e9 x( Y
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 1 s; J, F" @5 v
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。6 \+ G! h0 E4 ? p" R; u/ L7 W
/ @8 k9 `2 y* q8 R/ E: f
三、关于企业价格策略$ }% U6 V+ k- v* g, x
8 z1 y) k- u; U+ l: C! H4 T; S: g' w
) W- S- X; E/ `* @1 ~
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 ^% N7 u3 u9 n3 `' t
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |