理性与经验

发布 2019-08-05 16:42:00 阅读 4793

第12章。

演进博弈与自发秩序。

张维迎。北京大学光华管理学院。

进化博弈。john maynard smith and g price, 1973; maynardsmith, 1982, evolution and the theory of games,cup;

生物博弈是基因之间的博弈;

生物行为(战略)是由基因(genes)决定的;基因的生存和繁殖由自然选择决定;最适合生存的基因不断繁衍,而不适合生存的基因被淘汰;生物进化是一个自然选择的过程;最后可能导致一个稳定状态。

ess与纳什均衡。

ess一定是纳什均衡,但并非所有的纳什均衡都是ess;

演化过程可以帮助选择特定的纳什均衡;

理性与经验。

传统博弈理论:每个人都是理性的,并且理性和博弈结构是共同知识;每个人都在选择战略最大化自己的利益;只要知道博弈的结构,就可以**均衡结果;

但其他社会科学家一直对理性人假设抱有怀疑。

演化稳定战略。

ess: evolutionary stable strategies:种群中可以持续存在的行为方式;

静态:一个特定的行为方式被称为是演化稳定的,如果它的种群不能被变异所成功侵入;或者说,任何偏离行为的个体具有更低的生存能力,种群将会恢复到原来的状态;

动态:假定初始状态存在多样的行为方式,随着时间的推移,如果某个特定的行为方式能逐步主导整个种群,这个特定的行为方式就是ess;

生物进化与社会演进。

战略:生物行为是基因决定的,个人没有选择性;

社会行为并不完全取决于基因,而是与社会环境、文化、教育、以及个体的经验等因素等有关;个体有选择性。

适应性(fitness):基因的繁殖能力;总的或平均的报酬(payoff);传递:基因遗传;成功的人将信息传输给朋友、同事;好的行为方式会被学习、模仿;人们也会有意识地通过“试错”的办法寻找好的战略;所以社会和教育机制更为重要;

单元均衡与多元均衡。

演化稳定状态可能只有一个战略(行为方式),也可能包含多个具有同样适应性的行为方式;

前者称为单元均衡(monomorphicequilibrium);

后者称为多元均衡(polymorphicequilibrium).

左撇子与右撇子左撇子。

右撇子。左撇子。

右撇子0,0

三个均衡。如果x>1/2,左撇子更具生存能力,他们的比例将增加,直到100%;单元均衡;如果x<1/2,右撇子更具有生存能力,他们的比例将增加,直到100%;单元均衡;

如果x=1/2,两类人的生存能力相同;二元均衡。

但只有前两个均衡是ess;单元均衡。

协调博弈:左撇子与右撇子。

设想总人口中有两类人:一类人是左撇子;另一类人是右撇子;

任意挑选其中的一对进行博弈;支付矩阵如下图所示;

注意:战略是先天决定的,参与者并不在两种战略之间选择。

谁最适合生存?

答案依赖与初始的人口分布。直观。假定总人口中有x的比例是左撇子,1-x的比例是右撇子。那么,左撇子的预期支付为:x1+(1-x)0=x;

右撇子的预期支付:x0+(1-x)1=1-x;x>(1-xx>1/2

图示。生存能力1

右撇子。左撇子。

x=1与理性人博弈比较。

如果战略是理性人选择的结果,这个博弈也有三个均衡:(左撇子,左撇子);(右撇子,右撇子);(1/2左,1/2右);

所以,并非所有的纳什均衡都是演化稳定均衡;

但与“混合战略均衡”解释不同:每个人都是纯战略,只是一半人用左手,另一半人用右手;演化稳定性为选择特定的纳什均衡提供了新的依据;

演化稳定单元均衡:战略是对自身的最优反应(reply)

交通博弈靠左行。

靠右行靠左行。

靠右行-1,-11,1

谁将生存?假定总人口中,物质型的比例为x,感情型的比例为(1-x);

那么,对任何一个个体而言,物质型的预期支付:x1+(1-x)0=x;

感情型的预期支付:x0+(1-x)2=2(1-x);x=2/3

父母怎样教育孩子?

一旦使用右手成为主导习惯,少数左撇子并不能改变结果;

所以为了孩子的利益,父母会教育孩子用右手;

用手的习惯既有基因的遗传,也有后天的训练。

这可能是社会行为的典型特征。

协调博弈:婚姻。

物质型感情型。物质型。

感情型0,02,2

均衡。如果x>2/3,物质型更适合生存,将演化成稳定均衡;

如果x<2/3,感情型更适合生存,将演化成稳定均衡;

如果x=2/3,两类人有同样的适应性,但这一(二元)均衡是非稳定的;

演化均衡不一定是帕累托最优均衡。

图示。生存能力2感情型。

物质型。

x=1锁定与路径依赖。

演化均衡意味着技术、社会制度都可能长时间锁定在非帕累托状态;

但不同制度之间的竞争可能打破非帕累托均衡;

如全球化对公司治理结构以及其他制度的影响。

一次性博弈。

不合作”演化稳定均衡;

一般地,如果存在占优战略(dominantstrategy),该占优战略是ess;

婚姻的习俗。

找对象的主流模式影响个体的行为;物质主义盛行的社会,任何人都难以不随波逐流;门当户对;

信息与感情型:即使物质型大于2/3,感情型也可能生存下来。

囚徒困境。合作不合作。合作。

不合作6,-1

博弈重复两次。

all-ctftall-dall-c8,88,8-2,12tft8,88,8-1,6all-d

谁将生存?首先注意到,幼稚的合作型生存能力最差:如果遇到all-c和tft,与tft得到相同的支付,但如果遇到all-d,则比tft更遭;所以tft比all-c更能生存;

如果初始人口由all-c和all-d组成,tft将可以成功的侵入;

如果初始人口全是all-c或由all-c和tft组成,all-d将可以成功入侵;所以all-c不是ess。

谁将生存?假定初始人口中tft的比例为x,all-d的比例为(1-x);

tft的预期支付:8x-(1-x)=9x-1;

all-d的预期支付:6x+0(1-x)=6x;9x-1>6xx>1/3

图示。生存能力8

tft:9x-1

all-d:6x

x=1两类:all-d和tft

tftall-dtft

all-d6,-10,0

均衡。如果x>1/3, tft生存;稳定均衡;如果x<1/3, all-d生存;稳定均衡;如果x=1/3,二者同样生存,但不是稳定均衡;

n次博弈。tftall-d

tft4n,4n-1,6all-d

生存能力。tft:4nx-(1-x);

all-d: 6x+0(1-x)=6x4nx-(1-x)>6x(4n-5)x>1

x>1/(4n-5)

robert axelrod

axelrod(1981,1984)著名的实验证明,在14种战略中,tft是最成功的;

在第2个实验中,在62个战略中,tft是最成功的。

tft,tf2t,stft

all-c和tf2t是tft的中性变异;如果初始人口由tft和tft2t组成,stft入侵后,tft将消失;

所以,tft甚至不是弱稳定战略。人们将模仿成功者。

x与n的关系。

x1/3tft均衡。

all-d均衡n=2

n弱稳定与强稳定。

稳定性依赖于变异战略(mutant)的种类;假定原来的人口全由tft组成。如果变异是all-c,合作继续维持,但比例不会变化:

强稳定(strong stable):变异入侵之后,元战略比例会增加直到把变异者消灭为止;

若弱稳定(weak stable):变异入侵后,比例不会变化。“中性变异”

合作社会会被破坏吗?

假定tft长时间维持了社会的合作;人们可能变成all-c类型;此时,all-d入侵后,将可能蔓延很长时间,甚至导致整个社会进入非合作社会;中国人在西方为什么容易行骗?

tft:动物界的合作。

manfred milinski (1987): among certain small fishthat face an iterated pd;

当一条大鱼进入一群小鱼的池塘时,一条或更多的小鱼将接近它侦探它是否有危险。这种掠夺侦察活动对这些侦探者是有风险的,但整个鱼群是有好处的:如果侵入者不是掠夺者或者不是特别饥饿,小鱼无须疏散。

pd:每个个体都有很强的动机背叛,让其他鱼完成侦察;但是如果所有的鱼都背叛,就不可能获得侵入者的信息。而完全的合作可以最小化总的风险,因为如果不能集中于单个目标,入侵者将被迷惑。

鹰-鸽博弈hawk

dovehawk

dove0,10.5,0.5

均衡。如果x<1/3,鹰派占优势;不稳定如果x>1/3,**占优势;不稳定如果x=1/3,同样的适应性;稳定;

稳定均衡是polymorphic;

续)milinski和dugatkin独立地发现,鱼类确实在使用tft:当一对鱼接近入侵者时,如果一条想尾随在后,走在前面的鱼转身向后,等待另一条跟上,然后再并行前进。日复一日,guppies甚至可以记住其他同伙过去的表现。

如果一次试验中一方背叛,另一方在第二天的试验中也会背叛。

guppies倾向于与过去表现出更具合作精神的鱼结伴而行。

生存能力。假定鹰派的比例是x,**的比例是1-x;

鹰派的支付:-x+(1-x)=1-2x;

**的支付: 0x+0.5(1-x)=0.5(1-x);1-2x>0.5(1-x);x<1/3

图示。生存能力1

鹰派:1-2x

x=1**:0.5(1-x)

二元均衡。鹰派和**同时并存;

如果初始人口由单一类型构成,另一类型可以成功入侵,直到均衡;少数派占优势;

男人不坏,女人不爱”?

鹰-鸽博弈。bhawk

dovehawk

adove

信号与身份。

如果两人完全一样,就没有办法选择特定的均衡;

假定存在某种显性的标记机制:在博弈开始之前,每个人收到一个信号:a或b;概率是1/2;信号完全负相关;标记是共同知识;规则:

如果a,选择“鹰”;如果b,选择“鸽”;每个人都有积极性遵守这个习惯(规则);这个习惯就是事实上的产权规则(de fact).

自发秩序与产权制度。

人类的行为并非完全有基因唯一决定;即使并非总是完全理性地计算,人们也必然要在不同的战略之间选择;

社会秩序是所有人行为选择的结果,但不是集中设计的,而是自发演化的结果;

产权制度:先占原则(possession rule);教室占座位:

robert sugden, jep, 1989.

三个纳什均衡。

两个纯战略均衡:

(a-鹰,b-鸽);–a-鸽,b-鹰);

一个混合战略均衡:(1/3,2/3)

仅仅“理性”不足以决定均衡。虽然有限理性但有一定经验和想象力的人们可以协调他们的行为。

ess1)如果a,选择“鹰”;如果b,选择“鸽”;

2)如果a,选择“鸽”;如果b,选择“鹰”;

3)无论是a还是b,以1/3的概率选择“鹰”,2/3的概率选择“鸽”;只有(1)和(2)是ess。

哪一个习惯(convention)

演化过程将给出习惯。

习惯可以是演化稳定的,即使他们是非帕累托效率的。

如下图中:如果习惯(1)给每个人的预期收入是0.55;习惯(2)给每个人的预期收入是0.45;因此(2)帕累托劣于(1),但一旦建立,就会持续存在。

习惯如何开始演化?

一旦大部分人开始遵守一个习惯,这个习惯就会自我加强;最容易在没有习惯的地方建立的行为规则最容易成为习惯;

最初的信念何来?一种可能是能使人们在一次博弈中无须交流就可以相互协调的力量;先验的预期来自共同的经验:

习惯通过“类比”而扩散:如果共同的经验告诉我们一种特定习惯在一种情况下会被人们普遍遵守,这种习惯就成为类似情况下的模仿对象。

从习惯(convention)到规范(norms)

习惯是已经建立起来的行为规则;

如果人们认为每个人都应该按照这样的规则行为,习惯就变成了规范(norms);转换机制:对别人认可的渴望。与对物质的渴望同样重要。

psychological externality: one person’sstate of mine can affect that other person’shappiness or utility.不同与punishment.

鹰-鸽博弈。bhawk

dovehawk

adove

类比创造习惯。

儒家的“家”与“国”;

习惯家族:first-on规则(先来后到);“first come, first served”; last in, first out”;产权规则:谁先占,谁所有;领土的国际争端;

即使一开始不同的人有不同的习惯,随着时间的推移,人们趋向于最成功的规则;popularity:遵守的人越多,越值得遵守。

产权规则。产权规则一旦建立,每个人都会预期其他人会遵守这个规则;给定这样的预期,遵守它是每个人的利益所在。

给定自己遵守,每个人希望其他人也遵守;任何违反规则的行为都会被认为是一个威胁,引起愤怒和不满。

规则的其他受益者也会间接地感到威胁,因为他们也期待着靠这些规则保护自己的利益,所以会同情直接的受害者。

为什么?因为规则一旦建立,偶然的破坏并不会导致它的瓦解。但系统地偏袒少数人的习惯可能不会得到普遍遵守,因为处于不利地位的群体并不会谴责违反行为。

重男轻女。为什么妇女也“重男轻女”?

norm entrepreneurs

尽管习惯和规范是自然演化而来的,而非集体理性选择的结果,因而也不一定是帕累托有效的,但norm entrepreneurs在规范的演化中具有重要的作用;(sunstein, 1996)

norm entrepreneur的收益依赖于接受其推荐的规范的人数;遵守的人越多,说明越成功;创造社会规范是一种风险活动,只有少数人愿意冒险行事。孔子。

理性投资的经验体会

全世界有一半左右的cat扫描器 x光机和其他诊断设备在美国以外销售。通用的医疗设备系统 gems 在海外市场销售只占总营业额的10 这个以密尔沃基为基地的事业只有一个主要的海外分支机构 通用拥有75 股权的合资企业横川电器制作厂,它原先是通用在日本的经销商。这个合资企业 横川医疗设备系统 或称为ym...

与理性有关的作文素材作文素材

理性使人行事严谨,心思慎密,理性使人处事不惊,不骄不躁,理性使人沉着稳重,温文尔雅。保持理性能让我们看到更多,下面是橙子为您整理的关于理性的作文素材,希望对您有所帮助!与理性有关的作文素材一。所有的动物都是有感情的,喜怒哀乐惧,七情六欲,但人之为人的标志是有理性,通过理智控制自己的感情。苏霍姆林斯说...

温馨的回忆与理性的批判之我见作文

朝花夕拾 是一本 回忆的记事 记录了作者鲁迅的成长历程。文中包含了他对往事温馨的回忆与对半封建半殖民地种种丑恶不合理现象的批判,这点在 从百草园到三味书屋 中最有体现。所谓 温馨的回忆 与 理性的批判 体现了这本散文集作者不同的思想温馨的回忆指的是作者对自己童年的美好往事的怀念,而理性的批判指的就是...