下书网

风险-收益分析:理性投资的理论与实践(第2卷)全文阅读

外国小说文学理论侦探推理惊悚悬疑传记回忆杂文随笔诗歌戏曲小故事
下书网 > 哲学心理 > 风险-收益分析:理性投资的理论与实践(第2卷)

一般化:博弈的两种类型

书籍名:《风险-收益分析:理性投资的理论与实践(第2卷)》    作者:哈里·马科维茨
推荐阅读:风险-收益分析:理性投资的理论与实践(第2卷)txt下载 风险-收益分析:理性投资的理论与实践(第2卷)笔趣阁 风险-收益分析:理性投资的理论与实践(第2卷)顶点 风险-收益分析:理性投资的理论与实践(第2卷)快眼 风险-收益分析:理性投资的理论与实践(第2卷)sodu
上一章目录下一章
    《风险-收益分析:理性投资的理论与实践(第2卷)》一般化:博弈的两种类型,页面无弹窗的全文阅读!



设D是一个离散事件动态模型。我们假设这个模型是基于第7章介绍的EAS-E视角编写的而对其进行描述。D是离散事件动态模型的假设是出于方便的考虑,而并非必需的,因为数字电脑能做的任何事情,原始的“图灵机”也能做。参见克林(Kleene,1971)的著作和图灵(Turing,1936,1937)的论文。

D是一个特定模型,而非一般模型,也即除了随机种子外,它的所有参数都是特定的。因此,我们可以谈到D这个特例的多次运行。模型D的EAS包含永久实体类型参与人。存在性是参与人的属性之一,它的值可能为例如“未出生”“正在参与博弈”和“退出了博弈”。因此,将参与人定义为永久实体类型,不会将所描述的博弈限定为那些一组固定不变的参与人由始至终都活跃的博弈。例如一个生命周期博弈模拟程序可能包含参与人的出生和死亡。在某些随机的场景中,一个潜在的参与人可能根本就不会出生。如前面讨论的,我们假设:①博弈最多在T次行动后确定会结束;②系统的状态sT包含了计算每个参与人得自特定博弈(即模拟程序运行)的效用UI(sT)的足够信息。如果参与人I没有出生,那么很自然有UI(sT)=0;如果I出生了但博弈结束时的效用UI(sT)<0,那么还不如根本就没有出生过。

为将前一节的讨论一般化,我们必须区分博弈的两种类型,分别为:

A.给定所拥有的信息,将要采取行动的参与人总是能够计算出当前世界可能状态的条件概率分布,而无须猜测其他参与人所采取策略的博弈;

B.在其中假设A不成立的博弈。

本卷分析的所有金融博弈,都属于第一种类型。具体而言,莫辛萨缪尔森博弈是一个单人博弈,没有其他参与人,因而无须猜测其他参与人的策略。这一点对于第11章马科维茨和范戴克试探法的各个例子中投资者进行的博弈、第11章布莱和马科维茨考虑税收的投资组合分析(TCPA),以及为401(k)计划的参与人在GuidedChoice公司GuidedSavings和GuidedSpending产品上实施的模拟分析同样是成立的。

然而,JLMSim的运行可能包含成千上万或数百万的投资者。在JLMSim中,证券收益由投资和交易政策内生决定,但JLMSim中的投资者将证券价格视为给定的。他们基于市场上观察到的价格水平和变化,而不是基于猜测其他投资者的策略来做出自己的行动。在某种意义上,JLMSim多人博弈中的投资者与莫辛萨缪尔森、马科维茨和范戴克,以及GC公司的博弈中的参与人是相同的。莫辛萨缪尔森博弈的参与人不应被看作这个世界上唯一的投资者,而应被看作形成市场以及将收益分布视为不受他们自身行动影响的投资者之一员。

除单人博弈之外,其他A类型的博弈包含:①完全信息博弈,例如井字棋游戏;②不完全信息博弈,但不完全信息并非由于其他参与人的行动所引起,例如本章前面介绍的广义双骰子博弈。

扑克牌和大多数其他纸牌游戏是B类型博弈的例子(在本章前面的内容,我们假设理性决策者知道扑克牌游戏中其他参与人的下注规则,但这只是为了说明特定的知识点,事实上通常并非如此)。买卖流动性较差股票的RDM交易员,应该试着去推测当前市场上其他买家和卖家的意图,但这样的交易策略超出了本书的范围。

A类型博弈的解

在广义双骰子博弈的例子中,我们说明了有时限(实际上是有最大行动数限制)的A类型博弈的求解。我们可以假设每一个这样的博弈都恰好持续T个时期,这T个时期处于时点0到时点T之间。博弈包含这样一种可能性,即从某个时点t(t
动态规划运算从时点T开始向后逆推。在运算的每一步,对于在时点t+1可能出现的每一个状态

已经确定。运算依次考虑在时点t可能出现的每一个状态st。给定状态st,有1个或者没有参与人将要采取行动。没有参与人将要采取行动的一个原因是博弈已经结束。

将要采取行动的参与人(如果有的话)并不一定知道当前状态st,但他可能拥有关于当前状态的信息,就像双骰子博弈的参与人知道第一张牌是大还是小一样。这一信息隐含了可能状态的条件概率分布

给定是t时的状态和α是其所采取的行动,将要采取行动的参与人也知道t+1时可能状态的概率分布

该参与人选择一个行动α,以使

最大化。其中I是将要采取行动的参与人,第一个求和是针对可能的当前状态,第二个求和是针对t+1时在之后所有可能的状态(我们假设存在使EU极大化的α)3。结点问题通过一个所有人都知道的规则来解决。参与人选择的行动α,不仅确定了自身的效用,而且确定了其他参与人的效用。现在,运算就可以在t=t-1时重复进行,直至达到t=0。t=T-1时的初始运算,运用了博弈规则所确定的UI(sT)。

B类型博弈的解

B类型博弈的解可能是混合策略。这在前面的小节中已讨论过,在那里我们排除了需要采取这种策略的博弈,因为它们超出了本卷的范围。当前,博弈论的实践应用,通常会用到纳什(Nash,1950b,1951)均衡解。在纳什均衡中,每个参与人都在其他参与人使用的策略给定的条件下,采取使自己的期望效用最大化的策略。一个博弈可能有不止一个纳什均衡解,其中一些可能不是“帕累托最优的”,也即存在一个不同的纳什均衡,在其中某个参与人有更高的期望效用,同时没有参与人的期望效用下降。

找出纳什均衡超出了本卷的范围。然而,我们注意到,给定一个特定的纳什均衡,每一个参与人都知道其他参与人的策略,因而他们类似于前面小节中的RDM扑克牌游戏参与人,根据假设后者知道其他参与人下注和弃牌的策略。因此,就可以计算得到参与人的策略,就好像博弈是A类型的一样。



上一章目录下一章
推荐书籍:银行审慎监管 充分就业与价格稳定 宏观经济思想七学派 经济增长黄金律 为什么我也不是保守派:古典自由主义的典型看法 经济增长理论 衰老的真相:你不可不知的37个迷思 微行动:成长就是从做好每件小事开始 未来生活简史:科技如何塑造未来 销售的常识:回归销售的本质,重构你的销售思维