决策理论与方法.docx

上传人:lao****ou 文档编号:93895 上传时间:2023-03-04 格式:DOCX 页数:15 大小:17.61KB
下载 相关 举报
决策理论与方法.docx_第1页
第1页 / 共15页
决策理论与方法.docx_第2页
第2页 / 共15页
决策理论与方法.docx_第3页
第3页 / 共15页
决策理论与方法.docx_第4页
第4页 / 共15页
决策理论与方法.docx_第5页
第5页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《决策理论与方法.docx》由会员分享,可在线阅读,更多相关《决策理论与方法.docx(15页珍藏版)》请在第一文库网上搜索。

1、其次节 决策分析的分类及其基本原则其次节 决策分析的分类及其基本原则 第三节 决策分析的步骤与追踪决策 第三节 决策分析的步骤与追踪决策第三节 决策分析的步骤与追踪决策第三节决策分析的步骤与追踪决策第四节 决策分析的定性与定量方法概述本章小结决策分析是人们为了实现某一特定目标,依据主客观条件的可能性,提出各种可行方案,采纳科学的方法对各方案进行比较、分析和评价,依据决策准则,从中筛选出最满足的方案,并加以实施的过程。它包括决策者、决策目标、决策方案、自然状态、决策结果和决策准则等几个基本要素。本章结合其要素对决策分析从不同角度进行了较为具体的分类。决策分析是一个包括分析问题、确定目标、拟定方案

2、、评价方案、实施方案直至目标实现的系统过程。在决策分析的过程中,我们应遵循如下基本原则:信息准全原则、效益原则、系统原则、科学原则、可行原则、选优原则、行动原则、反馈原则等。在方案实施的过程中,当主客观状况发生重大变化或原决策方案存在重大失误时,要进行追踪决策。要做好追踪决策应把握其基本特征,如回溯分析、非零起点、双重优化、心理效应等。在决策分析的过程中,我们应采纳定性分析与定量分析相结合的综合决策方法。这种方法对能够量化的指标建立起精确的数学模型,而且同时考虑不能量化的因素,是一种切合实际的较优的决策分析方法。其次节完全信息静态博弈一、博弈的标准式表述 定义7.1在一个n人博弈的标准式表述中

3、,参加者的策略空间分别为,收益函数分别为则表示此博弈。 二、纳什均衡 定义7.2在博弈中,假如策略组合中任一博弈方i的策略 都是对其余博弈方的策略组合的最佳对策,也即:对任意 都成立,则称为G的一个“纳什均衡二纳什均衡有强弱之分,以上是弱纳什均衡,也是最常用的纳什均衡概念,强纳什均衡是指每个博弈方对于对手的策略有唯一的最佳反应,即为严格纳什均衡,当且仅当对全部i,全部其他 ,均有: 三、两人有限零和博弈(一)两人有限零和博弈模型两人有限零和博弈是指只有两个局中人,每个局中人都有有限个可选择的策略,而且在任一局势中两个局中人得失之和总是等于零。其次节完全信息静态博弈假如我们用 和表示两人有限零和

4、博弈的两个局中人,并设他们的策略集分别为,。局中人的支付矩阵可记作:依据局中人 的支付矩阵A ,结合博弈的一般式表述,我们可将这种博弈记作。(二)最优纯策略与纳什均衡定义7.3对于博弈,假如 则称分别为局中人 和 的最优纯策略,称局势()为博弈G的鞍点,v称博弈的博弈值。不难验证鞍点()是博弈的纳什均衡,鞍点又称纯策略纳什均衡。两人有限零和博弈存在的鞍点的充要条件是支付矩阵中存在一个元素 ,使对于一切,总有:其次节完全信息静态博弈(三)最优混合策略与纳什均衡局中人只能以肯定的概率在其策略集中随机选择每个策略,这种在纯策略空间上的概率分布为混合策略。设博弈,令分别为局中人和在各自的策略集和 中选

5、择策略和 的概率,则称 分别为局中人和的一个混合策略。称为局中人 的期望获得,为 的期望获得,而()为博弈的混合局势。又记分别为局中人 和 的混合策略集合。定义7.4假如 则称为局中人 和 的最优混合策略,称()为G的最优混合局势,称 为博弈方的期望所得。 最优混合局势 构成了混合意义上的纳什均衡,任何一方,单独背离这个局势,则它的期望所得将不会优于最优混合局势下的所得。其次节完全信息静态博弈(四)最优混合策略的求解方法 博弈有混合意义下的解的充要条件是:存在满足下列两个不等式组:(1) (2)为了求解上述不等式组,可将它们变为线性规划而求出博弈G的最优混合策略。不妨设(否则令,则 肯定可大于

6、零)。令,则不等式组(1)等价于下面的线形规划:(3)同理,令,问题(2)就变为线形规划(4): (4)其次节 完全信息静态博弈四、应用举例 图7-4市场进入阻挠博弈例7-3市场进入阻扰博弈。一种市场上存在一个垄断企业,另一个企业盼望进入这一市场,垄断者为了保持自己的地位需要对进入者进行阻挠。这种博弈中,进入者有两种策略可以选择:“进入”与“不进入”;垄断者也有两种策略:“容忍”与“反击”。他们的支付函数用以下双变量矩阵表示(见图7-4)o例7-4产量决策的古诺模型。古诺模型是博弈论中最经典的例子。古诺首先提出了这一模型。由于他采纳了分析企业各自的最优反应函数从而形成均衡的思路,与纳什均衡特别

7、相像,因此纳什均衡也称古诺一纳什均衡。它描述的是所谓厂商进行数量竞争的形势,以下是最常见的一种较为简化的版本。生产同质产品的两个企业同时选择各自的产量,市场需求打算价格。单位成本均为常数C。求解其中的纳什均衡。例7-5公共地悲剧模型。假设有n个人共同拥有的一个公共牧场,每个人要打算自己放牧羊的数目,总的羊数因此为。购买和照看1只羊的成本为常数co设每只羊的价值为 ,随着羊的增加,草地会越来越拥挤,食物也会更紧急,因此会造成羊的价值下降,另一方面,羊的供应增加也会造成羊的价值下降,求此博弈中的纳什均衡。第三节 完全信息动态博弈一、博弈的扩展式表述在动态博弈中,参加人的行动有先后挨次,且后行动者在

8、自己行动之前能观测到先行动者的行动且对各博弈方的策略空间及支付有充分的了解,我们称这种博弈为完全信息动态博弈。动态博弈有不同与静态博弈的特征,习惯于用扩展式来描述和分析动态博弈。 博弈的扩展式表述包括以下要素:(1)参加人集合;(2)行动次序,即参加人参加行动的次序;(3)收益,即参加人所实行行动的函数;(4)行动,即轮到次序的参加人的选择;(5)信息集,它表示参加人在每次行动时所知道的信息;(6)每一个外生大事的概率分布。二、多阶段可观看行动博弈与子博弈完善纳什均衡多阶段可观看行动博弈,这种博弈有着多个“阶段”,通常记为k,行动的历史通常记为,从而 (1)在每一个阶段k,每一个参加人都知道全

9、部行为状况,包括自然的行为以及过去各阶段全部参加人的行为;(2)在任一给定阶段中,每一个参加人最多只能行动一次;(3)阶段k的信息集不会供应有关这一阶段的任何信息。由于这种博弈存在多个阶段,它与只有一个阶段的完全信息博弈有着本质的区分,因此假如我们仍用纳什均衡思想分析这种博弈问题就难免存在局限性。泽尔滕(Selten, 1965)提出了子博弈完善纳什均衡的思想。泽尔滕子博弈完善纳什均衡是指在一个多阶段可观看的博弈中,由各博弈方的策略构成的一个策略组合,这个策略组合满足在整个动态博弈及它的全部子博弈中都构成纳什均衡。第三节完全信息动态博弈三、完善信息博弈与逆向归纳法在多阶段可观看行动博弈中,假如

10、我们对条件(2)稍加限制,即在任一给定阶段中,每一个参加人最多只能行动一次而且只有一个参加人实行行动,就得到完善信息博弈。由于多阶段可观看行动博弈中,引入了子博弈完善纳什均衡的概念,借助这种概念的思想,多阶段可观看行动博弈通常采纳逆向归纳法。“逆向归纳法”这一思路是通过逆向归纳的方法,先解决参加人在面临任何可能状况下的最终行为策略,然后逐步向前推导计算前一步最优选择。逆向归纳法可以在任何完善信息下的多阶段博弈中应用,这一方法从最终阶段k在每一历史状况 下最优选择开头,即在给定历史状况条件下,通过最大化参加人在面临历史状况条件的收益确定其最优行动,从而向前推算到阶段k-1,并确定这一阶段中实行行

11、动的参加人的最优行为,只要给定阶段中实行行动的参加人在历史状况下将实行我们之前推导出来的最优行动即可。用这一方法不断地向前推算下去,直至初始阶段,这样我们就可以建立一个策略组合。第四节 不完全信息静态博弈一、概念 假如在一个博弈中,某些参加人不知道其他参加人的收益,我们就说这个博弈是不完全信息博弈。海萨尼(Harsanyi, 1967 1968)首先给出了一种模拟和处理这一类不完全信息博弈的方法,即引入一个虚拟参加人一一“自然”,“自然”首先选择参加人1的类型(这里是他的成本)。在这个转换博弈中,参加人2关于参加人1成本的不完全信息就变成了关于“自然”的行动的不完全信息,从而这个转换博弈可以用

12、标准的技术来分析。从不完全信息博弈到不完善信息博弈的转换如图7-3所示,这个图是首先由海萨尼给出的。N代表“自然”,“自然”选择参加人1的类型。这里有一个标准假设,即全部参加人对自然行动的概率分布具有全都的推断。一旦采纳这一假设,我们就得到一个标准博弈,从而可以使用纳什均衡的概念。海萨尼的贝叶斯均衡(或贝叶斯纳什均衡)正是指不完善信息博弈的纳什均衡。二、策略和类型参加人的,类型”他的私人信息一一就是他的成本。在通常状况下,一个参加人的类型可能包括与其决策相关的任何私人信息。参加人的收益函数就相当于它的类型。 假如参加人的类型过于简单,模型就可能很难处理,在实际运用中,通常假定参加人关于对手的推

13、断完全由他自己的收益函数打算。 海萨尼考虑了更一般的情形。假定参加人的类型 取自某一客观概率分布 ,这里属于某一空间。简洁起见,假定存在有限个元素。只能被参加人i观看到。令 代表给定 是参加人i关于其他参加人类型 的条件概率。假定对于每一个 ,边际分布 是严格正的。第四节 不完全信息静态博弈我们通常把博弈的外生因素如策略空间、收益函数、可能类型、先验分布等视为共同学问。一般来说,这些策略空间都比较抽象,有些还包括如扩展式博弈中的相机行动策略。但在这里,为简洁起见,我们假定策略空间Si是参加人i的(非相机)行动集。 可以用代表类型为 的参加人i的策略选择(可能是混合策略)。假如参加人i知道其他参

14、加人的策略 是其相应类型的函数,参加人1就可以用条件概率 来计算对应于每一个选择的期望效用从而找出最优反应策略 。三、贝叶斯均衡 定义7.4在一个不完全信息博弈中,假如每一参加人i的类型 有限;且参加人类型的先验分布为P,相应纯策略空间为 ,则该博弈的一个贝叶斯均衡是其“绽开博弈”的一个纳什均衡,在这个“绽开博弈”中,每一个参加人i的纯策略空间是由从 到 的映射构成的集合 。给定策略组合 ,和 ,令 代表当参加人i选择 而其他人选择,且令代表策略组合在 的值。那么策略组合 是一个(纯策略)贝叶斯均衡,假如对于每一个参加入i均有 第四节 不完全信息静态博弈四、贝叶斯均衡的举例例7-8不完全信息下

15、的古诺模型。考虑双寡头垄断古诺模型(产量竞争)。假定企业的利润,这里 是线性需求函数的截距与企业i的不变单位成本之差,是企业i选择的产量 。企业1的类型 是共同学问(即企业2完全知道关于企业1的信息,或者说企业1只有一种可能类型)。但企业2拥有关于其单位成本的私人信息。企业1认为 的概率是, 的概率也是,而且企业1的推断是共同学问。这样,企业2有两种可能类型,我们分别将其成为“低成本型”()和“高成本型”()。两个企业同时选择产量。下面来看这个博弈的纯策略均衡。即企业1的产量为,企业2在 时产量为 ,在时的产量为 。企业2的均衡产量必需满足 企业1不知道企业2是那种类型,因此他的收益只能是对企业2的类型取期望: 将和代入中,我们得到贝叶斯均衡解为()(事实上,这也是惟一的均衡)。第五节 不完全信息动态博弈一、不完全信息动态博弈问题信号博弈的基本特征是博弈方分为信号发出方和信号接受

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 汇报材料

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服