天津团购鲜花的网站建设旧房装修
- 作者: 五速梦信息网
- 时间: 2026年03月21日 08:21
当前位置: 首页 > news >正文
天津团购鲜花的网站建设,旧房装修,湛江seo推广公司,网站网站环境搭建教程前言 这部分我们学习的是完全信息静态博弈#xff0c;主要内容包括博弈论的基本概念、战略式博弈、Nash均衡、Nash均衡解的特性、以及Nash均衡的应用。 零、绪论
1、什么是博弈论
1#xff09;博弈的定义
博弈论#xff1a;研究决策主体的行为发生直接相互作用时候的决策… 前言 这部分我们学习的是完全信息静态博弈主要内容包括博弈论的基本概念、战略式博弈、Nash均衡、Nash均衡解的特性、以及Nash均衡的应用。 零、绪论
1、什么是博弈论
1博弈的定义
博弈论研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
完全理性的个人或群体发生直接相互作用的情形。博弈论研究这种情形下个人或群体的决策以及这种选择所导致的结果的理论。
2博弈与传统决策的区别
传统的决策是从若干备选方案中选择一个有利方案如出门带伞问题就是一个决策问题。而博弈是研究决策主体的行为发生直接相互作用时候的决策在博弈中决策主体的选择不仅与决策主体的偏好结构有关而且与其他人的选择有关。
2、如何研究博弈论
1完全理性假设的主要表现 参与人的偏好具有一致性 参与人对面临的决策问题具有完全的理解 参与人具有强大的逻辑推理能力和计算能力
2共同知识是什么
如果有一种每个参与人都知道的“信息或事件”并且每个参与人都知道每个参与人都知道它每个参与人都知道每个参与人都知道每个参与人都知道它……如此等等那么这种“信息”对于参与人而言就是共同知识。显然关于一个事件的共同知识这个概念比人们所熟悉的“相互知识”需要更多的信息共同知识是无穷尽的“相互知识”。 有了参与人完全理性和参与人完全理性是共同知识这两个假设就可以确保博弈过程的分析具有逻辑上的一致性。
3、博弈论研究的目的
1什么是博弈问题的解
所有参与人都预测到的博弈结果即参与人的一致性预测
将Nash均衡作为博弈问题的一致性预测也就是博弈问题的解。
4、博弈论的主要分类
1合作博弈与非合作博弈
决策主体的行为相互作用时当事人能否达成一个具有约束力的协议。
2静态博弈与动态博弈
根据参与人的先后顺序。
3完全信息博弈与不完全信息博弈
参与人对其他参与人的特征战略空间及支付函数在博弈开始时是否已知。
4完美信息博弈与不完美信息博弈 注意完美信息博弈与完全信息博弈的比较
一、战略式博弈
1、基本概念
1参与人
博弈中选择行动以最大化自己效用的决策主体
2行动
参与人在博弈的某个时点的决策变量
3行动组合行动断面
博弈中每个参与人采取一个行动的一种博弈情形
4战略
参与人的行动规则规定了参与人在每一种轮到自己行动的情形下应该采取的行动。它是与博弈行动顺序相关的行动有序集战略是行动的规则而不是行动本身作为行动规则战略必须是完备的。
【特例】
在完全信息静态博弈中不存在决策时序上的差异所有参与人在同一决策时点即博弈开始那一时刻决策因此所有参与人面临的决策情形只有一种。参与人的战略集与行动集相同。
5战略组合
博弈中每个参与人采取战略组合中相应战略Si的一种博弈情形。
6支付
参与人在博弈中的所得。参与人的支付就可表示为一种特定博弈情形(如行动组合或战略组合)下参与人得到的确定效用水平或期望效用水平。
7信息
参与人所具有的有关博弈的所有的知识。
8完美信息与完全信息 9结果
博弈分析者所感兴趣的所有东西如均衡策略组合、均衡行动组合、均衡支付等。
10均衡
所有参与人的最优的战略组合。在博弈论中均衡是指所有个人的买卖规则战略的组合均衡价格是这种战略组合的结果。
2、战略式博弈
1战略式博弈的定义 战略式博弈是博弈问题的一种规范性描述亦称为标准式博弈。 战略式博弈是一种相互作用的决策模型这种模型假设每个参与人仅选择一次行动或行动计划(战略)并且这些选择是同时进行的。 二、Nash均衡
1、占优均衡
1“囚徒困境” 理性的前提假设使得每个小偷都有背离“抵赖抵赖”的意愿因此小偷的选择会偏离“抵赖”而选择“坦白”。 无论对方如何选择每个小偷都会选择“坦白”,可以发现战略“坦白”具有这样的特点无论对方怎样选择(选择“坦白”或者“抵赖”)“坦白”总是理性小偷的最优战略而与其他小偷的选择无关。
在学习占优行为、重复剔除劣战略行为这章之前不妨做一做下面这道题。
【收益矩阵的参数范围问题】 【题解】 2占优战略 参与人的最优战略与其他参与人的选择无关。无论其他参与人选择什么战略参与人的最优战略总是唯一的。这样的最优战略我们称为“占优战略”(dominant strategy) 3占优行为 在一个博弈问题中如果某个参与人具有占优战略那么只要这个参与人是理性的他肯定就会选择他的占优战略。参与人的这种选择行为我们称为占优行为。占优行为是理性参与人选择行为的最基本特征。 4占优战略均衡 如果所有的参与人都具有占优战略那么只要参与人是理性的肯定都会选择自己的占优战略。 博弈的结果就由参与人的占优战略共同决定。像这种由参与人的占优战略共同决定的博弈结果称为占优战略均衡(dominant-strategy equilibrium)。 2、重复剔除劣战略行为
1劣战略 2剔除劣战略行为 3重复剔除的占优均衡 4弱劣战略 5均衡结果是否与劣战略的剔除顺序有关 一般而言如果每次剔除的是严格劣战略均衡结果与剔除顺序无关如果剔除的是弱战略均衡结果可能与剔除顺序有关 在重复剔除劣战略的过程中需要注意 重复剔除劣战略均衡要求“理性”为“共同知识” 。 一般而言参与人的战略空间越大需要剔除的步骤就越多对“理性”的要求就越严格。
3、Nash均衡
1什么是博弈问题的解 博弈分析是在博弈问题的结构和参与人完全理性为共同知识下进行的 对博弈问题的求解等同于完全理性的参与人对博弈的求解; 博弈问题的解所有参与人的一致性预测。 2什么是Nash均衡 3求解Nash均衡的方法
【划线法】
在两人博弈中相互构成最优战略的战略组合就是Nash均衡。 【箭头法】
在两人博弈中一个战略组合只有在两个参与人都不愿意偏离的情况下才能构成Nash均衡。计算步骤如下 对于每个战略组合检查是否有参与人会偏离 找出没有参与人会偏离的战略组合 4Nash均衡 VS 占优战略均衡 VS 重复剔除的占优均衡 4、混合战略Nash均衡
1混合战略
以一定的概率分布来选择自己战略的行为在博弈中称之为混合战略。与此相对应参与人在给定信息下只选择一种特点战略成为纯战略。 混合战略解释了一个参与人对其他参与人所采取的行动的不确定性它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。混合战略为定义在纯战略集上的一个概率分布。 2混合战略的支付
对于混合战略参与人的支付是不确定的此时参与人关心的是支付的期望收益。 3混合战略与混合战略组合 4纯战略-混合战略 VS 完全混合战略 5混合战略Nash均衡 6最优混合战略的特性 7支集 8最优反应的引理 5、混合战略Nash均衡的求解
1等值法 【举例说明】 2Wilson奇数定理 3支撑是什么 掌握支撑的写法 4支撑求解法 支撑法求解过程中可能遇到的问题 5支撑法求解典例 6支撑法的问题计算量大 用剔除劣战略的方法排除支撑 7规划求解法 8规划法求解典例 从理论上来讲这两种方法对有限战略式博弈都是适用的但从以上例子的求解过程来看都存在着计算过程复杂计算量大等问题尤其是对多人(即参与人人数大于2)博弈问题。当参与人人数大于2时使用支撑法就必须求解非线性方程组而使用规划法就必须求解一个无论是目标函数还是约束条件都是非线性的规划问题。
三、Nash均衡解的特性
1、Nash均衡的意义
1一致性预测
Nash均衡是博弈中的一种一致性预测——如果所有参与人预测一个特点的Nash均衡会出现那么所有参与人都不会偏离这个Nash均衡就会出现。 2Nash均衡的特点
对任一个参与人i在给定其他参与人选择的情况下均衡战略是自己的最优战略。 3一般解的定义 2、Nash均衡解的存在性
1不同均衡概念之间的关系 2Nash均衡的存在性定理
每一个有限的战略式博弈至少存在一个Nash均衡(包括纯战略和混合战略Nash均衡)。
3、Nash均衡解的多重性 1什么是Nash均衡的多重性问题
传统的博弈论研究的问题或许并不是如何找到博弈的Nash均衡(即存在性问题)而是在博弈的多个Nash均衡中选择一个合理的均衡(即多重性问题)。
但事实上当在一个博弈中存在多个Nash均衡时目前还没有一个一般的理论能证明哪个Nash均衡结果一定会出现。
2如何解决Nash均衡的多重性问题
1、均衡精炼的方法 从博弈解的定义入手在Nash均衡的基础上通过定义更加精炼的博弈解如子博弈精炼Nash均衡、精炼贝叶斯Nash均衡等剔除Nash均衡中不合理的均衡。这种解决Nash均衡多重性的思路具有普遍性对所有的博弈问题都适用 均衡精炼的方法可以称为规范式的方法其它的方法称为非规范式的方法。 2、非规范式的方法 焦点效应 相关均衡 3什么是焦点效应
在一个具有多重均衡的博弈中趋向于将参与人的注意力集中到一个均衡的任何事情都可能使参与人全都预期并随之实行这个均衡就像一个自行应验的预言一样。
Schelling将这种现象称之为“焦点效应” (focal-point effect)。
在焦点效应中具有某种使它显著地区别于所有其它均衡性质的均衡被称为“焦点均衡”(focal equilibrium)。
结合“性别战”的例子理解详见PPT 博弈的现实状况或背景也会将博弈引向特定的均衡。 此外“焦点效应”在某些博弈中还可能由均衡战略自身的性质来确定。
但是需要注意的是聚焦因素只有针对Nash均衡时才可能是有效的。
4什么是廉价磋商
类似于“性别战”中这种博弈之前进行的沟通或商议在博弈分析中称之为具有通信的博弈或“廉价磋商”(cheap talk)。
在博弈分析中将参与人在博弈开始之前不花任何成本所达成的、对参与人没有约束力的协议称为“廉价磋商”。
5什么是相关均衡 在“性别战”博弈中夫妻双方通过长期的共处在周末娱乐项目的选择上可能会形成这样的习惯双方根据周末的天气状况来选择娱乐项目。 便得到了一种解决Nash均衡多重性问题的方式让参与人根据某个共同观测到的信号(如“性别战”中的天气状况)来选择行动。 如果参与人根据信号选择行动的规则本身能够构成一个Nash均衡那么参与人就可能会根据某个共同观测到的信号来选择行动。这种由参与人的行动规则所构成的Nash均衡就是Aumann定义的“相关均衡”(correlated equilibrium)。 四、Nash均衡的应用
1、Cournot寡头竞争模型
该模型研究了寡头垄断市场中企业追求利润最大化时的决策问题。
1Cournot模型的基本假设 2什么是反应函数 上面两个函数分别描述了给定对手的产量企业 i 应该如何反应因而分别称为企业1与企业2的反应函数(reaction function)。
反应函数意味着每个企业的最优产量是另一个企业的产量的函数两个反应函数的交点便是Nash均衡点。
3Cournot模型的计算 联合垄断市场、“垄断最优的情形在两个寡头的时候是无法达到”等内容详见PPT
2、Bertrand寡头竞争模型
在寡头垄断市场中企业关心更多的可能是自己的产品在市场上的价格而不是生产多少产品也就是说企业进行的可能是价格竞争而不是产量竞争。
1Bertrand模型的基本假设 2Bertrand模型的计算 3Bertrand悖论 3、Hotelling寡头竞争模型
在Hotelling价格竞争模型中Hotelling通过引入产品在空间位置上的差异巧妙地解决了产品的差异形式的描述问题。
在Hotelling价格竞争模型中产品虽然仍是同质的但其在空间位置上有差异因而对于不同位置的消费者其运输成本不同由此导致产品不再是完全替代的。
1Hotelling模型的基本假设 2Hotelling模型的求解 通过引入产品的位置差异使得企业的均衡利润不再为0而企业的定价也大于产品的边际成本在一定程度上解释了Bertrand悖论。
在上面的分析中我们将两个企业固定于线性城市的两端。如果允许企业在选择价格的同时还可以选择位置那么两个企业都会选择线性城市的中点(即[0,1]区间的中点)而当两个企业都位于中点时Bertrand均衡则成为模型的唯一均衡。
4、Hardin公共财产问题
公共资源被过度使用如草原沙化渔业资源枯竭以及各种矿产资源的过度开发等等使人类社会的生存面临着极大的挑战。以G. Hardin的公共财产模型为例分析人们的利己行为如何使得公共资源被过度使用。 具体求解过程详见PPT
5、混合战略Nash均衡的应用
1小偷-守卫博弈 2监督博弈
- 上一篇: 天津市做网站国外外贸网站大全
- 下一篇: 天津外贸优化公司上海百网优seo优化公司
相关文章
-
天津市做网站国外外贸网站大全
天津市做网站国外外贸网站大全
- 技术栈
- 2026年03月21日
-
天津市建设工程质量安全监督管理总队网站百度商桥可以在两个网站放
天津市建设工程质量安全监督管理总队网站百度商桥可以在两个网站放
- 技术栈
- 2026年03月21日
-
天津市建设工程评标专家网站wordpress局限性
天津市建设工程评标专家网站wordpress局限性
- 技术栈
- 2026年03月21日
-
天津外贸优化公司上海百网优seo优化公司
天津外贸优化公司上海百网优seo优化公司
- 技术栈
- 2026年03月21日
-
天津网络网站制作wordpress开发文档下载
天津网络网站制作wordpress开发文档下载
- 技术栈
- 2026年03月21日
-
天津网络网站制作用户体验设计软件
天津网络网站制作用户体验设计软件
- 技术栈
- 2026年03月21日
