设为首页
收藏本站
登录
注册
论坛
BBS
国际新闻
国内新闻
体育新闻
经济新闻
科技新闻
军事新闻
房产新闻
文化新闻
A8资讯网
»
论坛
›
A8资讯网
›
经济新闻
›
《微观经济学》第十章笔记 —— 博弈论初步 ...
返回列表
查看:
85
|
回复:
3
《微观经济学》第十章笔记 —— 博弈论初步
[复制链接]
肥仔林
肥仔林
当前离线
积分
13
3
主题
7
帖子
13
积分
新手上路
新手上路, 积分 13, 距离下一级还需 37 积分
新手上路, 积分 13, 距离下一级还需 37 积分
积分
13
发消息
发表于 2022-12-31 19:21:19
|
显示全部楼层
|
阅读模式
第十章 博弈论初步
10.1博弈论的几个基本概念
博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。
博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。
1.
博弈参与人
参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与人既可以是个人,也可以是团体(企业或国家)。
2.
参与人的策略
参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上决定如何行动。一般,每一个参与人都至少应有两个可供选择的策略。
3.
参与人的支付
参与人的支付则是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人所得到的结果(如效用或利润)。在一个博弈中,在所有的参与人都选择了自己的策略之后,就得到一个策略组合;对于任意一个策略组合,每一个参与人都会得到一个支付;所有这些参与人的支付合在一起,即构成相对于这个策略组合的支付组合。
4.
策略
策略是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。
5.
支付函数
支付函数也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。
6.
支付矩阵
参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。
10.2完全信息静态博弈:纯策略均衡
一、条件策略和条件策略组合
在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略称之为该参与人的条件策略;而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件策略组合。
二、纳什均衡
如表所示,(不合作,不合作)既是甲厂商的条件策略组合,也是乙厂商的条件策略组合,在该策略组合上,甲厂商和乙厂商都没有单独改变策略的倾向。
纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
三、寻找纳什均衡的方法——条件策略下划线法
对于一个简单的“二人同时博弈”,可以用一个以二元数组为元素的支付矩阵来表示,并用“条件策略下划线法”来确定它的纳什均衡。
具体步骤如下:
把整个博弈的支付矩阵分解为两个参与人的支付矩阵。
在第一个(即位于整个博弈矩阵左方的)参与人(甲)的支付矩阵中,找出每一列的最大者,并在其下画线。
在第二个(即位于整个博弈矩阵上方的)参与人(乙)的支付矩阵中,找出每一行的最大者,并在其下画线。
将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵。
在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。
四、囚徒困境
囚徒困境的博弈模型的假设条件是:甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获,但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。警方向这两个嫌疑犯交待的量刑原则是:如果一方坦白,另一方不坦白,则坦白者自由;不坦白者从重处理,判刑20年。如果两人都坦白,则每人都各判刑8年。如果两个都不坦白,则警方由于证据不足,只能对每个人各判刑1年。
表中的报酬均为负数,以表示判刑的年数
通过分析可以看出,囚徒困境的博弈有一个占优策略均衡(坦白、坦白)。但是,如果两人都是选择不坦白(即合作),则都可以获得最好的结局。很清楚,囚徒困境的占优策略均衡反映了一个矛盾:即个人理性和团体理性的冲突。
10.3完全信息静态博弈:混合策略均衡
并非所有的博弈都存在纯策略纳什均衡。如表下所示,此博弈就不存在纯策略纳什均衡,但却存在混合策略纳什均衡。
混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。
所有参与人的混合策略的组合构成“混合策略组合”。混合策略组合与参与人的支付的乘积之和为参与人的期望支付。当其他参与人的混合策略确定之后,某个参与人选择的可以使自己的期望支付达到最大的混合策略是该参与人的条件混合策略。不同参与人的条件混合策略曲线的“交点”就是混合策略条件下的纳什均衡。
10.4完全信息动态博弈
在完全信息动态博弈中,参与人的决策有先有后,特别是,后行动的参与人可以观察到先行动的参与人已经采取了的策略。
一、博弈树——描述完全信息动态博弈的工具
博弈树由“点”(包括“起点”、“中间点”、“终点”)、连接点的“线段”以及标在这些点和线段旁边的文字和数字组成。在博弈树中,一个纳什均衡代表一条均衡的路径。在该均衡路径上,没有哪个参与人愿意单独改变自己的策略。
二、纳什均衡
在完全信息动态博弈中,可能存在多个纳什均衡的情况。在多个纳什均衡中,有些可能并不合理。所谓对纳什均衡的“精炼”,就是要从众多的纳什均衡中进一步确定“更好”的纳什均衡。
纳什均衡的精炼方法通常是使用所谓的“逆向归纳法”,具体包括以下两个步骤:
先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈。
再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解;而在存在多重纳什均衡时,它就是对纳什均衡的精炼。
觉得有用的话可以点个赞,我会继续更新的。
(o゜▽゜)o☆
关注
我,第一时间获取最新笔记。
第11章-传送门
回复
使用道具
举报
刘倩倩
刘倩倩
当前离线
积分
9
2
主题
5
帖子
9
积分
新手上路
新手上路, 积分 9, 距离下一级还需 41 积分
新手上路, 积分 9, 距离下一级还需 41 积分
积分
9
发消息
发表于 2022-12-31 19:22:11
|
显示全部楼层
求更
回复
使用道具
举报
张燕军
张燕军
当前离线
积分
3
1
主题
6
帖子
3
积分
新手上路
新手上路, 积分 3, 距离下一级还需 47 积分
新手上路, 积分 3, 距离下一级还需 47 积分
积分
3
发消息
发表于 2022-12-31 19:23:11
|
显示全部楼层
明早更新最后一章。
回复
使用道具
举报
扎西哥哥
扎西哥哥
当前离线
积分
4
1
主题
6
帖子
4
积分
新手上路
新手上路, 积分 4, 距离下一级还需 46 积分
新手上路, 积分 4, 距离下一级还需 46 积分
积分
4
发消息
发表于 2022-12-31 19:23:53
|
显示全部楼层
好的
回复
使用道具
举报
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
网站导航:
网站首页
关于我们
联系我们
招贤纳士
帮助中心:
充值问题
登录问题
会员问题
其他问题
会员问题
其他问题
网站导航:
网站首页
关于我们
联系我们
招贤纳士
关于我们
联系我们
招贤纳士
电话:400123456
地址:北京中关村大厦12楼1201
版权所有:阳光科技
备案:123456
快速回复
返回顶部
返回列表