• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

关于java:JAVA进阶训练营2021最新版sesae

java 搞代码 4年前 (2022-01-28) 43次浏览 已收录 0个评论

download:JAVA进阶训练营(2021最新版)

问题形容
囚徒窘境是博弈论中经典问题,有两个囚徒有瞒哄未报的盗窃案件,在审讯过程中每个囚徒能够抉择抗拒不抵赖或者坦率抵赖。局势就是两个囚徒给出本人策略算一个局势,那么依据排列组合局势有

抗拒,抗拒
坦率,抗拒
抗拒,坦率
坦率,坦率
如果两个人都抗拒不抵赖每人会被判 1 年,如果两个人都坦率每个人会被判 3 年,如果一方坦率另一方抗拒,抗拒一方会被判 5 年而坦率会被开释。

局中人:
两个囚徒

策略
抗拒或者坦率

效用函数矩阵
每个人都会抉择最大化本人受害的最大化策略,那么对于囚徒最大化受害就是服刑工夫最短,为了这个目标怎么的策略才是感性的呢?

对于囚徒(A 囚徒)做出策略时还须要思考到另一个囚徒(B 囚徒)的策略抉择,那么 B 囚徒抉择有两种可能别离是抗拒或者是坦率,这里就称为 B 囚徒,如果 B 囚徒坦率的前提,A 囚徒如果坦率将服刑 3 年如果抗拒则服刑 5 年,所以 A 最佳抉择是认罪。

假如后面策略 A 囚徒抉择了抗拒状况,B 囚徒抉择坦率收益为 0,当 A 囚徒抉择坦率状况,B 囚徒也会抉择坦率获取去收益最大。

对于 A 囚徒无论 B 囚徒做出什么策略,坦率都是 A 囚徒的占优策略。两个囚徒都不能通过单方面扭转策略来减少本人的效益,因而谁都没有游离这个策略组合的动机。

占优策略
在抉择策略时,有一个策略的效用总是大于其余所有策略效用时,咱们就把这类策略称为占优策略(Dominant Strategy)

占优策略纳什平衡
当所有参与者的最优回应是抉择他们的占优策略时,这时达到的纳什平衡称为占优策略纳什平衡。


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:关于java:JAVA进阶训练营2021最新版sesae

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址