囚徒困境

首页 > 新闻中心 > EA相关

囚徒困境

2022/8/11 18:59:17

什么是囚徒困境？

囚徒困境是一个决策和博弈论悖论，说明两个理性的个人为了自身利益做出决策并不能产生最优解。该悖论由数学家 M. Flood 和 M. Dresher 在 1950 年提出，现代解释由加拿大数学家 AW Tucker概念化。

囚徒困境可以表达为一种方法，即个体一方以牺牲另一方为代价来谋求自己的福利。一般来说，由于双方都避免在决策过程中合作，他们最终会处于更糟糕的境地。

想象一下，警察逮捕了两名犯罪嫌疑人。两名嫌疑人被关押在不同的牢房中，无法相互交流。警官为两名嫌疑人提供了保持沉默或责备另一名嫌疑人的机会。如果两名嫌疑人都保持沉默，他们都将仅服刑一年。如果他们都互相指责，他们都将被判入狱三年。

如果其中一名嫌疑人指责另一名嫌疑人而另一人保持沉默，则保持沉默的嫌疑人将服刑五年，而另一名嫌疑人将被释放。下表显示了可能的收益：

在这种情况下，两名嫌疑人都不知道另一名嫌疑人选择的决定。因此，从自身利益的角度出发，最理性的决定就是责备对方嫌疑人。

例如，嫌疑人 A 害怕保持沉默，因为在这种情况下，如果嫌疑人 B 指责他，他可能会被判五年监禁。如果嫌疑人 A 选择责怪嫌疑人 B，如果嫌疑人 B 保持沉默，他就可以被释放。然而，这不太可能，因为嫌疑人 B 使用了同样的理由，而且他也会责怪嫌疑人 A。

尽管两个嫌疑人都保持沉默的决定提供了更优的回报，但这不是一个理性的选择，因为双方都为自己的利益行事。另一方面，从这个角度来看，指责另一个嫌疑人的决定是一个理性的决定，它提供了纳什均衡，尽管回报更差。

个人可以使用不同的正式方法来修改决策者遇到的激励措施。通过法律、民主决策、规则和对叛逃者的精确惩罚行动等联合努力执行合作措施等策略可能有助于将众多囚徒困境转化为有益的结果。

有益的结果可能会发生，因为合作比背叛产生更好的结果。然而，这可能不是一个理性的结果，因为从个人角度进行合作的决定是不理性的。

然而，随着时间的推移，一些当事方会利用行为和心理上的偏见，例如受重复参与影响的长期互动、个人之间的高度信任以及类似的合作行为，无论是对背叛的消极互惠还是合作的积极互惠。

上述意识形态可能会在一组竞争参与者中随着时间的推移而发展。一般来说，它们会非理性地影响个人选择为社会集体提供最大利益的结果。

CLASSIFICATION

NEWS CENTER

联系方式：请直接联系客服QQ或微信