学习公社数字图书馆--期望效用理论的两个悖论及其消解

期望效用理论的两个悖论及其消解

作者：熊卫来源：现代哲学发布时间：2016-04-08 阅读量：0

熊卫作者简介：熊卫，江西崇仁人，哲学博士，（广州510275）中山大学哲学系副教授。

①Savage, L., The Foundations of Statistics, John Willey&Sons, Inc., 1954, p15.

【摘要】

期望效用理论在弱序和独立性等公理基础上表征后果的价值和当事人的信念度，从而表征偏好关系。阿莱斯悖论和厄尔斯伯格悖论在理论基础和解释经验方面对期望效用理论提出了严重的挑战。阐述这两个悖论的消解，可以清晰地刻画现代决策理论的大概发展脉络。

【关键词】

决策；期望效用；悖论；信念度

中图分类号：B81文献标识码：A

文章编号：1000-7660（2013）05-0082-05

决策论表征当事人的偏好，是研究决策行为理性的一种理论。由于行为理性是社会科学一个重要的概念，决策理论逐渐成为哲学、经济学、统计学、计算机科学、认知科学、管理学和心理学等多学科的一个研究热点。事实上，在历年诺贝尔经济学奖获得者中，不乏来自不同学科的决策论研究大师，如经济学家阿莱斯和奥曼、哲学家西蒙、心理学家卡尼曼。在当今兴起的形式认识论的热潮中，越来越多的研究人员应用决策论和博弈论来探讨认识论中的一些基本问题。

作为一种规范性理论，期望效用理论（贝叶斯决策理论）在决策论中一直占有突出的地位。然而，阿莱斯悖论（Allais paradox）和厄尔斯伯格悖论（Ellsberg paradox）在理论基础和解释方面对期望效用理论提出了严重的挑战。如何解读和消除这两个悖论，决定了推广期望效用理论的思路。因此，阐述这两个悖论的消解，可以清晰地刻画现代决策理论的大概发展脉络。

一

根据萨维齐的观点①，一个典范决策情景包括：（1）由行为组成的集合；（2）由世界状态组成的集合，其中的每个元素都是对客观世界的一种描述；（3）由后果组成的集合。下表直观地表述了一般的典范决策情景，其中ai 为一个行为，sj为一个世界状态，oij为行为ai在世界状态sj下所形成的一个后果，ai的可能后果是oil，…，oim。

s1 s2…sm

a1 o11o12…o1m

a2o21o22…o2m

…………oim

an on1on2…onm

决策是当事人偏好所决定的。偏好是一个定性的概念，可以用“对x的偏好不次于y”等日常语言来刻画，实质上，它是定义在行为集合上的二元关系。主流的决策理论认为当事人的偏好取决于对后果的愿望（价值）。然而，任意一个后果产生的可能性又依赖于世界状态真假的不确定性，亦即他对世界状态的信念度（degree of belief）。因此，决策理论的目标在于给出一个模型，使得当事人能够合适地表征后果的价值和有关世界状态的信念度，从而表征他的偏好。

效用和概率均是定量的概念。前者刻画当事人对结果的心理满足或愉悦的程度，后者刻画当事人对世界状态真假的相信程度。在期望效用理论中，价值由效用概念来表征，而信念度以概率来表征。在此基础上，我们可以计算一个行为的期望效用，即对该行为可能后果的效用实行加权求和，而概率就是加权因子（决策权重）。于是，我们把偏好表征为期望效用：当事人对行为ai的偏好不次于aj当且仅当ai的期望效用不小于aj的期望效用。在这种情形下，我们也可以说偏好将行为集合中元素的期望效用最大化，它要求当事人选择某行为当且仅当它的期望效用是最大的。在决策理论中，命题“对行为ai的偏好不次于aj当且仅当ai的期望效用不小于aj的期望效用”被称为表征定理（Representation Theorem），它是理论中的主要定理。

根据科学方法论，一个科学理论，特别是成熟的科学理论，需要有内在公理（基本理论假定）。它们不是理论中其他命题的演绎结果；相反，它们是可以推演理论的定理。如果在决策理论中我们将表征定义视为导出定理，那么它的内在公理是什么？归结起来，期望效用理论有两类公理系统。

期望效用理论的两个悖论及其消解

《现代哲学》2013年第5期

基于客观概率的公理系统。冯诺依曼和摩根斯坦的巨著《博弈和经济行为理论》于上个世纪四十年代出版，如今再版几十次，这本著作被广泛地引用，产生了巨大的影响。他们的系统假定了当事人已知每个世界状态真值的概率（客观的）。因此，这个系统不需要表征信念度，而只要表征后果的价值。为此，他们提出了三个公理，并证明了效用函数的存在性（这里的效用函数在线性变换下是惟一的）和表征定理的成立。这些公理包括：其一，弱序公理，即偏好序列具有传递性和连通性。所谓偏好传递性是指该偏好序列满足如下性质：对行为a的喜好不次于b，而b不次于c，那么a不次于c。显然，假设传递性是为了保证偏好的一致性。所谓连通性是指任意两个行为都是可比较的。其二，阿基米德公理，即偏好具有连续性。其三，独立性公理，即若两个行为在某概率下产生的后果是无殊的（价值相等），则以其他等值的后果替代原先的后果不改变这两个行为之间的偏好关系。特别地，当我们可以用值为零的后果替代时，仍然不改变行为之间的偏好。因此，这个公理实际上说明了在其前提下偏好关系的确定与这些后果无关。作一个类比，在一个不等式两端各加上或减去相同大小的实数后，所得不等式的大小关系不改变。萨维齐把它称为“确凿性原则”（The surething principle）。

基于主观概率的公理系统。与冯诺依曼和摩根斯坦的观点不同，拉姆齐、萨维齐、安斯康伯和奥曼认为有关世界状态的信念度是主观的，它不是公理系统外的，而且当事人之间的信念度可能是不同的。因此，他们的公理系统不仅要推演效用函数（表征后果的价值），还要推演概率函数（表征信念度），从而证明表征定理的成立。这就意味着，相比冯诺依曼和摩根斯坦的系统，他们的系统更加复杂，他们需要有更多的公理，同时还需要扩展冯诺依曼和摩根斯坦理论的基本概念才能达到目的。但是，在相应的基本概念之下，他们的系统均包括上述三个公理，或者这些性质在其中都是成立的。由于他们把有关世界状态的信念度表征为主观概率（具有惟一性），在决策论中，我们把他们的理论称为主观期望效用理论。在认识论中，这些理论往往被贴上主观贝叶斯主义的标签。

在技术细节上，以萨维齐等人的主观期望效用公理为基础来表征信念度是非常复杂的，但其中的基本思想是简单的：系统提供一个测度信念度的方法，即给出一个信念度的操作性概念，从而阐明这个语词的意义。这个思想和逻辑实证主义中意义的经验划界标准是一脉相承的。以拉姆齐观点为例，他认为，考察当事人对一个命题为真的相信程度可以通过设置一个决策情景来进行，粗略地说，提议就此命题为真（假）进行打赌，看看他所愿意付出的赌注分别是多少，以赌比作为信念度的测度Hacking, I.,“An introduction to Probability and Inductive Logic”, Cambridge University Press, 2001，p,156. 。这种方法类似于物理学中测量电路的电流强度，即我们可以将一个安培表安置于某电路中，再看看安培表的指针刻度。

在主观期望效用理论那里，由于当事人之间对有关世界状态的看法是不同的，因此，它允许当事人拥有不同的信念度，但是必须满足概率公理以确保它们是融贯的。事实上，由表征定理的证明，拉姆齐等人的主观期望效用公理均能够保证信念度的融贯性熊卫：“Implications of the Dutch Book: Following Ramsey´s Axioms”，Frontiers of Philosophy in China, Vol.6, 2011, p334-344. 。

二

阿莱斯悖论。经济学家阿莱斯在研究期望效用理论中发现，该理论不能解释人们的一些实际决策行为。因此，他设计了如下决策情景以验证这个的观点。

决策情景一：对于行为a和b，你偏好于哪一个？

a：有100％的机会获得100万元；

b：有10％的机会获得500万元，有89％的机会获得100万元，还有1％的机会什么也得不到。

决策情景二：对于行为c和d，你偏好于哪一个？

c：有11％的机会获得100万元，有89％的机会什么也得不到；

d：有10％的机会获得500万元，有90％的机会什么也得不到。

阿莱斯的实验结果是：对于第一个决策情景，大多数人偏好行为a，即选择确定地获得一百万元而不愿去冒险（有10％的机会得到五百万元）；而对于第二个决策情景，大多数人偏好行为d，他们因寻求获得更多奖励而愿意冒大一点的风险。下面，我们应用期望效用理论中的独立公理来分析上述决策情景。事实上，行为a可以改写为：有11％的机会获得100万元，有89％的机会获得100万元。由于行为a和b均以089的概率获得相同的后果（100万元），我们以零替代100万元。经过如此替代后，a转换成c，b转换成d。于是，根据独立性公理，当事人在第一个决策情景中偏好a当且仅当他在第二个决策情景中偏好c。因此，期望效用理论分析的结果与实验结果不一致。这就是所谓的阿莱斯悖论。值得注意的是，由于在上述决策情景中概率是已知的和客观的，故阿莱斯悖论针对的是基于客观概率的期望效用理论。

若同时接受期望效用理论和实验结果，则由两个决策情节中的偏好关系分别可以推出011u（1000000）>01u（5000000）和011u（1000000）<01u（5000000），其中，u为效用函数。显然，这是矛盾的。

依据科学方法论，当一个理论做出的预测和经验不一致时，在不考虑特设性假说和边界条件下，我们应该对该理论的内在原理（公理）进行修改，以消除这个矛盾。实际上，消除阿莱斯悖论的方案主要是：在放弃或弱化独立性公理的基础上构建新的理论，而不再把该公理作为必要的条件。

这个方案的代表性理论之一是由奎基（Quiggin，J）提出的依序效用理论（Rankdependent Utility Theory）。奎基的主要思想包括：首先，假设行为后果的效用是已知的，并且，如冯诺依曼和摩根斯坦，他假设我们知道每个世界状态为真的概率，它是客观的。其次，他把后果的效用由大到小进行排列，然后定义后果的序（rank）。所谓后果的序就是一些概率累加，在这些概率之下的后果的效用均不小于该后果的效用。例如，考虑上述第一个决策情景中行为b，后果“500万元”的序就是01(记为F(5000000)=01)，“100万元”的序就是把前面两个后果所对应的概率加起来(即F(1000000)=099)，类似地，“0元”的序为1。进一步，再定义概率权重w，它是非线性的和递增的，具有非可加性，并且具有如下性质：在小概率的情况下决策权重超重，即决策权重大于该概率，反映了当事人在小概率事件发生的情况下往往会采取冒险的策略，例如参加一个抽彩活动；而在其他情况下决策权重次重，即决策权重小于该概率，说明了人们在非小概率事件发生的情况下往往会采取保守的策略，例如，在阿莱斯设计的第一个决策情景中，当事人偏好行为a。再次，他把概率和决策权重这两个概念区别开来：概率是有关世界状态的客观测度，而一个决策权重是关于后果的序的函数，可定义为两个概率权重之差，即两个相邻后果的序的权重差。最后，正如期望效用的计算方法，一个行为的依序效用就是对该行为可能后果的效用实行加权求和，但是与期望效用不同，其中加权因子不是概率，而是决策权重。例如，行为b的依序效用为：w(01)u(5000000)+［w(099)-w(01)］u(1000000)。

让我们应用依序效用理论来考察阿莱斯悖论。在计算四个行为的依序效用后，由a偏好于b可以推出u(1000000)(1-w(099))>u(5000000）w(01)；由c偏好于d可以得到u（1000000）w(01)>u(5000000)w(011)。因此，我们有：1-w(099)>w(011)-w(01)。它说明对于被试者而言，概率为1与099之间的概率权重差大于概率为011与01之间的概率权重差。实际上，根据佩勒克的概率权重表达式，这个不等式是成立的。

这个方案的另一个代表性理论是前景理论（Prospect Theory）。该理论是一种描述性理论和一个完整的行为决策理论，引导当今行为经济学的研究。它由卡尼曼和特维斯基于上世纪七十年代末提出，前者主要因此项成果获得2002年诺贝尔经济学奖，可惜后者于1996年谢世。与期望效用理论不同，它试图描述和解释人类的实际决策过程和有关认知偏差，而不是以“我们应该如此”为出发点。该理论可以视为依序效用理论的扩展，拥有依序效用理论的四个主要特点，除此之外，还引入参考点、获益和损失等因素。参考点的效用为零，次于参考点的后果即为损失，而好于参考点的后果为获益。获益部分的后果之效用函数为凸性的，反映了当事人是厌恶风险的；而损失部分的后果之效用函数呈现凹性，表明当事人是寻求风险的。获益和损失部分的价值计算方法和依序效用相同，于是，一个行为的期望价值等于这两个部分的价值之和。由于在阿莱斯决策情景中没有“损失”的后果，应用前景理论分析阿莱斯悖论基本上和依序效用理论的分析相同。

厄尔斯伯格悖论。与阿莱斯悖论不同，针对主观期望效用理论，厄尔斯伯格提出了另一个悖论。假设一个罐中盛有三百个球，其中一百个球是红色的，其余两百个球是黑色的或者是黄色的。现在从罐中随机抽取一个球，厄尔斯伯格设计如下决策情景：

决策情景一

取出红球取出黑球取出黄球

a1： 100元0元0元

a2： 0元100元0元

决策情景二

取出红球取出黑球取出黄球

a3： 100元0元100元

a4： 0元100元100元

其中，a1表示的意思为：如果世界状态为“取出红球”，那么当事人将得到一百元，否则他什么也得不到，其余类推。现在就上述两个决策情景分别进行选择，厄尔斯伯格邀请哈佛大学的学生参与实验。实验结果是：对于第一个决策情景大多数人偏好行为a1，而对于第二个决策情景大多数人则偏好a4。

让我们以期望效用理论中的独立性公理来考察这些决策情景。首先，情景一中行为a1和a2在世界状态“取出黄球”下的后果是相同的（0元）。由独立性公理，这两个行为的偏好关系的确定与在世界状态“取出黄球”下的后果是不相关的。其次，情景二中行为a3和a4在世界状态“取出黄球”下的后果是相同的（100元），同理，a3和a4的偏好关系的确定与这个后果无关。我们注意到：行为a1和a3（a2和a4）在世界状态“取出红球”和“取出黑球”之下的后果分别是相同的。因此，根据独立性公理，如果当事人偏好行为a1当且仅当他偏好行为a3。显然，由期望效用分析的结果和上述实验结果是矛盾的。众所周知，理论的功能在于解释和预测，一个好的理论应当能够解释经验现象，并且做出与经验相一致的预测。然而在上述决策情景中，期望效用理论却不能实现这些功能，这就是所谓的厄尔斯伯格悖论。

如果我们同时接受期望效用理论和厄尔斯伯格的实验结果，那么，一方面由“行为a1偏好于a2”可以推出“取出黑球”的概率小于三分之一，另一方面则由“行为a4偏好于a3”可以推出“取出黑球”的概率大于三分之一。所以，从前提中推出矛盾！

目前，对厄尔斯伯格悖论主要有两种解读方法，它们各自提供了扩展主观期望效用理论的思路。第一种解读方法是，厄尔斯伯格决策情景涉及信息或知识的不完全性，因为它没有提供黑球和黄球的数量，在不确定性条件下，当事人通常是厌恶含糊性的(ambiguity aversion)，而这种对不确定性的态度导致他的偏好关系违反了独立性公理。因此，为了消除厄尔斯伯格悖论，我们必须放弃独立性公理(但保留其他公理)。这个方案的代表性理论之一是肖凯特期望效用理论(Choquet expected utility theory)，它是依序效用理论的扩展理论。如前说述，依序效用理论是假定了我们知道每个世界状态为真的概率是客观的，在此基础上定义概率权重。肖凯特期望效用理论放弃了这个假定，它直接定义事件权重函数，这里的事件是一些世界状态的集合。于是，在肖凯特期望效用理论那里，我们在计算行为的期望效用时只需把依序效用理论中的概率权重替换成事件权重。回到厄尔斯伯格悖论，首先我们计算四个行为的肖凯特期望效用，再由两个偏好关系可以推出：w(取出黑球)<w(1/3)，w(取出红球或者黄球)<w(2/3)，其中w为事件权重。由于未知黑球和黄球，这些不等式反映了当事人在决策时含糊事件权重的赋值通常会小于有确定概率的事件权重，即他是厌恶含糊性的。

这种方案的另一代表性理论是累积前景理论(Cumulative Prospect Theory)，它是由卡尼曼和特维斯基扩展前景理论而得到的。类似肖凯特期望效用理论，它放弃了这个客观概率的假定，定义事件权重函数，然后在前景理论的期望价值公式中将概率权重替换成事件权重。由于在厄尔斯伯格决策情景中没有“损失”的后果，这个理论和肖凯特期望效用理论对厄尔斯伯格悖论的解读和消解所采用的方法基本上是相同的。

第二种解读方法是，由于我们仅知道罐中黑球和黄球数目的总量，所以我们不能确定取出的黑球或黄球的概率。这导致我们可能无法为每个行为指派精确的期望效用(可能为一个集合)，故两组偏好关系是不确定的和不可比的，这说明这些行为之间的偏好关系不满足弱序公理。如果我们武断地确定这些行为之间的偏好关系，将不免产生偏好的逆转而导致悖论。为了消除厄尔斯伯格悖论，这种解读方法提倡放弃弱序公理而保留独立性公理。它的代表性人物是塞登菲尔德（Seidenfeld，T）、莱维（Levi，I）。莱维认为，在不确定状况下当事人有关世界状态的信念度用一个概率函数来表征是不现实的和不合适的，也就是说，在信息或知识不完备条件下，我们应该用一个概率函数集合来表征信念度，从而刻画概率的不确定性和无知Levi, I., “Why indeterminate probability is rational”, Journal of Applied Logic, Vol7, 2009, p364-376. 。基于此，塞登菲尔德等Seidenfeld, T,. Schevish, M., Kadane, J., “Decisions Without Ordering”, in: Rethinking the Foundations of Statistics , Cambridge University Press, 1999, p40-68 在弱化弱序公理的基础上推广了期望效用理论。但是，他的理论只能表征那些确定的偏好。进一步，为了消除厄尔斯伯格悖论，莱维Levi, I., The Enterprise of Knowledge, Cambridge: MIT Press, 1980, p50 和基博亚等Gilboa, I., Schmeidler, D., “Maxmin expected utility with nonunique prior”, Journal of Mathematical Economics, Vol18, 1989, p 141-153. 各自提出了概率不确定条件下偏好关系的确定规则：先计算所有行为的最小期望效用，然后找出其中最大的一个(称之为安全水平)，再选择其对应的行为。这个规则通常被称为安全水平规则。在厄尔斯伯格决策情景中，四个行为的最小期望效用分别为1/3u(100)、0、1/3u(100)和2/3u(100)。由于1/3u(100)>0，故当事人偏好a1；因为1/3u(100)<2/3u(100)，当事人偏好a4。显然，这和实验结果是一致的，从而消除了厄尔斯伯格悖论。

三

典范的决策情景是决策理论中的基本概念。构造这样的一个决策情景,需要当事人能够预知所有的可能后果。另外，表征偏好关系需要表征一个融贯的信念度(或者决策权重)以及后果的价值，这些均要求当事人具有很强的计算能力、足够的记忆力和认知能力。美国哲学家和经济学家西蒙提出了有限理性概念，批判了这个假定和理性经济人假设。经历半个多世纪，虽然很多学者在基于有限理性概念研究决策的方面做出了很多的努力，但是有关研究仍有待进一步地开展。

在建立决策理论时，我们需要考虑偏好应该遵循的一些性质或者相关的认知因素，如偏好的传递性、含糊性规避等，而这实际上是做出了一个归纳论证。从这个意义上说，一个决策理论并不能够涵盖所有的决策经验现象，均为一个局部性理论。在规范的决策理论那里，所设立的公理容易受到经验事实的冲击。而描述性决策理论往往缺乏内在原理，使得一些概念得不到理论上的辩护，理论在解释方面同样地存在局限性，例如近期马辛纳（Machina，M）针对肖凯特期望效用理论和累积前景理论提出了两个类似厄尔斯伯格悖论的事例熊卫，刘海林：“On Solving Some Paradoxes Using the Ordered Weighted Averaging Operator Based Decision Model”, International Journal of Intelligent Systems，Vol00, 2013, p1-24. 。为了更深刻地理解决策理论中的相关概念，建立更有效的理论，我们还需要借鉴不同的研究方法并开展多学科的交叉研究。

（责任编辑行之）