博弈问题的哲学分析-哲学中国网

2002年8月21日纳什在京作了“在非合作博弈中通过代理人而达成合作的研究”的报告，这是纳什尚为完成的一项研究。虽然没有听到本来所期待的结论，但我其实不太相信博弈论这样深刻复杂的研究能够获得“最后的”结论。这种哲学的怀疑论态度或许不太礼貌，尤其今天博弈论已经取得辉煌成就而成为在数学、经济学、生物进化和社会分析等领域里极具影响力的理论。从哲学的角度对博弈问题进行分析可能另有一番意义。哲学属于理想主义式的研究，如与数学进行类比，似可说哲学有些类似纯数学。我喜欢克莱因说的：“为了激怒纯数学家，应用数学家宣称，纯数学家能发现任何求解中的困难，而应用数学家却能够对任何困难求解”。这话也可以用来“激怒”哲学家。哲学总是试图“全面地”看问题，试图把各种可能性考虑在内，于是就总是发现“任何求解中的困难”。这种思维虽然苛求，但任何一个事情确与各种可能性复杂地相关——这个事实正是哲学所以必要的理由。我们不得不在深入思考某个问题时去思考所有问题，这就是“一个问题/所有问题”的思维模式。因此我又喜欢Talleyrand所说的一句看来或多或少有利于哲学的话：“理想主义者无法持久，除非他是个现实主义者，而现实主义者也无法持久，除非他是个理想主义者”。

博弈论的辉煌首先来自纳什1950年以来的创造性成就。这里无需论及博弈论的细节（关于博弈论已有无数文献，在中文文献中也有张维迎和谢识予等的著作），但仍然可以从涉及更多可能性的哲学开放语境中去分析。其实博弈问题（即游戏问题，game）本来也是哲学中最重要的问题之一，维特根斯坦就是哲学博弈论的代表人。当代哲学中关于政治、社会、伦理、历史等问题的讨论实际就是关于人类博弈的基本条件和问题的研究，甚至在哲学中最纯粹的、过去一向仅仅研究人与知识对象之间的单纯关系的知识论在今天也已经不得不把博弈问题看作是它的一个方面。福科等在促进知识论这个不纯粹的方面的发展有着重要贡献，他发现知识与权力之间有着密切的互动关系；哈贝马斯等则进一步强调了知识论中的对话/交往问题；萨伊德和亨廷顿等更发现了知识生产的文化背景问题，而更新近的一些研究明确地指向了不同知识体系和文化体系的合作可能性问题。这些都几乎是纯正的博弈论眼光的研究。不过，哲学式的博弈研究不是经济学/数学意义上的标准化研究，而是“广义的”。后期维特根斯坦就已经明确地以“游戏”（博弈）为研究单位去分析所有哲学问题，无论语言、数学还是生活/日常实践。哲学化的博弈研究的意义在于它更广阔地意识到任何博弈所牵动的所有条件和所有问题这样一个彻底开放的语境，它与经济学/数学意义上的博弈论可以形成研究性的互补。比较简单地说，经济学/数学意义上的博弈论的思想语法是：给定如此这般的条件，某个博弈或者存在着形成某种均衡的规律或者不存在确定的博弈方法。而哲学化的博弈论的思想语法则是：任意一个博弈，它的博弈条件是否是清楚的、可以相信的和可以接受的。可以看出，哲学化的博弈研究是一种对博弈的反思性研究，它试图发现令人讨厌的但是事实上不得不考虑的“任何求解中的困难”。毫无疑问，经济学、应用数学或其它特定的研究确实总能够“对任何困难求解”，但我们也不妨考虑任意一个困难是否合理地被给出。

非合作博弈论有着一些基本假设（其中大多数假设同时也是经济学的一般假设），比如资源稀缺；经济人（理性行为并且仅仅考虑自己的利益最大化）；共同知识和互相不信任等等。其中有的假设是显然成立的，如资源稀缺。有的则是有限成立的，如经济人和互相不信任。但无论如何，互相不信任的确是人类的主要事实（福山在《信任》一书中声称：“新古典主义经济学有80%是正确的”，而剩下的20%就被“拙劣地解释”），而如何克服不信任则是关键问题。关于非合作博弈的研究表面上是描述非合作的规律，更深的目标其实是寻找合作之路。让人有些疑问的是关于理性行为的理解。理性行为一般地意味着总是选择能够达到利益最大化的最佳策略，而博弈论似乎特别突出了理性选择的风险规避或者说无投机原则，也就是反对赌博性选择。为什么理性的选择就要排除冒险性呢？这一点却没有被很好地说明。不管在日常直观中还是在哲学意识中，理性并不一定排斥冒险，有时冒险甚至是必要的理性选择。任何人在实际生活中想把任何一件事情做大，就不得不冒险；既然没有一件大事可以不冒险，那么如果想做大事，冒险就反而是一个理性选择。假如为了逻辑一致地坚持风险规避原则而反对做大事，于人类思维又恐怕太失真。事实上政治家和投机家们甚至科学家们都在冒险，任何制度设计和任何经济政策更是冒险。人类不具备无限理性（参考休谟/海耶克关于有限理性的理论）或充分信息——由已有知识不可能推论未来，因此某种程度的冒险是必然的，而必然的就是理性的。

一般来说，博弈论的反冒险原则在一次性博弈中或者在有限步的反复长期博弈的最后一步上明显有效，这两种特定情况同样都是短期收益极大而未来收益极小，因此没人愿意冒信任对方而吃亏的险。但总体性的或大规模的人类行为虽然也是博弈性的，却很难完全以非合作博弈论这种模式去分析，而恐怕不得不引入更复杂的分析原则以及重新理解了的基本概念。可是太复杂的行为超出了经济学的表述能力——似乎应该说超出了数学的表述能力，但数学的表述能力往往是经济学的表述偏好——因此经济学有时宁愿削足适履地迎合优美的数学表述而不愿意正确地表述事实。

博弈论的贡献不仅在于它产生了一系列据说在给定的博弈中能够相当准确地预测人类行为的可计算的分析模式，而且还在于它意味着一些有哲学深度的思想发现。其中最重要的一点可能是它突破了亚当.斯密的“看不见的手”理论，即博弈论似乎证明了个人自私的行为并不一定能够而且在许多情况下显然不能够在看不见的手的指引下产生最佳的社会共同结果，或者说，个人理性并不能保证集体理性。不过博弈论的见解不能被理解为与看不见的手是对立的，它只是指出了看不见的手是不够的，不是形成集体理性的充分条件。但这一有限的挑战仍然非常严峻，因为从个人理性到集体理性是在理论上所能够设想的危险最小的社会模式，通常认为这一模式既能够保证个人自由和权利又能够产生合理的利益分配，尤其能够避免极其危险的“奴役之路”。博弈论的挑战似乎说明了古典自由主义可以是一种优美的政治理想但却是一种坏的哲学。坏的哲学往往具有这样一个模式：当把现实还原为理想之后却发现由理想无法回归到现实。

事实表明，只有合作才有最佳的共同结果，而合作又建立在信任之上，于是信任是个关键问题。从博弈论最著名的模型“囚徒困境”可以看出，两个罪犯正是因为互相不信任并且互相不敢信任而都不愿意去冒险选择抵赖罪行（如果一方抵赖而另一方坦白，则抵赖方被判10年而坦白方被释放），结果几乎必然地都选择坦白而都被判8年，这个纳什均衡是个相当糟糕的结果，因为假如互相信任就可以都抵赖而仅仅各被判1年。这个结果显然好得太多，但是由于互相不信任，这个帕累托改进决不可能。罪犯的心理几乎清晰可见：罪犯首先想的是决不吃任何亏的非投机原则，这已经足以决定选择坦白；进一步还会想到，假如自己坦白而对方犯傻去抵赖，则自己甚至可以获得理想的最大福利，这可以看作是希望以别人的痛苦换取自己的幸福的损人利己原则。合起来就是“确保不受别人损害并且力求损人利己”。当然，博弈论一般只考虑“不吃亏”的非投机原则也就足够了，但“损人利己”原则实际上是逻辑蕴涵着的连带原则，因为如能做到损人利己，那就更成功了。

这两个原则的逻辑关联性会在某些情况下变得明显起来，可以考虑这样一个模式：两个心怀叵测的歹徒从银行抢了大笔钱，按照利益最大化的理性思考，他们都想到了干掉对方，再按照共同知识假定，他们都知道对方知道各自心里的想法，于是同时拔枪又同时开枪。这个最坏的结局是一系列纳什均衡的结果。我这个例子是想说明，人们如果非常自私又缺乏信任，那么什么坏事都是可能发生的，纳什均衡可以是“都不吃亏”的结局也可以是“同归于尽”的结局，这取决于具体情况。在缺乏信任的条件下，不吃亏就逻辑地蕴涵损人利己，因为在某些具体情况下，损人利己正是保证不吃亏的必要条件。人们并非不想做坏事，而是在许多时候不敢做坏事（风险太大、成本太高）。个人理性、个人自由和看不见的手也许是避免奴役之路的方法，但却不是避免所有危险之路的条件。虽然不能肯定会出现什么样的危险，但是，人之间的不合作和自私自利逻辑地蕴涵着所有危险，包括毁灭性的暴力行为——我在上面杜撰的“同归于尽”纳什均衡例子实际上是对今天世界危险的暴力倾向的一个隐喻。

我们接着按照“囚徒困境”的思路来想象社会——用罪犯来隐喻现代人并不算太过分，因为任何一个自私自利的理性的利益最大化者（现代人的抽象面目）意味着是个潜在的罪犯。不犯罪是因为没有条件，如果有条件就成为现实的罪犯，所以现代标准人即罪犯。为了获得帕累托改进，罪犯之间的信任是必要的，但这里最好先别引入道德自觉来保证信任，这要求太高，而且现在不是古代熟人社会而是现代陌生人社会，人们在人流中擦肩而过，更多的情况都具有一次性博弈的性质，因此骗子行为有利于利益最大化。为了克服不信任，最简单的方法是利用古老的智慧去形成某个熟人共同体，从而形成共同体内部的长期反复博弈环境，长期利益作为诱惑可以保证人们愿意表现出道德水平。根据博弈论“声誉模型”，人们会为了长期利益而假装好人，一直到最后一博时才原形毕露，把道德声誉一下子挥霍完以谋取最大利益。这个共同体就是“黑帮”（同样是隐喻的意义）。黑帮是强大的组织，组织成员只有互相合作才能得到组织提供的保护，不合作则会受到严厉惩罚，个人想对抗组织是没有希望的，因此，组织良好的黑帮能够形成帕累托改进。不过黑帮的支持/威胁虽然可能促使囚徒去选择“抵赖”，但更多的时候还是会选择“坦白”，这不是黑帮无效而是因为国家和政府是更强大的组织。

黑帮模式不足以提供现代社会的合作条件，因为现代社会从整体上说是流动性极大的陌生人社会，这多少可以说明为什么现代社会不可能“仿古地”建立各种共同体来形成合作。现代社会尤其需要严格的制度。一个拥有内部合作的成功组织需要一个制度来保证合作的可重复性和稳定性。制度是任何一个组织所以具有强大力量的原因，而成功的制度必须是个公正的制度，只有公正的制度才能形成巨大的力量。据说制度是长期博弈所选择的均衡结果。纳什目前关于选举代理人的研究实际上就属于一种制度建构的研究。

制度建构的问题可能是人类所有问题中最复杂、最冒险的问题，它意味着人类实现自身管理。每个人都有着各自的利益、意愿和优势资源，要满足每个人的利益在逻辑上永远不可能，因此公正问题是无解的。绝对意义上的公正是个伪问题，任何可能的制度都是不公正的。可以这样分析：给定任意某个共同体或社会，按照自然事实，它的成员各自天赋不同（自然优势不同），或体力过人，或智力过人，或善于言辞，或善于交际，或善于学术，或善于商业，诸如此类。而任何一种制度安排即使在分配程序上是公正的，它仍然不可能让所有人承认它是公正的。任何一种制度都相当于规定了一种游戏，有可能所有人都承认它的规则是程序合理的，但并非所有人都会承认这个游戏是实质合理的，总有些人愿意玩另一种游戏，这不是无理要求，既然我们有理由选择这种而不是那种规则，那么同样有理由选择这种而不是那种游戏。任何一种游戏/制度都先验地规定了具有某种天赋和品格的人才能够获利，而具有另一些天赋和品格的人则只能在另一种游戏中才能获利。比如说力大无比的人在古代可以做将军而现在只好去举重；在今天的社会里像克林顿和布什这些会讨人喜欢的人比拿破伦那样的天才更有机会当上总统，如此等等。每种游戏/制度都必定先验地赞助某些优势能力而排斥另一些优势能力（virtue），而先验地剥夺某些能力的获利资格显然不公正。游戏的公正性不仅仅在于游戏内部规则的合理性，而且在于游戏种类的选择合理性。可是没有一个游戏/制度能够满足全面公正的要求。

人们所能够期望的只是一个“比较好”的制度。一般来说，制度总是一个共同体成员自由选择的一个均衡结果，它使得每个成员在理性地思考自己的利益时，总是没有积极性愿意打破这一均衡，它大致满足纳什均衡的条件。但是一个好的制度却需要比这种纳什均衡有着更多一些的限定（正如我们看到的，纳什均衡在更多的情况下虽然能够保证人们不比别人更吃亏，可是也不能达到最大利益，因此终究不是众望所归的）。不过一个制度到底怎样才是好的，却是个永远的问题。根据人们不同的理想，好和坏，公正与否，显然有着非普遍必然的语境性。而一个满足所有理想的普遍语境是不存在的。

人们在谈论好坏公正不公正之类往往预设了理想，相当于已经在某种给定了的游戏内部讨论公正问题，这时候已经不再是全方位意义上的公正问题了，而仅仅是涉及作弊或耍赖的问题。比如说，给定只能玩“足球”，别的都不许玩，那么，所谓公正当然就只是如何遵守足球的规则，舞弊和耍赖固然不公正，可是想玩别的游戏也会被定义为不公正的——这个问题正是现代世界各种冲突的根源（人们总想把某种制度推广为唯一制度）。人们往往不把所有可能世界都看作是可考虑的（available）选择对象，而仅仅认定其中一个可能世界，其他的可能世界被剥夺了可考虑性（availability）。只有当任何一个可能制度和可能生活都获得话语权利，并且不同话语之间能够形成对话关系，我们才能拥有充分的知识背景。这也是对话问题在今天成为知识论的核心问题的理由。于是，制度建构的博弈不仅是个实践问题同时也是个话语问题。但也不能对话语博弈寄太高期望，即使存在着哈贝马斯式的“理想言说条件”，也仍然很难把实践博弈转化为话语博弈来解决问题。成功的对话需要太长时间，尽管人们有着“时间能够消解一切问题”的信念，但这个时间信念是不可靠的哲学，因为时间既能消磨掉问题，可也同样能积累问题甚至产生新的问题，最终还是个行动上的选择问题。

如何判断在所有的“可能制度”中哪一个是更好的，比较可靠的方法就是能够明确人们的一致性首选的方法。从理论上说，“全体一致”是定义公正的最好理由。布坎南采取的就是这种定义，即一致同意意味着公正。不过这个具有理论优势的定义并不具有实践优势，因为只有很少的事情能够真的获得一致同意。于是，问题就变成了如何来解决不一致。民主选举正是这样一种解决方法：民主选举根本不能产生一致性，却可以通过多数否决少数来解决意见的不一致。然而新的麻烦是，在许多情况下（可能是大多数时候），多数甚至并不能表达相对的公正，因为所谓的“多数”并不是真心实意的多数，而是在特定的利益语境或者价值取舍语境中“策略地”产生出来的临时性的乌合之众，比如说a明明与b在价值观上是一致的，但是a更渴望打倒b，于是就会宁愿牺牲自己的价值观而策略地选择与c的临时性同盟。

“阿罗不可能定理”可以理解为说明了真正公平的选举的不存在。其中根本的原因就是1）人们并非总是进行“真诚选举”，更多的时候进行的是“策略选举”（即不真诚的选举）；并且2）没有任何理由能够证明“策略选举”是不好的。这里涉及相当复杂的选举理论，在此不论，总之简单地说就是，“民主”这个哲学概念本身是非常抽象的，它并不能先验地指定什么样的选举方式是唯一好或最好的。能够满足程序公正的民主选举方式有许多种类（例如有多数原则、对决表决、逐轮胜出、逐轮末位淘汰、波达记分等），而这些选举方式在公正性上都同样好，可是这些同样好的选举方式所选出的结果却可以完全不同（比如说选总统）。因此，假如把各种同样好的选举方式都看作是“民主”这个概念的合法所指的话，那么“民主”必定是一个悖论性的概念。阿罗不可能定理所以能够证明公正选举的“不可能”，其哲学根据就在于，我们没有理由可以把某些同样好的选举方式排除出去以避免民主的悖论。

维特根斯坦有一个关于游戏规则的怀疑论问题：只要逻辑上没有矛盾或者说算法上是合理的，那么就总能够任意构造一条规则；并且在符合上述条件的情况下，任何一个行为都可以被解释为符合某条规则，于是，既然任何一个行为都可以被解释成符合某条可能的规则，那么就没有一个行为是符合规则的。维特根斯坦怀疑论不是为了证明不存在着游戏的确定性，相反，他试图说明的是，一个游戏是一种给定的、具体情景的生活形式，它的具体性不讲道理地拒绝了与之不合的但同样有理的其它规则，而且任何一种游戏的辩护链条的最后理由也是不讲道理的，所谓“不再有理由”，因为最后理由无非是无法再解释的习惯、价值观和具体利益。从维特根斯坦的哲学博弈论似乎引出这样的命题：1）一个游戏的具体性就是它的充分理由，不存在着高于这种具体性的普遍理由；2）人们之间如果能够达成一致，那么本来就是一致的，如果本来就不一致的就不能达成一致；3）如果存在着某种从不一致到一致的变迁，那么必定是游戏的条件发生了变化，其实就是变成了一个新的游戏。

游戏（博弈）的具体性是正确分析游戏问题不能省略的条件。这一点非常重要。不管是罗尔斯还是布坎南在分析社会游戏规则时都假定了人们事先对自己和别人的优势或劣势地位的无知，所谓“无知之幕”，但是这种乌托邦首先永远不可能，与事实完全不符，以此为模型对现实几乎无用（许多批评者早就深明此节）；其次，即使把这种假设看作相当于抽掉了实际内容的逻辑实验，它也是糟糕的题目。显然，按照社会博弈的逻辑，在对环境完全无知的情况下，就不得不从最坏处去着想（这样才保险），即把所有人都假定为坏人，假定处处都可能坏事；而如果人人都这样去想（按照博弈论，人人必定都这样想，就像各怀鬼胎的囚徒），这个无比险恶的心理环境和共同知识就必定在实际上倾向于把人人都造就成坏人，或者说，互相不信任和互相视为坏人的共同知识结果就把人真地变成坏人，把本来不确定的丰富世界变成确定的坏世界——我们不能忽视知识的这种生产力。罗尔斯和布坎南们似乎没有意识到无知之幕加上经济人所构成的逻辑是多么危险，如上推论，那种乌托邦虽然表面上没有限定什么，其实却逻辑必然地把丰富的可能世界削减为唯一的可能世界，一个充满坏人坏事的可能世界。即使人们出于理性而产生了某种公正谨慎的、能够避免发生最坏事情的规则，这种公正的规则也是以生产出坏的世界为代价的。在生产公正的规则的同时生产出坏的世界，这无论如何是个严重的问题。在今天这个虽然坏但是远远还不是最坏的现实世界里，人们已经建立了相当好的制度，但还是很容易发现，所有人都想从制度中获得好处（这是制度所以获得支持的一个重要原因），同时所有人都更想钻制度的空子（这是制度所以获得支持的一个更重要原因）。所以落后国家的腐败和发达国家如美国的大公司丑闻都不足为奇。制度总是被设想为来限制别人的利益的，而自己时刻准备着成为例外的受益者。

世界是我们关于世界的知识或知识论预期所生产出来的。这一点总是被有意无意地忽视。公正不仅是个关于规则的概念，而且应该是个关于世界的存在论状况的概念。博弈最终不仅是为了产生均衡，不仅是为了产生公正的制度——这些都是阶段性成果——还应该为了产生一个好的世界。可以考虑一个在生物进化和社会进化中都很有意义的ESS问题（evolutionarily stable strategy，Smith&Price, 1973），ESS被假定为是在长期反复博弈中最后胜出的最佳策略，根据Axerold&Hamilton的研究证明（1981），一种有着合作愿望和宽恕品质的“针锋相对”（TFT）策略总能够在众多策略的竞争中最后胜出，这说明了高道德水平的策略同时也是最有力的策略。不过TFT所以能够胜出的一个关键条件是TFT策略能够成为博弈的初始条件之一。假如以无知之幕和经济人为竞争的初始条件，那么人们是否能够在实践经验中摸索出TFT策略就很难说了，偶然出现的少数TFT策略人恐怕在头几轮博弈中就被吃掉了。

从生物学角度的进化博弈虽能说明生物学的问题，但我疑心它对于人类社会的说明力。可以考虑一个“时间问题”：在思考生物进化时可以只考虑种群的长期博弈，而对于人则不得不考虑个人对仅仅属于自己的有限生命的自觉意识和利益衡量，集体的博弈时间虽长，个人生命却短，这大概会更多地鼓励自私。另外还可考虑“人数问题”（在交换关于这个问题的看法时张宇燕给了我不少帮助）：人们在想到一个共同体时很容易想到的最简单模式是二人博弈，因为二元是最简单的关于“多”的表达模式，就好象人际问题可以简化为二人问题。其实许多至关重要的人际关系例如“结盟”、“选举”、“搭便车”等都不可能在二元关系中被表达，因此，逻辑上足够正确表达人际关系的最简单模式是三人关系。我相信这一修改可以从根本上改变许多哲学问题。三人模式增加了行为的许多可能性，而这些“增加了的”可能性所开拓的几乎都是产生损人利己现象的条件，因此，即使假定人性是善的，那么世界却不得不被假定为坏的。在一个坏的世界里如何使善良的共同体最后胜出，问题恐怕不像进化博弈论在电脑游戏中的实验那么简单。

二元模式和三元模式的区别就是理想和现实的区别。二元模式虽然不足以正确表达人际关系，但如果讨论道德问题则极具优势，著名者如孔子的“仁”和列维纳斯的“面对面”理论。这暗示着一个深刻的道理：二人关系有着人之间的对话、交往、合作和分享的单纯理想本质。仁就是二人关系，孔子所以提倡仁，无非是希望复杂的n人关系能够变成如同二人关系那样单纯。列维纳斯的面对面关系同样表达的是任意一个人与任意另一个人的单纯人性依存关系。单纯的二人关系正是道德形而上学的根据。二元人际模式虽是现实的错误表述，却是理想的希望。我们知道，想从三元人际模式的博弈导出二元人际模式的合作是一条艰难之路，但一个好的世界预期要比一个坏的世界预期更有可能生产出好的结果。

（本站首发。录入编辑：乾乾）