从知识表示的角度看DRT与一阶谓词逻辑-哲学中国网

DRT是Discourse Representation Theory的简称，在国内正式出版物中至少有“话语表征理论”、“篇章表述理论”、“话语表达理论”和“话语表现理论”四种译法[1]。在网络上我们还可以找到“语篇表示理论”[2]的译法。其中 “话语表现理论”的使用频率是最高的，但对这一译名也有权威人士提出异议[3]，所以，本文将不采用任何中文译名，而是直接称之为DRT。

DRT是一种自然语言逻辑理论，同时也是一种知识表示方法，这种知识表示方法与目前运用最广泛的另一种知识表示方法“一阶谓词逻辑”之间有一种内在的联系，这种内在的联系主要体现在DRS[4]与一阶谓词逻辑公式间的相互转换上，关于这个问题我已在“DRS与一阶谓词逻辑公式”[5]一文中进行过探讨。本文主要从知识表示的角度比较一下二者在刻画效力上的差异，在比较中我们将看到，DRT不仅能够刻画一阶谓词逻辑所能够刻画的语句，而且还能够刻画一阶谓词逻辑所不能够刻画的很多语言现象。这说明DRT较之一阶谓词逻辑而言有更强的刻画效力。本文旨在通过二者的比较，让更多的人了解DRT的优越性能，然后尝试用这一理论去解决汉语中的众多疑难现象。

一、DRT的基本框架

DRT由“句法规则”、“DRS的构造规则”和“DRS在模型中的解释”三部分构成。

句法规则给出的是英语的句法算法，由于DRT的目标是揭示语义和语言形式间的关系，而不是句法形式本身，所以，DRT只是从已有的句法理论中选择了“广义短语结构语法”。因而，DRT的句法实质上是一种短语结构语法。我们知道，刻画语言无非三条途径：一是穷举语言中所有成立的句子，对自然语言来说这一方法是行不通的，因为自然语言中成立的句子是无穷的；第二条途径是制定有穷数目的规则以生成无穷数目的句子；第三条途径是设计出一种装置即自动机，用自动机来检验输入的符号串是否是语言中成立的句子。短语结构语法用的是第二种方法，它通常表现为一个四元组：G =（VN, VT, S, P），其中VN是范畴符号的集合，这些符号是专门用来描述语法类别的，是非终极符号；VT是单词符号的集合，这些符号就是被定义语言中的具体的单词，是终极符号；S是初始符号，是集合VN中的一个特殊的成员；P是重写规则（rewriting rules）的集合，其中每一条规则都具有这样的形式：φ®ψ，这一形式意味着可以用右边的ψ来置换左边的φ。给定一个四元组G，就可以从初始符号S开始，先根据与S相关的重写规则“S®φ1”从S推导出φ1，再利用与φ1相关的重写规则“φ1®φ2”从φ1推导出φ2，……依此类推，直到不能再重写为止，这样我们就可以得到这种语法所描述的语句。这个过程既是语句的生成过程，也是对语句进行句法分析的过程。它不仅可以揭示出句子中单词的线形顺序，而且还能够反映出句子的层次结构。在短语结构语法中居于核心位置的无疑是重写规则。DRT中最基本的重写规则有：“S ® NP VP”、“VP ® V NP”、“NP ® PN”等，在这些基本规则中，位于“®”左右边的都是表示语法类别的符号。位于重写规则右边的还可以是被定义语言中的具体的单词，如“PN ® John, Smith, Mary, Anna Karenina,…”、“V ® likes, loves, abhors, arises, …”。有了这些重写规则就可以生成很多英语句子了，一个句子的生成过程就是得到该句子的句法结构的过程。

句子的句法结构即句子的语言形式，怎样透过句子的语言形式来把握句子的语义呢？这正是“DRS的构造规则”部分所要解决的问题，因为DRS的构造规则给出的正是语言形式和语义之间的转换模式，其中DRS就是对句子的语义刻画。任何一个DRS都含有话语所指集和DRS-条件集两个部分，以语句“Mary owns a dog”[6]（Mary有条狗）来说，其DRS为“á{x, y}, {Mary(x),dog(y),x owns y}ñ”，其中{x，y}为话语所指集，{Mary(x), dog(y),x owns y}为DRS-条件集，这里话语所指中的元素和DRS-条件集中的元素都是根据“Mary owns a dog”的句法结构引入的。在得到该DRS的过程中先后用到了规则CR.PN和CR.ID，前者是针对专名的，因为“Mary”是专名；后者是针对不定摹状词的，因为“a dog”是不定摹状词。在DRT中，对应于每一语类都有相应的DRS-构造规则，每一规则既对实施该规则的起始格局（triggering configuration）作出规定，也对获得DRS的具体步骤作出规定。根据前一规定，我们可以确定所面临的情形是否适合施用该规则；根据后一规定，我们可以得到相应的话语所指集和DRS-条件集。有了这些规则，任何人都可以根据英语中句子的句法结构，在有穷步骤内得到句子的DRS，并且面对同一个句法结构大家得到的是同样的DRS。由于句法结构也是按严格的重写规则得到的，这就意味着对同一个句子不同的人所给出的将是同样的句法结构，也意味着给出的DRS是完全相同的。

DRT的第三个组成部分是“DRS在模型中的解释”。DRS的语义解释是在模型中进行的，一个模型就是一种信息结构，通过这种信息结构可以求出某种给定语言的表达式的值，特别是语句的真假值。模型的结构完全取决于所要解释的语言表达式的结构，由于DRS由话语所指示集和DRS-条件集构成，前者由x, y, z, u, v等个体变项组成（用R表示），后者由给定语言的词汇（用V表示）和个体变项组合而成。因此，DRS的模型M就是一个三元组〈UM, NameM, PredM〉，其中UM是论域，是若干个体构成的集合；NameM是V中个体常项集到UM的映射，它给V中的每个名称都指派UM中的一个个体，即把UM中的个体赋值给V中的名称；PredM是V中谓词常项集合到与UM相连的适当的对象的映射，如果P是V中的一元谓词，PredM（P）便是UM的子集，如果P是n元谓词且n³2，PredM（P）便是UM中n元序组的集合。有了模型就可以确定具体的DRS在所给定的模型中是否为真了。

以上就是DRT的一个基本的框架。

二、DRT具备一阶谓词逻辑的刻画效力

一阶谓词逻辑所能刻画的语句在DRT中能得到刻画吗？本文仅以DRT对条件句、选言句以及全称量词语句的处理为例，来证明“凡一阶谓词逻辑所能够刻画的语句DRT都能够刻画”，证明DRT具备一阶谓词逻辑刻画自然语言的能力。

对条件句，DRT所采用的短语结构规则是“S ® if S1 then S2”。为获得与这种句法结构相对应的语句的DRS，DRT建立了相应的构造规则CR. COND，该规则用于形如“if A then B”的条件句时，引入的是一个形如“K1ÞK2”的DRS-条件。以语句“If John owns a book on semantics then he uses it”（如果John有本语义学方面的书他就使用它）来说，按照DRT所规定的算法，首先是把该语句的句法分析“[If John owns a book on semantics then he uses it]”[7]放入空框图K0中，然后对所得到的结果施用规则CR.COND，接下来再对前件施用专名的构造规则CR.PN和不定摹状词的构造规则CR.ID，最后将代词的构造规则CR.PRO运用于后件[8]，这样就得到了如下的语义结构:

á{x},{John(x),á{y},{book on semantics(y),x owns y}ñÞá{z,u},{z=x, u=y, z uses u}ñ}ñ

根据DRT给出的翻译规则，还可以把这一语义结构翻译成相应的一阶谓词逻辑公式：

$x(x=John&"y(book on semantics(y)&owns(x,y))®$z u(z=x& u=y & uses(z,u)))

对选言句，由于or联结的可以是完整的句子，也可以是名词，还可以是及物动词、动词短语，而后几种情况都可以转换为句子之间的联结，所以，DRT先规定：当or联结的是非句子范畴时先将之转换为句子范畴之间的联结。为构造选言句的DRS，DRT特制定了规则CR.OR。根据这一规则，遇到选言句时只需引入形如“K1∨…∨K n”的DRS-条件。以语句“John loves Mary or Jim loves her”（John爱Mary或者Jim爱她）来说，要得到它的DRS，首先也是把该语句的句法分析“ [John loves Mary or Jim loves her] ”放入空框图K0中；紧接着便对所得到的结果施用规则CR.OR；然后处理第一个选言支，由于第一个选言支中有两个专名，只需两次使用规则CR.PN即可；最后处理第二个选言支，第二个选言支中有一个专名和一个代词，所以需要先后施用规则CR.PN和CR.PRO，这样就可以得到该选言句的DRS了：

á{x,y,z},{John(x),Mary(y),Jim(z),á{},{x loves y}ñÚá{u},{u=y,z loves u}<,/SPAN>ñ}ñ

根据DRT给出的翻译规则，同样可以把这一语义结构翻译成相应的一阶谓词逻辑公式：

$xyz(x = John & y = Mary & z = Jim & loves(x, y) Ú$u(u = y & loves(z, u)))

对全称量词语句，DRT给出的则是规则“CR.EVERY”。在该规则的起始格局中，DRT既考虑了every修辞主语名词的情况，也考虑了every修辞宾语名词的情况，在这两种情况下所引入的都是一个形如“K1 K2”的DRS-条件。在K1中引入的是话语所指u和DRS-条件N(u)，其中N是紧跟在every后面的名词；在K2中引入的只是一个DRS-条件，这个条件是在原句法结构中用u替换“every N”后所得到的句法结构。以“Every farmer owns a donkey”（每个农夫都有一头驴）来说，按照该规则，“K1 K2”表现为：

á{u},{farmer(u)}ñ á{ },{[u owns a donkey]}ñ

对句法结构[u owns a donkey]施用不定摹状词的构造规则CR.ID，就得到了该语句的DRS：

á{ }，{á{u},{farmer(u)}ñ á{v},{donkey(v) & owns (u,v)}ñ} ñ

与前面所给出的DRS一样，这一DRS也可以翻译成相应的一阶谓词逻辑公式：

"u(farmer(u) ®$v(donkey(v) & owns(u, v)))

对一阶谓词逻辑所能够刻画的其它语句类型，DRT也都给出了生成其DRS的具体步骤。可以毫不夸张地说，一阶谓词逻辑所能够刻画的语句，DRT都能够刻画。

三、DRT对一阶谓词逻辑的超越

DRT不仅能刻画一阶谓词逻辑所能刻画的语句类型，还能够刻画一阶谓词逻辑所无力刻画的很多语言现象，限于篇幅，本文只通过DRT对复数代词照应关系和时间照应关系的刻画来对此进行说明。

复数代词照应关系在一阶谓词逻辑中是表现不出来的。如“John took Mary to Egypt. They had a good time”(John带Mary去过埃及，他们玩得很开心)，句中they的语义值只能是集合，这个集合是由John 和Mary所指称的个体构成的，这在一阶谓词逻辑中是表现不出来的，但DRT中却有一套特殊的方法专门用于处理这里的照应关系。求和法就是这些方法中的一种，它规定：如果K是DRS K的子DRS（也可能是K自身），v1,…,vn（n³2）是出现在K中的话语所指，并且相对K来说是可及的，那么就可以在UK中引入非个体的话语所指Z，同时在ConK中引入条件“Z = v1…vn”。在求和法的基础上，DRT设计了复数代词的DRS-构造规则CR.PRO [Num = plur]，此规则分三步操作：第一步是在U k中引入一个非个体的话语所指Z；第二步是在Con k中增加一个形如Z=Y的条件，这里Y是一个现成可用的非个体话语所指，这个话语所指对被处理的代词所处的位置来说是可及的；最后一步是用Z置换被处理的NP。在运用已有的规则的基础上将求和法与CR.PRO [Num =plur]同时用于“John took Mary to Egypt. They had a good time”，就可以得到该语句的DRS了：

á{u,v,y,Z,U},{John(u),Mary(v),Egypt(y),u took v to y,Z=uv,U=Z,U had a good time}ñ

从这一DRS 中可以清楚地看出，they是由John 和Mary所指称的个体构成的集合。

时间照应关系在一阶谓词逻辑中也是表现不出来的。如“A man entered the White Hart. He was wearing a black jacket. Bill served him a beer”（一个男人进了白鹿酒家，他穿着一件黑色夹克，Bill给他上了一份啤酒），这里的三个句子在时间上是有先后依存关系的：第一个和第三个是事件句，就涉及的时间而言前者先于后者；第二个句子是状态句，所延续的时间最长。这里的时间依存关系在一阶谓词逻辑中是体现不出来的，在基于一阶谓词逻辑所建立的时态逻辑中也得不到体现，在DRT中却能够得到精确的刻画。为了能刻画这里的依存关系，DRT在话语所指的家族中增加了e（表示事件）、s（表示状态）、n（表示说出话语的时间）和t（表示话语中所提到的时间）四个新成员；在DRS-条件的家族中增加了e t（表示事件e延续的时间在t范围内）、e＜n（表示事件e先于话语的时间）、s O t（表示s所持续的时间与t时间是重合的）、t < n（表示话语中所提到的时间早于说出话语的时间）等新成员。最后对这三个句子作了如下的刻画：

á{n,e,t,x,y,s,t¢,u,w,e¢,t²,z,r,u¢},{eÍt, t<n, man(x), the White Hart(y),e: x enter y, sOt¢, t¢<n, eÍs, u=x, black jacket(w), s: u be wearing w, e¢Ít², t²<n, e<e¢, Bill(z), beer®, u¢= x, e:¢

z serve u¢ r }ñ

该DRS中的“e Í s”和“e < e”正是对句中时间照应关系的刻画。“e Í s”表示，“u be wearing w ”这一状态持续的时间包括了“x enter y”这一事件持续的时间，也就是说，那个进入白鹿酒家的人在事件发生的前后都穿着夹克。“e < e”表明，第三个句子所描述的事件发生在第一个句子所描述的事件之后，也就是说，那个穿着夹克的人只有进入了白鹿酒家之后Bill才给他啤酒。显然，这种刻画是直接而清楚的，这是以往的形式语义学方法难以办到的，也是一阶谓词逻辑所无力刻画的。邹崇理教授在谈到DRT的这种处理方式时曾评价说：DRT“把时间参照点释放出来灵活自如地刻画时间特征，并且扩大了时间范畴，把事件的概念加入其中，这样DRT处理时间的手段相应得到拓展，沿此方向进行研究将获得越来越多的题材，其发展前景不可低估。”[9]

DRT还刻画了一阶谓词逻辑所无力刻画的其它语言现象，这里不一一道来。

综上所述，DRT不仅能够刻画一阶谓词逻辑所能刻画的语句，完全具备一阶谓词逻辑的刻画效力。由于新技术工具的引入，DRT还获得了处理各种不同自然语言现象的相应空间，至少能够刻画含有照应性复数和暗含时间关系的语句。作为知识表示方法，刻画能力的大小自然是衡量方法优劣的一个重要标准，从这个意义上说，DRT较之一阶谓词逻辑有更强的刻画效力。DRT是针对英语而设计的，汉语和英语间虽然有不小的差异，但终归都是自然语言，它们也有很多相同或相似之处。而且就语言的使用者来说，无论使用何种语言，在对语言的理解上也有一些根本的东西是相同的，比如说，人们对整个话语所提供的内容的理解总是逐步实现的：要把握当前句子的语义内容，不仅要分析这个句子自身的句法结构，而且还要依靠对其上文句子的理解，尤其是当前句子中含有照应性代词的时候，而当前句子的语义内容又给位于其后的句子的分析提供依据，这是不同民族的人在使用语言上的共同的认知规律。正所谓“人同此心，心同此理，人的认知心理不仅古今相通，而且中外相通”[10]。DRT的动态分析方法正是建立在这一规律的基础上的，因而借用它来分析汉语语义是有可行性基础的。在结尾处，我想重申一下本文的宗旨：让更多的人了解DRT的优越性能，然后尝试用这一理论去解决汉语中的众多疑难现象。希望此文能达到这样一个目的。

【注释】

[1]这四种不同的译法分别参见沈家煊翻译的《现代语言学词典》（戴维.克里斯特尔），北京：商务印书馆, 2002年版；蒋严、潘海华合著的《形式语义学引论》，北京：中国社会科学出版社，1998年版，第454页；邹崇理的《自然语言逻辑研究》，北京大学出版社,2000年版，第95页；方立的《逻辑语义学》，北京语言文化大学出版社, 2000年版，第360页。

[2]周北海教授的译法。2005年5月，美国德州大学哲学系DRT方面的专家Asher教授曾应邀来中国讲学，周教授在网上介绍Asher的北京大学之行时，把DRT译为“语篇表示理论”。

[3] Asher教授在讲学期间曾表示：“话语表现理论”这一译法不够准确。

[4] Discourse Representation Structure的缩写，对它的翻译是和对DRT的翻译对应的，倘若把DRT译为“话语表现理论”就把DRS译为“话语表现结构”，倘若把DRT译为“篇章表述理论”就把DRS译为“篇章表述结构”。

[5]该文发表在《哲学动态》2005年第11期。

[6] DRT是针对英语而设计的，为保持原理论的风格，我们在引用事例时仍然用英文句子。

[7]句法分析的结果通常是以句法树的形式来表现的，由于句法树占用的空间太大，DRT便采用了在句子的前后两端加方括号的方式，以此来表示所引入的是句子的句法分析而非句子本身。

[8]具体过程参见本人的博士论文《话语表现理论与一阶谓词逻辑——自然语言逻辑研究》，中国人民大学博士论文，2005年，第40-44页。

[9]参见邹崇理的《自然语言逻辑研究》，北京大学出版社,2000年版，第202页。

[10]参见沈家煊的“实词虚词化的机制”，载《当代语言学》，1998年第3期，第40页。

（原载《南京社会科学》2006年第2期。）