社科网首页|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
从知识表示的角度看DRT与一阶谓词逻辑
   

DRTDiscourse Representation Theory的简称,在国内正式出版物中至少有“话语表征理论”、“篇章表述理论”、“话语表达理论”和“话语表现理论”四种译法[1]。在网络上我们还可以找到“语篇表示理论”[2]的译法。其中 “话语表现理论”的使用频率是最高的,但对这一译名也有权威人士提出异议[3],所以,本文将不采用任何中文译名,而是直接称之为DRT

 

DRT是一种自然语言逻辑理论,同时也是一种知识表示方法,这种知识表示方法与目前运用最广泛的另一种知识表示方法“一阶谓词逻辑”之间有一种内在的联系,这种内在的联系主要体现在DRS[4]与一阶谓词逻辑公式间的相互转换上,关于这个问题我已在“DRS与一阶谓词逻辑公式”[5]一文中进行过探讨。本文主要从知识表示的角度比较一下二者在刻画效力上的差异,在比较中我们将看到,DRT不仅能够刻画一阶谓词逻辑所能够刻画的语句,而且还能够刻画一阶谓词逻辑所不能够刻画的很多语言现象。这说明DRT较之一阶谓词逻辑而言有更强的刻画效力。本文旨在通过二者的比较,让更多的人了解DRT的优越性能,然后尝试用这一理论去解决汉语中的众多疑难现象。

 

一、DRT的基本框架

 

DRT由“句法规则”、“DRS的构造规则”和“DRS在模型中的解释”三部分构成。

 

句法规则给出的是英语的句法算法,由于DRT的目标是揭示语义和语言形式间的关系,而不是句法形式本身,所以,DRT只是从已有的句法理论中选择了“广义短语结构语法”。因而,DRT的句法实质上是一种短语结构语法。我们知道,刻画语言无非三条途径:一是穷举语言中所有成立的句子,对自然语言来说这一方法是行不通的,因为自然语言中成立的句子是无穷的;第二条途径是制定有穷数目的规则以生成无穷数目的句子;第三条途径是设计出一种装置即自动机,用自动机来检验输入的符号串是否是语言中成立的句子。短语结构语法用的是第二种方法,它通常表现为一个四元组:G =VN, VT, S, P),其中VN是范畴符号的集合,这些符号是专门用来描述语法类别的,是非终极符号;VT是单词符号的集合,这些符号就是被定义语言中的具体的单词,是终极符号;S是初始符号,是集合VN中的一个特殊的成员;P是重写规则(rewriting rules)的集合,其中每一条规则都具有这样的形式:φ®ψ,这一形式意味着可以用右边的ψ来置换左边的φ。给定一个四元组G,就可以从初始符号S开始,先根据与S相关的重写规则“S®φ1”S推导出φ1,再利用与φ1相关的重写规则“φ1®φ2”φ1推导出φ2……依此类推,直到不能再重写为止,这样我们就可以得到这种语法所描述的语句。这个过程既是语句的生成过程,也是对语句进行句法分析的过程。它不仅可以揭示出句子中单词的线形顺序,而且还能够反映出句子的层次结构。在短语结构语法中居于核心位置的无疑是重写规则。DRT中最基本的重写规则有:“S ® NP  VP”、“VP ® V  NP”、“NP ® PN”等,在这些基本规则中,位于“®”左右边的都是表示语法类别的符号。位于重写规则右边的还可以是被定义语言中的具体的单词,如“PN ® John, Smith, Mary, Anna Karenina,…”、“V ® likes, loves, abhors, arises, …”。有了这些重写规则就可以生成很多英语句子了,一个句子的生成过程就是得到该句子的句法结构的过程。

 

句子的句法结构即句子的语言形式,怎样透过句子的语言形式来把握句子的语义呢?这正是“DRS的构造规则”部分所要解决的问题,因为DRS的构造规则给出的正是语言形式和语义之间的转换模式,其中DRS就是对句子的语义刻画。任何一个DRS都含有话语所指集和DRS-条件集两个部分,以语句“Mary owns a dog[6]Mary有条狗)来说,其DRS为“á{x, y}, {Mary(x),dog(y),x owns y}ñ”,其中{xy}为话语所指集,{Mary(x), dog(y),x owns y}DRS-条件集,这里话语所指中的元素和DRS-条件集中的元素都是根据“Mary owns a dog”的句法结构引入的。在得到该DRS的过程中先后用到了规则CR.PNCR.ID,前者是针对专名的,因为“Mary”是专名;后者是针对不定摹状词的,因为“a dog”是不定摹状词。在DRT中,对应于每一语类都有相应的DRS-构造规则,每一规则既对实施该规则的起始格局(triggering configuration)作出规定,也对获得DRS的具体步骤作出规定。根据前一规定,我们可以确定所面临的情形是否适合施用该规则;根据后一规定,我们可以得到相应的话语所指集和DRS-条件集。有了这些规则,任何人都可以根据英语中句子的句法结构,在有穷步骤内得到句子的DRS,并且面对同一个句法结构大家得到的是同样的DRS。由于句法结构也是按严格的重写规则得到的,这就意味着对同一个句子不同的人所给出的将是同样的句法结构,也意味着给出的DRS是完全相同的。

 

DRT的第三个组成部分是“DRS在模型中的解释”。DRS的语义解释是在模型中进行的,一个模型就是一种信息结构,通过这种信息结构可以求出某种给定语言的表达式的值,特别是语句的真假值。模型的结构完全取决于所要解释的语言表达式的结构,由于DRS由话语所指示集和DRS-条件集构成,前者由x, y, z, u, v等个体变项组成(用R表示),后者由给定语言的词汇(用V表示)和个体变项组合而成。因此,DRS的模型M就是一个三元组〈UM, NameM, PredM〉,其中UM是论域,是若干个体构成的集合;NameMV中个体常项集到UM的映射,它给V中的每个名称都指派UM中的一个个体,即把UM中的个体赋值给V中的名称;PredMV中谓词常项集合到与UM相连的适当的对象的映射,如果PV中的一元谓词,PredMP)便是UM的子集,如果Pn元谓词且n³2PredMP)便是UMn元序组的集合。有了模型就可以确定具体的DRS在所给定的模型中是否为真了。

 

以上就是DRT的一个基本的框架。

 

二、DRT具备一阶谓词逻辑的刻画效力

 

一阶谓词逻辑所能刻画的语句在DRT中能得到刻画吗?本文仅以DRT对条件句、选言句以及全称量词语句的处理为例,来证明“凡一阶谓词逻辑所能够刻画的语句DRT都能够刻画”,证明DRT具备一阶谓词逻辑刻画自然语言的能力。

 

对条件句,DRT所采用的短语结构规则是“S ® if S1 then S2。为获得与这种句法结构相对应的语句的DRSDRT建立了相应的构造规则CR. COND,该规则用于形如“if A then B”的条件句时,引入的是一个形如“K1ÞK2DRS-条件。以语句“If John owns a book on semantics then he uses it”(如果John有本语义学方面的书他就使用它)来说,按照DRT所规定的算法,首先是把该语句的句法分析“[If John owns a book on semantics then he uses it][7]放入空框图K0中,然后对所得到的结果施用规则CR.COND,接下来再对前件施用专名的构造规则CR.PN和不定摹状词的构造规则CR.ID,最后将代词的构造规则CR.PRO运用于后件[8],这样就得到了如下的语义结构:

á{x},{John(x),á{y},{book on semantics(y),x owns y}ñÞá{z,u},{z=x, u=y, z uses u}ñ}ñ

 

根据DRT给出的翻译规则,还可以把这一语义结构翻译成相应的一阶谓词逻辑公式:

$x(x=John&"y(book on semantics(y)&owns(x,y))®$z u(z=x& u=y & uses(z,u)))

 

对选言句,由于or联结的可以是完整的句子,也可以是名词,还可以是及物动词、动词短语,而后几种情况都可以转换为句子之间的联结,所以,DRT先规定:当or联结的是非句子范畴时先将之转换为句子范畴之间的联结。为构造选言句的DRSDRT特制定了规则CR.OR。根据这一规则,遇到选言句时只需引入形如“K1K n”的DRS-条件。以语句“John loves Mary or Jim loves her”(JohnMary或者Jim爱她)来说,要得到它的DRS,首先也是把该语句的句法分析“ [John loves Mary or Jim loves her] ”放入空框图K0中;紧接着便对所得到的结果施用规则CR.OR;然后处理第一个选言支,由于第一个选言支中有两个专名,只需两次使用规则CR.PN即可;最后处理第二个选言支,第二个选言支中有一个专名和一个代词,所以需要先后施用规则CR.PNCR.PRO,这样就可以得到该选言句的DRS了:

á{x,y,z},{John(x),Mary(y),Jim(z),á{},{x loves y}ñÚá{u},{u=y,z loves u}<,/SPAN>ñ}ñ

 

根据DRT给出的翻译规则,同样可以把这一语义结构翻译成相应的一阶谓词逻辑公式:

$xyz(x = John & y = Mary & z = Jim & loves(x, y) Ú$u(u = y & loves(z, u)))

 

对全称量词语句,DRT给出的则是规则“CR.EVERY”。在该规则的起始格局中,DRT既考虑了every修辞主语名词的情况,也考虑了every修辞宾语名词的情况,在这两种情况下所引入的都是一个形如“K1 K2DRS-条件。在K1中引入的是话语所指uDRS-条件N(u),其中N是紧跟在every后面的名词;在K2中引入的只是一个DRS-条件,这个条件是在原句法结构中用u替换“every N”后所得到的句法结构。以“Every farmer owns a donkey”(每个农夫都有一头驴)来说,按照该规则,“K1 K2表现为:

á{u},{farmer(u)}ñ á{ },{[u owns a donkey]}ñ

 

对句法结构[u owns a donkey]施用不定摹状词的构造规则CR.ID,就得到了该语句的DRS

á{ }{á{u},{farmer(u)}ñ á{v},{donkey(v) & owns (u,v)}ñ} ñ

 

与前面所给出的DRS一样,这一DRS也可以翻译成相应的一阶谓词逻辑公式:

"u(farmer(u) ®$v(donkey(v) & owns(u, v)))

 

对一阶谓词逻辑所能够刻画的其它语句类型,DRT也都给出了生成其DRS的具体步骤。可以毫不夸张地说,一阶谓词逻辑所能够刻画的语句,DRT都能够刻画。

 

三、DRT对一阶谓词逻辑的超越

 

DRT不仅能刻画一阶谓词逻辑所能刻画的语句类型,还能够刻画一阶谓词逻辑所无力刻画的很多语言现象,限于篇幅,本文只通过DRT对复数代词照应关系和时间照应关系的刻画来对此进行说明。

 

复数代词照应关系在一阶谓词逻辑中是表现不出来的。如“John took Mary to Egypt. They had a good time(JohnMary去过埃及,他们玩得很开心),句中they的语义值只能是集合,这个集合是由John Mary所指称的个体构成的,这在一阶谓词逻辑中是表现不出来的,但DRT中却有一套特殊的方法专门用于处理这里的照应关系。求和法就是这些方法中的一种,它规定:如果KDRS K的子DRS(也可能是K自身),v1,…,vnn³2)是出现在K中的话语所指,并且相对K来说是可及的,那么就可以在UK中引入非个体的话语所指Z,同时在ConK中引入条件“Z = v1…vn”。在求和法的基础上,DRT设计了复数代词的DRS-构造规则CR.PRO [Num = plur],此规则分三步操作:第一步是在U k中引入一个非个体的话语所指Z;第二步是在Con k中增加一个形如Z=Y的条件,这里Y是一个现成可用的非个体话语所指,这个话语所指对被处理的代词所处的位置来说是可及的;最后一步是用Z置换被处理的NP。在运用已有的规则的基础上将求和法与CR.PRO [Num =plur]同时用于“John took Mary to Egypt. They had a good time”,就可以得到该语句的DRS了:

á{u,v,y,Z,U},{John(u),Mary(v),Egypt(y),u took v to y,Z=uv,U=Z,U had a good time}ñ

 

从这一DRS 中可以清楚地看出,they是由John Mary所指称的个体构成的集合。

 

 

时间照应关系在一阶谓词逻辑中也是表现不出来的。如“A man entered the White Hart. He was wearing a black jacket. Bill served him a beer”(一个男人进了白鹿酒家,他穿着一件黑色夹克,Bill给他上了一份啤酒),这里的三个句子在时间上是有先后依存关系的:第一个和第三个是事件句,就涉及的时间而言前者先于后者;第二个句子是状态句,所延续的时间最长。这里的时间依存关系在一阶谓词逻辑中是体现不出来的,在基于一阶谓词逻辑所建立的时态逻辑中也得不到体现,在DRT中却能够得到精确的刻画。为了能刻画这里的依存关系,DRT在话语所指的家族中增加了e(表示事件)、s(表示状态)、n(表示说出话语的时间)和t(表示话语中所提到的时间)四个新成员;在DRS-条件的家族中增加了e t(表示事件e延续的时间在t范围内)、en(表示事件e先于话语的时间)、s O t(表示s所持续的时间与t时间是重合的)、t < n(表示话语中所提到的时间早于说出话语的时间)等新成员。最后对这三个句子作了如下的刻画:

 

 

á{n,e,t,x,y,s,t¢,u,w,e¢,t²,z,r,u¢},{eÍt, t<n, man(x), the White Hart(y),e: x enter y, sOt¢, t¢<n, eÍs, u=x, black jacket(w), s: u be wearing w, e¢Ít², t²<n, e<e¢, Bill(z), beer®, u¢= x, e:¢

 

z serve u¢ r }ñ

 

DRS中的“e Í s”和“e < e”正是对句中时间照应关系的刻画。“e Í s”表示,“u be wearing w ”这一状态持续的时间包括了“x enter y”这一事件持续的时间,也就是说,那个进入白鹿酒家的人在事件发生的前后都穿着夹克。“e < e”表明,第三个句子所描述的事件发生在第一个句子所描述的事件之后,也就是说 ,那个穿着夹克的人只有进入了白鹿酒家之后Bill才给他啤酒。显然,这种刻画是直接而清楚的,这是以往的形式语义学方法难以办到的,也是一阶谓词逻辑所无力刻画的。邹崇理教授在谈到DRT的这种处理方式时曾评价说:DRT“把时间参照点释放出来灵活自如地刻画时间特征,并且扩大了时间范畴,把事件的概念加入其中,这样DRT处理时间的手段相应得到拓展,沿此方向进行研究将获得越来越多的题材,其发展前景不可低估。”[9]

 

DRT还刻画了一阶谓词逻辑所无力刻画的其它语言现象,这里不一一道来。

 

综上所述,DRT不仅能够刻画一阶谓词逻辑所能刻画的语句,完全具备一阶谓词逻辑的刻画效力。由于新技术工具的引入,DRT还获得了处理各种不同自然语言现象的相应空间,至少能够刻画含有照应性复数和暗含时间关系的语句。作为知识表示方法,刻画能力的大小自然是衡量方法优劣的一个重要标准,从这个意义上说,DRT较之一阶谓词逻辑有更强的刻画效力。DRT是针对英语而设计的,汉语和英语间虽然有不小的差异,但终归都是自然语言,它们也有很多相同或相似之处。而且就语言的使用者来说,无论使用何种语言,在对语言的理解上也有一些根本的东西是相同的,比如说,人们对整个话语所提供的内容的理解总是逐步实现的:要把握当前句子的语义内容,不仅要分析这个句子自身的句法结构,而且还要依靠对其上文句子的理解,尤其是当前句子中含有照应性代词的时候,而当前句子的语义内容又给位于其后的句子的分析提供依据,这是不同民族的人在使用语言上的共同的认知规律。正所谓“人同此心,心同此理,人的认知心理不仅古今相通,而且中外相通”[10]DRT的动态分析方法正是建立在这一规律的基础上的,因而借用它来分析汉语语义是有可行性基础的。在结尾处,我想重申一下本文的宗旨:让更多的人了解DRT的优越性能,然后尝试用这一理论去解决汉语中的众多疑难现象。希望此文能达到这样一个目的。



【注释】

[1]这四种不同的译法分别参见沈家煊翻译的《现代语言学词典》(戴维.克里斯特尔),北京:商务印书馆, 2002年版;蒋严、潘海华合著的《形式语义学引论》,北京:中国社会科学出版社,1998年版,第454页;邹崇理的《自然语言逻辑研究》,北京大学出版社,2000年版,第95页;方立的《逻辑语义学》,北京语言文化大学出版社, 2000年版,第360页。

[2]周北海教授的译法。20055月,美国德州大学哲学系DRT方面的专家Asher教授曾应邀来中国讲学,周教授在网上介绍Asher的北京大学之行时,把DRT译为“语篇表示理论”。

[3] Asher教授在讲学期间曾表示:“话语表现理论”这一译法不够准确。

[4] Discourse Representation Structure的缩写,对它的翻译是和对DRT的翻译对应的,倘若把DRT译为“话语表现理论”就把DRS译为“话语表现结构”,倘若把DRT译为“篇章表述理论”就把DRS译为“篇章表述结构”。

[5]该文发表在《哲学动态》2005年第11期。

[6] DRT是针对英语而设计的,为保持原理论的风格,我们在引用事例时仍然用英文句子。

[7]句法分析的结果通常是以句法树的形式来表现的,由于句法树占用的空间太大,DRT便采用了在句子的前后两端加方括号的方式,以此来表示所引入的是句子的句法分析而非句子本身。

[8]具体过程参见本人的博士论文《话语表现理论与一阶谓词逻辑——自然语言逻辑研究》,中国人民大学博士论文,2005年,第40-44页。

[9]参见邹崇理的《自然语言逻辑研究》,北京大学出版社,2000年版,第202页。

[10]参见沈家煊的“实词虚词化的机制”,载《当代语言学》,1998年第3期,第40页。

(原载《南京社会科学》2006年第2期。)

中国社会科学院哲学研究所 版权所有 亿网中国设计制作 建议使用IE5.5以上版本浏览