照应关系是各种自然语言中都存在的一种很普遍的现象,不仅语言学家关注对这一现象的解释,逻辑学家对这一现象也表现出了很大兴趣,这一现象还是计算机对自然语言进行处理时所必须解决的一个问题。本文将透过DRT(Discourse Representation Theory,话语表征理论)和SDRT(Segmented Discourse Representation Theory,分割式话语表征理论)[1]对代词照应关系的形式刻画,揭示逻辑学家对自然语言中照应关系的处理方式,并以此为基础,对这两种理论进
行适当的评价。
一、代词与个体常项、个体变项
在自然语言的使用中,代词有两种完全不同的功能:指示功能和照应功能。指示功能是以说话者为中心的,含指示功能代词的语句离不开语境,如:“我不是班长,他也不是,他才是。”倘若脱离了语境孤立地看这个语句,可以说它没有传递任何信息,因为离开了语境,我们无从知道是谁说的,也无从知道说话人说“他也不是,他才是”时指着谁,当然也就无从知道究竟谁是班长了。代词的这种指示功能有时也被称作“文外照应”或“外照应”,以表示它们所指的实体存在于语篇之外。这是语用学的研究范畴。一般而言,形式语义学的理论派别都会声明代词的指示功能不在其研究范围之内,他们只关注代词的照应功能。所以,照应通常指的是文内照应。就代词而言,照应是说代词的所指存在于上下文中,不需要离开上下文去寻找。如:“杨威在学日语,他希望有一天能去日本。” “他”的所指就是前文中的“杨威”。其中“杨威”是先行语,“他”是照应语。文内照应是构成句子与句子之间,篇章的一部分与另一部分间粘连的重要语法、语义手段之一,是构成篇章连贯性的一个重要因素。
对代词的这种照应功能历来有两种完全不同的解释。其一是是把代词视为与其先行语同指的个体常项。当先行语指的是具体对象时,这种解释是很有说服力的,如上例中的“扬威”指称一个特定的对象,句中的“他”仿佛个体常项,与“扬威”指称同一对象。其二是把代词视为受其先行语约束的变项。当先行语指是具有某一属性的一类对象时,它们好似约束变项,如“Every man who loves a woman who loves him is happy”(每个男人若是爱着爱他的女人就是幸福的)中的“him”,无论句中的“a woman”取宽域还是窄域,代词“him”都处在先行语“every man”的约束范围之内。因为取宽域和取窄域时其逻辑形式分别为:
$x(woman(x) Ù"y(man(y) Ùlove(y,x) Ùlove(x,y)®happy(y)))
"y(man(y) Ù$x(woman(x) Ù love(y,x) Ùlove(x,y))®happy(y))
在这两个公式中,happy(y)显然都在"y的辖域中。单从此例来看的话,把代词解释为受先行语约束的变项似乎也能成立。
是不是所有的代词都可以这样解释呢?我们看下面的两个例子:
(1) A man entered. He smiled.
(2) Every man who meets a nice woman smiles at her.
句(1)中“he”的先行语是“a man”,句(2)中“her”的先行语是“a nice woman”,这两个先行语都是不定摹状词。不定摹状词与专名不同,对不定摹状词而言是不存在一个特定所指对象的,这就注定句中的代词不能解释为与其先行语同指的个体常项。第二种解释是否可行呢? 句(1)中 “a man”出现在第一个小句中,被处理为存在量词,该量词的辖域是不能超出该不定摹状词所处的小句的。于是位于第二个小句中的代词“he”不可能受到约束。而句(2)是个歧义句,可以表达两种不同的含义:
(2')$x(a nice woman(x) Ù"y(man(y) Ù meet(y,x) ®smile(y,x)))
(2")"y(man(y) Ù$x(a nice woman(x) Ù meet(y,x)) ®smile(y,x))
在句(2')中,“a nice woman”相对于“every man”来说取宽域,约束的是其后的整个公式,包括“smile(y,x)”。所描述的真值条件是:存在一个个体x,x是好女人,并且对任一个体y而言,如果y是男人且y遇到x的话,那么y对x微笑。这无论如何不是句(2)的优选解释。优选解释是句(2"),在句(2")中,“a nice woman”相对于“every man”来说取窄域,只约束公式“a nice woman(x) Ù meet(y,x)”,“smile(y,x)”不在其约束范围内,这样所出现的问题和句(1)中所出现的问题一样。这说明只是简单地将代词的照应功能解释为个体常项或个体变项是有问题的,至少是不全面的。
二、DRT对照应关系的处理
怎样才能准确解释代词与先行语间的照应关系呢?这正是DRT所试图解决的问题之一[2]。DRT的基本框架由“句法规则”、“DRS的构造规则”和“DRS在模型中的解释”三个部分构成,其中话语表征结构DRS(Discourse Representation Structure)是其最具特色的部分。每个DRS都由两部分组成:话语所指集和与话语所指相关的条件构成的条件集。如语句“Mary owns a dog”的DRS为á{x,y},{Mary(x),dog(y),x owns y}ñ,其中{x,y}为话语所指集,这一集合中含两个元素,分别是由句中的名词“Mary”和“dog”引入的。{Mary(x),dog(y),x owns y}为条件集,含“Mary(x)”、“dog(y)”和“x owns y”三个条件。照应关系在DRT中一律处理为话语所指间的关系,这样一种处理方式克服了单纯将其视为个体常项或约束变项所带来的问题。在DRT中代词的照应关系是分两种情形来探讨的。
第一种情形是单数代词的照应,既包括先行语为专名的情况,也包括先行语为不定摹状词的情况。当先行语为专名时,如:“Mary likes John. He fascinates her.”(玛丽喜欢约翰,他令她着迷。)我们先处理第一个小句,它含两个专名,根据专名的DRS-的构造规则,首先是要在论域中引入新的话语所指,其次是在条件集中引入形如“Mary(x)”的条件,其具体形式因专名不同而不同,最后把小句中的专名用相应的话语所指置换掉,并将这一结果输入条件集。两次对第一小句施用这一规则,就得到了第一小句的DRS:á{x,y},{Mary(x),John(y),x likes y}ñ。接下来处理第二个小句,第二个小句含两个代词,代词的DRS-构造规则要求引入一个新的话语所指,引入两个DRS条件,其中一个条件是通过把小句中的代词置换为新话语所指而形成的,另外一个条件是等式出现的,等式的一端是新话语所指,另一端是论域中已出现的某个适当的话语所指。在第一个小句的DRS的基础上对第二个小句连续两次施用代词的DRS-构造规则,所得到的是:á{x,y,u,v},{Mary(x),John(y),x likes y,u = y, v = x, u fascinates v}ñ。这就是整个句子的DRS,这里“u = y”和“v = x”分别是对句中代词“he”和“her”照应关系的刻画。当先行语为不定摹状词时,其处理方式与先行语为专名的情形大致相同。
第二种情形是复数代词的照应。在自然语言中,有很多照应性复数代词的语义值只能是集合,这个集合是由若干名词短语所指称的个体构成的,如“John took Mary to Egypt. They had a good time”(约翰带玛丽去了埃及,他们玩得很开心)中的“they”。为了刻画这里的照应关系,DRT对话语所指进行了扩充,话语所指不仅有对应个体的原子话语所指,还有对应个体集合的非原子话语所指,前者用小写字母表示,后者用大写字母表示。条件集中与非话语所指相关的条件或是依据求和法得到,或是依据复数代词的DRS-够则规则得到。施用求和法的时候要求“K¢是DRS K的子DRS(也可能是K自身),v1,…,vn(n³2)是出现在K中的话语所指,并且相对K¢来说是可及的”( Kamp H , Reyle U,p.341)。其具体操作方式是在UK¢ 中引入非个体的话语所指Z,同时在ConK¢ 中引入条件:Z = v1 … vn。施用复数代词的DRS-构造规则则是分三步进行的,第一步是在U k中引入一个非个体的话语所指Z;第二步是在Con k中增加一个形如Z=Y的条件,这里Y是一个现成可用的非个体话语所指,这个话语所指对被处理的代词所处的位置来说是可及的;其三是用Z置换被处理的NP(Kamp H , Reyle U,p.340)。有了这些就可以处理复数代词的照应问题了。第一个小句中含3个专名,3次施用专名的DRS-构造规则,话语所指中于是有3个原子话语所指u、v、y,条件集中有John(u)、Mary(v)、Egypt(y)、u took v to y。再施用求和法,在话语所指中引入Z,条件集中引入条件Z= uÅv。然后在此基础上对第二个句子施用与复数代词相关的规则,在话语所指集中引入U,条件集中引入U = Z、U had a good time。这样所得到的就是整个句子的DRS。不难看出,等式U = Z表示的就是复数代词“they”与“John & Mary”的照应关系。
DRT还探讨了句子间时间照应关系的刻画方式,这种照应是通过在话语所指中引入时间,在条件集中引入时间话语所指间的关系来实现的(Kamp H , Reyle U,pp.483-650)。由于时间要素的引入,其DRS结构相应变得更为复杂。对这种照应关系我们将在另外的文章中加以考察。
三、SDRT对照应关系的处理
SRT很好地处理了单数代词和复数代词的照应关系问题,并且颇有创意,且清晰简明。不过代词的指涉还有更复杂的情况,有的时候它指涉的并不是个体,而是命题。如:“班长把写有公式的纸条压在试卷下面,学习委员的手心上写满了公式,团支部书记把公式写在大腿上,这三个人考试都作弊了,但班主任不相信这个。”这里的“这个”指涉的是“这三个人考试都作弊了”这一命题。自然语言中还有“语用照应”或搭桥指涉(bridging reference ),如:“张三有条狗,毛是白色的。”待释名词是“毛”,指涉的是那条狗的毛。这里的指涉是借助于整体到其部分的联系来完成的,这种指涉也不在DRT的考虑范围之内。为了能解释更多的照应现象,也解决DRT中还存在的一些其他方面的缺陷,美国奥斯汀大学的阿西尔(N.Asher)教授提出了SDRT理论。SDRT的最突出之点是强调修辞结构对话语意义的影响,将修辞关系引入话语的逻辑形式中。在DRT中话语的逻辑形式表现为DRS,在SDRT中话语的逻辑形式表现为SDRS。从词汇上看,SDRS含有三类词汇。第一类属于微观结构,是由自然语言中原子语句的逻辑形式组成的集合Y,原子语句的逻辑形式即DRS;第二类是p0、p1、p2、p3等标记(labels);第三类是表示话语标记的关系符号:R0、R1、R2、R3等。任意一个SDRS都是一个三元组:áA,F,LASTñ。其中A是第二类词汇构成的集合;F是函项,该函项对A中的每个元素进行赋值,其值域是F;LAST是A 中的一个标记,直观上看,这个标记代表的是最后一个小句的内容。以“Max fell(p1). John pushed him(p2).”(马克斯摔倒了,约翰推了他一把)来说 ,其SDRS为áA,F,LASTñ,其中:
A={p0,p1,p2}
F(p0) =Explanation (p1,p2)
F(p1) = á{ x,e1,t1 },{Max(x), fall(e1,x),holds(e1 , t1),t1 < nowñ }
F(p2) = á{ y,z,e2,t2 },{john(y),push(e2,y,z),holds(e2 , t2),t2 < now, z=x}
LAST=p2
SDRT规定,照应关系的解释必须满足“右前侧限制条件 ”(right-frontier constraint)(Asher N , Lascarides A,p.11),也就是说当前句子中的代词其现行语只能出现在右前侧命题里。对话语中的任一命题而言,其右前侧命题包括位于它前面的那一命题以及统制这一命题的命题。如:“班长把写有公式的纸条压在试卷下面(p1),学习委员的手心上写满了公式(p2),团支部书记把公式写在大腿上(p3),但班主任不相信这个(p4)。”这里p4的右前侧命题有两个:p3及统制这一命题的命题 “三个班干部都作弊了”,这是前三个命题作为一个整体时所表达的命题,是这三个命题共同的主题。此时,对p4中的“这个”有两种不同的解释,既可以解释为p3,也可以解释为p1、p2、p3作为整体所表达的命题。这两种解释都能成立。倘若我们在p4前加上“这三个人考试都作弊了”这一命题,情形就变了,此时 p4的右前侧命题只有一个,就是刚加进的这一命题,因为并没有一个统制这一新命题的命题。
SDRT把照应关系能否得到解释看作话语融贯与否的一个重要标准。融贯的话语应该同时具备两点:第一,话语中的每个命题、每个问题和每个请求都与话语中的另外一个部分有修辞上的关联;第二,所有的照应表达式都能得到解释。一段话语往往会有很多种可能的解释,这些解释构成一个偏序,话语的逻辑形式总是偏序中值最大的那个逻辑形式。这就是话语融贯性最大化原则 (Maximise Discourse Coherence) [3]21。以“王霞昨晚过得很开心(p1),她美餐了一顿(p2),吃了三文鱼(p3),吃了好多冰激凌(p4),还在舞会上赢得了好几个英俊小伙子的青睐(p5),它的颜色很好看(p6)”为例来说,p6中的代词是得不到解释的,因为其右前侧命题是p5和 p1,即只有 p5和 p1可及。这意味着该话语是不融贯的。要使之融贯可以把p6移至p3和p4之间,这样p6中的代词就可以解释为“三文鱼”了。如果是用DRT中来分析这一话语,我们所做的只是根据规则一步一步给出其DRS结构,p6位于末尾时与p6位于p3和p4之间时,p,SPAN>3中的“三文鱼”对它们来说都是可及的。
显然,在解释代词的照应关系时,DRT完全不考虑话语的融贯性问题。在DRT中,就任一给定的语句序列而言,DRT只关注怎样把DRS-构造规则一步一步运用于其句法结构,从而得到它的DRS。至于这一序列是否融贯,怎样可以更融贯,DRT是不关注的。而事实却是:不同的语句序列在融贯性上是有很大差异的。而SDRT由于引入了修辞结构,并在修辞结构的基础上定义了融贯性最大化原则,因而不仅能给出话语的逻辑形式,还能对话语的融贯程度做出判定,并依据融贯程度的不同,找出融贯性最强的话语。毫无疑问,话语的融贯程度不同,其清晰程度就不同,这就决定了SDRT对自然语言的刻画会比DRT更准确。
【注释】
[1]对Discourse Representation Theory有多种不同翻译,参见文献[1]。对DRT有多少种译法,对SDRT就至少有多少种译法。
[2] DRT所试图解决的另外两个问题是:对句子静态语义的分析方式不符合人们理解自然语言的实际过程;并非左右的不定摩状词都应当作“存在”之意解释。
【参考文献】
夏年喜.从蒙太格语法的局限性看DRT的理论价值[J].哲学研究,2005(12).
Kamp H , Reyle U. From Discourse to Logic: Introduction to Model-Theoretic Semantics of Natural Language, From Logic and Discourse Representation Theory[M]. Dordrecht: Kluwer. 1993:341.
Asher N , Lascarides A. Logics of Conversation. Cambridge :Cambridge University Press, 2003.
(载于《重庆理工大学学报(社会科学)》2010年第7期。)