【胡龙彪】自然语言形式研究的历史演进-哲学中国网

分支学科

逻辑学伦理学美学宗教学科学技术哲学本体论认识论自然哲学社会哲学人生哲学政治哲学经济哲学文化哲学历史哲学价值哲学法哲学语言哲学心灵哲学中国辩证唯物主义研究会专栏

【胡龙彪】自然语言形式研究的历史演进

对自然语言进行形式研究的观念可以从古代和中世纪语言逻辑中找到渊源，但直到最近几十年，随着现代逻辑技术的广泛应用，才开始了自然语言真正的形式研究。本文从逻辑技术的视角，考察自然语言形式研究的历史演进过程。

一、古代和中世纪关于自然语言的形式研究

传统语法学(语言学)着力于研究词素句法学(morphosyntax)的规则，是一种静态或者封闭的研究方式，目标是使人们能够正确地表达语言。传统语法学除了使用表格形式(例如某些语言的名词变格表、动词变位表等)概括某些语法内容外，主要用日常的非形式化语言表述其理论，其研究模式以及理论描述工具依然是在自然语言的框架内。使用日常语言虽有直观的优点，但其缺点也十分明显，主要是不严格、不科学，在进行研究和讨论时会产生概念不清晰的问题。

自然语言的语法在很多方面都可以看作或者被处理为一个形式系统，我们可以用形式化的模型去描述。这些模型能把语法学、语义学乃至语用学结合起来。由于它们在很大程度上都是逻辑模型，因此很多用逻辑语法或形式语法命名的语法理论都可以表达它们。

从历史上看，关于自然语言的形式理论由逻辑学家、数学家以及计算语言学家(Computational Linguist)构建和发展，并且也被看作是表达语言知识和语言能力(linguistic competence)的模型。

逻辑与语言之间的结合研究可以追溯到古希腊。古希腊对语言学的最大贡献是语法，它们对后来的研究有着深远的意义。中世纪思辨语法(speculative grammar)和理论语法(theoretical grammar)都是基于亚里士多德对陈述句的主词和谓词关系的区分，另一方面，也是基于亚里士多德的范畴概念。亚氏本人首先对这些理论进行了技术性处理。他对语法的处理既是传统语言学的，也是逻辑的(亚氏的逻辑是形式逻辑，因此，逻辑的东西自然也是形式的东西)，或者说是通过逻辑的方式去理解和研究语言，表现在他的范畴论、判断论以及四谓词理论：句子分为主词和谓词，谓词乃是句子最重要的部分，可以分为四类，即定义、特性、种属、偶性，这就是四谓词。四谓词只是对各种宾词词性所作的大体分类。为了说明哪些宾词在对实体的描述中起重要的作用，亚里士多德把宾词分为十类：实体，数量，性质，关系，地点，时间，姿态，状况，活动，遭受等，称之为十“范畴”，即最具普遍性的概念，任何实体性的事物都逃不出这些范畴的约束，对任何实体性的事物进行描述的语句都是由这些范畴通过正确的逻辑方式组合而成，句子的语法也必须合乎逻辑。亚里士多德的语法理论是自然语言逻辑分析的渊源，并首先被斯多亚学派(Stoa)和亚历山大里亚学者(Alexandrines)采纳。

被称为古代最后一位逻辑学家、中世纪哲学第一人的波爱修斯对语言的研究起着承上启下的作用。波爱修斯应用亚里士多德的范畴逻辑，从语义学的角度研究了“共相”这一对整个中世纪哲学产生至关重要影响的范畴，以及“三位一体”等关于基督教神学的中心范畴。波爱修斯应用的是纯逻辑方法，推理过程类似于逻辑演算，可以认为是对语义的形式研究，而且对三位一体的研究涉及到了范畴的语境问题。但波爱修斯的研究没有涉及日常语言，其目的是为神学服务，这种研究方式也是中世纪语言研究的基本面貌。

中世纪逻辑虽然总体上不及希腊逻辑的辉煌，然而在语言学研究领域，逻辑学家依然作出了重要贡献。中世纪语法学既是思辨的，也是理性的(或者说基于逻辑理论的)。表面看来，语法学与逻辑学、修辞学并列，称为三科(trivium)，但实质上逻辑学和语法学是完全纠合在一起的。他们认为语言是现实之镜子(Speculum)，并视语词为事物与理解之间的符号中介。语法学研究自然语言，逻辑学则是某种意义上的普遍语法(这一观点对现代语言逻辑极为重要)，无论说拉丁语还是其他语言，都要遵从逻辑规则。现代生成语法学派则发展了这一观点，认为不仅逻辑规则可以看作是语言的普遍语法，而且不同语言在语法上也有共通之处，即在人的心灵中存在着一部“普遍语法”，语法研究的目的就是探寻这一普遍语法。

一般说来，句法比语词意义更容易形式化，因此，逻辑学一开始就和句法学(语法学)相关。中世纪语言逻辑则主要研究与推论、指代相关的一些特定句式的句法。其主要目的是为了诠释《圣经》(《圣经》里本来就有很多关于语言的故事)，通过语法去解读描述《圣经》的不同语言的普遍和不变的原则，使得说不同语言的人能够获得共同的“科学语言”，从而像上帝那样获得对世界的终极认识。因此，中世纪的语言学研究实际上是把用不同语言形式表示的语句当作具有统一意义的命题，把语法形式当作一种命题形式。这正是亚里士多德语言学研究的基本思路，也映照了现代自然语言研究的形式化方向。

应该指出，古代和中世纪西方语言学之所以较早研究语法，这可能是由于西方语言的语法规则具有较大的类似性，容易促使语言学家对这些规则加以整理，并形成体系。

二、形式语法学——现代逻辑与自然语言的完美结合

现代语言理论博大精深，其中关于自然语言的形式理论——特别是形式语法学——乃是最重要的分支。尽管形式语法实际上也是亚里士多德逻辑的具体应用，但同旧的语言学和作为言语艺术的语法概念迥然不同。现代逻辑学家把形式语法引入经典谓词逻辑，通过集合论的方式对范畴和意义做出语言学应对，并把句子的语法结构用一阶谓词逻辑公式展现出来。由于一个语句往往对应一个命题，因此，用一阶谓词逻辑公式表示的语法结构也可以看作是一个语句所对应的命题的逻辑形式。这样，逻辑形式就与语法结构技术性地结合起来。古希腊和中世纪持类似观点，但由于传统逻辑技术的局限性，语法形式与逻辑形式的结合并没有真正实现。只有现代形式逻辑才能提供实现这一结合的完美工具，尽管目前还面临着某些技术困难。基于此，我们认为形式语法才是自然语言形式研究的真正起点。

语法形式与逻辑形式的结合除前述的命题形式的层面外，还表现在推理形式的层面。语法理论可以被理解为一种装置(device)，通过这一装置决定一个句子是否符合语法，即这一装置对于句子是否符合语法具有能行的形式可判定性。形式语法系统因之在现代语言逻辑中被定义为一个包含有特定的公理和一系列推理规则的逻辑公理系统(也可以没有公理而只有推理规则，因而可以是一个自然推理系统)，推理规则具有α→β的形式，其中α、β是从在前定义的符号库(当然不同语言的初始符号库并不一致)中抽取的符号。一种语言符合语法(称为合式)的句子是这一公理系统中的可证定理。例如，英语语法也可以看作是一个公理系统，初始符号为26个英文字母以及标点符号(技术性符号)等等，形成规则是一个单词必须至少有一个元音字母等等，变形规则是句子的生成语法，每个符合英语语法的合式语句就是该系统的可证定理，话语篇章(discourse)则是可证定理集等等。其他语言系统大致如此。实际上这就是乔姆斯基(Chomsky)转换生成语法(Transformational Generative Grammar)的形式基础。

一种语法就是一个推理系统，在逻辑上依托于命题演算和谓词演算理论。语法的这种形式属性对于理解现代生成类的语法理论十分重要，后者如支配-粘合理论(Government and Binding Theory，简称GB，乔姆斯基，1981)、最小差别理论(Minimalism，乔姆斯基，1995)以及前述的转换生成语法理论。

乔姆斯基的转换生成语法是早期生成类语法的代表，与20世纪初兴起的结构主义(Structuralism)语法一脉相传。结构主义语法使用类似于数学符号、算式的形式语言表达语法事实，同时使用类似计算机程序的语言描写自然语言的语法。转换生成语法一方面继承了结构主义语法利用形式化做法，另一方面亦提出了一些新的语法概念，其中最重要的是“表层结构”(Surface Structure)和“深层结构”(Deep Structure)概念。这两个概念代表句子生成的两个阶段，可以用来解释某些有歧义的句子以及某些表面结构不同但语义上有关联的句子。由此可见，生成语法不仅尝试概括表面的语法现象，而且还尝试从深入的角度解释不同句子之间的联系，这一点是对结构主义语法的超越。

事实上，生成语法学不仅在研究方法上日趋形式化，而且它的研究对象也像数学那样日趋抽象化。跟以往的语言学流派不同，生成语法不仅重视符合语法的句子，而且也重视不合语法或介乎合格与不合格之间的句子。这是因为生成语法不仅要描写某种语言的语法，而且还要解释人类的语感，即辨认句子是否符合语法的能力，这就是前述的语法系统对于句子是否符合语法具有可判定性。

另一方面，把形式语法定义为言语表述的语法模型，其目的是为自然语言的计算模型提供工具。很多语法理论都为提供这种工具而导入了形式语法，如中心语驱动词组结构语法(Head-driven Phrase Structure Grammar, Pollard & Sag, 1994)和词汇功能语法(Lexical Functional Grammar, Bresnan, 1982)。它们所关心的是语法的形式属性，其中对语法和语义关系的处理方式类似于形式逻辑方式，通过对形式属性的研究使得某些语言现象的模型以计算的方式得到处理。

如果说上述形式语法只被看作广义的逻辑语法，那么另有一些语法模型被特别看作是标准的逻辑语法。这些理论主要是范畴语法(Categorial Grammars)与蒙太格语法(Montague Grammar)。

范畴语法来自波兰逻辑学家K·埃杜凯维茨(K. Ajdukiewicz)，后者在20世纪30年代基于两个主要的基本范畴对语言进行了范畴分析：用n表示名字以及那些指称个体的语言表达式，用s表示句子以及那些指称命题的语言表达式(埃杜凯维茨，1935)。这两个基本范畴函数式的应用与组合，定义了语言的其他表达式以及它们组合起来的属性。

范畴语法在50年代被巴希尔(Bar-Hillel)应用于机器翻译这一新兴领域(巴希尔，1950)。但当70年代美国逻辑学家蒙太格(R. Montague)重温为自然语言而建立的基于语义范畴的语法模型思想时，范畴语法就被抛弃了。蒙太格的工作成果就是我们现在所谓的蒙太格语法。

蒙太格语法认为，自然语言逻辑就是自然语言的逻辑符号学，具体说来，就是关于自然语言的逻辑语形学、逻辑语义学和逻辑语用学。蒙太格首先提出了“通用语法”(Universal Grammar)的概念。通用语法正是自然语言和逻辑语言在结构方面的共同性，实际上也是中世纪语法观念的发展。针对自然语言的特殊性，蒙太格语法构造了与逻辑形式系统不甚相同的自然语言语句系统；在自然语言的语用学研究方面，注意到了自然语言的索引句问题，提出了语境参照点和语用解释的概念。蒙太格语法奠定了自然语言逻辑的基本原则，即运用递归(所谓递归，是指某些句法单位可以重复出现在句子的内层结构中)方法，遵循组合原则，构造部分语句系统及其相应的语义模型等等。

三、动态语义学——自然语言逻辑的新型理论

传统语言学认为语义是千变万化、杂乱无章的，没有规律可循，难以系统化。因此，传统语义研究重在词源和词义变化(比如训诂的方法)，所得到的成果都是一些缺乏系统性的零星知识，不能汇成一套完整的学问。早期的生成类语法也尽量对语义问题避而不谈。随着研究的深入，人们发现语法问题实际上很难与语义问题分开，语义问题是回避不了的。随着现代逻辑的产生，语义学研究有了新的方向。经典数理逻辑的语义研究主要是对逻辑常项进行定义，当蒙太格把经典数理逻辑应用于一般自然语言后，便开创了语义学研究的新天地——形式语义学。这是语言学研究的重大进步。

对语法和语义关系的处理，形式语法比生成语法可以做多得多的事。可以说，引入形式语法也是为了引导语言学研究转向形式语义学。目前使用得最多的形式框架是范畴语法，特别是蒙太格语法。

蒙太格语法为形式语义学的建构提供了条件。蒙太格语法加上λ-演算使我们可以很方便地研究名词词组的语法和语义，包括专有名词和普通名词的指称、复数名词、物质名词、概称名词(generic noun)以及形容词和限定词(determiner)等的语义。蒙太格语法与内涵逻辑相结合，产生所谓的具有蒙太格语法意义的内涵语法(Intensional Grammar)，用于处理命题态度(propositional attitudes)、从属关系、疑问句与祈使句等等。此外，基于蒙太格语法，可能世界语义学也作为形式语义学的一部分，即把模态算子和时态算子引申到处理自然语言的一阶谓词逻辑。

但经典蒙太格语法实质上是一种静态语义学理论，对动态语义现象的处理是难以令人满意的。而语义的动态性质乃是语言的重要属性。这也是现代形式语义学关注的主要问题，由此产生了动态语义学(Dynamic Semantics)。

荷兰著名逻辑学家本特姆(J. vanBenthem)指出，逻辑与语言学之间结合的关键是添加多少逻辑粘合剂(算子)才能解释自然语言是如何起作用的。动态语义学主要用回指(anaphora)、推理、预设等方式去表述复合语句的语义。第一个也是最著名的动态语义学理论是话语表述理论(Discourse Representation Theory，简称DRT)。DRT诞生于20世纪80年代，坎普(Kamp)与雷耶尔(Reyle)是主要的创始人。创建的起因是为了解决某些超出蒙太格语法范围的话语动态解释问题。90年代，格伦恩迪耶克(Groenendijk)与斯托克霍夫(Stokhof)(1991)也提出了较详细的理论模型框架，即用加入了类型语言、λ-抽象以及经典蒙太格语法的一阶谓词逻辑处理动态语义的方法，这就是所谓的动态蒙太格语法(Dynamic Montague Grammar)——一种基于蒙太格语法但也能处理动态语义学的形式框架。

静态语义学理论没有给出由多重语句所组成的复合话语(compositional discourse)的模型。例如复合语句

(1)a. 一个人走了进来。

b. 他买了一杯啤酒。

这两个句子之间具有回指关系。由于蒙太格语法无法处理(1a)和(1b)之间的这种关系，因此也不能充分表达句子(1)的意思。DRT克服了这一困难，其基本思想是建立起一个关于语境(context)和语境解释的概念，通过此，上述(1b)包括了来自(1a)的素材，使得代词“他”可以通过先行词得到一个适当的解释，把它所隐藏的但其实意义确定的语义显示出来。DRT还引入了输入语境(input context，代表后续句子之前的话语内容)和输出语境(output context，代表后续句子的话语内容)的概念，一个句子的意义就是输入语境集合和输出语境集合之间的函数指派关系。

DRT由两部分组成：一套包含有模型理论语义学的形式语言，用以表述话语的逻辑形式；一套语言解释理论，用以说明在处理话语时，这些逻辑形式如何变化和增补。DRT在分析话语时使用话语表述结构(Discourse Representation Structure，简称DRS)。一个DRS是一个有序对＜U，C＞，其中U是话语指称(discourse referent)的集合(直观地说，话语指称就是这句话是关于什么的)，C是DRS的条件集合(就是话语指称中的属性和关系)。DRS的条件包括原子公式(也就是说，话语指称所带来的谓词，比如上述句子(1)中的“人(x)”和“买(x，y)”)，以及由并非、如果…那么、或者、模态词和限定词(比如每一，每个，多数，许多)生成的条件。

以上只是对DRT某些技术手段的介绍，以显示它与蒙太格语法的不同，即DRT特别注重对语境、话语之间关系的解释，并且基本没有实质性的技术障碍，方式也更为灵活。

DRT并非90年代应用于自然语言的唯一动态语义学，加标演绎系统(Labelled Deductive Systems，简称LDS)也是其中之一。LDS是一个逻辑和逻辑程序计算的一般框架，由格柏(D. Gabbay, 1996)建构。其目标是为应用于逻辑程序中的逻辑基本理论提供一个统一的框架，这一框架囊括了相关逻辑、模态逻辑、线性逻辑和时态逻辑等等。英国语言学家肯布森(R. Kempson)和格柏一起把范畴语法增补到LDS，处理自然语言的回指、时态与时间、结构的从属、逻辑推理以及语境、情境等对话语解释的影响(Gabbay & Kempson, 1992、1996)。从这个意义上看，LDS也是一个情境语义学或可能世界语义学。

进入21世纪，动态语义学又有新的发展，产生了切分话语表述理论(Segmented Discourse Representation Theory，简称SDRT)。SDRT由美国逻辑学家阿歇尔(N. Asher, 1991)首创，阿歇尔与拉斯卡里德斯(A. Lascarides)于2003年发表的著作《会话的逻辑》(Logics of Conversation)标志着SDRT的初步完成。SDRT建立在DRT的基础之上，但在话语表述的逻辑技术方面有了创新，其实质是在DRT的基础上增加了新的逻辑算子。SDRT的核心概念是修辞关系(rhetoric relationship)，认为话语意义受制于话语自身的修辞结构，即话语话段之间或者话语序列之间的逻辑结构，包括叙述(narration)、解释(explanation)、详述(elaboration)、对照(contrast)、并列(parallel)、纠正(correction)与续述(continuation)等等。SDRT的研究包括弄清楚修辞结构如何帮助解读话语的时间结构、回指、动词短语省略、预设、词语歧义、会话含义等语言现象，全面考察语义的语境要素，进行话语意义的搭桥推理。由于SDRT充分应用了认知语用学、认知语义学、计算语言学及自然语言理解的研究成果，因而具有比DRT更强的解读话语语义的能力。

四、结论

自然语言的形式研究经历了从一般观念到观念的实现——即通过技术手段把这一观念的内容显现出来——的过程。

古代和中世纪逻辑学家已经意识到了用逻辑方法研究自然语言的必要性和可能性，但由于逻辑理论的局限性和逻辑技术的单调性，其研究基本停留在观念和思想的阶段。亚里士多德提出了类似于范畴语法的范畴理论，但他没有精心地组织范畴和推演范畴，这一工作到了近代才由康德和黑格尔完成。斯多亚学派的逻辑学家尽管创建了命题逻辑，但对于自然语言的形式研究来说，并不会增加新的技术手段，现代自然语言逻辑所依托的基本逻辑理论乃是一阶谓词逻辑。波爱修斯代表了古代研究语言的较高水平，他用形式的方法推演了某些重要范畴和语句的语义甚至语用，但其研究主要局限在神学语言。中世纪指代理论是语法理论的标志性成就，由于中世纪逻辑技术同样没有实质性的突破，因此，也没有真正的形式语法研究；而且由于神学的影响，这种研究反而带有浓重的思辨色彩。

然而，考察古代和中世纪的自然语言逻辑理论依然具有重要意义。这不仅仅表现在我们现在的研究离不开古代的观念，更重要的是许多现代语法理论都是古希腊谓词理论和语法范畴的后续，并且只有被看作其后续才可以理解；而中世纪的指代理论则对今天的语用学具有深远影响。

从语言的本质上看，只有应用逻辑学所提供的形式或形式化方法，才能把语法、语义清晰而精确地刻画出来。随着现代逻辑的产生和应用，古代和中世纪语言形式研究的观念可以通过逻辑技术得以实现。在各种形式理论中，蒙太格语法的影响最大。

在很大程度上，蒙太格应视为用现代逻辑方法研究自然语言的第一人。蒙太格语法建构了自然语言的真正的形式语法，是现代逻辑学同理论语言学的第一次完美对接。今天，蒙太格语法依然是自然语言语义分析的基本工具。实际上，随后的关于自然语言的话语表述理论、加标演绎系统、情境语义学(Situation Semantics)、广义量词理论(Generalized Quantifier Theory)、类型-逻辑语法(Type Logical Grammars)以及切分话语表述理论等，都是对蒙太格语法的继承、发展或创新。短短数十年，自然语言语法学(包括语义研究)从一门传统的学科演变为大量使用数学、逻辑学概念与技术，讲求严格定义和证明的学科，并被纳入“认知转向”的历史进程之中。

【参考文献】

[1]Eijck, J. van. ( 2005) : Discourse Representation Theory[J]. Amsterdam.
[2]Asher, N. & Lascarides, A. ( 2003) : logics of Conversation[M]. London: Cambridge University Press.
[3]Lamillar, J. S. ( 2000) : Teaching Logic to Linguists: the Logical Approach to Grammar[J]. Universidad de Sevilla.
[4]Muskens, R, ( 1996) : Combining Montague Semantics and Discourse Representation[J]. in Linguistics and Philosophy, 19: 143-186.
[5]Groenendijk, J. & Stockhof, M. ( 1991) : Dynamic Predicate logic[J]. in Linguistics and Philosophy, 14/1: 39-100.
[6]Benthem, J. van. ( 1991) : Language in Action, Categories, Lambdas and Dynamic Logic[M]. Amsterdam.
[7]Kamp, H. ( 1981) : A Theory of Truth and Discourse Representation[J]. in Groenendijk, J. , Jansen J. & Stockhof M. , ( eds. ) ( 1981) : Formal Methods in the Study of Language. Amsterdam: Mathematical Centre, tracts 135.
[8]胡龙彪(2005)：《拉丁教父波爱修斯》[M]. 北京：商务印书馆.
[9]胡龙彪(2004)：《论波爱修斯与古代逻辑》[J]. 杭州：浙江大学学报(人文社科版)(2004，3).

（来源：《中共浙江省委党校学报》2006年2期。编辑录入：齐芳）