社科网首页|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
新闻动态

我国著名的资深计算机信息处理专家冯志伟研究员参加国家社科基金重大课题《自然语言信息处理的逻辑语义学研究》讨论会

2011422国家社科基金重大课题《自然语言信息处理的逻辑语义学研究》课题组在中国社科院哲学所940会议室召开学术讨论会。我国计算机信息领域著名的资深专家、教育部语言文字应用研究所的冯志伟研究员,中国传媒大学应用语言学研究所的胡凤国博士应邀参加了讨论会。参加讨论会的还有北京语言大学的吴平教授,中国社会科学院哲学所的刘新文副研究员,哲学所博士后娄永强,哲学所博士生满海霞、张晓君和张璐,以及北京化工大学的付瑶等课题组成员。大家就该课题有关理论研究和计算机实现等相关问题进行了较为深入的探讨。

研讨会上,课题组首席专家邹崇理研究员首先介绍了课题的主要研究内容及出席会议的课题组成员,指出在该研究中有关逻辑成果的计算机实现是相对薄弱的环节,希望冯志伟先生作为多年从事计算语言学方面的专家对该课题提出有益的意见与建议。先生指出,在现阶段国家有必要加大对基础科学理论研究的投入力度,祝贺哲学所课题组获得了这个国家重大课题。自然语言的形式语义研究不仅在语言学领域有着重要的理论意义,而且在计算机科学领域也具有重要的实践价值。

会上,冯志伟先生听取了第三子课题核心成员满海霞做的有关范畴类型逻辑的研究介绍。满海霞指出:传统的范畴语法只对相邻范畴进行运算,所以不相邻范畴的非连续现象的处理一直是其后继发展的核心问题。在诸多解决方案中,Jäger提出的竖线算子“|”处理照应现象被认为是处理非连续现象最方便、最实惠的办法。但是在对汉语照应现象推广应用的过程中,存在两个问题:(1)汉语中存在大量的空代词,其数目可观,要求类型逻辑系统能够提供新的技术工具对此予以解决;(2)在竖线算子范畴的运算过程中,需要确立被照应范畴标记的添加和消去的规则。基于这两点,第三子课题的成员构造了一个新的类型逻辑系统以满足更好地刻画汉语照应现象的需要,这是已取得一定进展的工作。另一方面,课题组成员还希望从基于自然语言处理的组合范畴语法出发,构造适合处理汉语语言现象的规则,为第四子课题的研究提供先期准备,而这一方面需要具有多年从事计算语言学研究并获得丰硕成果的冯志伟先生及胡凤国博士的大力帮助。

冯志伟先生指出,作为理论与实践相结合的研究项目,该课题的亮点是提出了计算机信息处理的应用目标,这一亮点要求我们对理论工作更加重视。因为,只有建立尽量完善的理论系统,才能更容易进行计算机实现。就该课题而言,必须能够依托逻辑方面的理论研究建立尽可能复杂丰富的词库,将难点置于词条之中,才能弥补计算机识别语言的缺陷,将简洁的句法运算施加于计算机,从而实现令人满意的自然语言的计算机处理。

冯志伟先生及胡凤国博士还就课题项目书中提到的组合范畴语法CCG)发表了自己的看法。CCG的优点在于,它的句法和语义之间有一个非常透明、直截了当的接口,每个词条的语义表达式和句法范畴都被存放在词库的词项上,尽管范畴标记较为复杂,需要大量人工的操作,但是它可以保证较为精确的句法与语义之间的匹配。句法范畴跟语义类型、语义最后的表示都可以基于词库进行组合生成。CCG能够满足自然语言信息处理领域对复杂的词典和简洁的句法的要求,是自然语言信息处理形式化的一个很好的选择。

此外,先生还介绍了他多年来经在计算机上编写程序进行的反复测试的基础上提出的较之乔姆斯基的树模型而言更适宜处理汉语句法语义的多叉多标记树模型MMT)。该模型采用多值函数标记代替短语结构语法的单值标记函数,并使用多叉树代替二叉树,极大提高了树形图的标记能力,使得树形图的各个节点上都能记录足够多的语法信息,将句子所蕴含的丰富的信息充分表示出来,先生的研究成果给了与会人员极大的启发。

先生是我国第一个汉语到多种外语的机器翻译系统的研制者,他关于计算语言学方面的真知灼见给与会人员提供了广阔的思考空间,为课题提出了很多中肯和建设性的意见,并就感兴趣的问题与课题组成员进行了探讨。大家一致认为,这次讨论会比较成功,它提供了一次宝贵的机会,使来自计算机界和逻辑学界的学者有机会了解到各自目前所做的工作及正在开展的工作。与会双方均表示了以后能经常进行类似探讨的愿望,并希望尽快推进双方进行实质性的合作。

(来源:中国社科院哲学所。录入编辑:乾乾)