北大教授俞士汶谈计算语言学
来源:动态信息
发布时间 : 2010-03-31
点击量:
3月29日下午,由我校人事处主办的著名教授论坛第119讲于北校图书馆多功能报告厅举行,北京大学教授俞士汶为我校师生带来题为“计算语言学:原理、基础、应用与前瞻”的精彩讲座。俞士汶结合自身多年的工作经验与领悟向师生介绍了计算语言学的概要、语言知识库和语义计算的发展等内容。 我校副校长刘建达,人事处副处长谢文新,信息学院院长姜灵敏、副院长蒋盛益,英文学院许罗迈教授、李金辉博士等领导以及北大教授朱学锋均出席讲座。刘建达代表我校与俞士汶互赠纪念品。 刘建达(左)与俞士汶(右)互赠纪念品
计算语言学的定义与功能
俞士汶介绍道,计算语言学是通过建立形式化的数学模型以分析、处理自然语言,并在计算机上用程序实现分析和处理的过程,从而达到以机器模拟人的部分乃至全部语言能力的目的。研究对象为人类的自然语言,与应用语言学、语言学的区别在于其研究必须在计算机上实现,更重要的是能增强计算机的智能水平,即理解与运用自然语言,而不仅仅是能够处理文字。 他指出计算语言学目前的主攻方向是解决以词语、句法、语义和语境层次为主的歧义问题,主要任务则是为自然语言处理提供理论、模型和实现算法。对于计算语言学的发展,俞士汶表示,计算语言学已实现长足的进步,为社会的信息化进程发挥了重要作用,但与人们的期望值相差甚远,与自然语言理解的目标还存在距离。
俞士汶阐述计算语言学的奥妙之处
语言知识库的重要性
据俞士汶介绍,语言知识库是自然语言系统中不可或缺的组成部分,20多年来,俞士汶与北大计算语言学研究所的同仁在这个领域做大量研究并取得丰硕成果。 他们成功开发了《现代汉语语法信息词典》、面向汉英机器翻译的《现代汉语语义词典》和面向跨语言文体处理的《中英文概念词典》等多个现代汉语语言知识库。俞士汶重点介绍了《现代汉语语法信息词典》,指出这是综合型语言知识库的第一块基石,是一部面向语言信息处理的大型电子词典。 计算语言学的现状与应用
自然语言理解的研究与实现是重大的科学问题,将为探索人类智能的本质和奥秘做出贡献。但俞士汶表示,自然语言理解的研究遇到很多困难,文学语言中的歧义消解和隐喻、影射、双关等表现手法都使自然语言理解的研究面临挑战。俞士汶强调,当今研究只着眼于话语或文本,多通道的人类阅读与交际实现了多形态信息的融合,而目前的自然语言理解研究才刚认识到这一步。 此外,俞士汶对计算语言学研究成果的应用作出介绍,主要包括机器翻译与机器辅助翻译、从信息检索到搜索引擎、文本管理以及人工系统的自然语言界面等。
|
【关闭】