题 目:自然语言处理基础研究/篇章结构分析
主 讲 人:周国栋 教授(苏州大学)
时 间:3月22日(周四)14:30
地 点:南校区G206
主办单位:人事处
承办单位:思科信息学院
主讲人简介
周国栋,1997年12月毕业于新加坡国立大学获得博士学位;1998年1月至1999年3月在新加坡国立大学从事博士后研究;1999年4月-2006年8月在新加坡资讯通信研究院分别担任副科学家、科学家博导和副主任科学家博导;2006年8月底加入苏州大学担任教授博导和计算机学科带头人。研究方向:自然语言理解、信息抽取、机器学习等。
近5年来发表国际著名SCI期刊论文10多篇和国际顶级会议ACL/EMNLP/COLING/IJCAI论文近20篇,主持NSFC项目3个,联合主持863项目2项,获得教育部科技进步二等奖1项。目前担任国际自然语言理解领域顶级SCI期刊Computational Linguistics编委(现任24位编委中唯一华人)、ACM杂志TALIP副主编和CCF中文信息技术专委会副主任委员;2009-2011年连续3年担任国家基金委信息学部会评专家。
讲座简介
1、自然语言处理基础研究:自然语言处理主要探讨如何处理与运用自然语言,是人工智能的重要组成部分,属于计算机学科的前沿方向,同时也是《国家中长期科学和技术发展规划纲要(2006-2020年)》信息科学重点建设的学科领域。自然语言一直在社会、经济和国家安全等领域中扮演着重要角色。但是迄今为止,计算机的自然语言理解能力远逊于人类,远远不能满足当今信息化社会对自然语言的处理与运用需求。因此,为计算机理解自然语言探索新的分析方法和构建新的计算模型,从而大幅度提高计算机对自然语言的理解能力和处理效率,不仅可以有力推动信息科学的快速发展,而且能够为国民经济和社会发展做出重大贡献。
通过回顾本人回国前后10年在自然语言理解领域的主要工作和拟开展的基础研究,探索未来5-10年可能的研究重点和热点。内容涉及句子和篇章级结构分析及语义理解。
2、篇章结构分析:自然语言的单位由小到大可以分为词、短语、句子,最后形成篇章。篇章在英文中常用Discourse表示,在汉语里常有篇章、语篇或者话语之说。在篇章结构分析中,“篇章”指一系列连续的语段或句子构成的语言整体单位:篇章可以看作是语段的层次化组织,每一个语段不仅具有内部连贯性,而且语段中的这些句子可被看作是描述同一个问题或同一种情境的一个相对完整的语言整体。只有分析出整个篇章的这种层次结构及各组成成分之间的语义关系,才能对整个篇章有一个总体上的把握。内容涉及本人近年来重点关注的面向篇章结构分析的资源建设与计算模型研究。