本网讯 近日,由广东省外语研究与语言服务协同创新中心(以下简称中心)和北京语言大学语言信息处理研究所联合主办的“英汉小句对齐语料库建设研讨会”在北京举行。研讨会对我校项目研究的推进产生了积极影响,扩大了我中心在语言学界和计算语言学界的影响。

研讨会现场
中心副主任葛诗利首先向专家介绍了中心的发展与特色,以及语言技术创新团队目前的工作任务,表达了中心对“英汉小句对齐语料库建设”项目的重视,恳请专家们提出宝贵意见。他对研究项目的进展以及所遇到的问题作了专题报告,指出汉语和英语的篇章都可以表示为指称语为中心的准小句序列,每一个准小句具有Naming-Telling结构。这一结构适合于表示篇章结构,能反映认知约束,具有高度的实证性,因此Naming-Telling结构具有篇章文法的意义。项目预期成果可直接用于英汉机器翻译的训练语料,完善机器翻译的评价系统,促进跨语言的篇章语法研究、英语和汉语的小句异同研究、语言认知机制和认知语法研究。
中心语言技术创新团队带头人宋柔介绍了英汉小句对齐语料库建设的研究背景和研究方向,指出机器翻译的最大困难之一是长句翻译,规则方法通常只研究简单句的分析转换,统计方法遇到长句则面临严重的数据稀疏问题。本研究项目通过分析英汉篇章中长句发生的结构因素,提出汉语和英语长句拆分的方法,进而探索“长句拆分、小句翻译、小句装配”三步走的翻译方法,旨在提高英汉长句机器翻译质量。

百家思想荟萃
与会专家从语言理论、应用语言学、认知语言学、语言信息处理等角度阐述了各自对于英汉小句对齐语料库建设研究的思考,对于课题组采用Naming-Telling结构进行英语长句句法切分的做法表示肯定,一致认同其可行性,并指出制定拆分细则的重要性,对今后的工作方向提出了许多具有启发性的建议。

合影留念
附:参与本次研讨会的会专家(按姓名拼音顺序排列):
顾曰国(中国社科院语言研究所主任、研究员)
侯敏(中国传媒大学教授)
陆丙甫(南昌大学人文学院教授)
沈家煊(中国社科院语言研究所研究员)
司富珍(北京语言大学教授)
王洪君(北京大学汉语语言学研究中心主任、教授)
荀恩东(北京语言大学大数据与语言教育研究所所长、教授)
袁毓林(北京大学中国文学系教授)
詹卫东(北京大学中国文学系教授)
张伯江(中国社科院语言研究所副所长、研究员)
赵军(中国科学院自动化研究所研究员)
周国栋(苏州大学计算机科学与技术学院教授)