英汉小句对齐语料库建设研讨会在京举行-广东外语外贸大学新闻中心

英汉小句对齐语料库建设研讨会在京举行

文字：外语研究与语言服务协同创新中心图片：编辑：梁玲华刘仕聪发布时间：2015-06-02 点击数：次

本网讯 近日，由广东省外语研究与语言服务协同创新中心(以下简称中心)和北京语言大学语言信息处理研究所联合主办的“英汉小句对齐语料库建设研讨会”在北京举行。研讨会对我校项目研究的推进产生了积极影响，扩大了我中心在语言学界和计算语言学界的影响。

研讨会现场

中心副主任葛诗利首先向专家介绍了中心的发展与特色，以及语言技术创新团队目前的工作任务，表达了中心对“英汉小句对齐语料库建设”项目的重视，恳请专家们提出宝贵意见。他对研究项目的进展以及所遇到的问题作了专题报告，指出汉语和英语的篇章都可以表示为指称语为中心的准小句序列，每一个准小句具有Naming-Telling结构。这一结构适合于表示篇章结构，能反映认知约束，具有高度的实证性，因此Naming-Telling结构具有篇章文法的意义。项目预期成果可直接用于英汉机器翻译的训练语料，完善机器翻译的评价系统，促进跨语言的篇章语法研究、英语和汉语的小句异同研究、语言认知机制和认知语法研究。

中心语言技术创新团队带头人宋柔介绍了英汉小句对齐语料库建设的研究背景和研究方向，指出机器翻译的最大困难之一是长句翻译，规则方法通常只研究简单句的分析转换，统计方法遇到长句则面临严重的数据稀疏问题。本研究项目通过分析英汉篇章中长句发生的结构因素，提出汉语和英语长句拆分的方法，进而探索“长句拆分、小句翻译、小句装配”三步走的翻译方法，旨在提高英汉长句机器翻译质量。