本网讯 6月10日下午,我校应用于翻译质量评测等领域的中文信息处理研究学术沙龙,在南校校办公楼第一会议室举行。本次学术沙龙由科研处主办,思科信息学院承办,思科信息学院副院长李心广、英文学院博士李金辉等到场参与此次研讨。会上思科信息学院老师柯晓华、郑琪、李霞分别就计算机应用于处理中文信息等方面进行了课题研究成果展示。李心广主持本次学术沙龙。
学术沙龙现场
李心广首先致辞。他概括性地指出本次学术沙龙举办的目的在于,为学校内在翻译测评等领域有研究、有兴趣的老师提供学术交流的平台。有利于学术科研活动的深入研究,扩大影响。他还提到21世纪的人才需要掌握“两门重要的工具”——信息技术和英语,如何将计算机和语言有效的结合是目前十分具有研究价值、并需要深入探讨的领域。而谈到本次学术沙龙交流活动的特点,李心广则表示主要是集中了更多年轻老师的优秀科研成果,在形容与会的年轻老师为“最具活力、最具力量的生力军”的同时,他也预祝此次学术沙龙取得成功。
李心广致辞
李金辉则结合自身在中文信息处理方面所进行的研究和思考在会上和大家交流了经验。他对比了中英文在分词处理和句法分析上的不同,并期待在本次沙龙活动及以后的学术研究中大家能够“共同努力,突破障碍,开拓新视野。”
在随后进行的科研成果展示中,柯晓华对其研究的,基于实例的文本翻译质量客观评测系统进行了详细的阐述。她表示本系统用于“将科技英语译成中文”,基本的框架中包括中文分词、质量分析和构建评价体系三大方面。柯晓华首先从介绍几种分词方法和评分标准切入课题,结合科技英语特点,提出“用客观的方法去为科技英语翻译评分”的思考。她认为系统将先按顺序查找关键词,同时查看语句中是否存在被动语态,进而得出译成品的通顺度判定。柯晓华表示思科信息学院07级7个班试用了此评分系统,在广泛收集学生反馈信息的基础上系统也在不断完善,译作和参考译文的测试点匹配速度快、计分公式接近人工评分等都是系统特色。在问答环节中,与会老师纷纷对系统的具体操作进行深入的交流,提出了诸如“关键词如何选定?”、“是否会出现只写出关键词也能得高分的情况?”等问题,柯晓华对其一一进行了分析和阐述。
柯晓华与在场老师深入交流
郑琪的课题涉及文本相似性的应用方向。他从检索、分类、聚类等方面具体介绍如何确定文本相似性的匹配。采用“后缀树模型”构建出针对英文文本处理的向量模型,他具体的演示了模型的运作,“每个节点作为一个向量的分量,聚类纯度越高越好。”而郑琪也谈到此系统在加入特征方法以及定义基于“后缀树”的其他形似度方法上还有待完成。而最后展示的李霞则选取了互联网海量中文文本不良信息检测方法这一研究方向,她先分析最原始的“基于关键字简单匹配的技术”,指出其存在没有考虑文本的立场、观点和态度等缺陷。进而提出目前较科学的研究方向——基于倾向性的文本不良信息检测。该系统广泛的应用面成为老师们关注的亮点,既可应用于网络中文不良信息检测垃圾邮件、垃圾短信的过滤,也可在网络舆情分析,产品网络评论分析方面有所突破。各位老师提出自己的建议和看法,整个沙龙研究会在学术的交流和对话中完满结束。