大学首页
各国语言/Languages
英语/English
关注广外微信平台
您现在的位置: 网站首页 > 专题报道 > 科技活动月专题 > 正文

【科技活动月】“语音识别与语音评测研究”沙龙分享初步成果

文字:记者 陈雪珠 图片: 编辑: 发布时间:2010-06-05 点击数: 分享至:


  本网讯 2010年我校科技活动月之“语音识别及语音质量客观评价研究”学术沙龙于6月4日14:00在南校行政楼第二会议室举行。出席沙龙的有副校长方凡泉,科研处副处长阳爱民,思科信息学院副院长李心广,副院长蒋盛益,英文学院教授王桂珍,东语学院教授张慧明和相关课题组的老师和同学。李心广主持了该沙龙。

  王桂珍首先主讲“语音区别特征与语音识别”,她通过阐述语音的三个区别特征:发音,发音部位和发音方法,比较了元音,鼻音,齿音和唇音等发音的不同。接着她着重讲了“重音”,由于英语音节有长有短,特征不明晰,而汉语每个字都很清晰,每个字用时均匀,所以英文发音与汉语说话有很大不同。而且英语中重读的音节数比较少,故要根据说话和写稿的对象决定重读的使用。根据“信息论”的说法,句子的最后一个重读音节其意义相当于这个句子的最后一个单词。然后王桂珍又指出,中国学生不是特别注意语流上的处理,中国人英语说得溜的程度不是很够,所以希望同学们不要忽视这一点。最后,她举例[p]跟[b],讲解了英汉双唇爆破音的异同,什么时候在[p]后面不送气,什么时候又该送。


王桂珍讲解“语音区别特征与语音识别”

  嵌入式系统研究所的陈永煊随后演示了语言识别技术的高端引擎SPEECH SDK的运行方式,并且针对SPEECH SDK占用资源多等缺点,现场展示了改进后的嵌入式语言识别系统。广外研究生林江豪则介绍了“语音质量客观评价系统”,讲解了采用MFCC及语音强度曲线特征分别对音素句子进行评价的过程。他还谦虚地向在场老师请教:如何选择更全面的特征来进行语音质量评价?如何建立科学的评分机制,将HMM模型输出概率转换为分数?

  接着,杨思哲,邹宇和李湘同学带来了“语音合成技术(TTS)研究”。他们先简单介绍了TTS的发展和应用,再从语法分析、音调分析、语音合成、语音输出等方面详细讲解了TTS的过程。在合成技术方面,他们更赞同于采用波型拼接合成技术。周慧芳同学则报告了语音识别的分类及识别模型的选择,重点介绍了隐马尔可夫HMM 模型,其精髓是“观看可测,状态可含”。杨佳能同学介绍了关于语音降噪技术的初步研究及其关键技术——语音增强。通过实验,证明了谱相减法算法可取得较好的语音降噪效果。他还提出采用双mic技术,在时域上处理噪声的设想,并设计电路验证设想的合理性。

  报告完毕后,现场进行了热烈的讨论,针对之前老师和同学的讲解介绍,再对其细化分析,深入探讨。


会议现场

  最后,阳爱民对诸位同学取得的成绩表示祝贺,对沙龙的质量给予了高度的评价。他同时表示,沙龙作为科技月的活动之一,旨在了解各项目的进展,增强学生与科研人员的交流,促进广外大科研氛围的营造,推进跨学院、跨学科的交流、合作和发展。科研处也将总结经验,并将汇总报告整理成小册子。对于本次沙龙,阳爱民采用五个词组进行评价:准备充足,规格较高,内容翔实,讨论热烈和效果良好。