• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

孙艳丰 (孙艳丰.) (学者:孙艳丰) | 林仙平 (林仙平.) | 尹宝才 (尹宝才.) (学者:尹宝才) | 贾熹滨 (贾熹滨.) (学者:贾熹滨)

收录:

CQVIP PKU CSCD

摘要:

为了在可视语音合成中获得更具有真实感的口型动画,提出了一种基于双重学习模型的合成方法.通过隐马尔可夫模型和遗传算法相结合的方法,可以更好地学习出语音特征与可视特征间的映射关系.该模型能去除传统语音识别领域在对大样本语音空间提取语音特征时的冗余信息,达到更好的可视语音预测效果.另外,在口型特征的表示上提出了一种基于面部动画参数特征点的几何特征表示,不仅对在不一致的光照条件下获得的训练样本有较好的鲁棒性,能更好地表征口型本身变化,而且与传统的主成分分析特征相比,具有较小的向量维数,提高了训练和合成速度.

关键词:

特征提取 语音合成 语音处理 语音识别 遗传算法 隐马尔可夫模型

作者机构:

  • [ 1 ] 北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

相关文章:

来源 :

北京工业大学学报

年份: 2009

期: 05

卷: 35

页码: 702-707

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次:

中文被引频次:

近30日浏览量: 2

在线人数/总访问数:6235/2940033
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司