一种基于双重学习模型的可视语音合成系统 - 文章详情页

作者：

孙艳丰 (孙艳丰.) (学者：孙艳丰) | 林仙平 (林仙平.) | 尹宝才 (尹宝才.) (学者：尹宝才) | 贾熹滨 (贾熹滨.) (学者：贾熹滨)

收录：

CQVIP PKU CSCD

摘要：

为了在可视语音合成中获得更具有真实感的口型动画,提出了一种基于双重学习模型的合成方法.通过隐马尔可夫模型和遗传算法相结合的方法,可以更好地学习出语音特征与可视特征间的映射关系.该模型能去除传统语音识别领域在对大样本语音空间提取语音特征时的冗余信息,达到更好的可视语音预测效果.另外,在口型特征的表示上提出了一种基于面部动画参数特征点的几何特征表示,不仅对在不一致的光照条件下获得的训练样本有较好的鲁棒性,能更好地表征口型本身变化,而且与传统的主成分分析特征相比,具有较小的向量维数,提高了训练和合成速度.

关键词：

隐马尔可夫模型语音识别语音合成遗传算法特征提取语音处理

作者机构：

[ 1 ] 北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室

通讯作者信息：

电子邮件地址：

查看成果更多字段

成果类型
所属机构

所有年份指定年份从至