基于双层码本的语音驱动视觉语音合成系统 - Details

Author：

贾熹滨 (贾熹滨.) (Scholars：贾熹滨) | 尹宝才 (尹宝才.) (Scholars：尹宝才) | 孙艳丰 (孙艳丰.) (Scholars：孙艳丰)

Indexed by：

CQVIP PKU CSCD

Abstract：

提出了一种基于双层码本的语音驱动视觉语音合成系统,该系统以矢量量化的思想为基础,建立语音特征空间到视觉语音特征空间的粗耦合映射关系.为加强语音和视觉语音的关联性,系统分别根据语音特征与视觉语音特征的相似性两次对样本数据进行自动聚类,构造同时反映语音之间与视觉语音之间相似性的双层映射码本.数据预处理阶段,提出一种能反映视觉语音几何形状特征与牙齿可见度的联合特征模型,并在语音特征LPCC及MFCC基础上采用遗传算法提取视觉语音相关的语音特征模型.合成的视频中图像数据与原始视频中图像数据的比较结果表明,合成结果能在一定程度上逼近原始数据,取得了很好的效果.

Keyword：

视觉语音特征双层码本语音特征视觉语音合成

Author Community：

[ 1 ] [贾熹滨]北京工业大学
[ 2 ] [尹宝才]北京工业大学
[ 3 ] [孙艳丰]北京工业大学

Reprint Author's Address：

Email：

Show more details

Related Keywords：

基于双层码本的语音驱动视觉语音合成系统
2013，2013年中国计算机学会人工智能会议
基于汉语语音特征的多媒体同步方法
2004，小型微型计算机系统
大规模汉语语音语料库的言语特征分析
2010，第九届中国语音学学术会议
基于非负矩阵分解的语音特征波形分解方法
2007，第十三届全国信号处理学术年会（CCSP-2007）

Source ：

计算机科学

ISSN： 1002-137X

Year： 2014

Issue： 1

Volume： 41

Page： 100-104

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： 4

Chinese Cited Count：

30 Days PV： 0

Affiliated Colleges：

信息学部

城市建设学部

Get Fulltext

DOI Library Discovery Baidu Scholar Search WF

Type
Departments

All Years Choose Year From to