基于双层码本的语音驱动视觉语音合成系统 - Details

Author：

贾熹滨 (贾熹滨.) (Scholars：贾熹滨) | 尹宝才 (尹宝才.) (Scholars：尹宝才) | 孙艳丰 (孙艳丰.) (Scholars：孙艳丰)

Abstract：

　　提出了一种基于双层码本的语音驱动视觉语音合成系统，该系统以矢量量化的思想为基础，分别根据语音特征与视觉语音特征的相似性两次对样本数据进行自动聚类，构造同时反映语音之间与视觉语音之间相似性的双层映射码本。数据预处理阶段，提出一种能反映视觉语音几何形状特征与牙齿可见度的联合特征模型，并采用遗传算法在语音特征LPCC及MFCC基础上提取视觉语音相关的语音特征模型。合成的视频中图像数据与原始视频中的图像数据比较结果表明，合成结果能在一定程度上能逼近原始数据，取得了很好的效果。

Keyword：

视觉语音合成双层码本语音特征视觉语音特征

Author Community：

[ 1 ] [贾熹滨]北京工业大学多媒体与智能软件技术北京市重点实验室
[ 2 ] [尹宝才]北京工业大学多媒体与智能软件技术北京市重点实验室
[ 3 ] [孙艳丰]北京工业大学多媒体与智能软件技术北京市重点实验室

Reprint Author's Address：

Email：

Show more details

Related Keywords：

基于双层码本的语音驱动视觉语音合成系统
2014，计算机科学
语音同步的可视语音合成技术研究
2005，北京工业大学学报
基于汉语语音特征的多媒体同步方法
2004，小型微型计算机系统
大规模汉语语音语料库的言语特征分析
2010，第九届中国语音学学术会议

Source ：

Year： 2013

Page： 34-34

Language： Chinese

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： -1

Chinese Cited Count：

30 Days PV： 0

Affiliated Colleges：

信息学部

城市建设学部

信息学部计算机学院

Get Fulltext

Library Discovery Baidu Scholar Search WF

Type
Departments

All Years Choose Year From to