• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

许鑫 (许鑫.) | 苏开娜 (苏开娜.) | 胡起秀 (胡起秀.)

摘要:

Mel频率倒谱系数(MFCC)表征了人类的听觉特征。目前国内外提出了一些比较好的MFCC改进算法,可以提高语音特征提取的鲁棒性。本文介绍了一些在语音识别中取得一定效果的Mel倒谱提取的改进算法。将这些算法应用于文本无关的说话人识别,并在此基础上提出了四种改进方法。在100人和200人的电话语料库中,分别进行同信道和不同信道的实验,使识别率获得了不同程度的提高。尤其在不同信道上的识别效果更为显著。其中频率掩蔽滤波与Expolog尺度相结合的方法识别效果最好:在用座机语音建模手机语音测试的实验中,识别率从基准系统的16.327%上升到38.776%;在用手机语音建模座机语音测试的实验中,识别率从基...

关键词:

MFCC 特征提取 说话人识别 鲁棒

作者机构:

  • [ 1 ] 北京工业大学计算机学院
  • [ 2 ] 清华大学计算机科学与技术系

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

年份: 2005

语种: 中文

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次:

中文被引频次:

近30日浏览量: 2

在线人数/总访问数:3942/2948354
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司