• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

鲍长春 (鲍长春.) | 白志刚 (白志刚.)

收录:

CQVIP CSCD

摘要:

语音增强在语音信号处理领域举足轻重,其目的在于减少背景噪声对语音信号的影响.然而,如何从极度非平稳噪声环境下有效地分离出目标语音仍然是一个具有挑战性的问题.基于非负矩阵分解(Nonnegative matrix factorization,NMF)的语音增强算法利用非负的语音和噪声基矩阵来建模语音和噪声的频谱子空间,是目前一种先进的对抑制非平稳噪声非常有效的技术.本文首先详细地介绍了非负矩阵分解理论,包括非负矩阵分解模型,代价函数(Cost function)的定义以及常用的乘法更新准则(Multiplicative update rules).然后,本文详细地介绍了基于非负矩阵分解的语音增强方法的基本原理,包括训练阶段和增强阶段的具体过程,并进行了实验,此外,还利用一个基于非负矩阵分解的语音重构实验验证了语音基矩阵对语音频谱的建模能力.最后,本文总结了传统的基于非负矩阵分解的算法的不足,并对一些现有的基于非负矩阵分解的算法分别做了一个简单的概述,包括其创新点和优缺点,并对比分析了几种具有代表性的方法.本文从历史的角度展示了基于非负矩阵分解的语音增强方法的不断发展.

关键词:

稀疏性 非平稳噪声 深度神经网络 半监督方法 非负矩阵分解 语音增强

作者机构:

  • [ 1 ] [鲍长春]北京工业大学信息学部,语音与音频信号处理研究室,北京100124
  • [ 2 ] [白志刚]北京工业大学信息学部,语音与音频信号处理研究室,北京100124

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

相关文章:

来源 :

信号处理

ISSN: 1003-0530

年份: 2020

期: 6

卷: 36

页码: 791-803

被引次数:

WoS核心集被引频次:

SCOPUS被引频次: 4

ESI高被引论文在榜: 0 展开所有

万方被引频次: -1

中文被引频次:

近30日浏览量: 1

在线人数/总访问数:396/5038942
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司