一种基于CTC多层损失的语音识别方法 - Details

Author：

陈仙红 (陈仙红.) | 罗德雨 (罗德雨.) | 鲍长春 (鲍长春.) (Scholars：鲍长春)

Indexed by：

incoPat

Abstract：

一种基于CTC多层损失的语音识别方法，属于模式识别、声学领域。该方法对语音识别网络不同层的输出进行规范，使不同层的输出尽量接近所需要的语音识别结果，从而提高语音识别的性能。该方法包括模型训练与模型测试两个阶段：在训练阶段，将预处理后的训练集输入所搭建的多层语音识别网络中，计算不同层的损失和不同层的权重，将不同层损失加权求和得到多层损失，循环计算损失，更新网络参数直至收敛；在测试阶段，将预处理后的测试集输入训练好的多层语音识别网络，输出识别结果。本发明仅仅改变CTC语音识别模型训练阶段的损失函数，并不改变CTC语音识别模型的结构及其语音识别的过程，以低复杂度、低开销的特点提高语音识别的准确率。

Keyword：

Reprint Author's Address：

Email：

Show more details

Related Keywords：

Patent Info ：

Type：发明申请

Patent No.： CN202210619908.5

Filing Date： 2022-06-02

Publication Date： 2022-09-06

Pub. No.： CN115019782A

Applicants：北京工业大学

Legal Status：实质审查

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 0

Affiliated Colleges：

信息学部

Get Patent

Library Discovery Baidu Scholar Search incoPat

Type
Departments

All Years Choose Year From to