普通话广播语音的多层次标注与检索 - 文章详情页

作者：

章森 (章森.) | 华绍和 (华绍和.)

收录：

CQVIP PKU CSCD

摘要：

广播语音的自动识别、标注、检索等是涉及到语音技术、自然语言处理、信息检索等多个领域的综合性课题。在介绍了广播语音的自动标注与检索的研究概况并分析了其中涉及的关键技术基础上,提出了面向普通话广播语音的多层次自动标注框架以及基于多层次标注的语音检索方案,对文档层、句子层和词语层的标注属性进行了探讨,采用了递归标注方法对属性逐层细化,并讨论了对语音自动标注至关重要的语音识别引擎和语音流分割等问题。基于本文提出的方法,对10小时的普通话广播语音资料进行了标注和检索,得到了比较满意的实验结果。

关键词：

广播语音声学模型自动标注语言模型语音检索中文信息处理计算机应用

作者机构：

[ 1 ] 北京工业大学信息与计算科学实验室
[ 2 ] 新华社音像部北京100022
[ 3 ] 北京100803

通讯作者信息：

电子邮件地址：

查看成果更多字段

成果类型
所属机构

所有年份指定年份从至