收录:
摘要:
本发明公开了一种基于多模态融合的中文歌曲情感分类方法,首先从音频信号中获取声谱图,并提取音频低层特征,然后基于LLD‑CRNN模型进行音频特征学习,从而得到中文歌曲的音频特征;对于歌词和评论信息,首先构建音乐情感词典,然后以该词典为基础,构造基于情感强度和词性的情感向量,从而得到中文歌曲的文本特征;最后使用决策融合和特征融合两种方法进行多模态融合,得到中文歌曲的情感类别。本方法基于LLD‑CRNN的音乐情感分类模型,该模型结合使用声谱图和音频低层特征作为输入序列。LLD集中在时域或频域,对于时、频特性关联变化的音频信号,而声谱图是音频信号在频率上的二维表示,在信息量上损失较少,因此,LLD和声谱图可以实现信息互补。
关键词:
通讯作者信息:
电子邮件地址: