收录:
摘要:
文本分类是自然语言处理的典型应用,一般采用卷积神经网络、双向长短期记忆网络等分类方法。基于语义网络和信息融合原理,研究工作提出了一种融合上下文特征、局部特征和平均表示特征等多特征的长文本分类方法。多特征融合方法需要清洗长文本并将文本表示为词向量,预处理后的定长文本词向量输入模型层;在模型层聚类提取特征,用双向长短期记忆网络提取词的上下文特征,用卷积神经网络提取词的局部特征,用平均池化模型提取词的平均表示特征;在线性层融合文本内容的这些信息特征并分类。经大量数据集实验,多特征融合方法分类准确率统计可达98.3%。
关键词:
通讯作者信息:
电子邮件地址: