收录:
摘要:
本发明提供了一种基于BERT和双向LSTM、注意力机制融合的关于灾难信息博文分类方法,用于解决灾难来临时评估社交媒体文本信息重要性的问题,本方法包括训练和分类两大阶段,训练阶段分为以下五步:训练数据预处理;用BERT模型获取训练数据的词向量;用双向LSTM算法对词向量序列进行特征提取;用注意力机制加权获取文本‑标签重要性特征向量;构建前馈神经网络并训练;分类阶段,利用训练完成的网络对待分类文本进行分类;训练阶段中的注意力机制分为两步,其中第二步注意力机制仅用于训练。本方法不同于以往的文本嵌入方式,克服了短文本特征稀缺的问题,明显的提升了分类效果。
关键词:
通讯作者信息:
电子邮件地址: