收录:
摘要:
本发明公开了一种基于深度学习和XGBoost算法的博文关于灾难信息重要性加权分类方法,本方法主要分为以下五步:步骤(1)接收社交媒体文本数据并预处理;步骤(2)构建灾难单词预训练词向量表,用于社交媒体文本数据转化为词向量;步骤(3)通过步骤(2)更新后的词向量表,把经过步骤(1)预处理后的社交媒体文本数据转化成维度为d的词向量,并利用XGBoost算法对社交媒体文本数据进行信息类别分类和重要性类别分类;步骤(4)对社交媒体文本数据的信息分类结果和警报性分类结果进行加权确定所含文本信息的重要性;本方法在社交媒体文本数据的基础上,加入了重要性加权函数,通过对社交媒体文本数据的信息类别和警报性类别划分,建立信息类别与警报性之间的关联程度,采用了深度学习和XGBoost算法结合进行分类,并且将信息类别和警报性类别关联进行加权,得到最终的社交媒体文本数据信息重要性指标。实验结果表明,社交媒体文本数据的信息重要性分类效果有明显提升。
关键词:
通讯作者信息:
电子邮件地址: