Indexed by:
Abstract:
本发明公开了一种处理微博文本认知歪曲的多标签分类方法,基于BERT与LSTM及Attention机制融合的文本分类方法,通过对中文语料数据集中的多条中文语料进行文本预处理,以获得所述多条中文语料对应的多个序列;使用BERT模型提取每个序列的词嵌入;采用LSTM及Attention对每个序列进行特征提取,以获得每个序列对应的文本深层语义特征;通过使用softmax分类器对所获得的文本深层语义特征进行分类,来对模型进行训练和测试,进而实现文本分类,能够捕捉到真正意义上的上下文信息;兼顾了上下文信息,避免长时间序列导致的历史记忆变弱的问题,可以有效提高分类效果。
Keyword:
Reprint Author's Address:
Email:
Patent Info :
Type: 发明申请
Patent No.: CN202011351175.9
Filing Date: 2020-11-27
Publication Date: 2021-02-09
Pub. No.: CN112347766A
Applicants: 北京工业大学
Legal Status: 实质审查
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: