收录:
摘要:
本发明提供基于笔画卷积和词向量的中文命名实体识别方法及系统,涉及命名实体识别技术领域,包括:获取文本中各汉字对应的笔画序列及各汉字的字符特征向量;将笔画序列输入笔画卷积神经网络,获取笔画特征向量;根据文本中实体的最大长度设置滑动窗口,通过自注意力机制获取每个字在滑动窗口内的词向量;拼接文本中各汉字的笔画特征向量、词向量和字符特征向量,并输入BiLSTM网络,获取每个汉字对应每种实体标签的得分;采用CRF模型对文本中每个汉字确定一个最佳的实体标签。本发明考虑到汉字的笔画序列对汉字的影响,结合汉字的笔画特征向量、词特征向量和字符特征向量后,在进行命名实体识别,提高命名实体识别的效果。
关键词:
通讯作者信息:
电子邮件地址: