收录:
摘要:
本发明涉及一种基于句法依存关系的命名实体识别方法。在命名实体识别中,只有当模型所识别到的实体边界和类型都与标注实体的边界和类型相匹配,才算是真阳例(TP)。在大多数测试样本中,假阳例(FP)和假阴例(FN)往往都是由于实体的边界判断不正确造成的,也就是说边界识别比类型识别困难得多。本发明提出使用自注意力机制来削弱实体与实体以外单词的联系,并加强实体内部单词之间的关系。具体的是在双向长短期记忆网络(Bi‑LSTM)网络之后,添加自注意力机制,把句法依存树中单词之间的依存关系编码进上下文信息,最后根据Bi‑LSTM网络提供的全局特征以及句法依存树提供的局部特征,共同来判断实体边界。本发明提高了命名实体识别的准确率。
关键词:
通讯作者信息:
电子邮件地址: