收录:
摘要:
本发明公开了基于语言模型的GRU‑CRF会议名称识别方法,本方法分为两部分,一部分是基于GRU的语言模型,另一部分是基于GRU‑CRF的识别模型。使用有标注的监督数据训练标注模型GRU‑CRF,得到一个不需要特征工程和领域知识的端到端的识别模型。使用大量无标注数据对LM进行无监督训练,从无监督训练得到的LM中获取字向量作为GRU‑CRF的输入,可以提升监督训练的效果,提高识别模型的泛化能力,使得从少量标语料上训练有较好效果的命名实体识别模型成为可能。实验结果表明,LM‑GRU‑CRF方法在自建语料库上得到了最好的效果,对于其他缺乏标注预料的命名实体识别任务而言,可以使用该方法提高模型的效果。
关键词:
通讯作者信息:
电子邮件地址: