• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

哈寅晨 (哈寅晨.) | 孟凡坤 (孟凡坤.)

收录:

CQVIP

摘要:

随着信息化的发展,在智能信息处理领域,对自然语言处理的要求在不断提高,其中命名实体识别是一项极其重要的研究课题.本文在对信息产业新闻本文深入地研究和分析的基础上,总结出了公司名称的基本特点,分别针对公司名全称和简称,设计了不同的两种标注方式,并提出了一种基于条件随机场的双模型两次扫描识别策略,第一次扫描使用公司名全称识别模型,同时提取出公司名关键字;第二次扫描利用第一次扫描中提取出的公司名关键词改善分词和词性标注结果,在此基础上使用公司名全简称识别模型对公司名进行识别.最终的实验结果表明这种识别方法是有效的.

关键词:

信息抽取 公司名 命名实体识别 条件随机场

作者机构:

  • [ 1 ] [哈寅晨]北京工业大学
  • [ 2 ] [孟凡坤]北京工业大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

网络安全技术与应用

ISSN: 1009-6833

年份: 2014

期: 4

页码: 13-14

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: 5

中文被引频次:

近30日浏览量: 2

归属院系:

在线人数/总访问数:1000/2911245
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司