• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

于楠 (于楠.) | 王普 (王普.) | 翁壮 (翁壮.) | 方丽英 (方丽英.)

收录:

CQVIP

摘要:

目的 针对某三级甲等医院电子病历中的非结构化部分(诊断和病情),建立多特征融合的条件随机场模型,自动化识别用自然语言描述的电子病历(electronic medical records,EMR)中的疾病和症状,从而实现电子病历信息的结构化存储,以利于电子病历的信息挖掘和统计分析.方法 将手动标注的语料库分为训练集和测试集,借助NLPIR工具分割文本,选择CRF++工具进行实验.针对中文电子病历的数据特点,先选取基本特征和相应的特征模板,通过不同上下文窗口的对比实验确定其大小;再分别添加引导词特征和构词结构特征,对比两种高级特征对实验结果的影响.结果 仅选取基本特征,上下文窗口为7时,识别效果最好;添加高级特征后,最终疾病实体F值为92.80%,症状实体F值为94.17%.结论 条件随机场模型融合多种有效的特征,可以很好地识别出电子病历中的疾病和症状实体.本研究对电子病历的命名实体识别有重要的意义.

关键词:

多特征融合 命名实体识别 电子病历 条件随机场模型

作者机构:

  • [ 1 ] [于楠]北京工业大学信息学部 北京 100124;城市轨道交通北京实验室 北京 100124;数字社区教育部工程研究中心 北京 100124;计算智能与智能系统北京市重点实验室 北京100124
  • [ 2 ] [王普]北京工业大学信息学部 北京 100124;城市轨道交通北京实验室 北京 100124;数字社区教育部工程研究中心 北京 100124;计算智能与智能系统北京市重点实验室 北京100124
  • [ 3 ] [翁壮]北京工业大学信息学部 北京 100124;城市轨道交通北京实验室 北京 100124;数字社区教育部工程研究中心 北京 100124;计算智能与智能系统北京市重点实验室 北京100124
  • [ 4 ] [方丽英]北京工业大学信息学部 北京 100124;城市轨道交通北京实验室 北京 100124;数字社区教育部工程研究中心 北京 100124;计算智能与智能系统北京市重点实验室 北京100124

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

北京生物医学工程

ISSN: 1002-3208

年份: 2018

期: 3

卷: 37

页码: 279-284,324

被引次数:

WoS核心集被引频次:

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: 8

中文被引频次:

近30日浏览量: 0

在线人数/总访问数:429/5046145
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司