• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

于楠 (于楠.) | 王普 (王普.) | 翁壮 (翁壮.) | 方丽英 (方丽英.)

Indexed by:

CQVIP

Abstract:

目的 针对某三级甲等医院电子病历中的非结构化部分(诊断和病情),建立多特征融合的条件随机场模型,自动化识别用自然语言描述的电子病历(electronic medical records,EMR)中的疾病和症状,从而实现电子病历信息的结构化存储,以利于电子病历的信息挖掘和统计分析.方法 将手动标注的语料库分为训练集和测试集,借助NLPIR工具分割文本,选择CRF++工具进行实验.针对中文电子病历的数据特点,先选取基本特征和相应的特征模板,通过不同上下文窗口的对比实验确定其大小;再分别添加引导词特征和构词结构特征,对比两种高级特征对实验结果的影响.结果 仅选取基本特征,上下文窗口为7时,识别效果最好;添加高级特征后,最终疾病实体F值为92.80%,症状实体F值为94.17%.结论 条件随机场模型融合多种有效的特征,可以很好地识别出电子病历中的疾病和症状实体.本研究对电子病历的命名实体识别有重要的意义.

Keyword:

多特征融合 命名实体识别 电子病历 条件随机场模型

Author Community:

  • [ 1 ] [于楠]北京工业大学信息学部 北京 100124;城市轨道交通北京实验室 北京 100124;数字社区教育部工程研究中心 北京 100124;计算智能与智能系统北京市重点实验室 北京100124
  • [ 2 ] [王普]北京工业大学信息学部 北京 100124;城市轨道交通北京实验室 北京 100124;数字社区教育部工程研究中心 北京 100124;计算智能与智能系统北京市重点实验室 北京100124
  • [ 3 ] [翁壮]北京工业大学信息学部 北京 100124;城市轨道交通北京实验室 北京 100124;数字社区教育部工程研究中心 北京 100124;计算智能与智能系统北京市重点实验室 北京100124
  • [ 4 ] [方丽英]北京工业大学信息学部 北京 100124;城市轨道交通北京实验室 北京 100124;数字社区教育部工程研究中心 北京 100124;计算智能与智能系统北京市重点实验室 北京100124

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

北京生物医学工程

ISSN: 1002-3208

Year: 2018

Issue: 3

Volume: 37

Page: 279-284,324

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: 8

Chinese Cited Count:

30 Days PV: 0

Online/Total:619/5304541
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.