收录:
摘要:
为了解决本体学习中在特定领域术语抽取效率偏低的问题,本发明提出了一种融合语境信息的领域术语识别方法,整合统计学和语言学方法,借鉴传统领域相关性与领域一致性思想,再结合对数似然比,从候选术语语境信息的复现次数角度刻画候选术语在不同领域的分布情况,然后计算候选术语的领域属性值,最后根据每个候选术语的领域属性值抽取领域术语。本发明所述的融合语境信息的领域术语识别方法可获得非常好的术语抽取准确率,其不仅可以应用在诸如抑郁症药物等领域的术语抽取中,还能够在概念抽取方法中作为候选概念产生工具使用。
关键词:
通讯作者信息:
电子邮件地址: