收录:
摘要:
本发明公开了基于隐马尔可夫模型的英文简历关键字段抽取方法,包括:收集英文简历,将收集的英文简历分为训练样本和测试样本;预处理训练样本,并对简历文本序列做隐含状态标记;获取字符字典;计算出隐马尔可夫模型参数初值;使用Baum‑Welch算法对隐马尔可夫模型参数重估,得到一个训练过的隐马尔可夫模型;预处理测试样本;根根据训练过的隐马尔可夫模型,使用维特比算法将测试样本简历标记出最大概率的隐含状态序列。本发明使用隐马尔可夫模型的维特比算法,不仅适应性好、抽取精度较高,而且不需大规模的词典集与规则集,具有很强的实用性。
关键词:
通讯作者信息:
电子邮件地址: