收录:
摘要:
基于路径摘要的链接信息提取方法属于计算机领域,采用了人工提取与机器提取相结合。人工提取部分提供了可视化人工提取器,将复杂的提取流程抽象成了一次鼠标点击的操作,具有极低的学习成本和极高的操作效率。而机器提取部分则在该方法框架下,通过对路径摘要节点进行向量化表示,实现了信息提取问题到机器学习二分类问题的转化,使得系统能够完成自动的规则抽取。设计并使用一组特征对路径摘要树节点进行了向量化表示,并利用随机森林模型作为分类器,实现了自动化的链接信息提取。该系统具有极低的学习成本、高效的人工提取效率以及良好的机器提取效果,在准确度与自动化程度之间达到了良好的平衡,能够显著提高链接信息提取这一环节的生产力。
关键词:
通讯作者信息:
电子邮件地址: