收录:
摘要:
本发明公开了一种改进的针对早期专利文档图文信息匹配的智能信息处理方法。该方法然后利用一个大小与fig标示相近的滑动窗口在扫描件图像上从左至右、从上至下的顺序依次扫描图像,同时利用训练好的SVM分类模型判断该滑动窗口所处位置的图块是否属于fig标示,如果是,则将该滑动窗口中的图块切割掉,同时保存fig标示,并且统计该幅图像中的fig标示的数量。然后利用种子区域生长法对切割掉fig后的图像进行图块切割并适当的缩放切割时的阈值。最后将切割后的附图文件和fig标示根据距离进行相应的匹配,并且将匹配后的文件保存在相应的文件目录中。本发明提高了fig标示的切割准确率同时减少了fig标示对附图切割时带来的影响,提高了图文匹配的准确性。
关键词:
通讯作者信息:
电子邮件地址: