收录:
摘要:
本发明提供一种基于浏览器扩展的数据抓取方法及系统,其中方法包括:获取浏览器中当前网页对应的当前网页地址,将当前网页地址与预设配置文件中的目标网页地址进行匹配,预设配置文件中包含至少一个目标网页地址;当匹配成功时,从预设数据库中获取当前网页地址对应的预设规则,根据预设规则从当前网页中抓取目标数据。该方法及系统无需模拟浏览器,仅需利用浏览器可扩展的特性开发浏览器扩展插件,利用浏览器扩展插件从浏览器解析好的页面中提取目标数据,降低了整体开发难度,且可扩展性强;同时对于普通用户来说,仅需安装和操作浏览器的扩展插件即可,是一种类似于“所见即所得”的体验,有效提高了用户使用友好度。
关键词:
通讯作者信息:
电子邮件地址: