• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

何泾沙 (何泾沙.) (Scholars:何泾沙) | 于聪 (于聪.) | 杨镇宁 (杨镇宁.) | 王亚芹 (王亚芹.) | 段梦园 (段梦园.) | 杜晋辉 (杜晋辉.) | 葛加可 (葛加可.)

Indexed by:

incoPat

Abstract:

本发明提供一种基于浏览器扩展的数据抓取方法及系统,其中方法包括:获取浏览器中当前网页对应的当前网页地址,将当前网页地址与预设配置文件中的目标网页地址进行匹配,预设配置文件中包含至少一个目标网页地址;当匹配成功时,从预设数据库中获取当前网页地址对应的预设规则,根据预设规则从当前网页中抓取目标数据。该方法及系统无需模拟浏览器,仅需利用浏览器可扩展的特性开发浏览器扩展插件,利用浏览器扩展插件从浏览器解析好的页面中提取目标数据,降低了整体开发难度,且可扩展性强;同时对于普通用户来说,仅需安装和操作浏览器的扩展插件即可,是一种类似于“所见即所得”的体验,有效提高了用户使用友好度。

Keyword:

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Patent Info :

Type: 发明申请

Patent No.: CN201810495217.2

Filing Date: 2018-05-22

Publication Date: 2018-12-04

Pub. No.: CN108932285A

Applicants: 北京工业大学

Legal Status: 驳回

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 1

Affiliated Colleges:

Online/Total:727/5416333
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.