• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

刘明洁 (刘明洁.) | 李珅 (李珅.) | 梁毅 (梁毅.)

Indexed by:

CQVIP

Abstract:

为了构建全面而且准确的法律文本纠错词库,本文提出基于网络爬虫的词库构建方法.此方法以常用爬虫为基础,扩展主题选取、网页排序等功能模块以提高爬虫的精准度和查全率.在得到数据后进行数据清洗以筛选有用词汇形成最终可使用的专业纠错词库.通过系统试运行验证了本爬虫设计方案的可行性,可以为相关词库的构建提供支持.

Keyword:

分词词库 网络爬虫 法律文本

Author Community:

  • [ 1 ] [刘明洁]北京工业大学信息学部计算机学院,北京 100124;中国司法大数据研究院有限公司,北京 100043
  • [ 2 ] [李珅]中国司法大数据研究院有限公司,北京,100043
  • [ 3 ] [梁毅]北京工业大学信息学部计算机学院,北京,100124

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

软件

ISSN: 1003-6970

Year: 2020

Issue: 5

Volume: 41

Page: 57-60

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 1

Online/Total:558/5294435
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.