• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

翟东升 (翟东升.) | 胡等金 (胡等金.) | 张杰 (张杰.) | 何喜军 (何喜军.) | 刘鹤 (刘鹤.)

Indexed by:

CQVIP CSCD CSSCI

Abstract:

[目的]针对如何确定专利发明等级,提出一种基于机器学习分类算法的专利发明等级分类模型.[方法]从专利文本中提取技术特征词,利用Word2Vec训练的词向量模型构建专利技术特征向量,计算专利文本指标和后向引用指标,构造模型训练数据集,采用机器学习分类算法构建分类模型.[结果]获取语音识别技术领域相关专利,对领域专利数据分类,高等级与低等级发明专利占比约为1∶4,符合实际情况,证明了该模型可行性.[局限]由于使用了WordNet词典,对于技术特征词汇的抽取会受到词典收录局限的影响.[结论]该模型可以对专利进行发明等级分类,从而为企业推荐高发明等级的专利.

Keyword:

词向量 机器学习 专利发明等级 技术特征向量

Author Community:

  • [ 1 ] [翟东升]北京工业大学
  • [ 2 ] [胡等金]北京工业大学
  • [ 3 ] [张杰]北京工业大学
  • [ 4 ] [何喜军]北京工业大学
  • [ 5 ] [刘鹤]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

数据分析与知识发现

ISSN: 1003-3513

Year: 2017

Issue: 12

Page: 63-73

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 1

Affiliated Colleges:

Online/Total:407/5275180
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.