• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

翟东升 (翟东升.) | 胡等金 (胡等金.) | 张杰 (张杰.) | 何喜军 (何喜军.) | 刘鹤 (刘鹤.)

收录:

CQVIP CSCD CSSCI

摘要:

[目的]针对如何确定专利发明等级,提出一种基于机器学习分类算法的专利发明等级分类模型.[方法]从专利文本中提取技术特征词,利用Word2Vec训练的词向量模型构建专利技术特征向量,计算专利文本指标和后向引用指标,构造模型训练数据集,采用机器学习分类算法构建分类模型.[结果]获取语音识别技术领域相关专利,对领域专利数据分类,高等级与低等级发明专利占比约为1∶4,符合实际情况,证明了该模型可行性.[局限]由于使用了WordNet词典,对于技术特征词汇的抽取会受到词典收录局限的影响.[结论]该模型可以对专利进行发明等级分类,从而为企业推荐高发明等级的专利.

关键词:

词向量 机器学习 专利发明等级 技术特征向量

作者机构:

  • [ 1 ] [翟东升]北京工业大学
  • [ 2 ] [胡等金]北京工业大学
  • [ 3 ] [张杰]北京工业大学
  • [ 4 ] [何喜军]北京工业大学
  • [ 5 ] [刘鹤]北京工业大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

数据分析与知识发现

ISSN: 1003-3513

年份: 2017

期: 12

页码: 63-73

被引次数:

WoS核心集被引频次:

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: -1

中文被引频次:

近30日浏览量: 0

归属院系:

在线人数/总访问数:371/5046492
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司