• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

翟东升 (翟东升.) (学者:翟东升) | 胡等金 (胡等金.) | 张杰 (张杰.) | 何喜军 (何喜军.) (学者:何喜军) | 刘鹤 (刘鹤.)

收录:

CQVIP CSCD CSSCI

摘要:

【目的】针对如何确定专利发明等级,提出一种基于机器学习分类算法的专利发明等级分类模型。【方法】从专利文本中提取技术特征词,利用Word2Vec训练的词向量模型构建专利技术特征向量,计算专利文本指标和后向引用指标,构造模型训练数据集,采用机器学习分类算法构建分类模型。【结果】获取语音识别技术领域相关专利,对领域专利数据分类,高等级与低等级发明专利占比约为1︰4,符合实际情况,证明了该模型可行性。【局限】由于使用了Word Net词典,对于技术特征词汇的抽取会受到词典收录局限的影响。【结论】该模型可以对专利进行发明等级分类,从而为企业推荐高发明等级的专利。

关键词:

机器学习 词向量 技术特征向量 专利发明等级

作者机构:

  • [ 1 ] 北京工业大学经济与管理学院

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

数据分析与知识发现

年份: 2017

期: 12

卷: 1

页码: 63-73

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次:

中文被引频次:

近30日浏览量: 1

在线人数/总访问数:349/3895147
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司