收录:
摘要:
【目的】针对如何确定专利发明等级,提出一种基于机器学习分类算法的专利发明等级分类模型。【方法】从专利文本中提取技术特征词,利用Word2Vec训练的词向量模型构建专利技术特征向量,计算专利文本指标和后向引用指标,构造模型训练数据集,采用机器学习分类算法构建分类模型。【结果】获取语音识别技术领域相关专利,对领域专利数据分类,高等级与低等级发明专利占比约为1︰4,符合实际情况,证明了该模型可行性。【局限】由于使用了Word Net词典,对于技术特征词汇的抽取会受到词典收录局限的影响。【结论】该模型可以对专利进行发明等级分类,从而为企业推荐高发明等级的专利。
关键词:
通讯作者信息:
电子邮件地址: