• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

樊存佳 (樊存佳.) | 汪友生 (汪友生.) | 王雨婷 (王雨婷.)

收录:

CQVIP

摘要:

特征选择是文本分类过程中非常重要的环节。 CHI统计是一种经典的特征选择方法,针对CHI统计方法存在的不足,一方面,为了兼顾特征项的文档频和词频,本文在CHI中引入词频因子和类间方差;另一方面,为了排除在指定类中很少出现但在其他类中普遍存在的特征项,降低人为选取比例因子带来的误差,本文在CHI中引入自适应比例因子。实验结果表明,与CHI统计方法相比,改进后的CHI特征选择方法提高了非平衡语料集上的分类准确度。

关键词:

CHI统计 类间方差 自适应比例因子 词频因子

作者机构:

  • [ 1 ] [樊存佳]北京工业大学
  • [ 2 ] [汪友生]北京工业大学
  • [ 3 ] [王雨婷]北京工业大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

计算机与现代化

ISSN: 1006-2475

年份: 2016

期: 11

页码: 7-11,63

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: 10

中文被引频次:

近30日浏览量: 2

归属院系:

在线人数/总访问数:6800/2952383
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司