• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

闫健卓 (闫健卓.) | 李鹏英 (李鹏英.) | 方丽英 (方丽英.) | 龙丽英 (龙丽英.) | 刘欣悦 (刘欣悦.)

收录:

CQVIP PKU

摘要:

为克服传统 X2统计模型未考虑特征词频数因素不足的缺陷,根据特征项的词频数及其在类间、类内不同分布情况,提出一种改进的 X2统计特征选择方法,使特征频数信息得到有效利用。实验对比改进前后的方法对文本分类的结果,实验结果表明,改进后方法的分类效果优于传统 X2统计方法,验证了其有效性。

关键词:

文本分类 X2 统计 特征分布 特征选择 特征频数

作者机构:

  • [ 1 ] [闫健卓]北京工业大学
  • [ 2 ] [李鹏英]北京工业大学
  • [ 3 ] [方丽英]北京工业大学
  • [ 4 ] [龙丽英]北京工业大学
  • [ 5 ] [刘欣悦]北京工业大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

相关文章:

来源 :

计算机工程与设计

ISSN: 1000-7024

年份: 2016

期: 5

卷: 37

页码: 1391-1394

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: 9

中文被引频次:

近30日浏览量: 0

归属院系:

在线人数/总访问数:2298/3888776
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司