• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

樊存佳 (樊存佳.) | 汪友生 (汪友生.) | 王雨婷 (王雨婷.)

Indexed by:

CQVIP

Abstract:

特征选择是文本分类过程中非常重要的环节。 CHI统计是一种经典的特征选择方法,针对CHI统计方法存在的不足,一方面,为了兼顾特征项的文档频和词频,本文在CHI中引入词频因子和类间方差;另一方面,为了排除在指定类中很少出现但在其他类中普遍存在的特征项,降低人为选取比例因子带来的误差,本文在CHI中引入自适应比例因子。实验结果表明,与CHI统计方法相比,改进后的CHI特征选择方法提高了非平衡语料集上的分类准确度。

Keyword:

自适应比例因子 CHI统计 词频因子 类间方差

Author Community:

  • [ 1 ] [樊存佳]北京工业大学
  • [ 2 ] [汪友生]北京工业大学
  • [ 3 ] [王雨婷]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

计算机与现代化

ISSN: 1006-2475

Year: 2016

Issue: 11

Page: 7-11,63

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: 10

Chinese Cited Count:

30 Days PV: 1

Affiliated Colleges:

Online/Total:438/5275097
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.