Indexed by:
Abstract:
特征选择是文本分类过程中非常重要的环节。 CHI统计是一种经典的特征选择方法,针对CHI统计方法存在的不足,一方面,为了兼顾特征项的文档频和词频,本文在CHI中引入词频因子和类间方差;另一方面,为了排除在指定类中很少出现但在其他类中普遍存在的特征项,降低人为选取比例因子带来的误差,本文在CHI中引入自适应比例因子。实验结果表明,与CHI统计方法相比,改进后的CHI特征选择方法提高了非平衡语料集上的分类准确度。
Keyword:
Reprint Author's Address:
Email:
Source :
计算机与现代化
ISSN: 1006-2475
Year: 2016
Issue: 11
Page: 7-11,63
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: 10
Chinese Cited Count:
30 Days PV: 1
Affiliated Colleges: