Indexed by:
Abstract:
分析了与类别信息有关的CHI统计特征选取方法和与类别无关的文档频率特征选取方法.在此基础上提出文档频率与CHI统计相结合的特征提取方法,以选取分类能力强的词项特征,从而提高网页分类效果.以该联合特征提取方法为基础构建的网页分类系统,在参加SEWM2007分类评测的8个代表队中,取得Macro-F1值排名第3的成绩.
Keyword:
Reprint Author's Address:
Email:
Source :
北京工业大学学报
ISSN: 0254-0037
Year: 2008
Issue: 9
Volume: 34
Page: 995-1000
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: 23
Chinese Cited Count:
30 Days PV: 1
Affiliated Colleges: