• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

杜芳华 (杜芳华.) | 冀俊忠 (冀俊忠.) (学者:冀俊忠) | 吴晨生 (吴晨生.) | 吴金源 (吴金源.)

收录:

CQVIP CSCD

摘要:

半监督文本分类中已标记数据与未标记数据分布不一致,可能导致分类器性能较低。为此,提出一种利用蚁群聚集信息素浓度的半监督文本分类算法。将聚集信息素与传统的文本相似度计算相融合,利用Top-k策略选取出未标记蚂蚁可能归属的种群,依据判断规则判定未标记蚂蚁的置信度,采用随机选择策略,把置信度高的未标记蚂蚁加入到对其最有吸引力的训练种群中。在标准数据集上与朴素贝叶斯算法和EM算法进行对比实验,结果表明,该算法在精确率、召回率以及F1度量方面都取得了更好的效果。

关键词:

Top-k策略 半监督学习 文本分类 聚集信息素 自训练 随机选择策略

作者机构:

  • [ 1 ] [杜芳华]北京工业大学
  • [ 2 ] [冀俊忠]北京工业大学
  • [ 3 ] [吴晨生]北京市科学技术情报研究所
  • [ 4 ] [吴金源]北京工业大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

相关文章:

来源 :

计算机工程

ISSN: 1000-3428

年份: 2014

期: 11

页码: 167-171

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: 6

中文被引频次:

近30日浏览量: 3

归属院系:

在线人数/总访问数:5835/2938587
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司