• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

杨震 (杨震.) | 赖英旭 (赖英旭.) | 段立娟 (段立娟.) | 李玉鑑 (李玉鑑.) | 许昕 (许昕.)

收录:

EI Scopus PKU CSCD

摘要:

基于 Enron邮件集合探索真实邮件网络,揭示出邮件网络的无标度特性和有限小世界特性.在此基础上,依据用户间交互强度设计出垃圾邮件协同过滤机制,通过调整参数λ,用户可以决定主要是依靠自己还是其他用户协同进行垃圾信息过滤.算法即使在没有对用户个人阅读习惯充分训练的情况下,也可以通过基于交互强度的网络协同方式实现良好过滤.同时为了解决Enron数据集缺乏标注的情况,基于训练样本集W和测试样本集T独立同分布的假设,利用改进的EM (Expectation maximization)算法最小化WUT集合上风险函数,给出了未知样本的一个良好标注.真实数据上的实验表明,同单.机过滤和集成过滤方法相比,协同过滤能够提高平均过滤精度且方法简单易行.

关键词:

邮件过滤 文本分类 协同过滤 邮件网络

作者机构:

  • [ 1 ] [杨震]北京工业大学
  • [ 2 ] [赖英旭]北京工业大学
  • [ 3 ] [段立娟]北京工业大学
  • [ 4 ] [李玉鑑]北京工业大学
  • [ 5 ] [许昕]北京工业大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

自动化学报

ISSN: 0254-4156

年份: 2012

期: 3

卷: 38

页码: 399-411

被引次数:

WoS核心集被引频次:

SCOPUS被引频次: 4

ESI高被引论文在榜: 0 展开所有

万方被引频次: 5

中文被引频次:

近30日浏览量: 0

归属院系:

在线人数/总访问数:275/5028959
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司