• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

黄娜 (黄娜.) | 何泾沙 (何泾沙.) | 吴亚飈 (吴亚飈.)

摘要:

在基于机器学习的恶意PDF检测中,现有特征容易引起混淆或逃逸.为了提高特征的准确性和鲁棒性,在现有方法的基础上研究和改进特征提取方法,结合内容特征、结构特征以及逻辑树的间接结构特征,通过分析特征重要性进行特征选择,最后应用分类算法实现恶意PDF检测.结构特征包括多个高频次叶子节点数量;内容特征包括元数据特征、字节熵值、流字节比例等特征.收集实验数据集,提取特征并分析,最终选择出58维特征,使用LightGBM算法训练梯度提升决策树模型,测试准确率为99.9%,优于其他方法.另外,模拟攻击部分样本的特征,生成对抗样本,检测准确率同样达到99.2%.

关键词:

恶意PDF检测 结构特征 内容特征 DOM树 梯度提升决策树

作者机构:

  • [ 1 ] [吴亚飈]北京天融信科技有限公司 北京 海淀区 100085
  • [ 2 ] [何泾沙]北京工业大学
  • [ 3 ] [黄娜]北京天融信科技有限公司 北京 海淀区 100085

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

电子科技大学学报

ISSN: 1001-0548

年份: 2022

期: 5

卷: 51

页码: 766-773

被引次数:

WoS核心集被引频次:

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: -1

中文被引频次:

近30日浏览量: 0

归属院系:

在线人数/总访问数:223/5019008
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司