• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

程淑萍 (程淑萍.) | 谭建军 (谭建军.) | 门婧睿 (门婧睿.)

收录:

CQVIP

摘要:

目的 非编码RNA-蛋白质的相互作用(noncoding RNA?protein interactions,ncRPI)具有重要的生物学意义,目前预测其相互作用已成为当下研究非编码RNA(noncoding RNA,ncRNA)和蛋白质功能的重要途径之一.方法 本研究基于ncRNA和蛋白质的序列信息提取特征,运用卷积自编码器预处理原始数据,训练三个机器学习模型:LightGBM(LBM)、随机森林(random forest,RF)和极端梯度增强算法(extreme gradient boosting,XGB),预测ncRNA与蛋白质的相互作用.结果 在RPI369和RPI488两个数据集做5倍交叉验证,LBM、RF与XGB三个模型在两个数据集均达到较高的预测准确率,在RPI369数据集三个模型的预测准确率分别为0.757(LBM)、0.791(RF)、0.791(XGB),在RPI488数据集三个模型的预测准确率分别为0.918(LBM)、0.908(RF)、0.918(XGB);三个模型在RPI1807、RPI2241、RPI13254大数据集也取得较高的AUC(area under curve)值,在RPI1807三个模型的AUC值均为0.99,在RPI2241三个模型最低AUC值为0.87,在RPI13254三个模型最低AUC值为0.81,都表现出较好的预测准确性.结论 机器学习方法能够预测ncRNA与蛋白质是否存在相互作用.

关键词:

卷积自编码器 极端梯度增强算法 LightGBM 非编码RNA-蛋白质相互作用 随机森林

作者机构:

  • [ 1 ] [程淑萍]北京工业大学生命科学与生物工程学院,智能化生理测量与临床转化北京市国际科技合作基地 北京,100124
  • [ 2 ] [谭建军]北京工业大学生命科学与生物工程学院,智能化生理测量与临床转化北京市国际科技合作基地 北京,100124
  • [ 3 ] [门婧睿]北京工业大学生命科学与生物工程学院,智能化生理测量与临床转化北京市国际科技合作基地 北京,100124

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

北京生物医学工程

ISSN: 1002-3208

年份: 2019

期: 4

卷: 38

页码: 353-359

被引次数:

WoS核心集被引频次:

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: 1

中文被引频次:

近30日浏览量: 0

归属院系:

在线人数/总访问数:525/5029892
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司