收录:
摘要:
一种基于MFA score和排除冗余的基因表达谱特征选择方法,肿瘤基因表达谱的特征选择和分类有助于肿瘤的早期诊断,从基因表达的角度解释肿瘤的成因。首先利用MFA score算法构造类间近邻矩阵Wb和类内近邻矩阵Ww,进而得到类间拉普拉斯矩阵Lb和类内拉普拉斯矩阵Lw,最后将基因排序。针对基因表达数据的高冗余这一特点,我们利用Pearson相关系数来判断基因间的相关性,将高相关的基因即冗余基因排除,最终得到基因子集。本发明适用于任意空间分布的训练样本,排除冗余基因进一步缩减了特征维数,算法复杂度较小,实验中取得了较高的分类准确率。
关键词:
通讯作者信息:
电子邮件地址: