收录:
摘要:
基于极限学习机的文本分类方法在对输入的文本特征进行随机映射时,会呈现一种非线性的几何结构,利用最小二乘法无法对其进行求解,影响文本的分类性能.为此,引入一种新的流形正则化思想,提出基于极限学习机的改进算法.利用拉普拉斯特征映射保持输入文本特征的几何结构.基于样本的类别信息对样本点之间的距离进行修正,优先选择类别相同的样本点,以改善分类性能.在Reuters和20newsgroup数据集上的实验结果表明,与正则化极限学习机算法、AdaBELM算法等相比,该算法分类性能较好,F1-measure值可达91.42%.
关键词:
通讯作者信息:
电子邮件地址: