收录:
摘要:
为了解决决策树C4.5算法生成的决策树过度拟合训练样本,泛化能力低的问题,提出了一种基于贝叶斯理论的决策树后剪枝算法.该算法利用贝叶斯后验定律,对决策树C4.5算法所生成的决策树的每一个分枝进行验证,将不能满足条件的分枝从该决策树中去除,生成一个简单的树.对北京市重点学科信息平台和硕、博授予点平台提供的学科历史审批数据进行实验验证.实验结果表明,该算法可以剪掉大多数不可靠分枝和过拟合分枝,较决策树C4.5算法对新数据的分类有着更高的预测精度.
关键词:
通讯作者信息:
电子邮件地址: