收录:
摘要:
目的:应用随机森林模型和Logistic回归模型,研究糖尿病的风险因素并构建风险预测模型。数据来源于全国13家三甲医院的调查数据和体检数据,选取包括年龄、体重指数、糖尿病病史、腰围、舒张压、收缩压等因素在内的初始备选指标共17个,响应变量为餐后两小时血糖。方法:应用随机森林算法和Logistic回归,比较两种模型的预测效果。结果:在随机森林模型的变量重要性评分中,糖尿病病史、体重指数、年龄、收缩压以及腰围这几个特征变量得分较高;Logistic回归模型中糖尿病病史情况以及体重指数对模型影响较大,结果显示随机森林模型的预测效果略优于Logistic回归模型。结论:研究随机森林算法分析结果给出了各...
关键词:
通讯作者信息:
电子邮件地址: