本研究数据来自一个中老年人公开数据库CHARLS,研究对象为基线患有脑卒中的患者,样本量为1479人。纳入分析的数据有4波,分别是2011、2013、2015和2018年。
本文关心的结局为脑卒中是否复发,处理为二分类结局。承接上一张图,可知作者做的是2年复发风险预测。结合其数据纳入情况,基线有3个,分别是2011、2013、2015年,分别随访2年后,在2013、2015、2018年收集这些患者的复发情况。
预测因素:本文纳入的预测因素如下,包括了人口学、生活方式、慢性病、量表测量等。值得一提的是,本文对预测因素的介绍十分详细,尤其是对各个量表的介绍很清楚,这一点值得借鉴。因为变量测度不清晰,很容易引起审稿人的疑问。
本文预测模型纳入较传统,包括了logistic回归、随机森林和广义学习系统。尤其是第3个模型,在预测中很少见。
构建流程:数据划分策略为7:3;特征选择采用先单后多策略(即先做单因素,后做多因素);由于存在类别不均衡(约14%),作者采用调整决策阈值方法进行处理;主要的评估指标包括AUC、灵敏度、特异度、阳性预测值和阴性预测值;采用Delong检验对模型间性能进行差异性分析。
https://mp.weixin.qq.com/s/0_UETjiWdIiwxKV4koridg



--
FROM 59.41.66.*