R语言mgcv包时间序列分析在空气污染与健康领域的应用(3)---模型自由度选择
原创 小娟娟123 零基础说科研 2021-12-07 09:30
https://mp.weixin.qq.com/s?__biz=MzI1NjM3NTE1NQ==&mid=2247485367&idx=1&sn=3d212a5134c7bad26023b73bc41213e7&chksm=ea26e7abdd516ebdf9675cc5a0603be0a8c268aaf822e488e27eab34982d5f02e674f074dcdb&scene=178&cur_album_id=2139387629899956224#rd
广 义 相 加 模 型 ( generalized additional model,GAM)是对传统广义线性模型的非参数拓展,可有效处理解释变量与效应变量间复杂的非线性关系。GAM 目前已广泛应用于空气污染流行病学研究中,主要用于分析空气污染或气象因素对人群健康事件(如发病、住院和死亡)的急性损害效应。
在基础模型构建之后,最重要的工作就是确定模型中非参数平滑函数的自由度 df。在广义相加模型中,由于平滑函数的自由度对模型的参数估计和模型稳定性有一定影响。因而,选择合适的自由度对模型构建有重大意义,通常根据以下评判准则进行设定:
①基于生物学知识和专家经验(包括敏感性分析)设置固定的自由度;
②赤池信息准则 (Akaike information criterion,AIC),依据 AIC 最小选择自由度。
③依据残差独立原则,通过最小化模型残差自相关来选择自由度。实际工作中,我们根据基础模型残差的偏自相关(PACF)绝对值之和最小选取自由度。
④依据广义交叉验证 (generalized cross-valida-tion,GCV)预测污染物浓度的最佳模型(GCV-PM 10 )选择自由度,这种方法是最小化误差均方过程的一种简化。
--
FROM 59.41.66.*