当前位置:首页 > 舆论纲要 > 正文内容

论文摘要:纵向数据线性模型的删除影响诊断

免费论文2年前 (2022-01-23)舆论纲要86

任何统计模型通常都是由分析某个实际问题所产生的数据而建立的。人们总是希望用该模型去描述这个实际问题。但是因为实际问题的复杂性及数据所固有的误差,任何统计模型都不可能是完美的,需要在对模型和数据的关系的研究中不断予以改进和完善。我们需要发现数据和模型之间的不相适应,寻找出那些对模型有强影响的数据。为此已形成了各种各样的诊断方法,其中最常用、最经典的方法就是COOK于1977年提出的“点(case)删除”诊断方法。“点删除”诊断方法成功地应用于许多常用的统计模型,但是它主要适用于截面数据,不能直接应用于纵向数据。1997年,Banerjee和Frees对纵向数据线性模型提出了基于“个体(subject)删除”的影响诊断方法,从而推广了“点删除”影响诊断方法。 但是,我们注意到,仅仅考虑单个个体对模型参数估计的影响是不够全面的。因此,本论文研究了纵向数据线性模型中多个个体删除时的联合影响和条件影响,从而推广了“个体删除”的影响诊断方法。我们主要针对只具有纯序列相关的纵向数据线性模型,给出多个个体删除时的联合影响诊断统计量和条件影响诊断统计量,并推导出这些统计量相对简单的计算式。在研究多个个体的联合影响时,我们讨论了常见的淹没(swamping)效应,给出了改进的判别因子。在研究多个个体的条件影响时,我们讨论了常见的掩盖(masking)效应,给出了改进的判别因子。此外,只具有纯序列相关的纵向数据线性模型中的相关结论可以平行推广到同时存在随机效应及序列相关的纵向数据线性模型中。最后,对美国个人所得税申报数据运用删除多个个体的方法进行诊断。我们发现了单个个体删除诊断时所不能发现的新影响点,很好的验证了删除多个个体的诊断方法对删除单个个体诊断方法的补充作用,并说明了删除多个个体在寻找影响个体时的有效性,扩大了删除方法的应用领域。

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。