汇总资料的单变量卡方拟合优度检验(Chi-square Goodness-of-fit Test)——SPSS软件实现

发布于 2023年1月8日 星期日 17:34:18 浏览:1872
原创不易,转载请注明来源,感谢!
附件下载:
1673170382-卡方拟合优度检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

卡方拟合优度检验(Chi-square Goodness-of-fit Test)是一种非参数检验方法,用于检验数据是否服从某个指定分布,是否与预期比例表现一致,只针对分类数据。本文介绍卡方拟合优度检验在SPSS软件中的实现过程。

关键词:SPSS; 卡方拟合优度检验; Chi-square goodness-of-fit test

卡方拟合优度检验的原理是通过计算实际频数与预期频数的差值,且将差值平方后求和得到卡方值,然后通过卡方值计算得到P值。实际频数与预期频数差值越大,卡方值越大,对应的P值越小。

一、案例介绍

某研究者在某市招募了104名志愿者,欲研究该市人群体型和饮食之间的关系。但在进行该项目之前,想知道招募的志愿者体型分布是否与该市总体人群一致。已知总体人群中有8%是偏瘦,50%是正常体型,27%为超重以及15%为肥胖。本案例中weight(体重)为多分类变量,测量尺度为“名义”,赋值为1=偏瘦、2=正常、3=超重、4=肥胖。freq(频数)为频数变量,测量尺度为“标度”。数据见图1 。本案例数据可在“附件下载”处下载。

图1

二、案例分析

   本研究中拟判断招募的志愿者体型分布是否与总体人群一致,可以使用卡方拟合优度检验,但需要先满足3个条件:

条件1:存在1个分类变量。本研究志愿者的体型变量是分类变量,该条件满足。

条件2:具有相互独立的观测值。本研究各志愿者的信息都是独立的,不会相互干扰。该条件满足。

条件3:样本量足够大,最小的样本量要求为分析中的任一预测频数大于5,该条件需通过软件分析后判断。

三、软件操作及结果解读

(一) 数据加权

χ2检验的数据录入可分为两种:第一种为频数资料,需要设置分组变量、观察变量和频数变量,该形式在进行χ2检验时较为常见,进行统计分析前需要进行数据加权。第二种为非频数资料,只有分组变量和观察变量两列,每一行为一个患者的数据,该形式是在SPSS软件中进行各种统计分析最常用的资料形式,进行χ2检验前不需要进行数据加权。

本案例为频数资料,需要先进行加权处理。

选择“数据”—“个案加权”(图2)。

图2

打开“加权个案”对话框(图3),选择“个案加权依据”,将freq选入“频率变量”框中,点击“确定”即可。

图3

数据加权后,再根据分析目的判断卡方拟合优度检验的类型。

一般来说,卡方拟合优度检验主要分为等比例(equal proportions)和自定义比例(unequal proportions)两种。等比例是指研究者假设志愿者有相等的可能性被分为任一种类。否则,研究者认为志愿者被分为某一类的可能性更高,就是自定义比例数据。

针对这两种情况,卡方拟合优度检验有不同的SPSS操作方法。本研究指定了总体人群体型分布的比例,属于自定义比例数据,但为了让读者更全面地了解该检验,此处分别介绍两种类型。

(二) 自定义比例卡方拟合优度检验

1. 软件操作

点击“分析”—“非参数检验”—“旧对话框”—“卡方”(图4)。

图4

在“卡方检验”对话框(图5)中,将weight选入“检验变量列表”;点击“期望值”栏中的“值”,依次输入总体人群的分布:8、50、27、15 (图6),点击“确定”即可。注意,此处一定要按照weight各水平的命名顺序依次输入对应的总体人群的分布比例。

图5
图6

2. 结果解读

    本研究共有104名观察对象,按照体型分为偏瘦、正常、超重、肥胖4类。期望频数的计算过程为:以体型正常为例,在总体人群中该体型人群应占50%。那么在这104名志愿者中,体型正常的应有104×50%=52名,其余期望频数计算方法相同。“体重”结果(图7)的第二列计算出了各水平的期望频数,可见最小期望频数为8.3>5,满足条件3。

志愿者体型的观测频数与预测频数并不相等,但本研究的数据残差值较小,提示志愿者的体型数据可能符合自定义比例分布。卡方拟合优度检验结果(图7)显示,χ2=2.384,P=0.497,可以认为这104名志愿者的体型分布情况与总体人群一致。

图7

(三) 等比例卡方拟合优度检验

1. 软件操作

 点击“分析”—“非参数检验”—“旧对话框”—“卡方”(图4)。打开“卡方检验”对话框(图8),将weight选入“检验变量列表”,点击“确定”即可。

图8

2. 结果解读

本研究中共有104名观察对象,按照体型分为偏瘦、正常、超重、肥胖4类。在等比例数据的假设下,可以认为观察对象有相等的可能性被分为任意一类。因此,每一水平的期望频数均为104/4=26>5满足条件3。卡方拟合优度检验结果(图9)显示,χ2=56.077,P<0.001,提示志愿者的体型数据不符合等比例分布。

图9

四、结论

本研究共招募104名志愿者,依据体型分类10名偏瘦,58名正常,23名超重,13名肥胖。采用卡方拟合优度检验判断这些志愿者的体型数据是否符合自定义比例分布。结果显示,最小预测频数为8.3,可以直接采用卡方拟合优度检验,χ2=2.384,P=0.497,提示本研究数据分布与指定数据分布一致,提示这104名志愿者的体型分布与总人群一致。

End
文章目录 沉浸式阅读