R×C χ²检验(R×C χ² Test) ——jamovi软件实现

2023年2月10日星期五发布于 11:37:29 浏览：2867

原创不易，转载请注明来源，感谢！

附件下载：

R×C卡方检验.zip 请勿重复点击，如无响应请耐心等待或稍后再试。

在前面文章中介绍了“R×C χ²检验(R×C χ² Test)的假设检验理论”，本篇文章将实例演示在jamovi软件中实现R×C χ²检验的操作步骤。

关键词：jamovi; 列联表卡方检验; 多个率比较; 关联性检验; 列联系数

一、案例介绍

某科室回顾性研究推拿疗法、药物疗法和针灸疗法3种疗法治疗腱鞘炎的疗效，问3种疗法的有效率有无差别以及疗法与效果的关联？数据见图1，本案例数据可从“附件下载”处下载。

二、问题分析

本案例的分析目的是比较3种疗法治疗腱鞘炎的疗效，也就是比较3组患者有效率的差异，同时分析两者的关联性。可以采用R×C χ²检验。但需要满足4个条件：

条件1：分组变量和观察变量均为分类变量，至少有一个无序多分类变量，且观察变量不是有序多分类变量。本案例的疗法为无序三分类变量，疗效为二分类变量，满足该条件。

条件2：观测值之间相互独立。本案例的观测值均是相互独立，满足该条件。

条件3：样本量足够大，要求每个格子内的期望频数(理论频数)T均>1，且1≤T<5的格子数不宜多于总格子数的1/5。

条件4：两个变量是同一随机样本的两种属性。本案例是回顾性分析腱鞘炎患者采用的疗法与效果的关联，所采用的疗法与效果均为已发生的事件，可以算作两种属性，满足该条件。

R×C χ²检验要求每个格子内的期望频数；如果期望频数太小，最好的办法是增加样本量以增加期望频数；若增加样本量有困难，则可使用Fisher确切概率法；若分组较多，可以合理的合并若干组，以增加期望频数。

三、软件操作及结果解读

(一) 适用条件判断

本案例数据满足条件1、2和4，条件3的判断详见统计描述及推断。

(二) 统计描述及推断

1. 整体检验

(1) 软件操作

①选择“分析”—“频数”—“独立样本χ²关联检验”(图2)。

②将变量“疗法”“疗效”“频数”分别选入右侧“行”“列”“计数(可选)”框内(图3)。

③在“单元格”下的“计数”中勾选“实际频数”和“理论频数”，在“百分比”中勾选“行”(图4)，结果见图5、图6。

④在“统计”的“检验”中勾选“χ²”“连续校正χ²”“Fisher精确检验”；在“名义”中勾选“列联系数”和“φ系数和Cramer’s V系数)”(图7)，结果见图8。

(2) 结果解读

“列联表”结果(图5)给出了每个疗法的实际频数、理论频数、有效率、无效率等。可知，推拿疗法的有效率为96.6%、药物疗法的有效率为90.1%、针灸疗法的有效率为81.9%；总频数为532，每个格子的期望频数均大于5。

“χ²检验”结果(图6)给出了R×C χ²检验的统计量、自由度和P值。由“列联表”结果(图5)中的总频数和每个格子的期望频数可知该案例数据满足条件3，假设检验的P值以第一行的Pearson χ²检验或Fisher's精确检验结果为准，即3种疗法的有效率的差异有统计学意义(χ²=21.038，P<0.001)。

“名义”结果(图8)给出了“列联系数”和“Cramer’s V系数”。结果表明，疗法与腱鞘炎的治疗效果为弱相关(列联系数=0.195，Cramer’s V系数=0.199)。

对于两个分类变量的相关(关联性)可以采用列联表的条件分布与列联系数进行描述，所分析的两个分类变量应为同一随机样本的两个属性，与2×2 χ²检验中两独立样本不同。

对于两个分类变量之间的关联程度，可以用φ系数(phi coefficient)、Cramer’s V系数和Pearson列联系数来描述。上述3个系数越接近0，说明关联性越弱；越接近1，说明关联性越强。当系数<0.1时为极弱相关，0.1~0.3时为弱相关，0.3~0.5时为中等相关，>0.5时为强相关。φ系数只适用于四格表数据，Cramer V系数和列联系数适用于多行多列数据。当数据中只有2个二分量变量时，φ系数与Cramer’s V系数的结果相同。由于列联系数受到行数的影响，最大值\sqrt{(k-1) / k})可能小于1，因此为达到0~1的度量尺度，多行多列数据的关联性建议用Cramer’s V系数描述(范围0~1)。

2. 事后检验(两两比较)

对于R×C χ²检验，其结果只能说明各组的率或构成比整体上差异有无统计学意义，并不能说明哪两组之间的差异是否有统计学意义。因此，需要进行事后检验，即事后两两比较。在jamovi中缺少直接进行事后两两比较的选项，可以通过χ²分割法进行两两比较，即将3组率或构成比的比较拆分成多个两组率或构成比的比较；同时校正检验水准α'=α/m，其中m=k(k-1)/2，k为分组数。本案例为3个分组，拆分成3个两组率的比较；取α=0.05，则α'=0.05/3=0.017。操作可以在上述步骤的基础上进行，其他选项不变，只需要进行分组的筛选。

(1) 软件操作

①选择“数据”—“筛选”，在公式框内键入“疗法<3”，即对推拿组和药物组的有效率进行比较(图9)，结果见图10~图12。

②对筛选框内的公式进行更改，改为“Theray>1”,即对药物组和针灸组进行比较(图13)，结果见图14~图16。

③将筛选框内的公式改为“Therapy!=2”，对推拿组和针灸组进行比较(图17)，结果见图18~图20。

(2) 结果解读

3个分组两两比较所形成的列联表(图10、图14和图18)给出了相应的观察频数、期望频数、有效率、无效率等。

“χ²检验”结果(图11、图15和图19)分别给出了推拿组与药物组、药物组与针灸组、推拿组与针灸组有效率的比较结果，P值分别为0.009、0.032、<0.001。可知，按照α'=0.017的检验水准，推拿组与药物组和推拿组与针灸组的有效率比较，差异有统计学意义；药物组与针灸组的有效率比较，差异无统计学意义。

“名义”(图12、图16和图20)给出了推拿组与药物组、药物组与针灸组、推拿组与针灸组进行两两比较的关联系数，可知其的关联系数φ分别为0.132、0.119、0.247，关联强度均较弱。

四、结论

本研究采用R×C χ²检验对3种疗法治疗腱鞘炎的有效率进行比较，结果显示推拿疗法的有效率为96.6%、药物疗法的有效率为90.1%、针灸疗法的有效率为81.9%，3种疗法有效率的差异有统计学意义(χ²=21.038，P<0.001)，表明3种疗法的有效率不全相同；疗法与效果的关联性为弱相关(列联系数=0.195，Cramer’s V=0.199)。

采用χ²分割法，按照α'=0.017的检验水准进行两两比较，发现推拿组与药物组有效率的差异有统计学意义(P=0.009)，药物组与针灸组有效率的差异无统计学意义(P=0.032)，推拿组与针灸组有效率的差异有统计学意义(P<0.001)，关联系数φ分别为0.132、0.119、0.247，关联强度均较弱。

我要纠错

End

比值比(Odds Ratio) ——jamovi软件实现