R×C χ²检验(R×C χ² Test) ——jamovi软件实现

发布于 2023年2月10日 星期五 11:37:29 浏览:950
原创不易,转载请注明来源,感谢!
附件下载:
R×C卡方检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了“R×C χ²检验(R×C χ² Test)的假设检验理论”,本篇文章将实例演示在jamovi软件中实现R×C χ²检验的操作步骤。

关键词:jamovi; 列联表卡方检验; 多个率比较; 关联性检验; 列联系数

一、案例介绍

某科室回顾性研究推拿疗法、药物疗法和针灸疗法3种疗法治疗腱鞘炎的疗效,问3种疗法的有效率有无差别以及疗法与效果的关联?数据见图1,本案例数据可从“附件下载”处下载。

图1

二、问题分析

本案例的分析目的是比较3种疗法治疗腱鞘炎的疗效,也就是比较3组患者有效率的差异,同时分析两者的关联性。可以采用R×C χ2检验。但需要满足4个条件:

条件1:分组变量和观察变量均为分类变量,至少有一个无序多分类变量,且观察变量不是有序多分类变量。本案例的疗法为无序三分类变量,疗效为二分类变量,满足该条件。

条件2:观测值之间相互独立。本案例的观测值均是相互独立,满足该条件。

条件3:样本量足够大,要求每个格子内的期望频数(理论频数)T均>1,且1≤T<5的格子数不宜多于总格子数的1/5。

条件4:两个变量是同一随机样本的两种属性。本案例是回顾性分析腱鞘炎患者采用的疗法与效果的关联,所采用的疗法与效果均为已发生的事件,可以算作两种属性,满足该条件。

R×C χ2检验要求每个格子内的期望频数;如果期望频数太小,最好的办法是增加样本量以增加期望频数;若增加样本量有困难,则可使用Fisher确切概率法;若分组较多,可以合理的合并若干组,以增加期望频数。

三、软件操作及结果解读

(一) 适用条件判断

本案例数据满足条件1、2和4,条件3的判断详见统计描述及推断。

(二) 统计描述及推断

1. 整体检验

(1) 软件操作

①选择“分析”—“频数”—“独立样本χ2关联检验”(图2)。

图2

②将变量“疗法”“疗效”“频数”分别选入右侧“行”“列”“计数(可选)”框内(图3)。

图3

③在“单元格”下的“计数”中勾选“实际频数”和“理论频数”,在“百分比”中勾选“行”(图4),结果见图5、图6。

图4
图5
图6

④在“统计”的“检验”中勾选“χ2”“连续校正χ2”“Fisher精确检验”;在“名义”中勾选“列联系数”和“φ系数和Cramer’s V系数)”(图7),结果见图8。

图7
图8
(2) 结果解读

“列联表”结果(图5)给出了每个疗法的实际频数、理论频数、有效率、无效率等。可知,推拿疗法的有效率为96.6%、药物疗法的有效率为90.1%、针灸疗法的有效率为81.9%;总频数为532,每个格子的期望频数均大于5。

“χ2检验”结果(图6)给出了R×C χ2检验的统计量、自由度和P值。由“列联表”结果(图5)中的总频数和每个格子的期望频数可知该案例数据满足条件3,假设检验的P值以第一行的Pearson χ2检验或Fisher's精确检验结果为准,即3种疗法的有效率的差异有统计学意义(χ2=21.038P<0.001)。

“名义”结果(图8)给出了“列联系数”和“Cramer’s V系数”。结果表明,疗法与腱鞘炎的治疗效果为弱相关(列联系数=0.195,Cramer’s V系数=0.199)。

对于两个分类变量的相关(关联性)可以采用列联表的条件分布与列联系数进行描述,所分析的两个分类变量应为同一随机样本的两个属性,与2×2 χ2检验中两独立样本不同。

对于两个分类变量之间的关联程度,可以用φ系数(phi coefficient)、Cramer’s V系数和Pearson列联系数来描述。上述3个系数越接近0,说明关联性越弱;越接近1,说明关联性越强。当系数<0.1时为极弱相关,0.1~0.3时为弱相关,0.3~0.5时为中等相关,>0.5时为强相关。φ系数只适用于四格表数据,Cramer V系数和列联系数适用于多行多列数据。当数据中只有2个二分量变量时,φ系数与Cramer’s V系数的结果相同。由于列联系数受到行数的影响,最大值\sqrt{(k-1) / k})可能小于1,因此为达到0~1的度量尺度,多行多列数据的关联性建议用Cramer’s V系数描述(范围0~1)。

2. 事后检验(两两比较)

对于R×C χ2检验,其结果只能说明各组的率或构成比整体上差异有无统计学意义,并不能说明哪两组之间的差异是否有统计学意义。因此,需要进行事后检验,即事后两两比较。在jamovi中缺少直接进行事后两两比较的选项,可以通过χ2分割法进行两两比较,即将3组率或构成比的比较拆分成多个两组率或构成比的比较;同时校正检验水准α'=α/m,其中m=k(k-1)/2,k为分组数。本案例为3个分组,拆分成3个两组率的比较;取α=0.05,则α'=0.05/3=0.017。操作可以在上述步骤的基础上进行,其他选项不变,只需要进行分组的筛选。

(1) 软件操作

①选择“数据”—“筛选”,在公式框内键入“疗法<3”,即对推拿组和药物组的有效率进行比较(图9),结果见图10~图12。

图9
图10
图11
图12

②对筛选框内的公式进行更改,改为“Theray>1”,即对药物组和针灸组进行比较(图13),结果见图14~图16。

图13
图14
图15
图16

③将筛选框内的公式改为“Therapy!=2”,对推拿组和针灸组进行比较(图17),结果见图18~图20。

图17
图18
图19
图20
(2) 结果解读

3个分组两两比较所形成的列联表(图10、图14和图18)给出了相应的观察频数、期望频数、有效率、无效率等。

“χ²检验”结果(图11、图15和图19)分别给出了推拿组与药物组、药物组与针灸组、推拿组与针灸组有效率的比较结果,P值分别为0.009、0.032、<0.001。可知,按照α'=0.017的检验水准,推拿组与药物组和推拿组与针灸组的有效率比较,差异有统计学意义;药物组与针灸组的有效率比较,差异无统计学意义。

“名义”(图12、图16和图20)给出了推拿组与药物组、药物组与针灸组、推拿组与针灸组进行两两比较的关联系数,可知其的关联系数φ分别为0.132、0.119、0.247,关联强度均较弱。

四、结论

本研究采用R×C χ2检验对3种疗法治疗腱鞘炎的有效率进行比较,结果显示推拿疗法的有效率为96.6%、药物疗法的有效率为90.1%、针灸疗法的有效率为81.9%,3种疗法有效率的差异有统计学意义(χ2=21.038P<0.001),表明3种疗法的有效率不全相同;疗法与效果的关联性为弱相关(列联系数=0.195,Cramer’s V=0.199)。

采用χ2分割法,按照α'=0.017的检验水准进行两两比较,发现推拿组与药物组有效率的差异有统计学意义(P=0.009),药物组与针灸组有效率的差异无统计学意义(P=0.032),推拿组与针灸组有效率的差异有统计学意义(P<0.001),关联系数φ分别为0.132、0.119、0.247,关联强度均较弱。

End
文章目录 沉浸式阅读