R×C 卡方检验(R×C χ² Test)——Stata软件实现

发布于 2022年1月9日 星期日 16:45:16 浏览:9206
原创不易,转载请注明来源,感谢!
附件下载:
R×C卡方检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

在前面文章中介绍了R×C χ2检验(R×C χ2 Test)理论,本篇文章将使用实例演示在Stata软件中实现R×C χ2检验(R×C χ2 Test)的操作步骤。

关键词:Stata; 列联表卡方检验; 多个率比较; 关联性检验; 列联系数

一、案例介绍

某科室回顾性研究推拿疗法(Manipulation,用“1”表示)、药物疗法(Drug,用“2”表示)和针灸疗法(Acupuncture,用“3”表示)3种疗法治疗腱鞘炎的疗效,数据见图1。本文案例可从“附件下载”处下载。问3种疗法的有效率有无差别以及疗法与效果的关联[分为有效(Effective,用“1”表示)和无效(Noneffective,用“2”表示)]?

图1

二、问题分析

本案例的分析目的是比较三种疗法治疗腱鞘炎的疗效,也就是比较三组患者有效率的差异,同时分析两者的关联性。可以采用R×C χ2检验。但需要满足四个条件:

条件1:分组变量和观察变量均为分类变量,至少有一个无序多分类变量,且观察变量不是有序多分类变量。本案例的行变量疗法为无序三分类变量,列变量疗效为二分类变量,本案例数据满足该条件。

条件2:观测值之间相互独立,本案例的观测值均是相互独立,本案例数据满足该条件。

条件3:样本量足够大,使得任一单元格内的期望频数均≥5。该条件需要通过软件分析来判断。

条件4:两个变量是同一随机样本的两种属性,本案例是回顾性分析腱鞘炎患者采用的疗法与效果的关联,所采用的疗法与效果均为已发生的事件,可以算作两种属性,该条件满足。

三、软件操作及结果解读

(一) 适用条件判断

本案例数据满足条件1、2和4,条件3的判断详见统计描述及推断。

(二) 统计描述及推断

1. 整体检验

(1) 软件操作
*R×C χ2检验*
tabi 199 7\164 18\118 26,expected row all exact
图2
(2) 结果解读

图2给出了每个疗法的观察频数、期望频数、有效率、无效率等。可知,推拿疗法的有效率为96.60%、药物疗法的有效率为90.11%、针灸疗法的有效率为81.94%;总频数为532,每个格子的期望频数均大于5。

同时,图2给出了R×C χ2检验的统计量、自由度和P值。由图2中的总频数和每个格子的期望频数可知该案例数据满足条件3,假设检验的P值以第一行的Pearson χ2检验或Fisher's确切概率法为准,即三种疗法有效率的差异有统计学意义(χ2=21.0377,P<0.001)。

图2给出了“Kendall's tau-b (肯德尔等级相关系数)”和“Cramer’s V (Cramer V系数)”“gamma(γ值)”。结果表明,疗法与腱鞘炎的治疗效果存在显著的正关联,且为弱相关(Cramer’s V=0.1989;gamma=0.5212;Kendall's tau-b =0.1864)。

2. 事后检验(两两比较)

对于R×C χ2检验,其结果只能说明各组的率或构成比整体上有无统计学差异,并不能说明哪两组之间的差异是否有统计学意义。因此,需要进行事后检验,即事后两两比较。在Stata中缺少直接进行事后两两比较的选项,可以通过χ2分割法进行两两比较,即将三组率或构成比的比较拆分成多个两组率或构成比的比较;同时校正检验水准α'=α/m,其中m=k(k-1)/2,k为分组数。本案例为3个分组,拆分成3个两组率的比较;取α=0.05,则α'=0.05/3=0.017。操作可以在上述步骤的基础上进行,其他选项不变,只需要进行分组的筛选。

(1) 软件操作

①*对推拿组和药物组进行比较*

tabi 199 7\164 18, expected row all exact

图3

②*对药物组和针灸组进行比较*

tabi 164 18\118 26, expected row all exact

图4

③*对推拿组和针灸组进行比较*

tabi 199 7\118 26, expected row all exact

图5
(2) 结果解读

对于两个分类变量之间的关联程度,可以用φ系数(phi coefficient)、Cramer V系数(Cramer’s V coefficient)和Pearson列联系数(Contingency coefficient)来描述。上述三个系数越接近0,说明关联性越弱;越接近1,说明关联性越强。当系数<0.1时为极弱相关,0.1~0.3时为弱相关,0.3~0.5时为中等相关,>0.5时为强相关。

图3、图4、图5分别给出了推拿组与药物组、药物组与针灸组、推拿组与针灸组三个分组进行两两比较时形成的交叉表,相应的观察频数、期望频数、有效率、无效率。以及有效率的比较结果,P值分别为0.009、0.032、<0.001。可知,按照α'=0.017的检验水准,推拿组与药物组有效率的差异有统计学意义,药物组与针灸组有效率的差异无统计学意义,推拿组与针灸组有效率的差异有统计学意义。

同时,图3、图4、图5给出了推拿组与药物组、药物组与针灸组、推拿组与针灸组进行两两比较的关联系数,可知其的Cramer V系数分别为0.1320、0.1187、0.2468,关联强度均较弱。

四、结论

本研究采用R×C χ2检验(R×C χ2 Test)对三种疗法治疗腱鞘炎的有效率进行比较,结果显示推拿疗法的有效率为96.60%、药物疗法的有效率为90.11%、针灸疗法的有效率为81.94%,三种疗法有效率的差异有统计学意义(χ2=21.038,P<0.001),表明三种疗法的有效率不全相同;疗法与效果的关联性为显著正相关,但为弱相关(Cramer’s V=0.1989;gamma=0.5212;Kendall's tau-b =0.1864)。

采用χ2分割法,按照α'=0.017的检验水准进行两两比较,发现推拿组与药物组有效率的差异有统计学意义(P=0.009),药物组与针灸组有效率的差异无统计学意义(P=0.032),推拿组与针灸组有效率的差异有统计学意义(P<0.001),Cramer V系数分别为0.1320、0.1187、0.2468,关联强度均较弱。

End
文章目录 沉浸式阅读