关键词:jamovi; t检验; 配对样本t检验
一、案例介绍
为检测肌肉组织中某生化指标(X)的含量,分别使用A、B两种方法检测17只小白鼠肌肉组织中生化指标(X)的含量,试问两种方法检测的结果是否有差异?对数据的变量进行标签赋值后部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较两种检测方法对同一批样本检测的结果是否存在差异,由于检测的指标是计量资料,可以使用配对样本t检验。但需要满足5个条件:
条件1:观察变量为连续变量。本研究中的生化指标(X)含量为连续变量,该条件满足。
条件2:观察变量为配对设计或具有相关性,即不满足独立性。本研究中,两组数据均是对同一批研究对象测量所得,因此属于相关样本,不满足独立性。该条件满足。
条件3:观察变量可分为2组,本研究中分为A方法和B方法两组,该条件满足。
条件4:观察变量不存在显著的异常值,该条件需要通过软件分析后判断。
条件5:两个配对(相关)组别间观察变量的差值服从正态或近似正态分布,该条件需要通过软件分析后判断。
三、软件操作及结果解读
(一) 适用条件判断
1. 条件4判断(异常值判断)
(1) 软件操作
① 选择“分析”—“探索”—“描述”,将观察变量“A方法”和“B方法”都选入右侧“变量”框(图2)。
② 在“统计”下的“样本量”中勾选“个案数”、“缺失”,在“集中趋势”中勾选“均数”、“中位数”,在“离散趋势”中勾选“标准差”、“最小值”和“最大值”(图3),结果如图4所示。
③ 在“绘图”下的“箱线图”中勾选“箱线图”和“数据”,“数据”下拉菜单中选择“散点”(图5),结果如图6-1—图6-2所示。
(2) 结果解读
图4“描述”表格中,列出了观察变量的最小值和最大值分别为0.275和0.399,尚无专业依据为异常值;图6-1和图6-2的箱线图也未提示存在异常值。综上,本案例未发现需要处理的异常值,满足条件4。
2. 条件5判断(正态性检验)
(1) 软件操作
本案例中需要判断差值服从正态或近似正态分布。
① 选择“分析”—“ T检验”—“配对样本T检验”,将“A方法”和“B方法”依次选入右侧“配对变量”框(图7)。
② 在“适用条件判断”中勾选“正态性检验”和“Q-Q图”(图8),结果如图9和图10所示。
(2) 结果解读
图9“正态性检验(Shapiro-Wilk)”结果显示P=0.246>0.1,提示数据满足正态性条件;图10 Q-Q图上散点基本围绕对角线分布,也提示数据呈正态分布。综上,本案例满足条件5。
(二) 统计描述及推断
1. 软件操作
选择“分析”—“T检验”—“配对样本T检验”,按照图11勾选相应选项。
2. 结果解读
(1) 统计描述
图12的“描述”表格中提供了研究案例的“个案数”、“均值”、“中位数”、“标准差”和“标准误”。可知,A方法组含量为0.341±0.035,B方法组含量为0.305±0.023。图13为两种方法检测的生化指标(X)含量的分布图。两组含量存在差异,但还需要依据统计学检验的结果进行判断。
(2) 统计推断
图14“配对样本T检验”表格中提供了统计推断后的“统计量”、“自由度”、P值、“均值差”及其“95%置信区间”、“均数差标准误”、“效应量”及95%置信区间。
可知A方法检测结果比B方法平均高0.036,95%置信区间为0.025~0.047;差异有统计学意义(t=7.085,P<0.001)。Cohen's d为1.718,95%置信区间为0.950~2.465,为高效应。
(三) 相关性分析
(1) 软件操作
① 选择“分析”—“探索”—“Scatterplot (散点图)”,将“A方法”选入“X-Axis (X轴)”框,将“B方法”选入“Y-Axis (Y轴)”框。
② 在“Regression Line (回归线)”中勾选“Linear (线性)”和“Standard error (标准误)”(图15),结果如图16所示。
③选择“分析”—“回归”—“相关矩阵”,将“A方法”和“B方法”均选入右框,在“相关系数”中勾选“皮尔森系数”,“附加选项”中勾选“报告P值”(图17),结果如图18所示。
(2) 结果解读
图16的散点图提示,两组之间存在线性相关。图18 “相关矩阵”分析结果可知,两组Pearson相关系数r = 0.804,P < 0.001,提示两组数据之间存在相关性。表明A、B两种方法之间的差异具有较好的稳定性。
四、结论
本研究采用配对样本t检验判断A、B两种方法检测肌肉组织中生化指标(X)的含量是否有差异。通过专业知识判断,数据不存在需要处理的异常值;通过绘制Q-Q图和Shapiro-Wilk检验,提示两组数据差值满足正态分布。
结果显示,A、B两种方法检测肌肉组织中生化指标(X)的含量分别为0.341±0.035和0.305±0.023,A方法平均值比B方法高0.036 (95%置信区间:0.025~0.047),差异有统计学意义(t=7.085,P<0.001);Cohen's d效应量为1.718 (95%置信区间:0.950~2.465),差异较大。两组Pearson相关系数r = 0.804,P < 0.001;表明A、B两种方法之间的差异具有较好的稳定性。。因此,本案例分析表明,使用A方法检测肌肉组织中生化指标(X)的含量通常会比B方法检测结果值要高。
五、知识小贴士
(一) 配对设计
临床研究过程中常见的两组配对设计包括:
- 同一组研究对象身体不同部位配对,如癌组织与癌旁组织某种基因的表达、左手和右手的血压比较。
- 条件配对,如在同一窝老鼠中选择性别和体重相同的2只作为一个对子,组成多个这样的对子;再将每个对子中的2只老鼠随机分配到2个处理组中去,然后比较两种处理方法的效果。
- 同一批标本不同检测方法配对,如同一批血液,被分成2份,分别用两种方法检测某种生化指标的含量(本案例属于该种类型)。
- 还有一类特殊的研究设计,同一组研究对象干预前后配对,如同一组病人使用降血糖药物前后空腹血糖值的比较。对于这类设计,尽管可使用配对样本t检验进行数据分析,但严格来说并不属于配对设计,而是属于干预前后的重复测量设计。
(二) 相关性分析
相关性的计算是为了验证配对数据的一致性,可以说明研究因素作用的稳定性或一致性,可能存在四种情况。
- 相关性检验与配对t检验的P值均<0.05,说明数据一致性较好,差异有统计学意义,而且差异的产生就是研究因素作用的结果。
- 相关性检验P>0.05,配对t检验的P<0.05,说明两组数据间存在差异,但对子间均数差异变化不一致,均数差异可能还受其他因素的影响。
- 相关性检验P<0.05,但配对t检验的P>0.05,说明数据变化有一致性,但均数差异不显著,即研究因素未发挥作用。
- 相关性检验与配对t检验的P值均>0.05,说明数据在两组间不具备一致性,且差异也无统计学意义。
六、分析小技巧
- 本案例中使用两组数值差值开展单样本t检验,其结果与配对样本t检验结果完全一致。
- 对于干预前后配对和部位配对研究,也可使用重复测量方差分析实现研究目标。