Friedman检验(The Friedman Non-parametric Repeated Measures ANOVA Test)——Python软件实现

2023年4月24日星期一发布于 20:15:42 浏览：2874

原创不易，转载请注明来源，感谢！

附件下载：

Friedman检验.zip 请勿重复点击，如无响应请耐心等待或稍后再试。

在前面文章中介绍了Friedman检验的假设检验理论，本篇文章将使用实例演示在Python软件中实现Friedman检验的操作步骤。

关键词：Python软件; 非参数检验; 秩和检验; Friedman检验; 重复测量非参数检验

一、案例介绍

8名受试对象在相同试验条件下分别接受A、B、C 3种不同频率振动的刺激，测量其反应率(%)，问3种频率振动刺激的反应率是否有差别？数据见图1。本案例数据可从“附件下载”处下载。

二、问题分析

本案例的分析目的是判断多组相关数据的差异，首先对3组数据进行正态性检验，若发现不符从正态分布，可以使用Friedman检验。Friedman检验可应用于多组配对或相关数据的秩转换非参数检验，但需要满足两个条件：

条件1：观察变量为连续变量或有序分类变量。本研究中反应率为连续变量，该条件满足。

条件2：观察变量具有3个及以上的分组，为配对设计，或各组之间存在相关性。本研究中3组数据均是对同一批研究对象所测量，该条件满足。

三、软件操作及结果解读

(一) 导入数据

import pandas as pd #导入pandas包
df = pd.read_csv('Friedman检验.csv')  #导入CSV数据
df  #查看数据

图1

在数据栏目中可以查看全部数据情况，数据集中共有4个变量和8个观察数据，4个变量分别代表被调查者的编号(ID)以及3种不同频率震动的刺激(A、B、C)。

(二) 适用条件判断

1. 软件操作

## 绘制Q-Q图 ##

import statsmodels.api as sm
import pylab
sm.qqplot(df['A'], line='s') #绘制A的qq图
pylab.show()
sm.qqplot(df['B'], line='s') #绘制B的qq图
pylab.show()
sm.qqplot(df['C'], line='s') #绘制C的qq图
pylab.show()

图2-1

图2-2

图2-3

## 正态性检验 ##

from scipy import stats #导入scipy包
shapiro_test1 = stats.shapiro(df.A)   # A的shapiro-Wilk正态性检验
print(shapiro_test1)
shapiro_test2 = stats.shapiro(df.B)   # B的shapiro-Wilk正态性检验
print(shapiro_test2)
shapiro_test3 = stats.shapiro(df.C)   # C的shapiro-Wilk正态性检验
print(shapiro_test3)

图3

2. 结果解读

Q-Q图 (图2-1、图2-2和图2-3) 显示3组散点偏离对角线较远，尤其是A、B两组数据，提示3组数据不服从正态分布；正态性检验结果 (图3) 显示A、B、C三组的P值分别为0.05988、0.03698和0.5969，前两组P值均<0.1，也提示两组数据不满足正态性条件。因此，本案例应使用Friedman检验比较3组反应率的差异。关于正态性检验的注意事项详见文章正态性假设检验(Normality Hypothesis Test)——SPSS软件实现（链接）。

(三) 整体检验

1. 统计描述

(1) 软件操作

## 描述性统计 ##

df.describe()

图4

(2) 结果解读

“describe (描述性分析)”运行结果 (图4) 提供了三组数据的“mean (均数)”、“std (标准差)”、“min (最小值)”、“25%(下四分位数)”、“50% (中位数)”、“75% (上四分位数)”和“max (最大值)”。可知，受试者对A频率振动的反应率为8.750% (P₂₅~P₇₅：8.300%~9.100%)；对B频率振动的反应率为9.050% (P₂₅~P₇₅：8.575%~9.650%)；对C频率振动的反应率为9.700% (P₂₅~P₇₅：9.350%~10.175%)。

2. 整体检验

(1) 软件操作

## 统计推断 ##

from scipy import stats
df_A = df['A']
df_B = df['B']
df_C = df['C']
stats.friedmanchisquare(df_A, df_B, df_C)#friedman检验

图5

(2) 结果解读

Friedman检验结果(图5)显示，χ²=7.4, P = 0.02472，差异有统计学意义(P < 0.05)。即3种频率振动刺激的反应率总体比较差别具有统计学意义(P < 0.05) (至少存在两组不相同)。

(四) 事后检验(两两比较)

虽然得到了“3种频率振动刺激的反应率总体比较差别具有统计学意义”的结论，但若要清楚了解到底是哪些频率刺激的反应率不同，则需要进一步进行两两比较。

1. 软件操作

## 事后检验 ##

import numpy as np
import scikit_posthocs as sp
data = np.array([df_A, df_B, df_C])
sp.posthoc_nemenyi_friedman(data.T)

注：若未安装“scikit_posthocs”包，需要先安装该包，代码为：

! pip install scikit_posthocs

图6

2. 结果解读

两两比较结果(图6)显示，频率A和频率B的差异无统计学意义(P=0.499)，频率A和频率C的差异有统计学意义(P=0.024)，频率B和频率C的差异尚无统计学意义(P=0.291)。

四、结论

本案例欲比较在3种不同频率振动(A、B、C)的刺激下受试者的反应率(%)是否存在差异。通过绘制Q-Q图和Shapiro-Wilk检验，提示数据不服从正态分布，故采用Friedman检验对数据进行分析。

结果显示，受试者对3种不同频率振动 (A、B、C) 的刺激反应率(%)分别为8.750% (P₂₅~P₇₅：8.300%~9.100%)、9.050% (P₂₅~P₇₅：8.575%~9.650%)、9.700% (P₂₅~P₇₅：9.350%~10.175%)，差异有统计学意义(χ²=7.4，P = 0.02472)。进一步两两比较显示，频率A和频率B的差异无统计学意义(P=0.499)，频率A和频率C的差异有统计学意义(P=0.024)，频率B和频率C的差异尚无统计学意义(P=0.291)。

我要纠错

End

Kruskal-Wallis H检验(Kruskal-Wallis H Test)——Python软件实现