Friedman M检验(The Friedman Non-parametric Repeated Measures ANOVA Test)——理论介绍

发布于 2021年10月21日 星期四 23:23:14 浏览:13905
原创不易,转载请注明来源,感谢!

Friedman M检验(Friedman M Test),用于推断随机区组设计的多个相关样本所来自的多个总体分布位置是否有差别。检验假设H0和备择假设H1与多个独立样本比较的Kruskal-Wallis H检验相同。随区组设计(Randomized Block Design)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响实验结果的非处理因素(如患者的性别、体重、年龄、职业、病情、病程等)将试验对象配成区组,再分别将各区组内的试验对象随机分配到处理因素的不同水平组。

关键词:非参数检验; 秩和检验; Friedman检验; 重复测量非参数检验

一、适用条件

条件1:观察变量为非(近似)正态的连续变量或有序分类变量。

条件2:观察变量具有3个及以上的分组,为配伍组设计,或各组之间存在相关性。

二、统计量计算

(一) 多个相关样本比较的Friedman M检验

1. M值法

M值法是指对数据编秩计算后,通过(M界值表)确定P值,做出统计推断。

(1) 检验统计量M值的计算

随机区组设计的区组个数用n表示,相关组别个数(等于研究因素的水平个数)用g表示,因此每个组别例数为n,总例数N=ng

①将每个区组数据由小到大编秩,遇数据相等者取平均秩;②计算各组别的秩和Ri,平均秩和为 \( \bar{R}=n(g+1) / 2 \) ;③按下式求M值。

\( M=\sum\left(R_{i}-\bar{R}\right)^{2}=\sum R_{i}^{2}-n^{2} g(g+1)^{2} / 4 \)

(2) 确定P值,做出统计推断

 当n≤15和g≤15时,查(M界值表),确定P值,作出推断结论。

(3) M界值表的制作原理

为简单起见,假定区组个数n=4,相关样本个数g=3,每个区组的秩为1,2,3。第一组样本、第二组样本和第三组样本在每个区组取秩的排列情况有3!=6种(即123,132,213,231,312,321),在4个区组取秩的排列组合情况有64=1296种。对3个相关样本取秩的每种排列组合情况,先求3个样本的秩和R1R2R3,再用上述公式计算M,就有1296个 M ,最后归纳整理即得n =4和 g=3时 M 的概率分布。

M 的概率分布是偏态的非连续分布。g个相关样本的秩和R1R2,…,Rg相等时,M 为最小值0; g个相关样本的秩和为1n,2n,…,gn 时,根据公式有M取最大值n2(g3-g)/12。R1R2R3的差别越大,M值越大。根据M的概率分布,可确定不同概率水平(如0.05,0.01)下M的上侧界值。如果H0成立,M 值越小,P值越大。

2. χ²近似法

(1) 检验统计量 χ² 值的计算

n>15或g>15时,超出(M界值表)的范围,可用χ²近似法,按下式计算χ²值。实际上,当g>4,或者g=4且n>5,或者g=3且n>9时就可用下列近似公式。

\( \chi^{2}=\frac{12 M}{n g(g+1) C} \) \( C=1-\frac{\sum\left(t_{j}^{3}-t_{j}\right)}{n\left(g^{3}-g\right)} \) \( v=g-1 \)

式中,C为校正系数,当相同秩次较多时,需要进行校正。(j=1,2,…)为按区组而言的第j个相同秩次的个数。若相同秩次个数少,C近似等于1,也可不校正。

(2) 确定P值,做出统计推断

根据自由度v=g-1,查(χ²界值表),确定P值,作出推断结论。

(3) χ²近似法的原理

设有 n 个区组, g 个相关样本,每个区组的秩为i=1,2,…, gi的均数和方差为µi=(g+1)/2, \(\sigma_{i}^{2} \)=g(g+1)/12 。故得 g个相关样本的n个区组秩和Ri的均数和方差: \( \mu_{R_{i}}=\bar{R}=n(g+1)/2 \) , \( \sigma_{R_{i}}^{2}=n g(g+1) / 12 \) 。而 \( \chi^{2}=\sum\left(R_{i}-\bar{R}\right)^{2} / \sigma_{R_{i}}^{2} \) ,若各区组内有相同秩, \( \bar{R} \) 不变,可证明 \( \sigma_{R_{i}}^{2}=(n g(g+1) / 12) \cdot C \) ,这就是上述χ²值计算公式的来源。

3. F近似法

随机区组设计的多个相关样本比较,当区组个数较多时,还可用秩转换的近似F检验,秩转换的F检验公式如图1。

图1

(二) 多个相关样本两两比较的q检验

当经过多个相关样本比较的Friedman M检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两个总体分布位置不同,可用q检验。

1.  检验统计量q值的计算

设有g个相关样本,当区组个数n较多时,按下式求第A个样本和第B个样本比较的q:

\( q=\frac{R_{A}-R_{B}}{\sqrt{n \cdot M S_{\text {误差 }}}} \)

其中

\( M S_{\text {误差 }}=\frac{\frac{n g(g+1)(2 g+1)}{6}-\frac{1} {n} \Sigma R_{i}^{2}-\frac{1}{12} \Sigma\left(t_{j}^{3}-t_{j}\right)}{(n-1)(g-1)} \)

q的自由度v=(n-1)(g-1)。此外,引入样本跨度a指,把g个样本秩和从小到大排序后RARB之间涵盖的秩和个数(包括RARB自身在内)。

2.  检验统计量q值的计算

根据自由度v=(n-1)(g-1)、α,查(q界值表),界定P值,作出统计推断。

三、案例数据

8名受试对象在相同试验条件下分别接受A、B、C 3种不同频率振动的刺激,测量其反应率(%),问3种频率振动刺激的反应率是否有差别?数据见图2。

图2

四、假设检验

本数据经过“Normality Test (Shapiro-Wilk) (夏皮罗-威尔克正态性)”正态性检验结果显示A、B、C三组的P=0.060、0.037、0.597,前两组P值均<0.1,提示两组数据不满足正态性条件。因此,本案例应使用Friedman M检验比较三组反应率的差异。

图3

(一) 建立检验假设,确定检验水准

H0:3种不同频率振动的刺激的反应率总体分布位置相同

H1:3种不同频率振动的刺激的反应率总体分布位置不全相同

a=0.05

(二) 计算检验统计量

1. 编秩

将每个区组数据由小到大编秩,遇数据相等者取平均秩,结果如图3“秩”列。

2. 求秩和、平均秩

计算各样本的秩和为Ri,平均秩和为 \( \bar{R}=n(g+1) / 2 \) ,结果即图3中“Ri”行且 \(\bar{R}=n(g+1)⁄2=8(3+1)⁄2=16 \) 。

3. 计算统计量M

由于本数据n=8,g=3,可直接求M值统计量。

\( \mathrm{M}=\sum R_{i}^{2}-n^{2} g(g+1)^{2} / 4=\left(11^{2}+15.5^{2}+21.5^{2}\right)-8^{2} \times \frac{3 \times(3+1)^{2}}{4}=55.5 \)

(三) 确定P值,作出推断结论

因本数据n=8,g=3,故可以查(M界值表)得P<0.05,按a=0.05水准,拒绝H0,接受H1,可认为3种不同频率振动的刺激的反应率总体分布位置不全相同。

(四) 事后检验

虽然得到了“3种不同频率振动的刺激的反应率总体分布位置不全相同”的结论,但我们仍然不清楚到底是哪两组之间不同,因此需要进一步两两比较,采用多个相关样本两两比较的q检验。

1. 建立检验假设,确定检验水准

H0:任意两反应率总体分布位置相同

H1:任意两反应率总体分布位置不同

α=0.05

2. 计算检验统计量q值

\(\begin{align}M S_{\text {误差 }}&=\frac{\frac{n g(g+1)(2 g+1)}{6}-\frac{1}{n} \Sigma R_{i}^{2}-\frac{1}{12} \Sigma\left(t_{j}^{3}-t_{j}\right)}{(n-1)(g-1)}\\&=\frac{\frac{8 \times 3(3+1)(2 \times 3+1)}{6}-\frac{1}{8}\times\left(11^{2}+15.5^{2}+21.5^{2}\right)-\frac{1}{12}\times\left[\left(2^{3}-2\right)+\left(2^{3}-2\right)\right]}{(8-1) \times(3-1)} \\&=0.575893\end{align}\)

\( q_{1,2}=\frac{15.5-11}{\sqrt{8 \times 0.575893}}=2.096508 \)

v=(n-1)(g-1)=(8-1)×(3-1)=14

同样可算得q1,3q2,3

图4

3. 确定P值,作出推断结论

列出相关样本两两比较表见图3。根据图3中q、v、α值,查(t界值表),界定P值,见图3第“P”栏。

可见频率A和频率B声音刺激的反应率差异无统计学意义;频率A和频率C声音刺激的反应率差异有统计学意义;频率B和频率C声音刺激的反应率差异无统计学意义。

End
文章目录 沉浸式阅读