关键词:非参数检验; 秩和检验; Friedman检验; 重复测量非参数检验
一、适用条件
条件1:观察变量为非(近似)正态的连续变量或有序分类变量。
条件2:观察变量具有3个及以上的分组,为配伍组设计,或各组之间存在相关性。
二、统计量计算
(一) 多个相关样本比较的Friedman M检验
1. M值法
M值法是指对数据编秩计算后,通过(M界值表)确定P值,做出统计推断。
(1) 检验统计量M值的计算
随机区组设计的区组个数用n表示,相关组别个数(等于研究因素的水平个数)用g表示,因此每个组别例数为n,总例数N=ng。
①将每个区组数据由小到大编秩,遇数据相等者取平均秩;②计算各组别的秩和Ri,平均秩和为 \( \bar{R}=n(g+1) / 2 \) ;③按下式求M值。
\( M=\sum\left(R_{i}-\bar{R}\right)^{2}=\sum R_{i}^{2}-n^{2} g(g+1)^{2} / 4 \)(2) 确定P值,做出统计推断
当n≤15和g≤15时,查(M界值表),确定P值,作出推断结论。
(3) M界值表的制作原理
为简单起见,假定区组个数n=4,相关样本个数g=3,每个区组的秩为1,2,3。第一组样本、第二组样本和第三组样本在每个区组取秩的排列情况有3!=6种(即123,132,213,231,312,321),在4个区组取秩的排列组合情况有64=1296种。对3个相关样本取秩的每种排列组合情况,先求3个样本的秩和R1、R2和R3,再用上述公式计算M,就有1296个 M ,最后归纳整理即得n =4和 g=3时 M 的概率分布。
M 的概率分布是偏态的非连续分布。g个相关样本的秩和R1,R2,…,Rg相等时,M 为最小值0; g个相关样本的秩和为1n,2n,…,gn 时,根据公式有M取最大值n2(g3-g)/12。R1、R2和R3的差别越大,M值越大。根据M的概率分布,可确定不同概率水平(如0.05,0.01)下M的上侧界值。如果H0成立,M 值越小,P值越大。
2. χ²近似法
(1) 检验统计量 χ² 值的计算
若n>15或g>15时,超出(M界值表)的范围,可用χ²近似法,按下式计算χ²值。实际上,当g>4,或者g=4且n>5,或者g=3且n>9时就可用下列近似公式。
\( \chi^{2}=\frac{12 M}{n g(g+1) C} \) \( C=1-\frac{\sum\left(t_{j}^{3}-t_{j}\right)}{n\left(g^{3}-g\right)} \) \( v=g-1 \)式中,C为校正系数,当相同秩次较多时,需要进行校正。(j=1,2,…)为按区组而言的第j个相同秩次的个数。若相同秩次个数少,C近似等于1,也可不校正。
(2) 确定P值,做出统计推断
根据自由度v=g-1,查(χ²界值表),确定P值,作出推断结论。
(3) χ²近似法的原理
设有 n 个区组, g 个相关样本,每个区组的秩为i=1,2,…, g。i的均数和方差为µi=(g+1)/2, \(\sigma_{i}^{2} \)=g(g+1)/12 。故得 g个相关样本的n个区组秩和Ri的均数和方差: \( \mu_{R_{i}}=\bar{R}=n(g+1)/2 \) , \( \sigma_{R_{i}}^{2}=n g(g+1) / 12 \) 。而 \( \chi^{2}=\sum\left(R_{i}-\bar{R}\right)^{2} / \sigma_{R_{i}}^{2} \) ,若各区组内有相同秩, \( \bar{R} \) 不变,可证明 \( \sigma_{R_{i}}^{2}=(n g(g+1) / 12) \cdot C \) ,这就是上述χ²值计算公式的来源。
3. F近似法
随机区组设计的多个相关样本比较,当区组个数较多时,还可用秩转换的近似F检验,秩转换的F检验公式如图1。
(二) 多个相关样本两两比较的q检验
当经过多个相关样本比较的Friedman M检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两个总体分布位置不同,可用q检验。
1. 检验统计量q值的计算
设有g个相关样本,当区组个数n较多时,按下式求第A个样本和第B个样本比较的q:
\( q=\frac{R_{A}-R_{B}}{\sqrt{n \cdot M S_{\text {误差 }}}} \)其中
\( M S_{\text {误差 }}=\frac{\frac{n g(g+1)(2 g+1)}{6}-\frac{1} {n} \Sigma R_{i}^{2}-\frac{1}{12} \Sigma\left(t_{j}^{3}-t_{j}\right)}{(n-1)(g-1)} \)q的自由度v=(n-1)(g-1)。此外,引入样本跨度a指,把g个样本秩和从小到大排序后RA和RB之间涵盖的秩和个数(包括RA和RB自身在内)。
2. 检验统计量q值的计算
根据自由度v=(n-1)(g-1)、α,查(q界值表),界定P值,作出统计推断。
三、案例数据
8名受试对象在相同试验条件下分别接受A、B、C 3种不同频率振动的刺激,测量其反应率(%),问3种频率振动刺激的反应率是否有差别?数据见图2。
四、假设检验
本数据经过“Normality Test (Shapiro-Wilk) (夏皮罗-威尔克正态性)”正态性检验结果显示A、B、C三组的P=0.060、0.037、0.597,前两组P值均<0.1,提示两组数据不满足正态性条件。因此,本案例应使用Friedman M检验比较三组反应率的差异。
(一) 建立检验假设,确定检验水准
H0:3种不同频率振动的刺激的反应率总体分布位置相同
H1:3种不同频率振动的刺激的反应率总体分布位置不全相同
a=0.05
(二) 计算检验统计量
1. 编秩
将每个区组数据由小到大编秩,遇数据相等者取平均秩,结果如图3“秩”列。
2. 求秩和、平均秩
计算各样本的秩和为Ri,平均秩和为 \( \bar{R}=n(g+1) / 2 \) ,结果即图3中“Ri”行且 \(\bar{R}=n(g+1)⁄2=8(3+1)⁄2=16 \) 。
3. 计算统计量M值
由于本数据n=8,g=3,可直接求M值统计量。
\( \mathrm{M}=\sum R_{i}^{2}-n^{2} g(g+1)^{2} / 4=\left(11^{2}+15.5^{2}+21.5^{2}\right)-8^{2} \times \frac{3 \times(3+1)^{2}}{4}=55.5 \)(三) 确定P值,作出推断结论
因本数据n=8,g=3,故可以查(M界值表)得P<0.05,按a=0.05水准,拒绝H0,接受H1,可认为3种不同频率振动的刺激的反应率总体分布位置不全相同。
(四) 事后检验
虽然得到了“3种不同频率振动的刺激的反应率总体分布位置不全相同”的结论,但我们仍然不清楚到底是哪两组之间不同,因此需要进一步两两比较,采用多个相关样本两两比较的q检验。
1. 建立检验假设,确定检验水准
H0:任意两反应率总体分布位置相同
H1:任意两反应率总体分布位置不同
α=0.05
2. 计算检验统计量q值
\(\begin{align}M S_{\text {误差 }}&=\frac{\frac{n g(g+1)(2 g+1)}{6}-\frac{1}{n} \Sigma R_{i}^{2}-\frac{1}{12} \Sigma\left(t_{j}^{3}-t_{j}\right)}{(n-1)(g-1)}\\&=\frac{\frac{8 \times 3(3+1)(2 \times 3+1)}{6}-\frac{1}{8}\times\left(11^{2}+15.5^{2}+21.5^{2}\right)-\frac{1}{12}\times\left[\left(2^{3}-2\right)+\left(2^{3}-2\right)\right]}{(8-1) \times(3-1)} \\&=0.575893\end{align}\) \( q_{1,2}=\frac{15.5-11}{\sqrt{8 \times 0.575893}}=2.096508 \)v=(n-1)(g-1)=(8-1)×(3-1)=14
同样可算得q1,3,q2,3。
3. 确定P值,作出推断结论
列出相关样本两两比较表见图3。根据图3中q、v、α值,查(t界值表),界定P值,见图3第“P”栏。
可见频率A和频率B声音刺激的反应率差异无统计学意义;频率A和频率C声音刺激的反应率差异有统计学意义;频率B和频率C声音刺激的反应率差异无统计学意义。