正态分布假设检验(Normality Hypothesis Test)——MedCalc软件实现

发布于 2022年5月26日 星期四 22:00:48 浏览:5948
原创不易,转载请注明来源,感谢!
附件下载:
正态性检验.zip 请勿重复点击,如无响应请耐心等待或稍后再试。

观测变量为正态或近似正态分布是进行t检验的重要条件之一,本文将介绍正态性检验在MedCalc软件的实现过程。

关键词:Medcal; t检验; 正态性检验; 图示法; 计算法

MedCalc中正态性检验(Normality test)的方法有两大类:一类是图示法,主要采用概率图(probalility-probability plot, P-P plot)和分位数图(quantile-quantile plot, Q-Q plot);另一类是计算法,主要包括Shapiro-Wilk检验、Shapiro-Francia 检验、D’Agostino-Pearson检验及Kolmogorov-Smirnov检验。

一、正态性检验的方法

(一) 图示法

1. 概率图(probalility-probability plot, P-P plot)

P-P图是以实际或观察的累积频率作为X轴,对正态分布的理论或期望累积频率作为Y轴,如果P-P图上的数据点分布在从左到右上的直线附近,则说明所分析的数据服从正态分布。

2. 分位数图(quantile-quantile plot, Q-Q plot)

Q-Q图是以实际或观察的分位数作为X轴,对正态分布的理论或期望分位数作为Y轴,如果Q-Q图上的数据点应分布在从左到右上的直线附近,则说明所分析的数据服从正态分布。

(二) 计算法

1. Shapiro-Wilk检验 (Shapiro-Wilk test)

Shapiro-Wilk检验又称W检验法或S-W检验法,Shapiro-Wilk W统计量(W statistic)可用于检验随机样本是否来自正态分布的总体。当W值较小时,表明资料偏离正态;W统计量可用于3≤n≤5000的资料,常用于小样本(3≤n≤50)资料的正态性检验。

2. Shapiro-Francia检验 (Shapiro-Francia test)

Shapiro-Francia检验又称W’检验法,Shapiro-Francia W’统计量(W’ statistic)可用于检验随机样本是否来自正态分布的总体。W’值较小时,表明资料偏离正态。W’值可用于5≤n≤5000的资料。

3. D’Agostino-Pearson检验(D’Agostino-Pearson test)

D’Agostino-Pearson检验又称D检验法,联合偏度(skewness)和峰度(kurtosis)系数计算单独的P值,适用于50≤n≤1000的资料。

4. Kolmogorov-Smirnov检验(Kolmogorov-Smirnov test)

对样本累积分布和正态累积分布的最大差异进行Lilliefors显著性校正,常用于n>50资料的正态性检验。

二、案例介绍

某研究者使用单样本t检验比较特殊作业成年男性工人血红蛋白与正常成年男性血红蛋白含量均数是否相等。研究过程中测量了52名特殊作业成年男性工人的血红蛋白含量,试分析这52名特殊作业成年男性工人的血红蛋白含量值是否服从正态性分布?部分数据见图1。本文案例可从“附件下载”处下载。

图 1

三、案例分析

上述案例为单样本t检验,欲分析测量的52名特殊作业成年男性工人的血红蛋白含量值是否服从正态性分布,根据测量的数据,可以通过图示法和计算法两种方式来进行判断。

四、软件操作

(一) 图示法 (以Q-Q图为例)

1. 软件操作

选择“统计”——“分布图”——“正态图”(图2);进入“正态图”界面(图3),“变量”下选择变量“Hb”,“选项”中勾选“Q-Q图”,“检验正态分布”下选择“Shapiro-Wilk检验 (夏皮罗-威尔克正态性检验,S-W检验)”。

图 2
图 3

2. 结果解读

图4为Q-Q图示法的结果,Q-Q图中的直线参考表示正态分布,本例圆点靠近直线参考线的两侧,基本呈一条直线,提示数据呈正态分布。

图 4

(二) 计算法 (以Shapiro-Wilk检验为例)

1. 软件操作

选择“统计”—“汇总统计”(图5);进入“汇总统计”界面(图6),“变量”下选择变量“Hb”,“检验正态分布”下选择“Shapiro-Wilk检验 (夏皮罗-威尔克正态性检验,S-W检验)”。

图 5
图 6

2. 结果解读

图7中Shapiro-Wilk检验 (夏皮罗-威尔克正态性,S-W检验)结果,P=0.1789>0.1,提示数据服从正态分布。

图 7

五、知识小贴士

End
文章目录 沉浸式阅读