关键词:R语言; R软件; 非参数检验; 秩和检验; 单样本Wilcoxon符号秩检验; 单样本秩和检验
一、案例介绍
某地正常人尿氟含量的中位数为45.20μmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量。问该厂工人的尿氟含量是否与当地正常人的尿氟含量有差异?部分数据见图1。本文案例可从“附件下载”处下载。
二、问题分析
本案例的分析目的是比较研究样本的水平是否与已知的总体中位数有差异,属于单样本设计的假设检验范畴。计量资料的单样本设计假设检验,主要有单样本t检验和单样本Wilcoxon符号秩检验。对于计量资料,若不满足正态性或数据分布情况未知以及一端或两端是不确定数值时,应选用秩转换的非参数检验更为恰当。
针对这种情况,首先,对本研究案例资料进行正态性检验,若发现不服从正态分布,则应选用单样本Wilcoxon符号秩检验。
三、软件操作及结果解读
(一) 导入数据
mydata <- read.csv("单样本Wilcoxon符号秩检验.csv") #导入CSV数据 View(mydata) #查看数据
在数据栏目中可以查看全部数据情况,数据集中共有2个变量和12个观察数据,2个变量分别代表被调查者的编号(ID)及其对应的尿氟含量(F)。
如果数据集较大也可使用如下命令查看数据框结构:
str(mydata) #查看数据框结构
(二) 适用条件判断
1. 异常值判断
(1) 软件操作
##查看最大值和最小值##
summary(mydata$F) #F描述性统计分析
is.na(mydata$F) #检查F是否存在缺失值
##绘制F的箱线图##
boxplot(mydata$F) #绘制箱式图
(2) 结果解读
图3“summary (描述性分析)”命令运行结果,列出了观察变量的“Min.(最小值)、“1st QU.(第1四分位数)”、“Median(中位数)”、“Mean(平均值)”、“3rd QU.(第3四分位数)和“Max.(最大值)”,依据专业可判断尿氟含量均可能存在44.21g/L和77.36g/L的情况;此外,图5中的箱线图也未提示任何异常值。综上,本案例未发现需要删除的异常值。
2. 正态性检验
(1) 软件操作
## 绘制Q-Q图##
qqnorm(mydata$F, ylab="F") #Q-Q图 qqline(mydata$F) #增加趋势线
##正态性检验##
shapiro.test(mydata$F) # shapiro-Wilk正态性检验
(2) 结果解读
图6 Q-Q图上散点与对角线的分布重合度较低,提示数据不服从正态分布;图7的“Shapiro-Wilk normality test (S-W正态性检验)”结果显示P=0.06118<0.1,也提示数据不服从正态分布。综上,本案例宜选用单样本Wilcoxon符号秩检验。关于正态性检验的注意事项详见(医学统计学核心概念及重要假设检验的软件实现(2/4)——正态性假设检验的SPSS实现)(链接)。
(三) 统计描述及推断
1. 软件操作
##Wilcox检验##
wilcox.test(mydata$F, mu = 45.20, alternative = "two.sided") #对比中位数为45.20
2. 结果解读
由图8Wilcoxon符号秩检验结果可知,W = 76, P < 0.001,差异有统计学意义(P<0.05),可以认为该厂工人的尿氟含量与当地正常人的尿氟含量水平有差异。
四、结论
本研究欲比较某厂工人的尿氟含量与当地正常人的尿氟含量水平是否存在差异,对该厂工人的尿氟含量进行正态性检验发现不服从正态分布,故选用单样本Wilcoxon符号秩检验。
经分析,该厂工人的尿氟含量为53.21 (P25~P75:48.70~58.21) μmol/L。采用单样本Wilcoxon符号秩检验分析显示:W = 76, P < 0.001,差异有统计学意义。本研究结果提示该厂工人的尿氟含量高于当地正常人的尿氟含量水平。