关键词:医学统计学; 核心概念; 总体与样本; 同质与变异; 参数与统计量; 频率与概率; 因素与水平
一、总体与样本
总体(population):是根据研究目的而确定的同质研究对象的集合,常可分为有限总体和无限总体。有限总体是指在空间、时间、人群范围上明确限制的观察单位,如某地区近5年一年级男学生的身高。无限总体往往没有这些限制,其观察总体只是理论上存在的,如研究某种降血糖药物治疗糖尿病的效果,那么所有糖尿病患者即是一个无限总体。实际情况中,医学研究所面向的总体大多数是无限总体。
样本(sample):是从总体中随机抽取的具有代表性的研究对象的集合,该集合内包含的观察单位数称为该样本的样本含量(sample size)。从总体中抽取样本的过程称为抽样(sampling),抽样一般需要遵循随机化的原则。如从某地区近5年一年级男学生中随机抽取200人测量其身高,并通过200人的身高代表该地区近5年一年级男学生的身高。
在医学研究中,我们通常会计算样本含量,那么是不是样本量越大越好呢?或者对总体进行调查的结果就一定要比抽样调查结果更可信呢?对这两个问题我们可以从以下几方面进行理解:首先,对于无限总体,只是理论上存在,在实际研究中我们很难知道这个总体到底有多大;就算是有限总体,一般也很难有足够的人力、物力、财力和时间去调查总体的特征。其次,调查的对象越多,工作越不容易细致,无限扩大样本含量得出的结果未必有随机抽样所获样本(有适宜的样本量)得出的结果可靠。
二、同质与变异
同质(homogeneity):是指研究的某些特征或者对研究对象的处理因素相同。在医学研究过程中,经常提到的“可比性”即是同质的概念,如实验组和对照组人群的性别构成差异无统计学意义,年龄相差控制在±3岁以内;同质只是相对的,并不存在绝对的同质,也不存在绝对的“可比”。
变异(variation):是指观察单位在同质基础上的个体差异。变异是统计学分析的始因,如果没有变异,也就不存在总体和样本的概念,所有研究只需选择一个研究对象即可。研究对象之间的变异是绝对的,不存在一模一样的患者。
三、参数与统计量
参数(parameter):参数是用于描述总体特征的指标,通常用希腊字母表示,如总体平均数(μ)、总体标准差(σ)、总体率(π)等。总体参数往往是未知的,需要通过样本的统计量去推断描述。
统计量(statistics):是用于描述样本特征的指标,常用英文字母表示,如样本平均数( \( \overline{x} \) )、样本标准差(s)、样本率(p)等。除此之外,还有一些统计分析过程中产生的统计量,如用于统计检验的z值、t值、X² 值、F值等。
四、误差
误差(error):是指观察值与实际值之差,根据产生的原因可粗略分为以下三类。
随机误差(random error):由于各种偶然因素导致的观察值与实际值之差。如同一个医生使用同一个血压计多次测量患者的血压结果不会完全一致。随机误差是不可避免的,也难以掌握其具体变化规律,但通过增加测量次数可以逐渐减小误差,如通过多次测量患者血压,取其平均值。在医学统计学分析过程中备受关注的抽样误差也属于随机误差,是指抽样造成的样本统计量与总体参数之间的差异。通过随机化和增大样本量可以减小抽样误差。
系统误差(systematic error):由于一些固有的因素导致的观察值与实际值之差。如测量体重时未对体重计进行校零,导致所有测量对象的体重都偏高。系统误差遵循一定的规律,误差值具有固定方向或者恒定不变。系统误差是可以避免的,如对仪器进行校准、按照操作流程进行质量控制等。
非系统误差(non-system error):又称过失误差(gross error),是指在测量或实验过程中因操作失误导致的观察值与实际值之差。如抄错数字、写错计量单位等。非系统误差可以通过仔细核对予以清除。
五、随机化
随机化(randomization):是指研究对象被选择、被分配到不同组别或被施加干预措施的概率相等,包括随机化抽样、随机化分组和随机化顺序。
随机化抽样是指从总体中选择样本时,每个个体被抽到的几率相等。随机化分组是指纳入的研究对象,被分配到各个研究组的几率一样。随机化顺序是指进行交叉试验时,随机化分组后的研究组接受不同干预措施的顺序是随机的。
六、频率与概率
频率(frequency):是指事件出现的次数与总试验次数之比。对于随机试验,在一次试验过程中某种事件出现的概率要么为1要么为0,但当重复试验次数不断增加时,事件出现的频率总会无限趋近于某个固定的数字,这个数字就是概率,即可以通过频率估计概率。
概率(probability):是反映随机事件发生可能性大小的指标,介于0与1之间,越接近1表示发生的可能性越大,越接近0表示发生的可能性越小。统计分析中的很多结论都是基于一定检验水准下的概率推断,习惯将发生概率小于或等于5%的随机事件(P≤0.05)称为小概率事件,表示在一次试验或者观察中该事件发生的可能性很小,可视为不发生。
七、变量
变量(variable):是指观察单位的某些特征,如调查对象的年龄、体重、血型等。根据变量特征的属性可以分为以下几类:
计量资料(measurement data):又称定量资料(quantitative data)或数值变量(numerical variable),是通过测量某项指标的大小而获得的资料,一般有度量衡单位,可比较大小,如身高(cm)、体重(kg)、血压(mmHg)等。根据其观测值是否连续,又可分为连续型(continuous)或离散型(discrete)两类。连续型计量资料是指任意两点之间的取值可以是无限的,可用小数表述,如身高、体重等;离散型计量资料是指任意两点之间的取值是有限的,用整数表示,如单位容积内的细胞计数、发病人数等。
等级资料(ranked data):又称半定量资料(semi-qualitative data)或有序分类资料(ordered categorical data),是指按照观察对象的某种属性的不同程度分成等级后分组计算、分类汇总各组观察单位数后得到的资料,具有半定量性质,表现为等级大小或属性程度。如学历(文盲、小学、初中、高中、大学、研究生及以上)、治疗效果(治愈、显效、好转、无效)等。
计数资料(enumeration data):又称定性资料(qualitative data)、无序分类资料(unordered categorical data)或名义变量(nominal variable),是通过观察单位某种属性或类别分组计数后得到的资料,表现为互不相容的属性或类别,如性别(男、女)、血型(A、B、AB、O)等。
研究对象的变量可以存在多种类型,如年龄可以用具体的数值表示,此时为计量资料,也可以用“<18岁”、“18-34岁”、“35-59岁”、“≥60岁”这种等级资料表示,还可以用“高龄”和“非高龄”这种二分类计数资料表示。不同类型的变量可以单向转换,即计量资料可以转换为等级资料,并可进一步转换为二分类计数资料,但反之转换则不可。这提示我们在研究设计中,应尽可能收集计量资料,以便为后续数据分析带来方便。
八、因素与水平
因素(factor):是可能对研究结局产生影响的变量。某个变量是否为因素是相对而言的,主要取决于研究目的,如研究年龄对激素分泌的影响时,年龄就是因素;而在研究激素对某种疾病的影响时,激素就是因素。
水平(level):是因素的不同等级或分类,如学历可有“文盲”、“小学”、“初中”、“高中”、“大学”、“研究生及以上”多个水平;性别有“男性”、“女性”两个水平。