关键词:数据重组; 数据转置; 长型数据; 宽型数据; 长数据; 宽数据
一、复发的长型数据与宽型数据
这里以两重复测量因素方差分析(Two Repeated Measures Factor ANOVA) (一)——无交互作用——SPSS软件实现一文中的案例数据进行介绍。评价在某麻醉药物的作用下,不同部位某蛋白酶活性变化情况。在使用该种药物后,检测12只小白鼠用药后10min、20min、30min、40min 4个不同时点A部位和B部位蛋白酶的活性。本案例中时间和部位均为重复测量数据。
图1为宽型格式数据,即每个对象只有一条记录(只有一行数据),A、B两个部位4次重复测量的蛋白酶活性分别用A部位10min、A部位20min、A部位30min、A部位40min,B部位10min、B部位20min、B部位30min、B部位40min表示。样本编号ID可以不需要,不影响数据分析。
图2为长型格式数据,即每次测量都是单独一条记录(均有一行数据),用ID、时间、部位联合表示是哪个对象第几次测量什么部位的数据,ID号不可缺少;活性则作为携带变量同时出现。12个对象各重复测量了4×2次,共形成了96个记录。
一般来说,长型格式是数据分析的标准格式,但是由于软件模块分析的需要,宽型格式是部分模块中的指定格式。对重复测量数据进行方差分析时,如果使用“重复测量方差分析”模块,则需要使用宽型格式;而如果使用“广义估计方程”模块,则需要使用长型格式。本案例宽型和长型格式数据均可在“附件下载”处下载练习。
二、长型数据转宽型数据
将图2长型数据转换为宽型数据。
选择“数据”—“重构”(图3)。
打开“重构数据向导”对话框(图4),选择“将选定个案重构为变量”,单击“下一步”。
进入“重构数据向导-第2/5步”对话框(图5)中,需要指定被重复测量个体的标识变量和用于反映重复测量次数的索引变量,此处分别为ID和时间、部位。将ID选入“标识变量”,部位、时间选入“索引变量”,单击“下一步”。此处需要注意,如果希望转换后4个时间点的数据紧挨在一起,需要先选择部位,后选择时间;如果希望转换后2个部位的数据紧挨在一起,需要先选择时间,后选择部位。
进入“重构数据向导-第3/5步”对话框(图6),此时“完成”按钮已经可用,表明后续界面的选项都有默认值填充,可以直接运行相应过程;如果希望更改,则可对是否需要排序、重组后数据文件的结构、是否需要标识变量等进行设定,最后单击“完成”按钮即可以得到相应转换后的数据(图7)。将该结果与宽型数据(图1)进行比较,可以看出除变量名和标签不同外,上述两个文件的内容基本一致。
三、宽型数据转长型数据
将图1宽型数据转换为长型数据。
选择“数据”—“重构”(图3),打开“重构数据向导”对话框,选择“将选定变量重构为个案”,单击“下一步”。
进入“重构数据向导-第2/7步”对话框(图9),在“您希望重构多少个变量组?”下选择“多个”,数目为“2”(因为此处是2个部位的重复时间数据),单击“下一步”。
进入“重构数据向导-第3/7步”对话框(图10),“个案组标识”用于设定重复测量个体的ID标识变量,此处设定为数据集中的变量“ID”。“要转置的变量”用于设定被转换的变量组,首先选择“目标变量”中默认的“trans1”,随后在下方列表框中将“A部位10min~A部位40min”选入(图10-1)。
在图10-1基础上,再选择“目标变量”下的“trans2”,并在下方列表框中将“B部位10min~B部位40min”选入(图10-2)。
进入“重构数据向导-第4/7步”对话框(图11),在“您希望创建多少索引变量?”下选择“一个”,单击“下一步”。
进入“重构数据向导-第5/7步”对话框(图12),“索引值具有什么类型?”下选择“连续数字”;“编辑索引变量名和标签”中“名称”下的“索引1”改为“时间”,点击“完成”,即完成了重复测量变量“时间”的转换(图13)。
在图13基础上再次重复上述操作,完成“部位”的转换。最终数据如图14所示。将该结果与长型数据(图2)进行比较,可以看出上述两个文件的内容一致。图14中的“trans1”即为图2中的“活性”变量。