spssspss多元回归模型型中参数和常数项 y=c+bX1

spss实例-海文库
全站搜索:
您现在的位置:&>&&>&天文/地理
第一章 SPSS概览--数据分析实例详解1.1 数据的输入和保存1.1.1 SPSS的界面1.1.2 定义变量1.1.3 输入数据1.1.4 保存数据1.2 数据的预分析1.2.1 数据的简单描述1.2.2 绘制直方图1.3 按题目要求进行统计分析1.4 保存和导出分析结果1.4.1 保存文件1.4.2 导出分析结果欢迎加入SPSS使用者的行列,首先祝贺你选择了权威统计软件中界面最为友好,使用最为方便的SPSS来完成自己的工作。由于该软件极为易学易用(当然还至少要有不太高的英语水平),我们准备在课程安排上做一个新的尝试,即不急于介绍它的界面,而是先从一个数据分析实例入手:当你将这个例题做完,SPSS的基本使用方法也就已经被你掌握了。从下一章开始,我们再详细介绍SPSS各个模块的精确用法。我们教学时是以SPSS 10.0版为蓝本讲述的--什么?你还在用7.0版!那好,由于10.0版在数据管理的界面操作上和以前版本有较大区别,本章我们将特别照顾一下老版本,在数据管理界面操作上将按9.0及以前版本的情况讲述,但具体的统计分析功能则按10.0版本讲述。没关系,基本操作是完全一样的。好,说了这么多废话,等急了吧,就让我们开始吧!
希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)?患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87让我们把要做的事情理理顺:首先要做的肯定是打开计算机(废话),然后进入瘟98或瘟2000(还是废话,以下省去废话2万字),在进入SPSS后,具体工作流程如下:1.2.3. 4. 将数据输入SPSS,并存盘以防断电。 进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。 按题目要求进行统计分析。 保存和导出分析结果。下面就按这几步依次讲解。§1.1 数据的输入和保存11.1.1 SPSS的界面当打开SPSS后,展现在我们面前的界面如下:
请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、工具栏。特别的,工具栏下方的是数据栏,数据栏下方则是数据管理窗口的主界面。该界面和EXCEL极为相似,由若干行和列组成,每行对应了一条记录,每列则对应了一个变量。由于现在我们没有输入任何数据,所以行、列的标号都是灰色的。请注意第一行第一列的单元格边框为深色,表明该数据单元格为当前单元格。
对Windows操作界面不熟悉的朋友可参见SAS入门第一课中的相关内容。对数据表界面操作不熟悉的朋友可先学习一下EXCEL的操作(因为它的帮助是中文的)。
有的SPSS系统打开时会出现一个导航对话框,请单击右下方的Cancer按钮,即可进入上面的主界面。1.1.2 定义变量该资料是定量资料,设计为成组设计,因此我们需要建立两个变量,一个变量代表血磷值,习惯上取名为X,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为GROUP。
对数据的统计分析格式不太熟悉的朋友请先学习统计软件第一课。选择菜单Data==&Define Variable。系统弹出定义变量对话框如下:
该变量定义对话框在SPSS 10.0版中已被取消,这里的操作只适合9.0~7.0版的用户。
对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。好,先来建立分组变量GROUP。请将变量名改为GROUP,然后单击OK按钮。
有没有搞错?!折腾了半天就改个名字!难道连变量格式、标签等都不改?是这样的,在SPSS中所有的数据均以最大位数保存(好象是双精度),也就是说,上面虽然默认只有两位小数,但那指的是计算精度,实际保存的数据位数是非常长的(可以输入Pi值试一下)。在绝大多数情况下,SPSS给出的默认数据类型和数据精度完全可以满足需要,只是不太好看而已。至于标签等比较花哨的选项,反正我也很少用。现在我们才刚刚入门,一切从简。以后我会详细介绍各种设置的用法。
在第一列灰色的“var”上双击,同样会弹出定义变量对话框。现在SPSS
的数据管理窗口如下所示:
3第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。现在我们来建立变量X。单击第一行第二列的单元格,然后选择菜单Data==&Define Variable,同样,将变量名改为X,然后确认。此时SPSS的数据管理窗口如下所示:
现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。1.1.3 输入数据我们先来输入变量X的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一个数据0.84,此时界面显示如图A所示:
图A 图B请注意:在回车之前,你输入的数据在数据栏内显示,而不是在单元格内显示,现在回车,界面如图B所示:首先,当前单元格下移,变成了二行二列单元格,而一行二列单元格的内容则被替换成了0.84;其次,第一行的标号变黑,表明该行已输入了数据;第三,一行一列单元格因为没 4有输入过数据,显示为“.”,这代表该数据为缺失值。用类似的输入方式,我们将患者的血磷值输入完毕,并将相应的变量GROUP均取值为1,此时数据管理窗口如下所示:
从第12行开始输入健康人的数据,并将相应的GROUP变量取值为2。最终该数据集应该有24条记录。1.1.4 保存数据选择菜单File==&Save,由于该数据从来没有被保存过,所以弹出Save as对话框如下:
单击保存类型列表框,可以看到SPSS所支持的各种数据类型,有DBF、FoxPro、EXCEL、ACCESS等,这里我们仍然将其存为SPSS自己的数据格式(*.sav文件)。在文件名框内键入Li1_1并回车,可以看到数据管理窗口左上角由Untitled变为了现在的变量名Li1_1。
5为什么这里的对话框会出现汉字?是这样的,需要从编程的角度来解释:SPSS在弹出该对话框时会调用Windows系统的公用函数,由于我们用的是中文Windows系统,所以调用出来的就是中文。§1.2 数据的预分析1.2.1 数据的简单描述首先我们需要知道数据的基本情况,如均数、标准差等。选择Analyze==&Descriptive Statistics==&Descriptives菜单,系统弹出描述对话框如下:
如果按SPSS标准的叫法,这里应该是调用了Descriptives过程,为了避免太生硬,我们称为调用对话框,等大家熟悉SPSS了以后,在统计分析各章中可能两种称呼会混用。该对话框可分为左右两大部分,左侧为所有可用的侯选变量列表,右侧为选入变量列表。我们只需要描述X,用鼠标选中X,单击中间的,变量X的标签就会移入右侧,注意这时OK按钮变黑,表明已经可以进行分析了,单击它,系统会弹出一个新的界面如下所示:
该窗口上方的名称为SPSS for Windows Viewer,即(结果)浏览窗口,整个的结构和资源管理器类似,左侧为导航栏,右侧为具体的输出结果。结果表格给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量。从中可以看到,24个数据总的均数为1.2846,标准差为0.4687。我们以上的做法对吗?当然有问题!光看总的描述是不够的,还应当看看分组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择Data==&Split File菜单,系统弹出文件分割对话框如下:
7选择单选按钮Organize output by groups,将变量GROUP选入右侧的选入变量框,单击OK钮,此时界面不会有任何改变,但请再做一次数据描述,你就可以看到现在数据是分Group=1和Group=2两种情况在描述了!从描述可知两组的均数和标准差分别为1.6和0.1。
如果定义了文件分割,则它会在以后的所有统计分析中起作用,直到你重新定义文件分割方式为止。1.2.2 绘制直方图统计指标只能给出数据的大致情况,没有直方图那样直观,我们就来画个直方图瞧瞧!选择Graphs==&Histogram,系统会弹出绘制直方图对话框如下:
将变量X选入Variable选择框内,单击OK按钮。此时结果浏览窗口内会绘制出如下两个直方图:
两组的数据没有特别偏的分布,也没有十分突出的离群值,因此无须变换,可以直接采用参数分析方法来分析。综合设计类型,最终确定采用成组设计两样本均数比较的t检验来分析。8最后,我们还要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“Analyze all cases, do not creat group”,单击OK按钮就可以了。§1.3 按题目要求进行统计分析下面我们要用SPSS来做成组设计两样本均数比较的t检验,选择Analyze==&Compare Means==&Independent-Samples T test,系统弹出两样本t检验对话框如下:
将变量X选入test框内,变量group选入grouping框内,注意这时下面的Define Groups按钮变黑,表示该按钮可用,单击它,系统弹出比较组定义对话框如右图所示:该对话框用于定义是哪两组相比,在两个group框内分别输入1和2,表明是变量group取值为1和2的两组相比。然后单击Continue按钮,再单击OK按钮,系统经过计算后会弹出结果浏览窗口,首先给出的是两组的基本情况描述,如样本量、均数等(糟糕,刚才的半天工夫白费了),然后是t检验的结果如下:
Independent Samples Test
可见该结果分为两大部分:第一部分为Levene's方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F = 0.032,p = 0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,p=0.019。从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。§1.4 保存和导出分析结果1.4.1 保存结果文件前面我们已经做出了分析结果,但是,可是,可但是,但可是呢?再好的结果只要一断电就会全部消失(废话),对于这一问题人们早已想出了三种解决办法,他们分别是:需要结果的时候再运行一次分析程序。? 用笔将结果抄在纸上。? 直接保存结果文件。 ?显然,最方便快捷、最符合信息时代特征的就是第三种方法,在结果浏览窗口中(注意:一定要在结果浏览窗口中)选择菜单File==&Save,由于该结果也从来没有被保存过,所以弹出和前面保存数据时极为相似的一个Save as对话框,和前面相比,他唯一的区别就是文件的保存类型只有View Files(*.spo)一种。好,闲言少叙,在文件名框中键入“Li1_1”并回车,该结果文件就会按文件名Li1_1.spo被存储。不是文件保存类型还有一种“ALL Files(*.*)”吗?别费劲了,这种类型是SPSS公司放在那里哄人的,在该对话框里无论怎么折腾,都只能按SPO文件的格式来保存。1.4.2 导出分析结果文件倒是保存了,但问题还没有完全解决:我们从来写文章什么的都用的是文字处理软件,尤其是WORD,可WORD不能直接读取SPO格式的文件,怎么办呢?没关系,SPSS提供了将结果导出为纯文本格式或网页格式的功能,在结果浏览窗口中选择菜单File==&Export,系统会弹出Exprot Output对话框如下:10
最上方的Export下拉式列表可以选择输出的内容,可以为含图表的输出文档、无图表的输出文档和只有统计图表三种;中部的Exprot File对话框则填入输出的目标文件名;左下方的Export What单选框可以选择输出结果的哪些部分,可以是所有结果、所有可见结果或只输出选择的结果,一般选输出所有可见结果;右下方的输出文件类型下拉式列表已被我打开,可见里面有网页格式和纯文本格式两种,在一切按所需选择完毕后按OK钮,则结果文件就会输出为你想要的类型。好,到这里,就象我们刚开始所说的一样,你实际上已经完全掌握了SPSS的基本使用方法。我们以后将要做的工作就是“百尺竿头,更进一步”,将从下一章开始详细介绍SPSS各个模块的精确用法,使大家能尽快的从SPSS新手向SPSS高手过度。
第二章 数据文件的管理(上)2.1 建立与保存数据文件-File菜单2.1.1 新建数据文件2.1.2.1 直接打开2.1.2.2 使用数据库查询打开2.1.2.3 使用文本导入向导读入文2.1.2 打开其他格式的数据文件2.1.3 保存数据文件2.1.4 File菜单中的其他条目2.2 编辑数据文件2.2.1 定义新变量2.2.1.1 直接定义新变量2.2.1.2 从原有变量计算新变量-Transform菜单2.2.2 数据的录入2.2.2.1 直接录入2.2.2.2 数据录入技巧2.3 进一步整理数据文件-Data菜单
11不言而喻,一切统计分析都是以数据为基础的,因此统计软件的数据管理能力非常重要。SPSS以其豪华的界面为依托,为用户提供的便捷的数据管理功能,下面我们就来具体看一下。§2.1 建立与保存数据文件和大多数应用软件相同,SPSS中数据文件的管理功能基本上都集中在了File菜单上,该菜单的组织结构和WORD等也极为相似,因此这里我们只介绍比较有特色的几个菜单项。
SPSS 10.0有三个主要窗口界面:数据管理窗口、程序编辑窗口和结果浏览窗口;另有两个不常用的窗口:结果草稿浏览窗口和VBs脚本语言编辑窗口。他们共享许多菜单项,如File菜单就大部分相同,这里介绍的许多内容在五个窗口中都是通用的。2.1.1 新建数据文件如果你正从头开始进行一个新的课题,刚刚把数据收集上来,要做统计分析,自然需要新建一个数据库,然后将所有的数据从纸上请到计算机里。在SPSS中,新建一个数据库容易的不得了--已经到了什么都不用做的地步!是这样,当你进入SPSS系统时,系统就已经生成了一个空数据文件,即你看到的空白的数据管理界面。你只要按自己的需要定义变量,输入数据然后存盘就是了(这些操作马上会讲到)。2.1.2
打开其他格式的数据文件凡是做过数据输入工作的人都知道:这活又费眼睛又累人,出错太多了还要挨批评,非常影响个人的光辉形象。算了,还是在有限的经费里划几百美元出来雇个打字小姐吧(怎么用美元?因为我请了个老外!)。可是非常不幸,该同志只会用EXCEL 2000(又是一个被微软成功洗脑的家伙),数据现已输好,怎么转成SPSS数据文件呢?没关系,SPSS提供了以下几种方法来打开其他格式的数据文件。2.1.2.1
直接打开SPSS现在可以直接读入许多格式的数据文件,其中就包括EXCEL各个版本的数据文件。选择菜单File==&Open==&Data或直接单击快捷工具栏上的“”按钮,系统就会弹出Open File对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是:
选择所需的文件类型,然后选中需要打开的文件,SPSS就会按你的要求打开你要使用的数据文件,并自动转换为数据SPSS
格式。也许有视力好的朋友会注意到右下方除了“打开”和“取消”两个按钮外,中间还有一个“Paste”按钮,该按钮在SPSS的大多数对话框中都存在,是用于自动生成SPSS程序的,我们以后会专门讲解该问题。2.1.2.2
使用数据库查询打开SPSS可以直接打开许多类型的数据文件,但这并不是说它可以打开所有类型的数据文件(废话)
,比如FoxPro 3.0以上版本的*.dbf文件就不能直接打开(有兴趣的话你可以试试)。为此,SPSS还提供了另一个适用范围更广、但使用上较为专业的数据接口--数据库查询。实际上,SPSS在这里使用的是一种叫ODBC(Open Database Capture)的数据接口,该接口被大多数数据库软件和办公软件(如MS Office)支持,通过它,应用程序可以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管理系统。由于SPSS 10.0
可以直接打开EXCEL所有系列的数据文件,因此数据库查询接口的用处不是很大。但是,在9.0及以前的版本中,该查询仍是直接打开EXCEL 95、97及2000数据文件的唯一办法。ODBC数据引擎是独立与各种应用软件,直接安装到Windows系统中的,因此你所用的系统中ODBC所支持的数据类型取决于所安装的ODBC引擎的情况。还好,大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如MS Office)。不过有一点要提醒大家,许多机器的OBDC数据引擎安装有问题(尤其是D版),在SPSS中使用它往往要死机。选择菜单File==&Open Database==&New Query,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。我原来准备举一个具体例子,但后来发现不同版本的ODBC引擎所弹出的对话框并不相同!不仅如此,不同的数据驱动程序其对话框也各不相同!比如说,有的需要你的LoginID和Password,有的又不需要,因此我这里就不再讲了。由于它使用上太专业(尤其在10.0版中,9.0版还好些),如果确实要用,请找一个对数据库接口比较熟的人来帮你。2.1.2.3
使用文本导入向导读入文选择菜单File==&Read Text Data,系统就会弹出Open File对话框,对!和前面的情况完全一样,只是文件类型自动跳到了Text (*.txt)。实际上,该功能在SPSS中已被整合到了Open File对话框中之所以在菜单上保留该条目有两个原因:1. 读入纯文本的情况非常普遍,放在这里更加醒目;2. 为了和SPSS老版本的使用上保持兼容。13
例2.1 现有一数据文件以纯文本的形式存为“c:\Li2_1.txt”,且第一行为变量名,请将其读入SPSS。解:在Open File对话框选中相应的文件名并单击“确定”,系统会自动启动文本导入向导对话框如下:
在SPSS 10.0中,该向导并没有重新设计,因此仍然有问题被截断无法显示完的情况出现。可以看到该向导共分6步,这是第一步。中部为一对单选按钮,问题为“你的文
14最上方的问题是“你的变量是如何排列的?”,下面的选项分别为Delimite(用某种字符区分)和Fixed Width(固定宽度),一般都是Delimite,第二个问题是“变量名包括在文件最前面了吗?”,我们当然选“Yes”,单击“下一步”,系统弹出第三个对话框:
最上方的句子意为“第一条记录从第几行开始?”,右侧可以输入行数。由于我们所用的数据 第一行为变量名,因此这里输入2。下面的问题是“你的记录是怎样存储在文件中的?”。可以是“每一行代表一条记录”,或者“每**个变量代表一条记录”,数据一般都是第一种情况。下一个问题是“你想导入多少条记录?”,可以是“所有记录”、“前**条”或“随机导入**%的记录”。一般也选前者。单击“下一步”,第四个对话框如下:
我这里写的非常详细,但实际使用中你可以不管大多数问题,因为SPSS一般都能自动正确设置。
15最上方的问题为“变量间用的是哪种分隔符?”,可选的有Tab键、空格、逗号、分号或自行定义的其他符号。本数据采用的是空格,可见系统已经自动识别并选择了空格,而下方的数据预览窗口显示出了正确的数据读入情况。单击“下一步”,第五个对话框如下:
上方的提示为“定义在数据预览窗口中所选择的变量。”。顾名思义,在这个对话框中你可以在数据预览窗口中选择某一列变量,然后更改其变量名和类型。当然,在这里我们不用这样做,直接单击“下一步”,系统弹出文本导入向导的最后一个对话框如下:
16最上面的问题为“你愿意保存这次的文件(读入)格式设置以备下次使用吗?”,第二个问题为“你是否愿意将以上操作粘贴为SPSS语句?”,一般这两个问题我们都可以不管。单击“完成”,系统最终成功的读入了Li2_1.txt。2.1.3 保存数据文件在对数据做了修改后,保存数据文件是必不可少的工作之一。选择菜单File==&Save,如果数据文件曾经存储过,则系统会自动按原文件名保存数据;否则,就会弹出和选择Save as 菜单时相同的Save as对话框。里面可以保存的数据类型和可以打开的几乎一样多,选择合适的类型,确定就是了。
Save命令的快捷键为^S,如果你曾经领教过Windows死机的巨大潜力,那么你一定会同意习惯性的随手按^S至少不能算是一个坏习惯。
如果你准备将数据存为SPSS以外的其他类型,要注意有些设置可能会丢失,如标签和缺失值等。尤其是缺失值,如果想存的数据格式不支持缺失值,那你的数据可能会变的面目全非。2.1.4 File菜单中的其他条目【Disp Data Info】该菜单项用于显示数据的基本信息,选择它后会弹出非常类似于打开文件的一个对话框用于选择数据文件,选择好后按OK,系统就会在结果窗口中列出所选数据的基本情况,如建立时间、标签设置、记录数、变量设置等。【Apply Data Dictionary】即使用数据字典,该功能使你可以直接在新数据集中套用以前定义好的变量设置(格式、标签等,但不包括数据类型),举个例子吧:请打开Li1_1.sav文件,将变量x的长度从8改为4,标签删掉,然后选择菜单File==&Apply Data Dictionary,在文件对话框中选择Li1_1.sav并按OK(即将Li1_1.sav的变量设置按相同变量名一一套用在现在的数据集上),怎么样?一切都变回去了吧。【Cache Data】建立数据缓冲区。以前SPSS每执行一条命令都会重新读取所需的数据,如果是从远程用SQL调用数据库,这会非常的费时。现在使用Cache Data,可以将数据全部读入暂存盘,建立活动数据的缓冲区。大大加快处理速度。不过我特意试了一下,如果是处理本机数据的话,该命令对速度的提升不是非常明显:(。【Print和Print Preview】这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来,其中Print Preview是新增加的,使用上和WPS2000的打印预览非常相似(其实用的是同样的程序),不过和SPSS结果的打印程序一样,用SPSS直接打印数据非常的浪费纸张,用不用你自己决定吧。
17【Stop Processor】用于停止执行当前的SPSS命令。由于SPSS处理速度非常的慢,如果你正在对一个大型的数据执行统计命令,等了半天都没有结束,此时你的另一半约你逛街的时间又要到了,可是你的结果还没有存,执行命令时又存不了,怎么办呢?试试这个命令吧。
并非所有的命令都可以喊停的,许多数据库操作命令(计算变量,合并等)好象就停不了。§2.2 编辑数据文件在SPSS中,数据文件的编辑、整理等功能被集中在了Data和Transform两个菜单项中,这两个菜单的内容如下所示:
Data菜单项下面我们将根据其功能来分别讲述。 Transform菜单项2.2.1 定义新变量2.2.1.1 直接定义新变量大多数情况下我们需要从头定义变量,在SPSS 10.0中,定义变量的操作界面和FoxPro等数据库非常相似,只需单击左下方的Variable View标签就可以切换到变量定义界面开始定义新变量。如Li1_1.sav的变量定义如下所示:
18以变量x为例:变量名为x,类型为Numeric,宽度为4,小数位数2位(因小数点还要占一位,故整数位只有一位),变量标签位为“血磷值”。右侧在图中未能看到的依次为Values,用于定义具体变量值的标签;Missing,用于定义变量缺失值;Colomns,定义显示列宽;Align,定义显示对齐方式;Measure,定义变量类型是连续、有序分类还是无序分类。使用该窗口,我们可以一次定义许多新变量,不会象老版本那样一个一个的定义了。
由于SPSS是英文软件,变量名采用中文会有潜在的冲突(100%的兼容性是不存在的,典型的例子就是微软公司的产品)。
对于喜欢搞点花样的用户,这里有必要介绍一下SPSS中标签和缺失值的定义方法: 标签
和老版本不同,现在变量标签和变量值标签被分开设置,变量标签就在Label框中直接输入,变量值标签则在它右侧的Value框定义。以group为例,单击Value框右半部的省略号,会弹出变量值标签对话框如下:
上部的两个文本框分别为变量值输入框和变量值标签输入框,分别在其中输入“1”和“克山病患者”,此时下方的Add钮变黑,单击它,该变量值标签就会被加入下方的标签框内。与此类似定义变量值“2”为“健康人”,最后按OK,变量值标签就设置完成。此时你做任何分析,在结果中都有相应的标签出现。如果你现在就想看效果,切换回Data View界面,然后选择菜单View==&Value Labels,怎么样,看到了吗?缺失值
单击missing框右侧的省略号,会弹出缺失值对话框如下:
界面上有一列三个单选钮,默认值为最上方的“无缺失值”;第二项为“不连续缺失值保疃嗫梢远ㄒ?个值;最后一项为“缺失值范围加可选的一个缺失值”,文如其意,不用我多解释了吧。19第二章 数据文件的管理(下)2.1 建立与保存数据文件-File菜单2.1.1 新建数据文件2.1.2.1 直接打开2.1.2.2 使用数据库查询打开2.1.2.3 使用文本导入向导读入文2.1.2 打开其他格式的数据文件2.1.3 保存数据文件2.1.4 File菜单中的其他条目2.2 编辑数据文件2.2.1 定义新变量2.2.1.1 直接定义新变量2.2.1.2 从原有变量计算新变量-Transform菜单2.2.2 数据的录入2.2.2.1 直接录入2.2.2.2 数据录入技巧2.3 进一步整理数据文件-Data菜单2.3.1 用于数据管理的菜单项2.3.2 正交设计菜单项2.2.1.2 从原有变量计算新变量从头定义变量的情况多数在建立数据集时出现。但是,当数据集已经建立,需要整理、转换变量时,碰到的更多情况是需要根据某种条件从原有变量计算新变量。下面我们将按菜单条目的顺序依次讲解他们的功能。但是,首先我们需要了解一下所用的对话框界面的情况。【SPSS对话框元素介绍】下面是我们在第一章曾经见过的两样本t检验对话框:
这是一个非常典型的SPSS对话框。它包含了许多具有SPSS特色的对话框元素:
20oo 对话框左侧为候选变量列表框,里面列出了可被该对话框使用的变量; 右上方为Test Variables框,可将变量选入其中;注意在两个框的中间用”相连,这是变量移动按钮,其方向表明是将变量从那个框移动到哪个框,上“图中我们选中了变量group,两个移动按钮均变黑并向右指,表明变量group可以移动到他们右侧的两个框里去,改变当前框(在其他两个框里单击),移动按钮就会转向、变灰等以表明不同的意思(墙头草一个,可别小看这个功能,我想用VB实现这个功能,也是费了些工夫才把它搞定了);o 右侧为一排五个按钮,分别是确定、粘贴、重置、取消和帮助。这五个兄弟也是几乎永远一起出现的,另外四个大家都比较熟悉了,重置(Reset)按钮用于取消对话框内已做的选择,恢复到默认的状态;o 最下方有个Options按钮,用于设置专门用于该对话框的选项;o OK、Paste两个按钮为灰色,表明所需条件尚未满足,该按钮暂不可用。同理,Grouping Variable框下方的Define Groups按钮为灰色显示,也表明暂不可用。【Compute Variable对话框】例3.2
在li1_1.sav中建立新变量temp,令其值当血磷值大于1时为2,否则为1。 解:这里需要用到Compute Variable对话框,外加一点技巧。首先给变量temp均赋值为1,然后将血磷值大于1的记录其temp变量值改为2即可。选择菜单Transform==&Compute,弹出Compute Variable对话框如下:
左上角为需要计算的变量名,在其中键入“temp”,此时“Type&Lable”按钮就会变黑,喜欢精确的朋友可以在这里对temp进行详细的定义,但如果你和我一样非常懒,就可以对它视而不见(不要生气,聪明人大多都非常懒:));左下方为候选变量列表,现在还用不着;中部为类似计算器的软键盘,可以用鼠标按键输入数字和符号,这里我们直接输入“1”,输入的内容回立刻在右上方的数值表达式窗口中出现;软键盘右侧为函数窗口,可以在这里找 21到并使用所需的SPSS函数;这次也用不到。好,现在“OK”按钮已经变黑,单击他,系统就会自动生成一个新变量temp,并且取值均为1。
软键盘上几个奇奇怪怪的符号的含义如下:
在函数窗口中选中某个函数并单击右键,系统就会弹出该函数的用法说明。函数主要是和变量名组合起来使用的,比如说ABS(x)就是取变量x的绝对值。好,现在开始进行第二步,再次选择菜单Transform==&Compute,系统也再次弹出这个对话框--等等!注意到了吗?该对话框自动记住了你上次输入的内容,几乎所有SPSS的对话框都有这个特性,这会大大方便我们的使用。好,将数值表达式窗口中的1改为2,然后单击中下部的“If”按钮,系统弹出记录选择对话框如下:
不需要太多解释,大部分内容都是前面见过的。由于我们这里不是对所有记录做变换,因此选中第二个单选钮“Include if case statisfies confition:”,此时下方的所有窗口变亮,表明现在可用;而“Continue”按钮变灰,表明当前还没有提供所需的信息,好,我们就来提供,在左侧选中血磷值(x),然后单击“”,x就被引入了右侧的变量框,任你用键盘或者用鼠标,总之将下面这个算式补充完:x&1。现在可见“Continue”按钮再度变黑。在它又变灰之前赶快单击它(开个玩笑),系统回到Compute Variable对话框,请注意If按钮右侧的变化:x&2。如果你做的结果不一样,请重来一遍。22现在单击“OK”按钮,由于我们要替换变量值,系统会弹出一个确认对话框,确认替换,马上你就会看到,我们已经把这道题做完了。【Count对话框】Count对话框用于计算某个值或某些值在某个变量的取值中是否出现(好象有点拗口),比如我们想看看有哪些记录的血磷值在2~3之间,选择菜单Transform==&Count,系统弹出Count对话框如下:
Target Variable框中用于指定记录变量值是否出现的变量名,在这里输入temp2;选中血磷值(x),将其选入Variables窗口,此时“Define Values”按钮变黑,单击它,系统弹出变量值定义窗口如下:
左半部为变量值定义窗口,可以定义某个值、系统缺失值、系统或用户定义缺失值、变量值范围、小于某值或大于某值。我们这里是第四种情况:选择Range,在through两侧分别键入2、3,然后单击已变黑的“Add”按钮,“2 thru 3”就会被加入“Values to Count” 23框内。然后单击“Continue”,再单击Count对话框的“OK”,可以看到系统自动生成变量temp2,其中10、11号记录因血磷值介于2和3之间,temp2取值为1,其余的记录temp2取值均为0。
SOS,SOS,请大家千万注意,Count对话框有一个潜在的bugs,当你需要计算同时满足两个变量取值条件的记录数有多少时,直接用该对话框会得出完全错误的结果。这里有一点技巧,需要对对话框生成的指令加以修改,至于怎么修改嘛,我们将在Syntax(语法)窗口使用详解一章中讲述 :)。【Recode对话框】Recode对话框用于从原变量值按照某种一一对应的关系生成新变量值,可以将新值赋给原变量,也可以生成一个新变量。例2.3
在Li1_1.sav中生成新变量temp3,当血磷值小于1时取值为0,1~2时取值为10,大于2时取值为20。解:选择菜单Transform==&Record==&Into Different Variables,Recode对话框如下:
将血磷值(x)选入Input Variable-&Output Variable框,此时Output Variable框变黑,在其中键入新变量名temp3并单击Change,可见原来的x-&?变成了x-&temp3。现在单击“Old and New Values”,系统弹出变量值定义对话框如下:24
许多东西和前面类似,不再重复。按照题目的要求,选择Range:Lowest through,在右侧框中键入1,然后在右上方的Value右侧框中键入对应的新变量值0,此时下方Add键变黑,单击它,Old-&New框中就会加入Lowest thru 1-&0,按照类似的方法依次加入另两条转换规则,最终Old-&New框中共有Lowest thru 1-&0、1 thru 2-&10、Else-&20三条,现在单击Continue,再单击OK,系统就会按要求生成新变量temp3。
哎呀不得了,图片太多了,虽然这样非常直观,但下载速度太慢了。等大家对基本界面操作熟悉了后,我们将对比较简单的对话框试着对操作用文字的方式描述,比如上面的操作我们将用文字表达为:1. Output Variable框:选入x2. Output Variable Name框:键入temp3:单击Change钮3. 选中x-&temp3:单击Old and New Values钮:4.
Range:Lowest through单选钮:键入1:New Value Value单选钮:键入0:单击Add钮5.
Range: through单选钮:两侧分别键入1、2:New Value Value单选钮:键入10:单击Add钮6.
Range: All other values单选钮:New Value Value单选钮:键入20:单击Add钮7.
单击Continue8. 单击OK怎么样,还能理解吧。【Categorize Variables对话框】Categorize Variables对话框用于将连续性变量自动按要求分成等间距的几类。其界面非常简单,许多东西都是我们所熟悉的,唯一特别的是右下方的number of categories框,用于输入变量的等级数,默认为4,比如我们希望将血磷值按大小分成5个等级,先将血磷值选入Create Categories框,然后将下面的4改为5,单击OK,就会看到系统产生了一个
25新变量nx(即number of x之意),其取值就对应了血磷值相应的5个等级(1~5)。重复一下,具体操作步骤为:1. Create Categories框:选入x2. Number of categories框:53. OK【Rank Cases对话框】例2.4
请分组计算血磷值的秩和。解:选择菜单Transform==&Rank Cases,弹出Rank Cases对话框如下:
将血磷值选入Variable框,分组变量选入By框,单击OK即可。系统会建立一个新变量rx(即原变量名前加r表示Rank之意),其取值为x分组的秩次。
解释一下Rank Cases对话框的其他几个零件:左下角的Assign Rank 1 to框架用于选择将秩次1赋给最小值还是最大值;o 中下部的Display summary tables复选框用于确定是否在结果窗口内输出结果报表;o Rank Types钮用于定义秩次类型,有Rank(秩分数)、Savage评分(新变量值按指数分布)、Fractional rank(新变量值是秩分数除以非缺失值观测量的权重之和)、Fractional rank %(新变量值是秩分数除以非缺失值观测量数乘100)、Sum of case weights(新变量值是各观测量的权重之和)、Ntiles(新变量值是按所选变量的百分位数分组的组序号),默认值为Rank。单击More按钮,还会有更多的设置,这里就不再讲了。o Ties钮用于定义对相同值观测量的处理方式,可以是取平均秩次、最小值、最大值或当作一个记录处理,默认值为取平均秩次。 o【Automatic Record对话框】26该对话框用于按原变量值的大小生成新变量,变量值就是原值的大小次序,功能和Rank Cases对话框重复(等价于相同值观测量当作一个记录处理的情况)。【Create Time Series对话框】用于自动生成时间序列变量,由于太专业,这里不做过多解释。【Replace Missing Value对话框】用于填充缺失值,结果存入一个新变量。填充方法有:序列的均数、相邻若干点的均数、相邻若干点的中位数、线性内插、线性外延,默认值为序列的均数。2.2.2
数据的录入2.2.2.1
直接录入我想直接录入的问题就不用多讲了吧,直接敲就是了!2.2.2.2
数据录入技巧和其他常用统计软件相比,SPSS数据界面最大的优势就是支持鼠标的拖放操作,以及拷贝粘贴等命令,下面的数据录入技巧就是对这些功能的利用。【连续多个相同值的输入】如前面group变量有连续多个1,如果直接输入,可以在第一格内输入1并回车,然后回到刚才的单元格并单击右键,选择copy,最后用拖放方式选中所有应输入1的单元格,单击右键并选择paste,所有选中的单元格就会都被刚才拷贝的1填充。【将EXCEL数据直接引入SPSS】Excel已经打开原数据,并且数据量较少的时候,可以直接用拷贝粘贴的方法将数据引入SPSS:先在EXCEL中选中所有的数据(不包括变量名),然后选择拷贝命令;然后切换到SPSS,最好使行1列1单元格成为当前单元格,然后执行粘贴命令,数据就会全部转入SPSS,再定义相应的变量即可。2.3
进一步整理数据文件--Data菜单在许多情况下,我们需要先对数据进行一些整理(如分组、合并、加权等)才能将其用于最终的统计分析。这些功能基本上都集中在Data菜单项中,下面我们就对这些对话框做逐一介绍。2.3.1 用于数据管理的菜单项【Sort Cases对话框】例2.5
对数据集li1_1.sav按group升序,x降序的次序排列。27解:选择菜单Data==&Sort Cases,系统弹出Sort Cases对话框,该对话框并不复杂,其中比较特殊的是下方的Sort Order单选钮,有升序和降序两种选择。请注意,该单选钮是和上方的Sort By框一起使用的,具体方法如下:1. 确认升序单选钮被选择,将Group选入Sort By框;2. 选择降序单选钮,将x选入Sort By框。
请注意:group和x后面分别跟着Ascending和Descending,表明前者是按升序、后者按降序排列;由于Group在前,因此排序时以Group优先。【Transepose对话框】该对话框用于对数据进行行列转置,可以在原数据文件中指定一个变量记录转置后的变量名。原变量名则自动保存在系统产生的名为case_lbl的字符变量中。该对话框也非常简单,左侧为候选变量框;右上方为Variable框,用于选入需要转置的变量,一般应选入除名称变量外的所有其他变量,如果有变量未选入,则转置时会被自动丢弃;右下方为Name Variable框,用于指定原数据文件中记录转置后变量名的字符变量,但不是必需的,此时系统会将新变量自动按var001、var002...的顺序命名。【Merge Files对话框】用于合并数据文件,实际上包括了两个对话框,分别对应了两种合并方式:1. 从外部数据文件中增加记录到当前数据文件中,称为纵向合并,用Add Cases对话框完成,相互合并的数据文件中应该有相同的变量。选择菜单Data==&Merge Files==&Add Cases,系统首先弹出打开数据文件对话框,选中需要添加的数据文件并按OK,系统才弹出Add Cases对话框,左侧显示的是新、老数据文件中不匹配的变量名,右侧显示的是已经匹配的变量名。可以用Rename按钮对不匹配变量改名(先选中)或用鼠标强行匹配(即先按Ctrl键选中匹配的两个变量再单击Pair钮)。右下方的Indicate case source as variable复选框用于定义一个新变量以区分哪些记录是后来添加的。选择停当后单击OK,该操作就完成了。
实际上右侧显示的是将要包括在合并后数据集中的变量,如果有哪个你不需要,把它弄到左侧框中即可。282. 从外部数据文件增加变量到当前数据文件,称为横向合并,用Add Variable对话框完成,相互合并的数据文件中应包含同样的记录。选择菜单Data==&Merge Files==&Add Variable对话框,系统同样先弹出打开数据文件对话框,单击OK后弹出和前面相似的Add Variable对话框。按需选择即可。【Aggregate对话框】用于对数据进行分类汇总,所谓分类汇总就是按指定的分类变量对观测值进行分组,对每组记录的各变量值求指定的描述统计量,结果可以存入新数据文件,也可以替换当前数据文件。
上图中各个零件的含义如下:? Break Variables框:用于选择分组变量;? Aggregate Variables框:用于选择被汇总的变量;? Name&Label钮:用于定义新产生的汇总变量的名称和标签;? Function钮:用于定义汇总函数,共有三组函数,以最常用的第一组为例,可选的函数有均数、同组的第一个观测值、最后一个观测值、同组记录数、标准差、最小值、和、最大值共8个;? Save Number of cases in break group as variable复选框:用于定义一个新变量以存储同组的记录数;? Create new data file单选钮:定义一个新文件以存储汇总的结果,右侧的File钮用于具体文件名的定义,默认文件名为AGGR.sav;? Replace working data file单选钮:用汇总的结果替换原来的数据。例2.6
计算Li1_1.sav中两组的血磷值标准差。解:该题完全可以用更简单的方法完成,这里只是演示一下汇总对话框的用法。
291.2.3.4.5. Break Variables框:Group
Aggregate Variables框:x
Function钮:(Standard deviation单选钮:Continue钮)
Replace working data file单选钮:选中
OK【Split File对话框】用于将数据文件分组进行处理,该对话框我们在第一章时已经使用过了,这里再介绍一下各个对话框元素的用途:? Analyze all cases单选框:和下面的两个单选框为一组,选中本框不拆分文件; ? Compare groups单选框:按所选变量拆分文件,各组分析结果紧挨在一起便于相互比较;? Organize output by groups单选框:按所选变量拆分文件,各组分析结果单独放置; ?
Groups based on框:用于选择拆分数据文件的变量;? Sort the file by grouping variables单选框:将数据按所用的拆分变量排序; ? File is already sorted单选框:数据保持原状,不按所用的拆分变量排序。【Select Cases对话框】很多时候我们不需要分析全部的数据,而是按某种要求分析其中的一部分(比如只分析男性的身高、只对前200个数据进行分析以了解大概情况),这时使用Select Cases对话框可以大大简化工作。 该对话框界面如下所示:
其中主要的对话框元素为:30? All cases单选钮:和下面的4个单选钮为一组,选中它则分析所有的记录;? If condition is satisfied单选钮:只分析满足条件的记录;?
If按钮:和If单选钮一起使用,单击后弹出If对话框;? Random sample of cases单选钮:从原数据中按某种条件抽样;?
Sample按钮:和Random单选钮一起使用,可以设定按百分比抽取记录,或者精确设定从前若干个记录中抽取多少个记录;? Based on time or case range单选钮:基于记录序号来选择记录;?
Range按钮:和Based单选钮一起使用,用于输入记录序号范围;? Use filter variable单选钮:使用筛选指示变量来选择记录,必需在下面选入一个筛选指示变量,该变量取值为非0的记录将被选中,进入以后的分析;? Filtered单选钮:和下面的Deleted单选钮为一组,表示未被选中的记录只是被隔离,这些记录的记录号会被加上斜杠以示区别;? Deleted单选钮:未被选中的记录将被删除,一般不要使用。当对数据集做出筛选后,所做的筛选将在以后的分析中一直有效,直到再次改变选择条件为止。同时在多数情况下,系统会自动产生一个名为filter_$的筛选指示变量,被选中的记录该变量取值为1,反之则为0。【Weight Cases对话框】在默认情况下,每一行就是一条记录,这在多数情况下没有什么问题,但有时却非常麻烦,想想看如果你需要计算一个四格表卡方,有100例,如果每一行就是一条记录,你就需要输入100条记录!如果希望在计算过程中利用不同的变量对数据进行加权处理,就需要用到Weight Cases对话框。该对话框的使用极为简单,界面上有两个单选钮,分别是不权重记录和用某变量权重记录,如果选择后者,则需要选中一个权重变量。【Data菜单中的其余对话框】? Define dates对话框:可以自动生成时间变量。? Insert Variable命令:在当前列插入新变量。? Insert cases命令:在当前行插入新记录。? Goto cases对话框:到达指定记录号的记录,该命令在记录数极多时(1000条以上)非常有用。2.3.2
正交设计菜单项
正交设计不包含在SPSS/BASE模块中,因此由于解密范围的问题,有的D版中不含该菜单项,不过我用的10.0版里是有的:)。以前我以为SPSS不能作正交设计,感谢网友edof@sh的提醒,经研究,在SPSS中可以直接进行正交设计,Orthogonal Design子菜单项就是专门用于完成该任务的,具体做法用下面的例子说明如下:例2.7 做A、B两个因素的正交设计,A因素有三个水平,B因素有两个水平。解:选择Data--&Orthogonal Design--&generate,弹出的就是正交设计窗口,操作如下:
311. Factor name框:输入A;2. 单击ADD钮;3. 确定变量A被选中,单击Define value钮;4.
Value列:头三行分别输入1、2和3,代表变量A的三个水平;5.
单击continue钮;6. Factor name框:输入B;7. 单击ADD钮;8. 确定变量B被选中,单击Define value钮;9.
Value列:头两行分别输入1、2,代表变量B的两个水平;10.
单击continue钮;11. 单击OK在第10步定义完后,对话框应如下图所示:
在其他没有用到的选择项中,各种LABELS当然适用于定义相应的各种标签的;Data Files单选框组用来定义产生的数据文件是存为制定的文件名,还是直接替换当前工作文件;而Define Value对话框中的Auto fit框可以自动填充从1到你输入的那个数值这么多个水平的定义,特别适合我这种懒人。这里我们直接替换当前工作文件,在这个自动产生的正交设计数据集中,前两个变量就是要分析的A和B,各个水平已经按正交设计的要求排列好了。后面的status_和card_变量是系统产生的LOG变量,可以不管它。现在你再建立一个结果变量,输入实验结果,就可以进行正交设计的分析了。
第三章:程序编辑窗口用法详解 323.0.1 3.0.23.0.3 3.0.4 3.0.5 程序编辑窗口界面 邂逅Paste按钮 用程序编辑窗口加快我们的工作 用程序编辑窗口完成对话框无法完成的工作 再罗嗦几句在某年某月的某一天,你和你的另一半正在街上为地球表面的平整而贡献自己的绵薄之力。突然(也许是必然),你觉得有些饿了。这是一个问题,当然,不用说大家也知道解决问题的方法就是--吃。不过就是吃也有讲究,可以随便找个面馆简单的填饱肚子;要求高的话还可以去几星级的地方享受一下;当然还有的人觉得自己回去做口味也合适,花费也不多;更有些超级美食家,星级水准也不满意,需要亲自给一级厨师露一手,指点他们一下,才会吃的满意。好,使用SPSS进行统计分析的方式就象上面填饱肚子的方法一样有几种选择,如果你烹饪工夫还欠火候,或者习惯了享受星级服务,那么直接使用SPSS为你提供的对话框进行操作就是了;而如果你习惯了DIY,甚或对话框也无法满足你的统计分析要求(别瞪眼,下面你就会看到了),就请你在本章学习一下如何写SPSS程序吧。什么?SPSS还有程序?!是的,如果大家以前用过SPSS/PC+ 4.0,就一定不会对SPSS的程序感到陌生:在那个非常遥远的DOS时代(大约15年前),学习SPSS程序的语法,掌握如何编写SPSS程序是熟练使用SPSS的必要条件(但还不充分)。随着Windows旋风的登陆,软件的易操作性被推进到了前所未有的高度,而SPSS显然是统计软件中做的最成功的一个。他的操作界面是如此的成功,让使用者可以完全无须了解SPSS的语法而使用其99%的功能,使得SPSS程序被人逐渐忘记。其实,适当的使用SPSS程序可以大大提高我们的工作效率,并且SPSS在设计时也充分注意到了编程功能和使用界面的结合--还记得Paste按钮吗?下面我们就结合几个实例来学习如何使用程序编辑窗口。
请注意:我们不准备教大家那些枯燥的SPSS语法,现在写SPSS程序就象在WORD中记录宏一样简单,所需要做的只是略加修改而已。3.0.1 程序编辑窗口界面选择菜单File==&new==&syntax,系统会开启一个新的程序编辑窗口如下:
33Syntax从字面上应该翻译为句法、语法的意思,这里从实际用途出发,翻译为程序。 和以前见过的数据管理窗口相比,这个窗口简单的不能再简单了。菜单项中的File、Edit、View、Analyze、Graphs等菜单都是通用的,唯一特殊的是Run菜单,该窗口的特殊功能均在这里实现。3.0.2 邂逅Paste按钮Paste按钮在几乎所有SPSS对话框中均存在,它是专门为编程准备的。以第一章的那个t检验为例,如果最终选择完毕后不单击OK而是单击Paste,则程序编辑窗中会自动生成以下语句:T-TESTGROUPS=group(1 2)/MISSING=ANALYSIS/VARIABLES=x/CRITERIA=CIN(.95) .这就是你刚才想做的工作,如果运行它,就可以得到t检验的结果!怎么运行?选择菜单Run==&all,看到了吗?
Paste按钮如何能生成程序?在SPSS中,操作界面实际上起的就是“操作界面”的作用。当你用对话框选定某项操作,单击OK后,SPSS就将你的选择翻译成程序语句,然后提交系统执行。如果你单击Paste按钮,SPSS就不将生成的程序语句提交执行,而是传送到程序编辑窗中供你折腾。说的再广一些,不光SPSS,SAS等其他统计软件也是这么做的。
从上面的语句可以看到SPSS程序的基本结构:一条语句可占多行,最前面为语句主体,具体的选项用斜杠和语句主体相连,最后用小数点结束语句。3.0.3 用程序编辑窗口加快我们的工作如果程序编辑窗口只能带来“暂停”功能的话,我也就不用再往下写了。幸好,它的作用还远不止与此。当需要成批次的处理数据时,当你需要重复进行相同的统计分析时,当你要做许多统计分析,每一步均费时较长而你又不想等时...,使用Paste按钮是你的救命稻草。仍以第一章为例,如果从预分析一开始就连续使用Paste按钮,则到分析结束我们会得到如下程序:DESCRIPTIVESVARIABLES=x/STATISTICS=MEAN STDDEV MIN MAX .SORT CASES BY group .SPLIT FILESEPARATE BY group .DESCRIPTIVES
34VARIABLES=x/STATISTICS=MEAN STDDEV MIN MAX .GRAPH/HISTOGRAM=x .T-TESTGROUPS=group(1 2)/MISSING=ANALYSIS/VARIABLES=x/CRITERIA=CIN(.95) .现在你可以再次启用Run菜单来一次完成所需的统计分析。特别的,如果你的数据还会不断添加(试验尚未结束),就可以把该程序存为程序文件(*.sps),下次读入新数据后再运行一次就可以直接得到新的结果。
Run菜单几个选项的含义分别为:???? ALL 运行全部程序。
SELECTION 运行所选择的程序语句。
CURRENT 运行当前光标所在行的语句。
TO END 从当前语句起一直运行到程序结束。3.0.4 用程序编辑窗口完成对话框无法完成的工作如果程序编辑窗口的本事只限于上面介绍的这一点,那么在Windows时代,它仍然不配我来专门写一章。还记得吗?上面我提到用SPSS的图形界面可以完成99%的工作,可有时候你偏偏需要用另外那1%的功能,请看下面的例子:例3.1 请打开SPSS提供的cars.sav数据,假设每条记录代表一辆车,现在将按下列条件挑选一些车出来:Year&=76、Cylinder&=4、Weight&=3000,并且要看看每辆车符合了以上三条要求中的几条。解:没有什么难的,从第二章的知识我们了解到Count对话框就是做这类事情的,好,在Count对话框进行操作如下:1. Target variable框:键入G1(新变量名)2. Numeric variable框:选入Year3. 单击Define values钮:4.
Range lowest through:键入76:单击ADD钮5.
单击Continue钮6. Numeric variable框:选入cylinder7. 单击Define values钮:8.
Range lowest through:键入4:单击ADD钮9.
单击Continue钮10. Numeric variable框:选入Weight11. 单击Define values钮12.
Range through higest:键入3000:单击ADD钮13.
单击Continue钮3514. 单击OK好了,做完了--不过好象不大对劲呀!怎么前面做的条件选择在后面定义的时候仍然出现?再看看结果,更不对了!看来有问题。毛病出在哪里呢?请再次开启Count对话框,选择好的条件仍然在里面,单击Paste钮,可以看到这些选择产生的SPSS语句如下:COUNTG1 = year cylinder weight (Lowest thru 76) year cylinder weight (Lowest
thru 4) year cylinder weight (3000 thru Highest) .EXECUTE .仔细看看,这个语句不对呀!明明Lowest thru 76应该是对变量Year的限制,怎么year、cylinder、weight 这三个变量都在它前面?再看另两个条件,一样“大家有份”,这还了得,改!将语句改为正确的格式如下:COUNTG1 = year (Lowest thru 76) cylinder (Lowest thru 4) weight (3000 thru Highest) . EXECUTE .再次运行该语句,可以看到各个记录G1分别被取值为0~3,代表该车满足了0~3条要求,最终满足全部三条要求的应为3条记录。3.0.5 再罗嗦几句由于SPSS的大多数用户已经习惯了在图形对话框界面下操作,许多人不了解程序编辑窗口的用途,编写本章的目的主要是提醒大家:适当的时候,程序编辑窗口可以大大简化我们的工作。实际上,SPSS针对高级用户(需要编程做模拟抽样之类的事情)专门开发了SPSS Production facility模块,确有编程需要(或狂热)的朋友可参考有关书籍。第四章:SPSS结果窗口用法详解4.1 结果窗口元素介绍4.1.1 结果浏览窗口(Viewer)4.1.2 结果草稿浏览窗口(Draft Viewer)4.1.3 如何美化你的输出结果--SPSS选项设置4.2 驾驭结果浏览窗口4.2.1 结果窗口的的一般操作4.2.2 结果的导出4.2.3 如何在WORD等软件中使用输出结果4.3 文本输出结果的编辑4.4 表格编辑方法详解4.4.1 基本操作4.4.2 特色菜单内容详解4.5 图片编辑方法详解4.5.1 基本操作4.5.2 特色菜单内容详解36
§4.1 结果窗口元素介绍SPSS实际上提供了两个结果窗口--结果浏览窗口和结果草稿浏览窗口。前者最为常用,显示美观,但非常消耗系统资源;后者实际上是一个RTF格式文档,显示简单朴素,但节省资源。我们可以根据所用计算机的情况选择使用哪一种窗口。
结果草稿浏览窗口的内容虽然是RTF格式,但由于中、英文兼容性的问题,其中的表格读入WORD以后会变的面目全非,因此对我们不是很适用。4.1.1 结果浏览窗口SPSS的输出结果美观大方,是该软件的一大特色,下面是一个典型的结果浏览窗口。
相信99%的人都用过资源管理器,SPSS的结果浏览窗口和Windows资源管理器的结构完全相同,操作也几乎相同。除了上面的菜单栏、工具栏以外,绝大部分窗口被纵向一分为二!左侧是大纲视图(Outline view),又称结构视图,右侧则显示详细的统计结果(统计表、统计图和文本结果),两侧的元素是完全一一对应的,即选中一侧的某元素,在另一侧该元素也会被选中。例如左侧的Title图标旁有一个红色的箭头,表明该内容为结果窗口当前所在位置,相应的,右侧的标题Descriptives旁也出现一个红色三角,表明这就是Title图标所代表的内容。下面解释一下大纲视图的各个元素。大纲视图 顾名思义,大纲视图用于概略显示结果的结构,用于在宏观上对结果进行管理,如移动,删除等。里面采取和资源管理器类似的层次方式排列元素,每个元素用一个小图标来表示。常见的图标有:37大纲图标,代表一段或整个输出结果,含下级元素,单击左侧的减号就可以将下级元素折叠,折叠后减号变为加号,图标则变为。
运行记录图标,代表系统操作产生的一段运行记录。
警告图标,代表输出结果中的系统警告。
注解图标,代表系统自动产生的注解,默认情况下注解内容在输出结果中是隐藏的。
标题图标,代表输出标题。
页标题图标,代表输出标题,较少出现。
表格图标,代表输出结果中的统计表(Pivot table,字面意思为数据透视表)。
统计图图标,代表统计图。
文本图标,代表文本输出结果。
交互式统计图图标,代表交互式统计图。
统计地图图标,代表统计地图。
单击图标会选中所代表的一块或一段输出结果,双击图标可以让对应输出在显示、隐藏间切换,选中后单击图标的名称则可以对图标改名。4.1.2 结果草稿浏览窗口和它漂亮的兄弟相比,结果草稿浏览窗口就朴素的多了,什么花样也没有。当然,系统资源也要少占用许多,前面的输出结果在结果草稿浏览窗口中的显示如下:
38由于是英文软件,里面会出现一些奇怪的字符,不用理会。由于该窗口用的非常少,也没有什么复杂的操作,下面的讲解将基本上以结果浏览窗口为主。
你可以在下面讲到的选项设置中设定SPSS默认使用结果浏览窗口还是结果草稿浏览窗口。如果需要使用不同于选项设置的结果窗口,则关闭所有的结果窗口,然后用File==&New菜单新建一个所需类型的结果窗口,以后的结果会自动输出到该窗口中。4.1.3 如何美化你的输出结果--SPSS选项设置俗话说:爱美之心,人皆有之。当人们还在温饱线上挣扎时,美丽只能是一个遥远的梦;一旦远离贫困,没有人会不想把这个梦变为现实。用着SPSS豪华的界面,我们已经小康了,难道你不想把输出结果弄的更漂亮一些吗?选择菜单Edit==&Options,弹出的Options对话框会帮你实现这个美丽的梦想。Options对话框可以设置SPSS的方方面面,让他处处打上你个人的印记,由于里面内容太多,下面分头叙述,并给出我推荐的设置方式(在800*600分辨率下)。1. General 用于设置一些常规性选项,比如记录日志(Session Journal)的设定,变量列表(Variable lists)显示方式、临时文件夹(Temporary directory)的位置、结果窗口类型设置(Output type at start-up)、声音提示设置等。需要修改的内容如下:o Variable lists:选中Alphabetica,即在对话框中变量按字母顺序排列。o Sound:System Beep,有新输出结果时系统发出“嘀”声警告。o Output type at start-up:请根据所用计算机的性能自行设定。2. Viewer 用于设置结果浏览窗口的外观,这是对结果美观最重要的设置,左侧用于设置各种结果元素是否显示及对齐方式,右侧设置标题、正文的文字格式,修改如下:o Title Font:魏碑(或黑体),14号,加粗,红色。o Text Output Font:宋体(该字体可尽量保证中、英文混排时列对齐),12号,蓝色。3. Draft Viewer 既然是草稿,也没有什么好排的,上面的内容和Viewer的一对应就明白了,多数不用动,只有Font可能小了点,改为10号。4. Output Labels 用于设置在各处是否显示标签,不用做任何更改。5. Charts 设置统计图的常规选项,请将Frame:inner复选框去掉。6. Interactive 设置交互式统计图的选项,一般不用更改。7. Pivot Tables 设置统计表的格式,这里要做两处重要的修改:o Tablelook:选择Academic (VGA).tlo格式,它最符合统计学和美学要求。o Default Editing Mode:选择Edit small and medium tables in Viewer。最后三个为Data、Currency和Script,他们分别设置数据、货币和宏语言的格式,不用做修改即可。怎么样,改完了吗?请单击确定,然后退出SPSS并重新进入,随便打开个数据,做两个分析瞧瞧,不一样了吧!以后教程中的所有输出结果将多数采用这种优化过的格式。39§4.2 驾驭结果浏览窗口4.2.1 结果窗口的一般操作【打开与保存】如果结果窗口是当前窗口,则可以直接用快捷工具栏进行操作;否则,可以用File菜单操作。注意SPSS提供了一项特殊的保存功能--Save with password,即将输出结果加密保存,存盘时会让你提供PASSWORD和OEM CODE,后者随便输几个数字就行了。要小心,这东西可没有解密软件可用,因此请一定记住所设的口令。【移动、删除】记得在资源管理器中如何移动、删除目录和文件吗?对了,左、右侧均可操作,并且左、右键均有用处。这里的情况非常相似,但左侧大纲视图用起来显然更得心应手些:选中图标,将它拖到祖国最需要的地方去,或者轻按Delete键,让它在你的眼前消失。再注明一下:左键默认是移动,右键和资源管理器类似,也会弹出确认菜单。
这里的大纲视图具有和WORD中大纲视图相似的功能,升、降级等功能均可用。4.2.2 结果的导出在第一章中我们已经用过导出结果这项功能,实际上,SPSS设计该功能的作用将结果发送到网上,而对我们而言,目的则是打印或用WORD进行再编辑,也算是拿来主义吧。由于该功能非常重要而又多为人所忽视,这里专门列为一节。下面解释一下Export对话框的主要内容: o Export下拉列表 确定需要输出的内容,有全部结果、无统计图的文档和只输出统计图三种选择。
o Export File框 在这里输入输出目标文件名。o Exprot what单选钮组 确定输出的范围,有全部对象、全部可见对象和所选择的对象三种选择,由于SPSS将Note等可有可无的输出内容隐藏了起来,因此一般选择全部可见对象,可以省近1/3的篇幅。o Export Format下拉列表 确定导出文件的格式,有HTML和文本格式两种,如果是用针式打印机输出,则文本最好;如果要用WORD进一步编辑,则HTML更佳。o Options钮 设定导出的一些选项,在10.0版中这里需要设定的内容非常少,只有存储图片格式等几项。选好后单击OK,系统就会将结果按你的要求输出,其中的统计图会在相同的子目录中按Image1.jpg、Image2.jpg...这样的默认名依次存储。
SPSS使用守则第一条:除非你的打印纸多的没处用了,永远不要直接打印SPSS的结果,那样会多浪费近一倍的纸张。4.2.3 如何在WORD等软件中使用输出结果40现在,文字处理软件使用的越来越广,SPSS漂亮的输出结果如果无法在WORD等中使用岂不可惜!直接用WORD打开?不行。那么就用拷贝粘贴的方法吧。问题恰恰就出在这里。SPSS的表格和图均是专用增强格式,直接弄过去可能还不合适(尤其在9.0版以前)。在这里我要专门讲一下相关的问题。
由于版本的差异,各位在使用时可能和这里叙述的不太一样,我用的是SPSS10.0和WORD2000。【纯文本结果】包括标题等都是纯文本结果。对这种输出结果的操作没有什么特殊的,直接拷贝粘贴过去就行了,WORD会自动转换相应的字体、格式等。【统计表格】选中需要的统计表,在拷贝时会有两种选择:拷贝或拷贝对象(Object),前者会将统计表按普通的WORD表格来拷贝,粘贴后格式大部分丢失,但可以做进一步修改;后者则将统计表拷贝为特殊的图片,格式和以前完全一样,但无法更改。本来选择哪一种都行,问题是9.0以前的版本和WORD97的兼容性不好,按普通表格粘贴过去的表格会变的七扭八歪。此种情况下用拷贝对象的方法较好。【统计图】和统计表的情况类似,这里也有拷贝或拷贝对象两种选择,但我们推荐一直使用后者!如果使用拷贝,则弄过去的是增强的图元文件,往往无法编辑,还会把WORD文档撑的很大;如果拷贝对象,则粘贴过去的就是普通图片。当然,众所周知WORD对图片的编辑能力简直就是一塌糊涂,因此请务必在SPSS中编辑满意了再拷贝。§4.3 文本输出结果的编辑结果草稿浏览窗口里当然都是文本啦。至于结果浏览窗口嘛,简言之,在窗口中看起来象纯文本的都是纯文本(?)。双击它,就可以进行编辑了。根据设置的不同,编辑时有可能打开一个新窗口,该窗口简直和Windows自带的写字板一模一样,用法也一样;也可能只是在原窗口内更进一步,这时要注意:文本过长时自己也会带有滚动条,操作时要小心使用两个方向的共四个滚动条(含原窗口的两个),如果鼠标点错了地方,立刻就会退出编辑。具体的编辑方法就不写了,这些文本实际上是RTF格式,写字板里能用到的功能这里基本上都有。
在大约8.0及以前各版中,SPSS输出结果窗对中文的支持不是很好,有时输出乱码。倒是有个技巧可以解决,但年代太久,我实在记不起来了(好象是将中文输入法打开),实在不行就不用中文。§4.4 表格编辑方法详解41在多数时候SPSS默认的统计表格已经可以满足我们的需要,但有时我们还是不满足,想做进一步的修改。双击选中的表格,就会进入该表格的编辑模式。
此时进入的是表格的默认编辑模式,相当于右键菜单上的SPSS Pivot table对象==&编辑。如果要强行让它在新窗口中编辑,请选择右键菜单上的SPSS Pivot table对象==&open。4.4.1 基本操作在表格编辑模式中的基本单位为单元格,包括表格标题和脚注均被看成特殊的单元格来处理。单击可以选中单元格,双击则显示单元格内数据的确切值,并可以修改。
单击选中某个单元格
双击编辑单元格内容 惨了,我把数值改坏了!不仅可以选中某个单元格,还可以选中其中的一行或一列,但这要先选中最上侧或左侧的标题格,然后选择菜单Edit==&select,有四个选项:table、Table body、Data cells和Data cells and label,分别会选中表格、表格主体(不含标题和脚注)、所在行、列的数据区和所在行列。
选中所在行数据区
选中所在行(包括数据区和标题格)
选中所在列(包括数据区和标题格)选中这么多做什么?你可以对他们做删除、拷贝、更改格式等操作,显然会方便的多。
这些表格和WORD表格一样,都可以直接按住单元格边界拖放其大小。4.4.2 特色菜单内容详解用惯了Windows软件后,许多菜单项都会无师自通,因此这里只向大家列举其中非常有特色、或者非常有用的内容,其他的各位举一反三,会很快掌握的(其实这只是借口,真正原因是我不想打那么多字)。42【Edit菜单】1. Group、Ungroup菜单项用于给标题单元格加顶帽子--加上、去掉亚组的标签,选中标题单元格这两个菜单项才可能变黑,结果如下图所示。用户可以将Group Label改为自己想要的名字。
2. Drag to copy菜单项选中该选项会使对单元格的拖动成为拷贝操作,反之,则会弹出关联菜单,确认是和当前单元格交换还是插入。3. Create graph菜单项图,总是比表要受欢迎的多。Create graph菜单项可以将统计表中的内容以图形的方式立体的呈现在面前。共有七种图形可供选择,下面是我们用前面的统计表数据做出的条图。
这里所做的实际上是一个交互式统计图。【Pivot菜单】1. Transpose Rows and Columns菜单项该选项进行表格的行列转置操作。转置后表格的效果如下:43
该操作在表格太宽时非常有用。2. Pivoting Trays菜单项即数据透视表托盘,选中该菜单项会弹出数据表托盘。
数据表托盘 将原数据表的列转换为多层表后的情况则用来进行拖放操作。托盘的右、下方分别代表了表格的列、行。左侧代表表格的层。图标将它在三处随意拖放,就可以进行将数据表变换成多层表、行列转置等操作。
这里可能涉及到了图象编辑中层(Layer)的概念,不用多想它,觉得好玩就是了。【Format菜单】1. Tablelooks菜单项可以在这里直接选用新的表格模板。2. Autofit菜单项表格的行、列宽会自动按内容的多少调整为最小。§4.5 图片编辑方法详解在SPSS中做出的统计图不是简单的图片格式,而是可以继续编辑的增强图片格式,双击统计图就可以打开图片编辑窗口。4.5.1 基本操作
44所有命令都可以在菜单上找到,该窗口的特殊命令主要集中在Gallary、Chart、Format三个菜单中,对于不同类型的统计图,这些菜单的内容会略有区别,但大部分相同。另外,菜单中还有和外面完全相同的Analyze、Graphs菜单,可以直接在这里继续进行分析。
工具栏上的一排按钮基本上可以和Format菜单的内容一一对应,用惯了以后会觉得非常方便。一旦进入了图片编辑窗口,统计图就被有机的分成了若干个基本单位,如标题,图例、纵坐标、坐标刻度值等,单击可以选中这些基本单位,双击则弹出相应的设置窗口(等价于选择相应菜单命令)。在统计图中,用的最多的是格式的设置,他们全部集中在Format菜单内。下面以前面用到过的直方图为例介绍一下用法。例 4.1 将下面直方图的红色实心填充区域换为兰色斜线填充,标题换为“正常人”,删除右侧的文字图例。
变换前的统计图 一、更换填充类型
二、更改颜色
三、更改标题 四、去掉图例解:操作步骤如下:选中红色填充区,选择菜单Format==&Fill Pattern,弹出填充样式对话框,选中实心填充下方的斜线,单击Apply按钮,再单击Close。确定红色填充区仍被选中,选择菜单Format==&Color,选择兰色,单击Apply按钮,再单击Close。选中标题,双击,弹出标题对话框,删除已有的subtitle,在title中输入正常人,单击OK。
45选中文字图例,双击,将Display Legend复选框去掉,单击OK。最终的图形如上面所示。4.5.2 特色菜单内容详解【File菜单】1. Save chart template菜单项将现在的图片设置格式存为模板,便于以后再做图时直接套用。2. Export chart菜单项将SPSS的统计图输出为常用格式的图形文件,如BMP、JPG等。【Gallery菜单】有许多统计图可以互相变换,如线图和饼图、面积图等(当然是按某种对应关系)。选择该菜单,可变换的统计图类型为黑色可选,选中需要的类型,确定后图形就自动转换过去了。【Chart菜单】1. Options菜单项做各种统计图比较有自身特色的设置,因而每种统计图的内容均不相同。2. Axis菜单项对两个坐标轴进行设置,如最大、最小值,刻度间距、坐标轴标题等。3. Reference line菜单项在纵坐标或横坐标方向上按所给数值的位置加上参考线。【Format菜单】1. Apply chart template菜单项在已经做好的统计图中应用存储的统计图模板,和前面的Save chart template菜单项相对应。2. Interpolation菜单项在散点图中确定用某种连线将各点相连,可选择的有无连线、直线、锯齿线(step)、尖端直线(jump)、平滑线(spline)。3. 3D rotation菜单项46对三维图形做三维空间旋转。第五章:SPSS统计绘图功能详解5.1 常用统计图5.1.1 操作界面介绍(条图)5.1.1.1 条图的通用界面5.1.1.2 复式条图与分段条图的界面5.1.2 其他常用统计图5.1.2.1 散点图5.1.2.2 线图5.1.2.3 饼图5.1.2.4 面积图5.1.2.5 直方图5.1.2.6 其他5.1.3 常用统计图编辑方法详解5.2 交互式统计图5.3 统计地图在常用的统计软件中,SAS绘制的统计图不太美观;而SPSS绘制的统计图较为美观,可以满足大多数情况下的要求;STATA绘制的统计图形最为精美,但由于它采用命令行方式操作,美观的图形需要添加大量选项,普通人不易掌握;而S-PLUS、MATHLAB等偏数理统计的软件虽然绘图能力也非常强,但由于自身的定位问题,并不为大多数人所熟悉。因此,在各种统计软件中,以SPSS制作的统计图应用最为广泛。
EXECL的统计绘图功能非常的强,我们还有必要学习SPSS的绘图功能吗?这个问题我的看法是:EXCEL由于它的纯中文界面和简单而强大的绘图功能,使得可以用它来直接绘制各种简单的统计图,但是,EXCEL可以直接绘制的统计图种类有限,象误差条图、自回归图等它就无能为力,即是它支持的线图、条图等,如果过于复杂,如叠式条图、累计条图等也无法作出,而这些图在统计中是经常会碰到的,此时就只有采用统计软件来绘制,SPSS就是其中的佼佼者。§5.1 常用统计图在SPSS 10.0版中,除了生存分析所用的生存曲线图被整合到ANALYZE菜单中外,其他的统计绘图功能均放置在graph菜单中。该菜单具体分为以下几部分:? Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学者可以通过它对SPSS的绘图能力有一个大致的了解。? Interactive:交互式统计图,这是SPSS 9.0版新增的内容。? Map:统计地图,这是SPSS 10.0版新增的内容。
市面上所能见到的SPSS 10.0 D版由于执照不全,并不能安装统计地图模块。? 下方的其他菜单项是我们最为常用的普通统计图,具体来说有:47条图
质量控制图
交互相关图
自回归曲线图
其中后面几种图形用于时间序列分析。我们的讲解将这些常规统计图为主,对交互式统计图和统计地图只举例介绍,就不再全面讲述了。我们所用的数据集为SPSS自带的anxiety.sav,本章的大多数例子都将围绕该数据集展开。5.1.1
操作界面介绍(条图)5.1.1.1
条图的通用界面由于不同图形的绘图对话框有相当强的共性,下面我们通过一个简单的例子来看看绘图菜单的大致界面是怎么样的,通过这个例子大家可以举一反三。例5.1:在数据集anxiety.sav中分不同的subject对变量score值(之和)绘制条图。 选择graphs==&bar后,系统首先会弹出一个简单的导航对话框如下所示:
绘制简单条图(单式条图)绘制复式条图绘制堆积条图(分段条图)定义统计图中数据的表达类型:条图反映了同一变量若干条记录的分组汇总条图反映了不同变量的汇总条图反映了个体观察值
48在该对话框中,SPSS将条图进行了大致的分类,对话框的上半部分用于选择条图类型,下半部分的Data in Chart are单选框组用于定义条图中数据的表达类型。这里根据我们所需绘制条图的类型,应该选择简单条图,在表达类型中则应选择&Summaries for groups of cases&。选好后单击DEFINE钮,系统开启正式的条图定义对话框如下:
对话框左侧为通用的侯选变量列表框,右侧的对话框元素依次解释如下:【Bars Represent单选框组】用于定义条图中直条所代表的含义,可以是样本例数、样本数所占的百分比、累计样本例数、累计样本数所占的百分比或其余汇总函数,在例5.1中我们要对变量score的值绘图,因此选择最后一项&Other summary function&,系统开启summary function对话框如下所示:
49该对话框中列出了更多的统计汇总函数,可以满足绝大多数情况的需要。具体有: ? 上部:包括大多数常用统计汇总函数,如均数、标准差、中位数、方差、众数、最大、最小值、样本例数、变量值之和、累计变量值。? 中部:可对各记录按大小进行筛选,如上侧百分之多少,或者只选择小于某个数值的记录。具体的数值在value框中输入。? 下部:可按数值大小值选择取值在某个范围内的记录,具体的范围在low和high框中输入。
注意上面的一些函数是和前面重复的,如样本例数。此外,对话框最下侧还有一个Values are grouped midpoints复选框,当选中median of values或percentile单选框时该框变为可选,选中则表明数据为频数表格式,所输入的数值为组中值。根据我们的目的,这里选择sum of values单选框,单击continue后系统回到上一个对话框。【Category Axis框】用于选择所需的分类变量,此处必选。这里根据要求,将subject选入,可以见到此时OK已经变黑可用了。【Template框】用于选择绘制条图的模板,一般较少用。【Titles钮】用于输入统计图的标题和脚注,最多可以输入两行主标题,一行副标题,两行脚注。【Options钮】弹出Options对话框,用于定义相关的选项,有:Confidence Interval框 输入需要计算的均数差值可信区间范围,默认为95%。如果是和总体均数为0相比,则此处计算的就是样本所在总体均数的可信区间。 o Missing Values单选框组 定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。 o现在,我们已经完成了绘制该图所需的工作,单击OK,系统绘出统计图如下:
至于Data inChart Are中的另两种情况Summaries of separate variables和Values of individual cases,其对话框界面极为简单,可以说是一目了然,这里不再多讲,只指出以下几点:? 在Summaries of separate variables的对话框中,可以用Change summary钮更改汇总函数。? 在Values of individual cases的对话框中,下方category labels的选择并不影响做出直条的多少,只会影响X轴表示的内容,默认是记录号。5.1.1.2
复式条图与分段条图的界面复式条图与分段条图的界面并非全新的东西,只是在前面的简单界面上增加了一些元素,让我们再通过一个例子来看看:例5.2:在数据集anxiety.sav中分不同的subject对变量score值(之和)绘制条图,并且按变量trial的不同取值堆积(分段):由于要按变量trial的不同取值分段,因此在导航对话框中就不能选simple,而应根据目的选择stacked,单击define后系统开启的条图定义对话框和我们前面所用的略有不同,具体来说在Category Axis框附近不同,现在Category Axis框下面多了些东西如下所示:
选择stacks时的情况 选择clusters时的情况显然,当需要做复式条图时,将所需的分类变量选入stacks框中即可,做分段条图的情况也与此类似。
51以例 5.2为例,其操作步骤如下:1. Graphs==&bar2. Clustered:选中3. Summarizes for groups of variables单选框:选中4. 单击Define5.
Bars repesent框:选入score。6.
Other summary function单选框:选中7.
Variable框:选入subject8.
Change summary钮:单击9.
Sum of values单选框:单击10.
单击continue钮11.
Category Axis框:选入subject12.
Define stacks by框:选入trial13.
单击OK绘出的条图如下所示:
但是,在Values of individual cases的对话框中情况有些不同,原先Bars repersent框只能选入一个变量,做复式条图和分段条图时该框中可以选入多个变量了,其他的内容不变。5.1.2
其他常用统计图5.1.2.1
散点图散点图是各种统计图中比较简单的一种,共分为simple、matrix(以矩阵的形式显示多个变量间两两的散点图)、overlay(将多个变量间两两的散点图同时做在一张图上)和3D(将X、Y、Z三个变量间的相关散点图做在一个立体空间中)四种,其中需要解释的比较特殊的内容有:52? Set marks by框:选入一个标记变量,根据该变量取致的不同对同一个散点图中的各点标以不同的颜色(或形状),例如在数据cars中我们以horse和weight做图,如果用orgion的大小来做marks,则两次做出的图如下:
没有mark变量时的情况? Label cases 用orgion做mark变量时的情况 框:当编辑图形在图形选项中选择显示labels时,图形默认显示记录号,如果在这里选择了label变量,则显示该变量的取值。? 做出的3D图形可以在编辑时进行三维旋转,从多个角度进行观察。5.1.2.2
线图线图实际上和条图是一回事,可以认为它就是条图的变形,条图是用直条的高低表示多少,而线图是用点的高低来表示,然后又用直线将各点连接而成。5.1.2.3
饼图饼图的做法简直太简单了,不值一提!5.1.2.4
面积图面积图的做法是和线图、饼图类似的,比如堆积面积图是将各个指标值相加而成,和分段式条图非常类似。5.1.2.5
直方图直方图用于观察某个变量的分布情况,如果选择了display normal curve复选框,则会同时做出一条当前变量理想状况的正态分布曲线来,和该曲线相比,你就可以知道变量的实际分布究竟差了多远。53
其他P-P图和Q-Q图都是用来观察变量是否服从正态分布的;质量控制图则用来观察个体值是否有超过正常值范围的情况出现;箱式图的作用和它类似,只是换了一种表达方式;其余的几种图几乎都是用与时间序列模型的。5.1.3
常用统计图编辑方法详解该部分内容请参见4.5节:图片编辑方法详解。§5.2 交互式统计图交互式统计图是SPSS 8.0版新增的绘图类型,包括了交互式条图、线图、面积图、饼图、散点图、箱式图、误差限图和和直方图共七种类型,那么,这种新的统计图类型和普通的统计图相比有什么优越性,或者说,它的主要卖点--交互性都体现在哪里呢?在我看来,“交互式”这三个字主要体现在以下几个方面:? 对话框的交互。它的对话框全部采用拖方式操作,并且每一个元素的可操作性都大大强于普通对话框,以前需要两至三层对话框才能完成的工作,现在在一层对话框中就可以完成了。? 图形内容的交互。在技术上,普通统计图存储的是图形元素,因此编辑时只能就图形元素的特征,如颜色、线型等加以修改;而现在的交互式统计图完全不同,它存储的是原始数据或者绘图用的中间结果(如均数、标准差等),因此当图形绘制完毕后仍能对图形进行彻底更改,如加入锌的变量(在散点图中加入标示变量,甚至二维变三维)、删除某一部分数据、甚至改变所会图形的基本类型,如将条图改绘为线图等,只要所需信息相同,随你如何转换!不但如此,由于这个存储特点,现在我们还可以绘出以前无法直接得到的图形,如将一个数据透视表的内容用图形来表示!
哈哈,统计表,我们要拿你来做图!
这就是做出的交互式统计图 把它转成三维怎么样?? 增强的图形编辑能力。同样由于它的存储特点,现在交互式统计图的图形编辑能力达到了有恃无恐的地步!几乎任何东西都可以拿来改,也可以往里添加许多辅助线,如下面所示的一样:
朴素的美 削尖脑袋的模样
墙上长满了爬山虎
太阳照在红墙内外 反客为主的蓝飘带
我没有放倒!请注意,最后一幅图是在三维实时旋转时截取的(三维实时旋转也是交互式统计图新增的功能之一),因为如果我不这样做,它可能会那样一直旋转下去,我这样也算是挽救了他吧!§5.3 统计地图统计地图是 SPSS 10.0的新增功能,如果用时髦的说法就应该是“地球物理信息系统”,不过我喜欢用朴素的名称。该功能可以将收集到的数据和地图相联系,从而绘出统计地图来。该功能共分为区域值统计地图、渐近符号统计地图、点密度统计地图、个体值统计地图、分类计数条图统计地图、饼图统计地图和多主题统计地图七种。但是,如同我在SPSS 10.0抢鲜报道中提到过的一样,该地图集关于中国的部分简直就是一塌糊涂,所以对国内用户来说它更多的使用来玩,而不是工作。统计地图在操作上和交互式统计图完全一致,实际上,它就是一类特殊的交互式统计图。它所用的数据集应该和所选的地图相对应,否则会给出错误信息,并停止做图。这是用SPSS附带的亚州数据集做出的亚洲国家人口点密度图:
SPSS 在根目录下的MapData目录中放有许多绘制统计地图用的数据集,有兴趣的朋友可以自己做几个图试试。第六章:描述性统计分析--Descriptive Statistics菜单详解6.1 Frequencies过程6.1.1 界面说明6.1.2 分析实例6.1.3 结果解释6.2 Descriptives过程6.2.1 界面说明6.2.2 结果解释6.3 Explore过程6.3.1 界面说明6.3.2 结果解释6.4 Crosstabs过程6.4.1 界面说明6.4.2 分析实例6.4.3 结果解释
描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2 检验也在其中完成。
本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。§6.1 Frequencies过程频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。
和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并不按某种要求确定组段数和组距,而是按照数值精确列表。如果想用Frequencies过程得到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。6.1.1 界面说明57Frequencies对话框的界面如下所示:
该界面在SPSS中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【Display frequency tables复选框】确定是否在结果中输出频数表。【Statistics钮】单击后弹出Statistics对话框如下,用于定义需要计算的其他描述统计量。
现将各部分解释如下:o Percentile Values复选框组 定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分 58oooo 位输出当前百分位数(Cut points for
equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5。
Central tendency复选框组 用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。
Dispersion复选框组 用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。
Distribution复选框组 用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。
Values are group midpoints复选框 当你输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。
众数(Mode)指所有数值中出现频率最高的一个值,在国内用的非常少。【Charts钮】弹出Charts对话框,用于设定所做的统计图。o Chart type单选钮组 定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。o Chart Values单选钮组 定义是按照频数还是按百分比做图(即影响纵坐标刻度)。【Format钮】弹出Format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。o Orde}

我要回帖

更多关于 tobit回归模型 spss 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信