如何利用spss进行回归分析析

关于SPSS回归分析与数据预处理的心得体会,句句都是肺腑之言
关于SPSS学习与交流的专业论坛,小兵博客一直推荐大家去人大经济论坛(现在叫做经管之家)SPSS专版。这个板块几乎覆盖了SPSS统计分析从理论到实践、从工具到方法的各类资料。特别适合 SPSS初学者和使用者交流互动,传授经验。
今天小兵就先为大家分享一篇论坛网友SPSS数据分析的心得体会,原作者:xddlovejiao1314,谢谢他的宝贵经验分享。
关于SPSS数据预处理
拿到一份数据,或者在看到国内外某个学者的文章有想法而自己手里的数据刚好符合这个想法可以做时,在整理好数据后不要急于建模。一定要对数据做缺失值处理、异常值处理。在数据预处理的基础上再进一步建模,否则可能得到错误的结果。
心得1:缺失值的处理
我个人有几个看法:
数据样本量足够大,在删除缺失值样本的情况下不影响估计总体情况,可考虑删除缺失值;
数据样本量本身不大的情况下,可从以下两点考虑:
1是采用缺失值替换,SPSS中具体操作为 “转换” 菜单下的 “替换缺失值” 功能,里面有5种替换的方法。若数据样本量不大,同质性比较强,可考虑总体均值替换方法,如数据来自不同的总体(如我做农户调研不同村的数据),可考虑以一个小总体的均值作为替换(如我以一个村的均值替换缺失值)。
2是根据原始问卷结合客观实际自行推断估计一个缺失值的样本值,或者以一个类似家庭的值补充缺失值。
心得2:异常值的处理
我大概学了两门统计软件SPSS和Stata,SPSS用的时间久些,熟悉一下,Stata最近才学,不是太熟。关于这点我结合着来说。
关于异常值的处理可分为两点,一是怎么判定一个值是异常值,二是怎么去处理。
判定异常值的方法我个人认为常用的有两点:
1是描述性统计分析,看均值、标准差和最大最小值。一般情况下,若标准差远远大于均值,可粗略判定数据存在异常值。
2是通过做指标的箱图判定,箱图上加“*”的个案即为异常个案。
发现了异常值,接下来说怎么处理的问题。大概有三种方法:
1是正偏态分布数据取对数处理。我做农户微观实证研究,很多时候得到的数据(如收入)都有很大的异常值,数据呈正偏态分布,这种我一般是取对数处理数据。若原始数据中还有0,取对数ln(0)没意义,我就取ln(x+1)处理;
2是样本量足够大删除异常值样本;
3是从stata里学到的,对数据做结尾或者缩尾处理。这里的结尾处理其实就是同第二个方法,在样本量足够大的情况下删除首尾1%-5%的样本。缩尾指的是人为改变异常值大小。如有一组数据,均值为50,存在几个异常值,都是500多(我这么说有点夸张,大概是这个意思),缩尾处理就是将这几个500多的数据人为改为均值+3标准差左右数据大小,如改为100。
总结而言,我个人认为做数据变换的方式比较好,数据变换后再做图或描述性统计看数据分布情况,再剔除个别极端异常值。
关于SPSS回归分析
心得1:如何做好回归分析
经过多次实战,以及看了N多视频,上了N多课,看了N多专业的书。我个人总结做回归的步奏如下:
1对数据进行预处理,替换缺失值和处理异常值;
2是将单个自变量分别与因变量做散点图和做回归,判定其趋势,并做好记录(尤其是系数正负号,要特别记录);
3是自变量和因变量一起做相关系数,看各个变量相关关系强弱,为下一步检验多重共线性做准备;
4是自变量多重共线性诊断。若变量存在多重共线性,可采用主成分回归,即先将存在多重共线性的变量做主成分分析合并为1个变量,然后再将合并成的新变量和其余自变量一起纳入模型做回归;
5是做残差图,看残差图分布是否均匀(一般在+-3个单位之间均匀分布就比较好);
6是报告相应结果。
心得2:不建议采用后向步进法处理变量多重共线性
记得张文彤老师说过他有个同学做过一个研究,即采用后向步进法剔除变量的方式去做回归,得到的结果犯错的几率比较大。张老师也不建议用这个方法处理多重共线性。处理多重共线性比较好的方法是做主成分回归。
心得3:用未标准化的回归系数好,还是用标准化后的回归系数好
我个人觉得这个问题仁者见仁智者见智,要看想表达什么。具体而言,如果想表达在其它条件不变的情况下,自变量X每变化1个单位,因变量变化多少个单位,这种情况用未标准化回归系数就好;如果想比较各个自变量对因变量影响的相对大小,即判断相对而言,哪个变量对因变量影响更大。这时需要消除量纲的影响,看标准化后的回归系数。
心得4:稳健性检验
我做的是 无序多分类logistic回归模型。因变量分了5类,有一类个数比较多,达到300多,有1-2类个案比较少,只有30左右。专家提到了要做稳健性检验。这个用stata软件编程加一个robust即可解决问题。不知道在SPSS里面怎么做。欢迎知道的朋友一起讨论下。我个人认为这是一个好问题的。不做稳健性检验模型可能受一些极端值的影响,结果不稳定。可能本来显著的变量剔除1-2个样本后就变得不显著了。所以做回归分析稳健性检验也比较重要。
通知:网易云课堂《自学SPSS:数据分析12大经典案例》视频课程正在做年底回馈活动,感兴趣可以点【阅读原文】前往关注。
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
和数据小兵一起学习SPSS统计分析方法。
帮你甄选优质学习资料。
今日搜狐热点苹果/安卓/wp
积分 53, 距离下一级还需 32 积分
道具: 涂鸦板, 彩虹炫, 雷达卡, 热点灯, 显身卡, 匿名卡, 金钱卡下一级可获得
权限: 自定义头衔
购买后可立即获得
权限: 隐身
道具: 金钱卡, 变色卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
我想用spss做非线性回归分析,模型中自变量有一次项,也有二次项,还有控制变量。该用什么方法做呢?我是想发现自变量与因变量是U型关系。按道理应该是用曲线回归,可是曲线回归加不进控制变量,非线性回归貌似要有几个点的值也不好弄,该怎么办呢?求高人指教,万分感谢!
小桥流水人家
如果是单变量的非线性回归比较容易直观看出趋势,如果加入其他变量从图形上就比较抽象了,你看二次项前面的系数显著性就可以检验模型的抛物线情况
要用回归分析里面 有一栏是block 功能,先把控制变量作为一个变量移入进去,然后点击block&&再把自变量移入进去
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
论坛法律顾问:王进律师【图文】用SPSS做回归分析_百度文库
您的浏览器Javascript被禁用,需开启后体验完整功能,
享专业文档下载特权
&赠共享文档下载特权
&10W篇文档免费专享
&每天抽奖多种福利
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
用SPSS做回归分析
阅读已结束,下载本文到电脑
想免费下载本文?
登录百度文库,专享文档复制特权,积分每天免费拿!
你可能喜欢& 利用SPSS进行主成分回归分析
利用SPSS进行主成分回归分析
摘 要:利用SPSS
8.0for Windows的Linear Regression,Factor Analysis和Compute Variable等过程,结合线性回归和主成分分析的基本原理,介绍了多重
【题 名】利用SPSS进行主成分回归分析
【作 者】刘润幸 萧灿培 等
【机 构】广州暨南大学医学院,广州510632
【刊 名】《数理医药学杂志》 2001年第14卷第2期,103-105页
【关键词】多重共线性诊断 主成分回归分析 计算方法
【文 摘】利用SPSS
8.0for Windows的Linear Regression,Factor Analysis和Compute Variable等过程,结合线性回归和主成分分析的基本原理,介绍了多重性共线性诊断,主成分回归分析过程和确定最佳方程的方法。
【下载地址】
本文导航:
多重共线性诊断,主成分回归分析,计算方法
上一篇:暂无 上传我的文档
 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
如何用SPSS做logistic回归分析
下载积分:835
内容提示:如何用SPSS做logistic回归分析
文档格式:DOC|
浏览次数:380|
上传日期: 13:22:11|
文档星级:
全文阅读已结束,如果下载本文需要使用
 835 积分
下载此文档
该用户还上传了这些文档
如何用SPSS做logistic回归分析
关注微信公众号}

我要回帖

更多关于 用spss进行回归分析 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信