spss spss线性回归分析析结果怎么看

【上一篇】【下一篇】
您可能还会对这些文章感兴趣!
最新日志热评日志随机日志
日志总数:26 篇
评论总数:524 篇
标签数量:30 个
链接总数:7 个
建站日期:
运行天数:1145 天
最后更新:《大数据-机器学习就业班@深圳》 报名咨询火爆,名额有限,有兴趣的赶紧上车,即将开课!30天培训+3个月实习,50多家企业直聘合作资源,签订就业服务协议,AI时代转行首选!/Answer/page/dashujujiqixuexi
> SPSS多重线性回归分析的关键点
鉴于多重线性回归已经到了滥用的程度,特总结一下在使用线性回归时需要注意的问题,总结为四大纪律加三项注意事项。
多重线性回归分析四大定律
1:自变量与因变量之间要存在线性关系,可以通过绘制散点图矩阵来考察,若不符合,需要进行变量的变换予以修正;
2:各个观测值y1y2y3……要相互独立,可通过残差图或durbin-watson检验予以考察;
3:残差服从正态分布,可以通过标准化残差图考察;
4:方差齐性,也可以通过标准化残差考察;
多重线性回归分析三项注意事项
1:样本量为自变量个数的5倍以上,要想效果好一些,最好20倍以上。
2:判断有无强影响点,如有应该改正数据或者剔除或采用稳健回归
3:判断自变量之间有无强相关性,如有改用岭回归等方法。
案例说明:
某公司计划在国内在开设几家分店,收集了目前分店的销售数据Y以及分店所在城市的16岁以下人数X1,人均可支配收入X2,试进行分析(选自张文彤spss统计分析高级教程99页)。
1、案例数据
两个自变量,21个样本含量,符合20倍原则
2、散点图判断线性关系
从图中可以看出,因变量与每个自变量都有线性关系。
3、多重线性回归
4、共线性,独立性和异常点判断
上图分别检查共线性,独立性和异常点
5、残差正态性检验
做残差图,横坐标为因变量,纵坐标为标准化残差。
6、结果解读
调整r的平方越近与1,回归效果越好,0.907效果不错,durbin watson值在2左右说明残差独立性较好。
p=0.000小于0.05,线性回归为显著
回归方程为y=-6.886+0.009人均支配收入+1.455人数,vif为方差膨胀因子一般只要不超过10,认为不存在共线性。
pp图,点在直线附近分布,近似一条直线,说明残差服从正态分布。
残差图,散点在零的附近均匀分布,而且没有超过正负3,认为残差服从正态分布且方差齐,且没有强影响点。
作者:小兵精选
来源:http://www.datasoldier.net/post/yang1.html
转载请注明: &
or分享 (0)大数据(21)
,最近一直很忙,公司的潮起潮落,就好比人生的跌岩起伏,眼看着一步步走向衰弱,却无能为力,也许要学习“步步惊心”里面“四阿哥”的座右铭:“行到水穷处”,”坐看云起时“。
&&&&接着上一期的“多元线性回归解析”里面的内容,上一次,没有写结果分析,这次补上,结果分析如下所示:
结果分析1:
由于开始选择的是“逐步”法,逐步法是“向前”和“向后”的结合体,从结果可以看出,最先进入“线性回归模型”的是“price in thousands&&& 建立了模型1,紧随其后的是“Wheelbase&& 建立了模型2,所以,模型中有此方法有个概率值,当小于等于0.05时,进入“线性回归模型”(最先进入模型的,相关性最强,关系最为密切)当大于等0.1时,从“线性模型中”剔除
结果分析:
1:从“模型汇总”中可以看出,有两个模型,(模型1和模型2)从R2 拟合优度来看,模型2的拟合优度明显比模型1要好一些
(0.422&0.300)
2:从“Anova&表中,可以看出“模型2”中的“回归平方和”为115.311,“残差平方和”为153.072,由于总平方和=回归平方和+残差平方和,由于残差平方和(即指随即误差,不可解释的误差)由于“回归平方和”跟“残差平方和”几乎接近,所有,此线性回归模型只解释了总平方和的一半,
3:根据后面的“F统计量”的概率值为0.00,由于0.00&0.01,随着“自变量”的引入,其显著性概率值均远小于0.01,所以可以显著地拒绝总体回归系数为0的原假设,通过ANOVA方差分析表可以看出“销售量”与“价格”和“轴距”之间存在着线性关系,至于线性关系的强弱,需要进一步进行分析。
&结果分析:
1:从“已排除的变量”表中,可以看出:“模型2”中各变量的T检的概率值都大于“0.05”所以,不能够引入“线性回归模型”必须剔除。
从“系数a” 表中可以看出:
1:多元线性回归方程应该为:销售量=-1.822-0.055*价格+0.061*轴距
但是,由于常数项的sig为(0.116&0.1) 所以常数项不具备显著性,所以,我们再看后面的“标准系数”,在标准系数一列中,可以看到“常数项”没有数值,已经被剔除
所以:标准化的回归方程为:销售量=-0.59*价格+0.356*轴距
2:再看最后一列“共线性统计量”,其中“价格”和“轴距”两个容差和“vif都一样,而且VIF都为1.012,且都小于5,所以两个自变量之间没有出现共线性,容忍度和
膨胀因子是互为倒数关系,容忍度越小,膨胀因子越大,发生共线性的可能性也越大
从“共线性诊断”表中可以看出:
1:共线性诊断采用的是“特征值”的方式,特征值主要用来刻画自变量的方差,诊断自变量间是否存在较强多重共线性的另一种方法是利用主成分分析法,基本思想是:如果自变量间确实存在较强的相关关系,那么它们之间必然存在信息重叠,于是就可以从这些自变量中提取出既能反应自变量信息(方差),而且有相互独立的因素(成分)来,该方法主要从自变量间的相关系数矩阵出发,计算相关系数矩阵的特征值,得到相应的若干成分。
从上图可以看出:从自变量相关系数矩阵出发,计算得到了三个特征值(模型2中),最大特征值为2.847, 最小特征值为0.003
条件索引=最大特征值/相对特征值 再进行开方 (即特征值2的 条件索引为 2.847/0.150 再开方=4.351)
标准化后,方差为1,每一个特征值都能够刻画某自变量的一定比例,所有的特征值能将刻画某自变量信息的全部,于是,我们可以得到以下结论:
1:价格在方差标准化后,第一个特征值解释了其方差的0.02, 第二个特征值解释了0.97,第三个特征值解释了0.00
2:轴距在方差标准化后,第一个特征值解释了其方差的0.00, 第二个特征值解释了0.01,第三个特征值解释了0.99
可以看出:没有一个特征值,既能够解释“价格”又能够解释“轴距”所以“价格”和“轴距”之间存在共线性较弱。前面的结论进一步得到了论证。(残差统计量的表中数值怎么来的,这个计算过程,我就不写了)
从上图可以得知:大部分自变量的残差都符合正太分布,只有一,两处地方稍有偏离,如图上的(-5到-3区域的)处理偏离状态
&&& 下班了,有时间继续写,百度空间发表文章,为什么过几分钟,就输入不了文字了啊
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:99515次
积分:1715
积分:1715
排名:第18240名
原创:68篇
转载:26篇
评论:16条
(1)(5)(2)(1)(1)(15)(1)(3)(11)(4)(2)(9)(2)(1)(2)(6)(4)(4)(4)(1)(27)(1)(2)(1)}

我要回帖

更多关于 spss多元线性回归分析 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信