做回归分析时,单因素分析如何处理连续型变量性变量

[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合
回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。
&10.1 Linear过程
<font COLOR="#.1.1
简单操作入门
调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等)。
例10.1:请分析在数据集Fat
surfactant.sav中变量fat对变量spovl的大小有无影响?
显然,在这里spovl是连续性变量,而fat是分类变量,我们可用用单因素方差分析来解决这个问题。但此处我们要采用和方差分析等价的分析方法--回归分析来解决它。
回归分析和方差分析都可以被归入广义线性模型中,因此他们在模型的定义、计算方法等许多方面都非常近似,下面大家很快就会看到。
这里spovl是模型中的因变量,根据回归模型的要求,它必须是正态分布的变量才可以,我们可以用直方图来大致看一下,可以看到基本服从正态,因此不再检验其正态性,继续往下做。
10.1.1.1 界面详解
在菜单中选择Regression==&liner,系统弹出线性回归对话框如下:
<img HEIGHT="442" src="http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif" real_src ="http://www.bioon.com/biology/UploadFiles/03.gif" WIDTH="642" BORDER="0"
ALT="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合"
TITLE="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合" />
除了大家熟悉的内容以外,里面还出现了一些特色菜,让我们来一一品尝。
【Dependent框】
用于选入回归分析的应变量。
【Block按钮组】
由Previous和Next两个按钮组成,用于将下面Independent框中选入的自变量分组。由于多元回归分析中自变量的选入方式有前进、后退、逐步等方法,如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入即可。下面的例子会讲解其用法。
【Independent框】
用于选入回归分析的自变量。
【Method下拉列表】
用于选择对自变量的选入方法,有Enter(强行进入法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)五种。该选项对当前Independent框中的所有变量均有效。
【Selection Variable框】
选入一个筛选变量,并利用右侧的Rules钮建立一个选择条件,这样,只有满足该条件的记录才会进入回归分析。
【Case Labels框】
选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记录ID号的变量。
【WLS&&钮】
可利用该按钮进行权重最小二乘法的回归分析。单击该按钮会扩展当前对话框,出现WLS
Weight框,在该框内选入权重变量即可。
【Statistics钮】
弹出Statistics对话框,用于选择所需要的描述统计量。有如下选项:
Regression
Coefficients复选框组:定义回归系数的输出情况,选中Estimates可输出回归系数B及其标准误,t值和p值,还有标准化的回归系数beta;选中Confidence
intervals则输出每个回归系数的95%可信区间;选中covariance
matrix则会输出各个自变量的相关矩阵和方差、协方差矩阵。以上选项默认只选中Estimates。
Residuals复选框组:用于选择输出残差诊断的信息,可选的有Durbin-Watson残差序列相关性检验、超出规定的n倍标准误的残差列表。
Model fit复选框:模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检验:,R,R2和调整的R2,
标准误及方差分析表。
R squared change复选框:显示模型拟合过程中R2、F值和p值的改变情况。
Descriptives复选框:提供一些变量描述,如有效例数、均数、标准差等,同时还给出一个自变量间的相关矩阵。
Part and partial correlations复选框:显示自变量间的相关、部分相关和偏相关系数。
Collinearity
diagnostics复选框:给出一些用于共线性诊断的统计量,如特征根(Eigenvalues)、方差膨胀因子(VIF)等。
以上各项在默认情况下只有Estimates和Model fit复选框被选中。
【Plot钮】
弹出Plot对话框,用于选择需要绘制的回归分析诊断或预测图。可绘制的有标准化残差的直方图和正态分布图,应变量、预测值和各自变量残差间两两的散点图等。
【Save钮】
许多时候我们需要将回归分析的结果存储起来,然后用得到的残差、预测值等做进一步的分析,Save钮就是用来存储中间结果的。可以存储的有:预测值系列、残差系列、距离(Distances)系列、预测值可信区间系列、波动统计量系列。下方的按钮可以让我们选择将这些新变量存储到一个新的SPSS数据文件或XML中。
【Options钮】
设置回归分析的一些选项,有:
Stepping Method
Criteria单选钮组:设置纳入和排除标准,可按P值或F值来设置。
Include constant in
equation复选框:用于决定是否在模型中包括常数项,默认选中。
Values单选钮组:用于选择对缺失值的处理方式,可以是不分析任一选入的变量有缺失值的记录(Exclude cases
listwise)而无论该缺失变量最终是否进入模型;不分析具体进入某变量时有缺失值的记录(Exclude cases
pairwise);将缺失值用该变量的均数代替(Replace with mean)。
10.1.1.2 输出结果解释
根据题目的要求,我们只需要在Dependent框中选入spovl,Independent框中选入fat即可,其他的选项一律不管。单击OK后,系统很快给出如下结果:
Regression
<img HEIGHT="144" src="http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif" real_src ="http://www.bioon.com/biology/UploadFiles/15.gif" WIDTH="300"
ALT="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合"
TITLE="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合" />
这里的表格是拟合过程中变量进入/退出模型的情况记录,由于我们只引入了一个自变量,所以只出现了一个模型1(在多元回归中就会依次出现多个回归模型),该模型中fat为进入的变量,没有移出的变量,具体的进入/退出方法为enter。
<img HEIGHT="124" src="http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif" real_src ="http://www.bioon.com/biology/UploadFiles/69.gif" WIDTH="378"
ALT="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合"
TITLE="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合" />
上表为所拟合模型的情况简报,显示在模型1中相关系数R为0.578,而决定系数R2为0.334,校正的决定系数为0.307。
<img HEIGHT="187" src="http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif" real_src ="http://www.bioon.com/biology/UploadFiles/36.gif" WIDTH="534"
ALT="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合"
TITLE="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合" />
这是所用模型的检验结果,可以看到这就是一个标准的方差分析表!有兴趣的读者可以自己用方差分析模型做一下,就会发现出了最左侧的一列名字不太一样外,其他的各个参数值都是相同的。从上表可见所用的回归模型F值为12.059,P值为0.002,因此我们用的这个回归模型是有统计学意义的,可以继续看下面系数分别检验的结果。
<img HEIGHT="16" src="http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif" real_src ="http://www.bioon.com/biology/UploadFiles/47.gif" WIDTH="33" BORDER="0"
ALT="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合"
TITLE="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合" />由于这里我们所用的回归模型只有一个自变量,因此模型的检验就等价与系数的检验,在多元回归中这两者是不同的。
<img HEIGHT="198" src="http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif" real_src ="http://www.bioon.com/biology/UploadFiles/97.gif" WIDTH="506"
ALT="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合"
TITLE="[转载]SPSS&10.0高级教程十二:多元线性回归与曲线拟合" />
上表给出了包括常数项在内的所有系数的检验结果,用的是t检验,同时还会给出标化/未标化系数。可见常数项和fat都是有统计学意义的,上表的内容如果翻译成中文则如下所示:
未标准化系数
标准化系数
系数标准误
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。单因素分析与多因素分析的结果矛盾怎么办?
全国服务热线:400-627-0012
单因素分析与多因素分析的结果矛盾怎么办?
发布时间: | 来源: | 责任编辑:嗵嗵e研
现在的临床研究中,除了RCT研究,一般要进行多因素分析,比如病因研究、预后研究中,一般先做单因素分析(t检验、方差分析、卡方检验等),再做logistic回归、COX回归、线性回归等,可以说不做多因素分析的文章都不好意思投稿。那么问题来了,单因素分析与多因素分析的结果不相同怎么办?
我们用下表表示单因素分析与多因素分析结果对比的可能结果:
对于情形A,当单因素分析结果和多因素分析结果差异都有统计学意义时,在文章中比较好解释,我们认为这个自变量是因变量的独立影响因素;对于情形D,单因素分析结果和多因素分析结果差异都没有统计学意义时,我们认为这自变量不是因变量的影响因素。
对于情形B,在单因素分析中差异有统计学意义,但多因素中没有。这种情况也较常见。我们认为在单因素分析中,自变量与因变量是假关联或者间接影响因素,因此在多因素分析中调整了某些因素的影响后,这个自变量与因变量的“假关联”消失了。我们一般下结论:这个自变量不是因变量的独立影响因素(影响因素可以换成危险因素、保护因素、预后因素等)。
对于情形C,在单因素分析中差异无统计学意义,但多因素中差异却有统计学意义。这种情况并不常见,原因是当我们进行单因素分析差异没有统计学意义时,一般不会再将此自变量引入多因素分析。事实上,混杂因素使自变量与因变量的关联扭曲了,这里的扭曲可以是关联增强,也可以是关联减弱甚至掩盖了真实的关联。因此这种情形C就会出现了,也可以下结论这个自变量是因变量的独立影响因素。
当然我们下结论也不能太任性了。上面成立的基础是多因素分析的正确应用。实际是多因素分析是一个黑匣子,很多原因可能导致多因素分析是错误的,这就要求我们掌握多因素分析的条件,仔细检验回归模型是否正确,并与临床实际相结合,才能得到正确的结果和合理的结论。
如何确定Δ的大小
横竖大不同——文章表格中应该提供“率”还是“构成比”
配对t检验,你用对了吗?
京卫计网审[2015]第0523号&&&&&&京ICP备号&&&&&&京ICP证160408号
&&&&&&Copyright (C) 2014 北京易康医疗科技有限公司版权
全国免费咨询热线
400-627-0012Logistic回归模型使用注意事项和结果表达_百度文库
您的浏览器Javascript被禁用,需开启后体验完整功能,
享专业文档下载特权
&赠共享文档下载特权
&10W篇文档免费专享
&每天抽奖多种福利
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
Logistic回归模型使用注意事项和结果表达
阅读已结束,下载本文需要
想免费下载本文?
定制HR最喜欢的简历
你可能喜欢&#xe621; 上传我的文档
&#xe621; 上传文档
&#xe602; 下载
&#xe60c; 收藏
该文档贡献者很忙,什么也没留下。
&#xe602; 下载此文档
logistic回归变量筛选及回归方法选择实例分析
下载积分:1500
内容提示:logistic回归变量筛选及回归方法选择实例分析
文档格式:PDF|
浏览次数:626|
上传日期: 20:36:33|
文档星级:&#xe60b;&#xe60b;&#xe60b;&#xe60b;&#xe60b;
全文阅读已结束,如果下载本文需要使用
&#xe71b; 1500 积分
&#xe602;下载此文档
该用户还上传了这些文档
logistic回归变量筛选及回归方法选择实例分析
关注微信公众号}

我要回帖

更多关于 对于连续性变量 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信