700多的数据能进行正态性如何分析正态分布图吗

苹果/安卓/wp
积分 48, 距离下一级还需 37 积分
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡下一级可获得
权限: 自定义头衔
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
本帖最后由 Kristen_pasur 于
15:56 编辑
这是初中级教程书上的题目:
一家汽车厂设计出3种新型号的手刹,现欲比较它们与传统手刹的售寿命。分别在传统手刹,型号Ⅰ,型号Ⅱ,型号Ⅲ中随机选取了5只样品,在相同的实验条件下,测量其使用寿命(单位:月),结果如下。
传统手刹:21.2& &13.4& &17.0& &15.2& &12.0
型号Ⅰ:& & 21.4& &12.0& &15.0& &18.9& &24.5
型号Ⅱ:& & 15.2& &19.1& &14.2& &16.5& &20.3
型号Ⅲ:& & 38.7& &35.8& &39.0& &32.2& &29.6
(1)各种型号间寿命有无差别?
(2)厂家的研究人员在研究设计阶段,便关心型号Ⅲ与传统手刹寿命的比较结果。此时应当考虑什么样的分析方法?如何利用SPSS实现?
我做出来手刹的寿命这组数据的正态性,PP图和直方图都显示不好。
我就用“将标准化得分另存为变量”,想把它变成标准正态分布。然后用标准化后的新变量做单因素方差分析,结果带正态曲线的直方图没有任何变化,数据并没有服从标准正态分布。
以上结果图都上传在图片附件里了。
变量变换是方差不齐的时候用的。正态性不好也能用变量变换的方法解决吗?
说 连续性变量 用 参数检验& && &&&(参数检验只包括T检验或方差分析吗?)
有 序分类变量 用 非参数检验。
又说如果 变量变换后 数据正态性和方差齐性还是不好,就用非参数分析。
那如果 连续性变量 通过 变量变换后 数据正态性和方差齐性还是不好,就用非参数分析?
第二个小问是问3号型号和传统型的寿命的比较结果。我觉得是事先计划的,而且也没有说要验证哪个型号是最好的这类观点,属于不知道结果的探索性分析,所以用SCHEFFE法。
请问老师思路对吗?
题目:北京大学和清华大学时国内一流的两所大学,这两个学校都声称自己的录取分数是全国最高的,这里就用统计方法来判断他们的录取分数是否有差别。
这题张老师用的是两个配对样本的非参数检验,为什么不是独立样本的检验呢?两所大学的录取平均分我看不出有关联。请教张老师~
载入中......
附件: 你需要才可以下载或查看附件。没有帐号?
本帖最后由 zqy100200 于
12:30 编辑
我来掺和一下,也请张老师看看我理解有没有问题。
1 第一道题,4个样本应该分别考察正态性,pp图显示正态性情况还行。t检验对正态性有一定的耐受性。楼主为什么会把四个样本混合成一个样本考察?
2 第二题中两个样本的相关性很高,非彼此独立的两个样本,所以不能用检验独立样本的方法检验。
(在不考虑数据背景的情况下,选择独立样本检验还是配对样本检验,可先进行相关分析,检验两样本的相关性。相关则用配对,不相关则用独立样本检验。这样理解对吗?请教张老师)
听楼上说的第一题我懂了,前后联想这应该是4组数据的。
我只联想到有型号和寿命两个变量。
第二题的关联性我看不出来,可否说的再明白一点?
我不知道数据怎么输入了。
我这样输入,找不到自变量了。
附件: 你需要才可以下载或查看附件。没有帐号?
Kristen_pasur 发表于
听楼上说的第一题我懂了,前后联想这应该是4组数据的。
我只联想到有型号和寿命两个变量。第二题:北京大学和清华大学时国内一流的两所大学,这两个学校都声称自己的录取分数是全国最高的,这里就用统计方法来判断他们的录取分数是否有差别。
比如北京地区:& & 北大录取分数:637.8& &&&清华录取分数:638.7
首先北大的平均分应该是从北大这批录取的北京学生的分数中得出的,这批北京学生和清华录取的北京学生肯定不能是同一个人,因为一个学生不能上2个学校。那么不是同一个人,考出来的分数关联性应该几乎没有啊?每个被录取的学生是一个样本,这些样本应该是独立的样本了。
本帖最后由 zqy100200 于
11:36 编辑
关于手刹寿命这道题:
1如果是楼主这样录入数据,可以用配对样本t检验。
附件: 你需要才可以下载或查看附件。没有帐号?
也可以将数据录入为一列,作为寿命变量,同时增加一个分组变量。
用独立样本t检验,进行两两比较。
也可以用单变量方差分析,再两两比较。
这三种方法的结果是一样的。
张老师,我这样做,有适用条件不当的问题吗?
本帖最后由 zqy100200 于
12:33 编辑
关于北大清华分数线这道题:
KS检验表明,两个样本都不是正态分布,而直方图也看不出偏得怎么样。用独立样本t检验,结果表明方差是齐的,两样本均值之间无差别。用配对样本t检验,结果也是均值无差别。
我的问题是:
1参数检验结果与非参数检验结果相同(两样本来自同一总体),而且样本非强烈偏态以及方差齐这些条件并未特别显著地违反t检验适用条件,因此,就本例而言,做参数检验也是可接受的。这么说对吗?
2好像能做方差齐检验的样本都是独立样本?用检验独立样本的方法检验相关样本的方差齐是一件很无厘头的事情?
本帖最后由 Kristen_pasur 于
13:38 编辑
一:为判断奶粉重量是否合格,根据抽样数据做单样本t检验(预设奶粉重量总体为正态分布)
奶粉这道题,要预设奶粉重量总体为正态分布,需要先做PP图看样本数据的正态性吧?
如果服从正态性,就说明它来自正态分布的总体是吗?就可以做T检验了是吗?
可否建议张老师把每张练习题的答案汇总给我们?这样我才能判定自己学的想的思路到底对不对。
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
加入我们,立即就学扫码下载「就学」app& Join us!& JoinLearn&
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
京公网安备号
论坛法律顾问:王进律师你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
在进行T检验的时候,一般要求检验的两组数据要是正态分布,但是如果数据不是正态分布的怎么办呢?
比如一个过程,改进前和改进后进行T检验,结果发现改进后的数据不是正态分布的,这个时候如何做T检验?多谢!
使用双总体T检验(即2-SampleT)必须满足下列3个条件,在使用前一定要先进行验证检验,一旦条件不满足,就不再能使用此检验。
我赞成云淡风清的观点:
YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY按照Oliven的观点,没有必要对样本进行检验,只需搞清总体数据本身的特性即可,但是我想不出除了通过
抽样来认识总体外还有什么手段?
其次即便你搞清了总体是应该服从正态分布的,但如果其中由于一些特殊的原因造成数据偏态分布,这种情况下你如何去做,难不成置之不理!?I
YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
在计算机已经如此发达的当今时代,人们进行统计分析的关键支出是花时间花金钱做试验采集数据,一旦数据收集完毕,计算的花费已几乎可以忽略不计。换言之,当前统计工作的主要任务是对于现有数据要最充分地挖掘出它们所包含的信息。既然要“最充分”,怎么可能“搞清总体数据本身的特性即可”,“没有必要对样本进行检验”呢?有了数据岂有白白放过的道理?
当然,如果数据量太小,甚至于没达到检验所需最小数据量,因而有些检验不可能进行,这当然没办法。但是,一旦允许进行检验,而只是由于“坚信”自已已“搞清总体数据本身的特性”而放任自流,那不是已掌握统计方法的人应该持有的态度。“除了通过抽样来认识总体外还有什么手段?”问得很深刻。
我们看看3个检验最小样本量是多大?
1.独立性检验
T检验的首要前提是两个样本观测值都必须是独立的。其实在单样本Z检验或T检验时也都有此要求。因为数据如果不独立,则下面所有的检验步骤与公式都无意义。
检验独立性方法有两个:
1)样本量大于40,可以用时间序列分析检验。
使用时间序列分析检验方法的原理是,看自相关函数(Auto-Correlation Function)和偏自相关函数(Partial Auto-Correlation Function)中,在Lag10以内,是否有自相关函数项或偏自相关函数项超过临界值。一旦有超过,则应该盘数据不独立。这些在MINITAB的时间序列分析窗(Time Series Analysis)中可以很方便地得到有关结果。图上有条红色界线,如果没有任何一个自相关系数或偏自相关系数超过临界值(红线)则可以判数据独立。
2)样本量大于9,就可以进行“游程检验”。
这里要说明的是MINITAB软件给的方法不全面。在MINITAB中,用
STAT=&Non Parametric Test=&Runs Test
可以得到游程检验的大样本的正态近似法,这里的条件是n&= 22。 游程检验的含义是,游程个数太多或太少,就都可以认为数据不独立。一旦能够判断游程个数不是太多或太少就都可以认为数据是独立的了(化为标准正态后,绝对值在1.96以内即可)。用p-value&0.05,即可同样判断数据是独立的。
其实样本量未达到22时, 用上述方法是不行的。MINIATAB 会给出警告信息,对此不能置之不理。其实,游程检验有精确方法, 在样本量大于9时就可以使用。操作是:
STAT=&Quality Tool=&Run Chart
可以提供出序列对于中位数的总游程数, 再查马林编《六西格玛管理》一书的第560页,附录表10,游程检验表,当游程个数太多或太少时(超过表中双侧拒绝域临界值),判数据不独立。
要注意,样本量未达到22时,不能直接使用MINITAB中Runs Test的结论。
2.正态性检验.
正态性也是必须检验的。 详细的检验方法这里不在赘述。现在的检验方法相当灵敏。所谓“灵敏”指的是“总体非正态能很快被鉴别出来”。事实上,对于Anderson-Darling及 Ryan-Joiner两种方法都能有例子说明,只要有4个以上样本就能判定拒绝正态。当然,根据假设检验基本概念,大家都知道“不能拒绝”时是没有说服力说明它确实为正态的。样本量小时,确实不容易判定分布对于正态性的偏离,但样本量小是客观条件限制的结果,这种情况下,是应该提倡“检验”还是提倡“搞清总体数据本身的特性就行”呢?事实很明显,拿到样本后,不论是否已“搞清总体数据本身的特性”,都应该进行检验。 如果你确实来自正态总体,对这样的数据进行检验,你还用“怕”什么或“担心”什么吗?那为什么还有人建议“没有必要对样本进行检验,只需搞清总体数据本身的特性即可”呢?统计假设检验就是要打破那种自以为已经“搞清总体数据本身的特性”的观念的。请问还有什么理由认为“没有必要对样本进行检验”呢?请注意到这样提倡的结果将会导致多么严重的结果啊!,
3.方差相等性。
这也是2-SAMPLE T检验的前提条件之一。很多人忽略了。纵然,在MINITAB软件操作中,在T检验时,对于两总体方差相等与否,只是在进入选项中判定勾选或不勾选“是否假定等方差”钮而已,但实际上这二者含义完全不同。“假定等方差”下的计算是精确T检验,“不假定等方差”下的计算则只是一种近似方法而已,自由度会大幅度减小,功效会大幅降低,只是一种不得已而为之的策略。对此条件一定要事先验证好。方差相等性检验样本量没有限制,F检验要求各自都在2个样本以上,Levenes检验要求各自都在3个样本以上即可。
对于云淡风清最后的问题
YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
即便你搞清了总体是应该服从正态分布的,但如果其中由于一些特殊的原因造成数据偏态分布,这种情况下你如何去做,难不成置之不理!?i
YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
我的回答是不能置之不理
有些书建议先用Box-Cox变换处理一下。其实,用Box-Cox变换来进行假设检验(包括单总体检验)在理论上都只是一种近似方法,不应该首选。最好的办法还是直接使用非参数方法。双样本可以使用Non-Parametrics =& Mann-Whitney检验, 很容易就得到结果了,而且Mann-Whitney检验之功效只略比2SampleT检验稍小一点点,值得作为非参数方法的首选。Mann-Whitney检验样本量最小的限制是:单侧:(2,4),双侧:(2,6),(3,4)。
我想我们现在讨论不只是一个具体检验方法问题,这里牵涉到如何对待检验,何时可以“不做检验直接判断”的问题。这是有关于统计理念的一件大事情,不可不讨论清楚,所以才写了这么个长帖。本人是书呆子,难免发些呆论,敬请批评指正。
Student-xuling0688
39 个回复,游客无法查看回复,更多功能请或
男人无所谓正派,正派是因为受到的引诱不够;女人无所谓忠诚,忠诚是因为背叛的筹码太低.
扫一扫微信订阅
浏览: 14745
关注: 0 人
6SQ质量日刊
服务号: Lsqdnet
6SQ质量周刊关注今日:43 | 主题:176523
微信扫一扫
扫一扫,下载丁香园 App
即送15丁当
【求助】各位行家:方差分析前必须做正态性检验吗
页码直达:
这个帖子发布于7年零235天前,其中的信息可能已发生改变或有所发展。
各位老师们:
1、方差分析前只做个方差齐性检验不行吗,必须还要做个正态性检验吗?
2、三个独立样本,如果方差齐性检验得出某些指标(如心理问题中的焦虑、抑郁维度等)的方差不齐,那么对这样的指标接下来用什么方法做两两比较呢分析呢?
不知道邀请谁?试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
首先做正态性检验,如果满足正态性分布,而且各组例数相等,可以认为方差齐,结果相对可信。可以直接用方差分析。如果各组不等,需要转化一下。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
如何转化?这也是我关心的问题。谢谢了。为什么必须是例数相等,这个在实际的情况中,不一定能保证啊。还有就是如果不是正态分布,如何处理不符合正态的这些组
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
可以倒数,可以square, 可以指数,很多种转化方法 ,看看spss、computing, 里面很多,可以自己试试。例数相等的道理可以看看书本上的原理。不是正太分布的话,只能用非参数检验了。 自给自足,多看看别人资料。
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园}

我要回帖

更多关于 正态分布图分析 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信