选择统计学归因分析法分析法时主要应考虑哪些方面

1.金融统计的性质有哪些? 答:第一,金融统计是从总体上对客观金融现象进行研究的。第二,金融统计研究金融领域内容客观现象的现状及发展过程。第三,金融统计必须定性分析和定量分析相结合,才能有效地揭示金融活动的规律。第四,金融统计研究的目的在于探寻金融活动的规律。
2.做好金融统计设计工作,要注意哪些问题? 答:第一,明确金融统计研究的目的;第二,确定金融统计指标和指标体系;第三,确定金融统计分析的内容和方法;第四,制定调查方案,选择调查方法;第五,制定金融统计整理方案。
3.金融统计分析主要有哪些方法? 简述金融统计整理的一般步骤。答:第一,大量观察法;第二;综合分析法;第三,归纳推断法;第四,数学模型法。步骤:第一,设计和编制金融统计资料的汇总方案;第二,对原始资料进行审核;第三,用一定的组织形式和方法,对原始资料进行分组、汇总和计算;第四,对整理好的资料进行审核,改正在汇总过程中发生的各种差错;第五,编制金融统计报表,以简明扼要的方式来反映金融现象在数量方面的有关联系。
4.简述金融统计分析的基本步骤。答:第一,确定分析目的并选定分析题目;第二,拟订分析提纲;第三,搜集、鉴别、整理资料;第四,进行分析,得出结论;第五,根据分析结果提出统计分析报告
5.现代金融统计在经济发展中的作用主要表现在哪些方面? &
6.简述商业银行统计分析的主要内容、统计资料来源及统计分析的意义。 答:主要内容:商业银行统计主要围绕其主要业务和经济效益情况展开,包括:第一,资产负债统计,其中包括资产业务统计、负债业务统计、信贷资金营运分析等;第二,经济效益分析,其中包括社会经济效益分析,银行自身经济效益分析等。
来源:资料来源于商业银行自身业务运营中积累的大量业务数据,也来源于宏观经济环境的一些指标数据。具体说来,主要包括以下几类:①业务经营数据②信贷数据③金融市场和同业数据④宏观经济数据⑤为某一目的进行的调查得到的数据资料。
意义:①通过分析主要业务以及经济效益的各项统计指标,银行的领导层、决策者能够把握银行的经营情况,分析不足,预测未来的走势,制定有效的经营方针,提高银行的业务水平。②通过统计分析商业银行的经营状况,中央银行可以更好地了解商业银行的经营情况,从而更行之有效、有的放矢地对商业银行进行管理。③通过商业银行公布的有关自身经营状况的分析统计,社会经济中的其他成分能够了解到与自身发展相关的信息,特别是关于社会资金流量的信息,从而能更好地为自身的良好发展做出规划。④通过商业银行的统计分析数据,国家经济发展规划部门也能更为清楚地认识现阶段社会各经济部门的发展状况、社会资金的流向,从而更好地调整、规划社会经济的发展。
7.什么是利率风险?常见的利率风险评估与预测方法有哪些? 答:利率风险就是指由于预期的市场利率水平与到期的实际市场利率水平产生差异而导致形成损失的可能性。评估方法:①缺口分析②期间分析法预测方法:①经济计量预测方法②判断预测法③技术预测方法(也叫图表法)
8.货币政策中间指标的选择一般有哪些原则?存款准备金为什么可以作为货币政策的中间指标?(P45)答:原则:①可测性②可控性③相关性④抗干扰性原因: 存款准备金由商业银行的库存现金及其在中央银行的准备金存款两部分组成,包括法定准备金和超额准备金。⑴就可测性而言,存款准备金尤其是法定存款准备金是满足这一要求的。因为法定存款准备金是商业银行缴存中央银行的,所以中央银行对其可以了如指掌。⑵就可控性而言,存款准备金也是容易满足要求的。首先,因为存款准备金是中央银行负债的组成部分,所以只要中央银行控制住创造负债的总规模,也就是能控制住存款准备金。其次,从商业银行的存款准备金来源看,无非是吸收的存款、自有资金,向中央银行借入的款项、金融市场上筹措的资金。商业银行可以通过控制自身负债规模、要求商业银行进行中报注册、控制向商业银行的贷款规模等手段来对存款准备金加以控制。⑶就存款准备金与货币政策目标的相关性而言,也是可以满足要求的。银行体系存款准备金增加,则意味着信贷规模的萎缩、货币供应量的减少,有利于减少社会总需求,稳定物价,促进经济稳定发展。而银行体系的存款准备金减少,也可以在一定程度上抑制经济衰退,促使经济复苏。
9.商业银行竞争力比较的基本框架是什么?(P89)答:①对我国银行业的现实竞争力的分析②对我国银行潜在竞争力的分析③对我国银行业竞争力的环境分析④对我国银行业竞争态势的分析
10.为什么说政策性银行具有政策性和商业性的双重性质?(P92)答:①政策性银行是政府机构。政策性银行通常由政府机构创设或由政府直接经营。政府为政策性银行提供运作条件,为其拨付资本金,为其筹资提供担保。因此,政策性银行必须依据政府宏观决策和法规行事,为政府出台的产业政策、经济政策服务,实施政府意图。②政策性银行是政策机构,这主要体现在其职能和任务是贯彻国家产业政策和区域发展政策。此外,政策性银行一般要以政府经济职能和政策为依据,按照政府的意向来安排其融资活动好资产负债结构。③政策性银行还是金融机构。它在为政策性业务进行融资时,并不放弃对利润的获取。这是由于政策性银行仍然具有一般银行的基本属性,仍然遵循一般的信用原则,它在发放贷款时,仍有收回本息的责任和义务。政策性银行与商业性金融机构一样具有信用中介职能,同时它又非完全的金融企业,与政府有着特殊密切的关系。因此,政策性银行是一类特殊的金融企业。
11.简述金融稳健统计的含义 。答:金融稳健统计通过一系列指标来监测一个国际金融体系的运行情况,分析金融体系的实力和脆弱性,进而发现金融运行中存在的问题,为防范金融风险,提高金融体系的稳定性提供支持。
12.简述风险加权资产的概念。(P160)答:风险加权资产是用表内资产所面临的风险和损失的可能性作为因子对表内资产进行加权平均,以计算风险资产的规模。
13.简述存款机构核心指标的内容。答:资本充足性、资产质量、收益与利润、流动性、对市场风险的敏感程度
14.金融的内在不确定性是如何产生的,银行经营中如何表现? (P175)答:信用的出现导致了货币价值与其内在价值的不一致,这种不一致产生了金融活动中的不确定性问题。信用货币制度的出现,最大限度地深化了交换媒介的功能,同时,它使价值尺度开始缺乏相应的统一标准,不同的人会根据自身的偏好做出可能不一致的判断,其结果就使相同货币量表现出不同的价值水平,或者说,相同价值水平的经济品,不同人有不同货币量的评价。个人判断的不一致与集体判断的非统一性使得作为价值尺度的货币在价值量的评价上表现出它的内在不确定性。
15.为什么金融风险管理离不开统计分析? (P179)答:无论投资者是冒险型、保守型还是风险中性型,在风险管理中,都必须要计算最大概率,要么计算可能最好或最坏之结果,最常见的还是计算期望收益值。纵观风险管理中这些定量的处理技术,不难发现,他们无一不是使用的统计方法。因此,金融风险管理的任何一个环节都离不开统计分析,统计分析构成金融风险管理中的一个重要的内容。
16.衡量金融风险的方法主要有哪些?它们分别有哪些缺点? (P184)答:①σ或σ2 :现实中会存在用σ作为风险的度量明显与现实情况不符,即某种项目的投资无论在什么情况下都不会给投资人带来损失,但收益率还是不固定。②β值:用这种方法度量风险显然没有反映不同价格购买第j中资产的风险差别。然而,当投资者以不同价格购买同种资产时,所面临的风险肯定是不同的,购买价格越高,风险就越大,这是显而易见的。③范围法:它衡量风险,仅仅考虑最大与最小收益两个极端情况,这种处理方法实际上是将最有利的结果和最坏的结果同等地以50%的概率对待。两外,由于范围法只考虑最好与最坏的两种极端情况,自然就只包含了较少的信息状况,它不能全面反映信息在风险管理中的作用。
17.什么是风险承受能力?度量的指标是什么?答:风险承受能力是指行为人能够接受的最大损失占其财富的比重。度量的指标是风险偏好,当行为人的财富一定时,行为人的风险承受能力完全取决于它的风险偏好,行为而越喜欢风险,其风险承受能力就越强,否则,就越弱。
18. 适应性预期与静态预期和外推预期的关系是怎样的?它的不足之处有哪些?(P181)答: 适应性预期比外推预期在理论与方法上又更进了一步,它不仅包含静态预期,而且包含了外推预期。 不足:①当前期预期值正好与实际值相同,可得P*t=P*t-1,也就是说,本期的预期值与上期的实际值相同,它归结为静态预期。若该变量具有趋势特征,则本期的预期值必然会偏离实际值,至于偏离程度的大小,则取决于事物本身的波动。②本期的预期值取决于前期的预期值和前期预期的误差,若前期的误差是由偶然因素的影响所致,那么调整后的本期预期值就有可能比不调整的偏离更大。③适应性预期的调整是一种规范的调整形式,它只需要前期预期误差,除此之外,任何其他信息均没有什么作用,这种预期行为显然没有能充分利用已有的信息资源。
19.无违约债券的票面利率受哪些因素制约,如果发行人根据自身需求确定了融资期限、融资规模和发行方式,那么无违约债券的票面利率由什么因素决定。 答:⑴取决于:发行价格Pa,债券的期限n,票面面值mv;市场利率r⑵完全取决于:市场利率r
20.什么是流动补偿?它是怎样确定的?(P210)答:由流动性偏好假设知,时间价值就是对投资者的流动补偿。如何确定:(见P210上半部分)
21.什么是即期利率、远期利率,它们的区别是什么? (P206)答:即期利率是指在某一时刻i,期限为T的利率水平。远期利率是指现在确定的,从未来某一时刻i开始,到未来另一时刻j结束,某一期限为T=j-i的利率水平。区别:(见P206图下方文字)
22.什么是债券的凸度?它与债券价格随利率变动的关系式什么?(P217)答:债券的凸度被定义为债券价格对利率的二阶导数与债券价格的比率,即C=(1/P)*(d2P/dr2)
23.什么是违约风险、违约溢价,违约溢价如何来确定? 答:违约风险是指债券发行人在债券到期时无力偿还本金及利息而产生的风险。违约溢价是指债券承诺的到期收益率与预期的到期收益率之差。确定:违约溢价的大小取决于违约的可能性(以违约概率来衡量)和发生违约时债券持有者可能遭受的经济损失。在违约溢价、违约的可能性和发生违约时债券持有者可能遭受的经济损失这三个变量中,只要知道其中任意两个,便能确定第三个变量。
24.利用市盈率指标对股票价值进行判断,有哪些优缺点? (P240)答:优点:①市盈率模型可以直接用于不同收益水平的股票的价格的比较;②对于那些不支付股息的股票,市盈率模型同样可以对股票价值进行判断,而股息贴现模型则不能使用;③虽然市盈率模型也需要对有关变量进行预测,但所涉及的变量预测要比股息贴现模型简单
缺点:①市盈率模型理论基础较为薄弱,而股息贴现模型的逻辑性较为严密;②在进行股票投资价值比较时,市盈率模型只能比较股票间的相对价值,而不能比较股票的绝对价值
25.股票价格指数的计算都有哪些方法,它们的优缺点分别是什么? (P229)答:①简单算术平均法②综合平均法③几何平均法④加权平均法
26.通货膨胀对上市公司的影响是怎样的,公司应该如何努力才不会在通货膨胀的环境中降低公司股票的实际价值?(P242)答:通货膨胀对企业的微观影响表现为:通货膨胀之初,&税收效应&&负债效应&&存货效应&&波纹效应&有可能刺激股价上涨;但长期严重的通货膨胀,必然恶化经济环境、社会环境,股价将受大环境影响而下跌。如何努力:???
27.对股票投资进行基础分析的内容主要有哪些? (P240)答:⑴经济分析:国内生产总值、通货变动、失业率、利率、汇率、财政收支状况 ⑵行业分析:行业的市场结构分析、行业的生命周期分析、行业产品的供需分析、行业的技术进步因素分析、行业的政策因素分析 ⑶公司分析:公司基本分析、公司重大事项分析、公司财务分析
28.一个投资组合的风险可以被分解为哪两部分?随着组合中证券种类的增多,哪种风险能够被消除,哪种风险不能被消除,为什么?(P255)答:分解为非系统风险和系统风险。由于非系统风险只对局部股票收益产生影响,因此,它可通过投资者的分散投资组合来加以规避,故又可称可多样化风险。如持有多种股票,当有些股票价格下跌、股息减少时,另一些股票价格可能上升,这样此升彼落就可能使风险彼此冲销。
29.什么是两基金分离定理?它的经济含义是什么? (P261)答:也就是说,如果找到一个有效前沿的投资组合WM,再找到一个与它线性无关(代数意义上)的有效组合WaM,就可以表示出所有的有效前沿的投资组合WP。在有效前沿上的任意一个投资组合都可以由有效前沿上两个线性无关的投资组合线性地表示出来。这就是著名的&两基金分离定理&。经济含义:假...
人人移动客户端下载统计分析方法有哪些,其基本功能和适用范围是
我的图书馆
统计分析方法有哪些,其基本功能和适用范围是
统计分析方法从根本上说有两大类,一是逻辑思维方法,二是数量关系分析方法。在统计分析中二者密不可分,应结合运用。  逻辑思维方法是指辩证唯物主义认识论的方法。统计分析必须以马克思主义哲学作为世界观和方法论的指导。唯物辩证法对于事物的认识要从简单到复杂,从特殊到一般,从偶然到必然,从现象到本质。坚持辨证的观点、发展的观点,从事物的发展变化中观察问题,从事物的相互依存、相互制约中来分析问题,对统计分析具有重要的指导意义。  数量关系分析方法是运用统计学中论述的方法对社会经济现象的数量表现,包括社会经济现象的规模、水平、速度、结构比例、事物之间的联系进行分析的方法。如对比分析法、平均和变异分析法、综合评价分析法、结构分析法、平衡分析法、动态分析法、因素分析法、相关分析法等。
常用统计分析方法一.统计学的定义& & & 统计是一种具有悠久历史的社会实践活动。可以说,自从有了国家,就有了统计工作。最初的统计活动是为统治者管理国家的需要而进行的搜集资料的工作,涉及到计算国家的人力、物力和财力等活动。今天,统计已经发展成为各行各业开展活动时必不可少的一项基础工作,所有搜集信息和处理信息的活动,都可以归结为统计工作。& & & 古往今来的统计学者对统计学给予了不同的定义。根据美国统计学家David Freedman等著的《统计学》(魏宗舒等译,中国统计出版社,1997年版)中的定义:统计学是对令人困惑的问题作出数字设想的艺术。& & & 把统计学称为艺术显然有些夸张,但这一定义的目的正在于提示统计工作者,应当创造性地提出和解决统计问题,不应囿于某些条条框框去理解统计这门科学。案例:& &在一个水库中养着许多鱼,管理人员希望了解鱼的大致数量,这就是一个实践中的统计学问题。& &由于鱼是不听从指挥,会在各处自由游动的,因此,在进行统计时,必须创造性地提出解决方案。& &一种解决方法是先从水库的不同位置一共捕上来1000条鱼,在每条鱼的尾部作上一个标记,应当保证标记不会影响鱼的自由游动。然后,将鱼全部放回水库。几天后,从水库中再捕上来2000条鱼,检查其中尾巴上有标记的鱼的数量。假定在第二次捕上来的2000条鱼中,有20条尾巴上做了标记,则可以推断,水库中鱼的总数大致为1000/(20/2000)=10万条& & & 上述这个案例在实践中是经常见到的,对于一个统计工作者来说,作出一个10万条鱼的估计是不够的,他还应当对这一估计的精度作出判断。但这种搜集统计数据的方法,更多地是一种艺术,是很难从书本上学到的。在实践工作中,统计的应用方面是十分复杂的,只有将统计理解为一种艺术,创造性地提出新的方法去解决新的问题,才是真正地掌握了统计的精髓。& & & 统计学的研究方法从根本上说,是从数据出发去研究自然和社会经济规律,这一点与其他科学存在着显著的区别。例如经济学,是通过对各种经济主体行为的理论分析,探讨经济规律,而统计学在研究经济现象时,是从结果出发,去探寻其中的规律。& & & 统计学从学科分类上看,可以分为理论统计学和应用统计学两大部分。理论统计学(Theoretical Statistics)是指统计学的基本原理,主要研究统计学的一般理论问题,尤其是各种统计方法的数学理论问题。应用统计学(Applied Statictics)是研究如何应用统计方法去解决实际问题的,应用统计学一般都与特定的领域相联系。例如,统计学在教育领域的应用,称为教育统计学;在经济领域的应用,称为经济统计学;等等。& & & 本门课程主要讲授理论统计学的一些基本概念和方法,又称为统计学原理课程。二.统计学原理的学科构成& & & 统计学原理是一个复杂的体系,不同的学术机构对于这门学科的构成进行了不同的阐述。美国数学学会出版的《数学评论》中对统计学的分类:& &A.基础;B.充分性和信息;C.决策理论;D.抽样理论和抽样调查;E.分布理论;F.参数推断;G.非参数推断;H.多元分析;I.线性推断;J.试验设计;K.序贯分析;L.随机过程推断;M.工程统计学;N.应用;O.统计表& & & 从非统计专业的学生学习的角度来看,统计学原理可以分为四个大的组成部分:& & & 1.调查与实验设计& & & 调查与实验设计涉及到统计中获得原始数据的各种方法。调查是在社会经济统计中获得原始数据的主要手段。随着市场经济的发展,调查在经济活动中所起的作用越来越大,企业的经营,政府的决策,都离不开来自调查的第一手数据。& & & 在科学研究过程中,获得统计数据的手段还包括实验方法。实验是在研究对象进行一定控制的情况下获得数据的方法。& & & 2.描述统计& & & 描述统计包括整理、显示和分析数据的一系列方法。调查或者实验中所获得的有关事物整体的原始资料,往往是零乱和不系统的,需要经过一系列的统计处理,才能转化为人们可以直接阅读和理解的信息。这种针对事物整体数据的统计处理工作,被称为描述统计。& & & 3.推断统计& & & 在有些情况下,人们获得的统计资料并非事物整体的状况,而是来自事物的一个局部。如果利用局部的数据去推断整体的情况,以及这种推断的有效性和可靠性如何,即是推断统计所要研究的内容。& & & 4.多元统计分析& & & 在统计课程设计中,多元统计分析是一个独立的部分,主要涉及到对多变量情况的研究。例如,描述一个人的能力,需要从科研能力、动手能力、组织能力等多个方面进行综合判断,如果对涉及多个变量的统计问题进行研究,即为多元统计的内容。多元统计根据掌握信息的不同,也可分为多元描述统计和多元推断统计,但基本方法大多需要涉及到矩阵等工具,属于统计学原理中要求较高的部分。三.统计学科简史& & & 最古老的统计可以上溯到远古时代人们对于土地和产量的测量,但这一时期的统计方法往往是粗陋的,没有形成完整的科学体系。& & & 统计学者比较认同的现代统计学的源头大致包括三个方面。& & & 1.1676年英国经济学家威廉·配弟发表的《政治算术》。在这本书中,配弟用大量的数字分析了英、法、荷等三国的经济实力,开创了利用统计数字进行经济学分析的先河。这一统计学分枝后来发展成了国势学派,今天的国民经济核算体系,就是源于这一学派的理论。& & & 2.1662年英国学者约翰·格朗特发表的《关于死亡表的自然观察与政治观察》。在本书中,格朗特分析了英国伦敦的人口死亡情况,成为最早的人口统计学研究。目前,人口统计学是统计学中最有活力的分枝之一。& & & 3.17世纪法国数学家帕斯卡尔和费尔马创立的古典概率论。在这一时期,两位数学家以通信的方式,讨论了赌博中各种具体情况的概率计算问题,发展了概率论理论。& & & 到19世纪末,古典统计学的框架基本形成,其主要的内容主要是今天描述统计学涉及的内容。& & & 进入20世纪以来,随着大工业生产的发展,质量检验的统计理论迅速形成。1908年,英国酒作坊学徒工戈赛特(Gosset)以“Student”的笔名在《生物统计学》杂志上发表了一篇论文《平均数的概差》,提出了基于小样本的t统计量理论,极大地推动了推断统计理论的发展。20世纪中叶,英国统计学家Ronald Aylmer Fisher()等人分别对F统计量、极大似然估计、方差分析等理论进行了大量的探讨,从而建立起了推断统计学的庞大的学科体系。在1920年之前,由样本对总体进行估计的概念,一直是直观和模糊的,1925年,Fisher在其著名论文《研究人员用的统计方法》中,阐明和扩展了估计的概念,提出了最优估计概念,以及估计的效率和充分性等问题。在长期从事实验设计的过程中,Fisher还提出了重要的随机化原则,认为这是保证取得无偏估计的有效措施,也是进行可靠的显著性检验的必要基础。理论界认为,在1920年之前,统计研究属于“资料整理”时期,即描述统计学时期,从Fisher开始,进行了“分析统计”时期,即推断统计学时期。四.本门课程的学习要求& & & 学习统计学原理课程,主要应达到三个方面的目的:& & & 1.运用统计思想进行分析的能力。在实践工作中,要善于利用统计的思维方式进行思考,在纷繁复杂的社会实践中,要学会发现数字、分析数字,并使用数字说话。& & & 2.掌握基本的统计方法。要掌握统计工作中涉及到基本统计概念和基本统计计算方法,能够阅读常规的统计报告,了解统计指标的含义。同时,能够自己处理常见的统计问题。& & & 3.锻炼统计计算的能力。在掌握统计方法的基础上,要培养动手计算的能力。其中涉及到运用数学公式和使用计算机进行计算的有关技能。& & & 其中,第一个方面是学习本课程最为重要的目的,为达此目的,在学习过程中,要积极地结合社会实践,分析统计问题。第二个方面是对课程知识的掌握问题,课程中涉及到的统计方法都是最常用的,要牢固掌握。第三个方面则涉及到日常的自我训练,要学会自己运用计算机等工具,处理统计计算问题。小结:统计学是对令人困惑的问题作出数字设想的艺术。& & & 对于非专业人员而言,统计学的学科体系分为四个组成部分:& & & 1.调查与实验设计;& & & 2.描述统计;& & & 3.推断统计;& & & 4.多元统计分析。
TA的最新馆藏[转]&[转]&[转]&[转]&[转]&[转]&扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
下载作业帮安装包
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
统计分析方法的内容可以根据变量的多少划分为()
扫二维码下载作业帮
拍照搜题,秒出答案,一键查看所有搜题记录
1. 因子分析模型
因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法.它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子.对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量.
因子分析的基本思想:
把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子
因子分析模型描述如下:
(1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现).
(2)F = (F1,F2,…,Fm)¢ (m&p)是不可测的向量,其均值向量E(F)=0,协方差矩阵Cov(F) =I,即向量的各分量是相互独立的.
(3)e = (e1,e2,…,ep)¢与F相互独立,且E(e)=0, e的协方差阵∑是对角阵,即各分量e之间是相互独立的,则模型:
x1 = a11F1+ a12F2 +…+a1mFm + e1
x2 = a21F1+a22F2 +…+a2mFm + e2
xp = ap1F1+ ap2F2 +…+apmFm + ep
称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型.
其矩阵形式为: x =AF + e .
x=,A=,F=,e=
(1)m £ p;
(2)Cov(F,e)=0,即F和e是不相关的;
(3)D(F) = Im ,即F1,F2,…,Fm不相关且方差均为1;
D(e)=,即e1,e2,…,ep不相关,且方差不同.
我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e 称为X的特殊因子.
A = (aij),aij为因子载荷.数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性.
2. 模型的统计意义
模型中F1,F2,…,Fm叫做主因子或公共因子,它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量.公共因子的含义,必须结合具体问题的实际意义而定.e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之间以及特殊因子与所有公共因子之间都是相互独立的.模型中载荷矩阵A中的元素(aij)是为因子载荷.因子载荷aij是xi与Fj的协方差,也是xi与Fj的相关系数,它表示xi依赖Fj的程度.可将aij看作第i个变量在第j公共因子上的权,aij的绝对值越大(|aij|£1),表明xi与Fj的相依程度越大,或称公共因子Fj对于xi的载荷量越大.为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献.
因子载荷矩阵A中第i行元素之平方和记为hi2,称为变量xi的共同度.它是全部公共因子对xi的方差所做出的贡献,反映了全部公共因子对变量xi的影响.hi2大表明x的第i个分量xi对于F的每一分量F1,F2,…,Fm的共同依赖程度大.
将因子载荷矩阵A的第j列( j =1,2,…,m)的各元素的平方和记为gj2,称为公共因子Fj对x的方差贡献.gj2就表示第j个公共因子Fj对于x的每一分量xi(i= 1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标.gj2越大,表明公共因子Fj对x的贡献越大,或者说对x的影响和作用就越大.如果将因子载荷矩阵A的所有gj2 ( j =1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子.
3. 因子旋转
建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析.如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子.
旋转的方法有很多,正交旋转(orthogonal rotation)和斜交旋转(oblique rotation)是因子旋转的两类方法.最常用的方法是最大方差正交旋转法(Varimax).进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小.因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;如果因子对应轴相互间不是正交的,则称为斜交旋转.常用的斜交旋转方法有Promax法等.
4.因子得分
因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价.例如地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,哪些地区发展较快,哪些中等发达,哪些较慢等.这时需要将公共因子用变量的线性组合来表示,也即由地区经济的各项指标值来估计它的因子得分.
设公共因子F由变量x表示的线性组合为:
Fj = uj1 xj1+ uj2 xj2+…+ujpxjp j=1,2,…,m
该式称为因子得分函数,由它来计算每个样品的公共因子得分.若取m=2,则将每个样品的p个变量代入上式即可算出每个样品的因子得分F1和F2,并将其在平面上做因子得分散点图,进而对样品进行分类或对原始数据进行更深入的研究.
但因子得分函数中方程的个数m小于变量的个数p,所以并不能精确计算出因子得分,只能对因子得分进行估计.估计因子得分的方法较多,常用的有回归估计法,Bartlett估计法,Thomson估计法.
(1)回归估计法
F = X b = X (X ¢X)-1A¢ = XR-1A¢ (这里R为相关阵,且R = X ¢X ).
(2)Bartlett估计法
Bartlett估计因子得分可由最小二乘法或极大似然法导出.
F = [(W-1/2A)¢ W-1/2A]-1(W-1/2A)¢ W-1/2X = (A¢W-1A)-1A¢W-1X
(3)Thomson估计法
在回归估计法中,实际上是忽略特殊因子的作用,取R = X ¢X,若考虑特殊因子的作用,此时R = X ¢X+W,于是有:
F = XR-1A¢ = X (X ¢X+W)-1A¢
这就是Thomson估计的因子得分,使用矩阵求逆算法(参考线性代数文献)可以将其转换为:
F = XR-1A¢ = X (I+A¢W-1A)-1W-1A¢
5. 因子分析的步骤
因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释.因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的.
(i)因子分析常常有以下四个基本步骤:
(1)确认待分析的原变量是否适合作因子分析.
(2)构造因子变量.
(3)利用旋转方法使因子变量更具有可解释性.
(4)计算因子变量得分.
(ii)因子分析的计算过程:
(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同.
(2)求标准化数据的相关矩阵;
(3)求相关矩阵的特征值和特征向量;
(4)计算方差贡献率与累积方差贡献率;
(5)确定因子:
设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;
(6)因子旋转:
若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义.
(7)用原指标的线性组合来求各因子得分:
采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分.
(8)综合得分
以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数.
F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
此处wi为旋转前或旋转后因子的方差贡献率.
(9)得分排序:利用综合得分可以得到得分名次.
在采用多元统计分析技术进行数据处理、建立宏观或微观系统模型时,需要研究以下几个方面的问题:
· 简化系统结构,探讨系统内核.可采用主成分分析、因子分析、对应分析等方法,在众多因素中找出各个变量最佳的子集合,从子集合所包含的信息描述多变量的系统结果及各个因子对系统的影响.“从树木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍弃次要因素,以简化系统的结构,认识系统的内核.
· 构造预测模型,进行预报控制.在自然和社会科学领域的科研与生产中,探索多变量系统运动的客观规律及其与外部环境的关系,进行预测预报,以实现对系统的最优控制,是应用多元统计分析技术的主要目的.在多元分析中,用于预报控制的模型有两大类.一类是预测预报模型,通常采用多元线性回归或逐步回归分析、判别分析、双重筛选逐步回归分析等建模技术.另一类是描述性模型,通常采用聚类分析的建模技术.
· 进行数值分类,构造分类模式.在多变量系统的分析中,往往需要将系统性质相似的事物或现象归为一类.以便找出它们之间的联系和内在规律性.过去许多研究多是按单因素进行定性处理,以致处理结果反映不出系统的总的特征.进行数值分类,构造分类模式一般采用聚类分析和判别分析技术.
如何选择适当的方法来解决实际问题,需要对问题进行综合考虑.对一个问题可以综合运用多种统计方法进行分析.例如一个预报模型的建立,可先根据有关生物学、生态学原理,确定理论模型和试验设计;根据试验结果,收集试验资料;对资料进行初步提炼;然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合;在此基础上构造预报模型,最后对模型进行诊断和优化处理,并应用于生产实际.
Rotated Component Matrix,就是经转轴后的因子负荷矩阵, 当你设置了因子转轴后,便会产生这结果. 转轴的是要得到清晰的负荷形式,以便研究者进行因子解释及命名. SPSS的Factor Analysis对话框中,有个Rotation钮,点击便会弹出Rotation对话框, 其中有5种因子旋转方法可选择: 1.最大变异法(Varimax):使负荷量的变异数在因子内最大,亦即,使每个因子上具有最高载荷的变量数最少. 2.四次方最大值法(Quartimax):使负荷量的变异数在变项内最大,亦即,使每个变量中需要解释的因子数最少. 3.相等最大值法(Equamax):综合前两者,使负荷量的变异数在因素内与变项内同时最大. 4.直接斜交转轴法(Direct Oblimin):使因素负荷量的差积(cross-products)最小化. 5.Promax 转轴法:将直交转轴(varimax)的结果再进行有相关的斜交转轴.因子负荷量取2,4,6次方以产生接近0但不为0的值,藉以找出因子间的相关,但仍保有最简化因素的特性. 上述前三者属於「直交(正交)转轴法」(Orthogonal Rotations),在直交转轴法中,因子与因子之间没有相关,因子轴之间的夹角等於90 度.后两者属於「斜交转轴」(oblique rotations),表示因子与因子之间彼此有某种程度的相关,因素轴之间的夹角不是90度. 直交转轴法的优点是因子之间提供的讯息不会重叠,受访者在某一个因子的分數与在其他因子的分數,彼此独立互不相关;缺点是研究迫使因素之间不相关,但这种情况在实际的情境中往往并不常存在.至於使用何种转轴方式,须视乎研究题材、研究目的及相关理论,由研究者自行设定. 在根据结果解释因子时,除了要看因子负荷矩阵中,因子对哪些变量呈高负荷,对哪些变量呈低负荷,还须留意之前所用的转轴法代表的意义.2,主成分分析(principal component analysis)
将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法.又称主分量分析.在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息.但是,在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性.人们自然希望变量个数较少而得到的信息较多.在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠.主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息.主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形.信息的大小通常用离差平方和或方差来衡量. (1)主成分分析的原理及基本思想.原理:设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法.基本思想:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标.最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多.因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分.如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分.(2)步骤Fp=a1mZX1+a2mZX2+……+apmZXp
其中a1i, a2i, ……,api(i=1,……,m)为X的协方差阵∑的特征值多对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z标准化].A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0 .进行主成分分析主要步骤如下:1.
指标数据标准化(SPSS软件自动执行);2.
指标之间的相关性判定;3.
确定主成分个数m;4.
主成分Fi表达式;5.
主成分Fi命名;选用以上两种方法时的注意事项如下:1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合.
2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差.
3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设.因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关.
4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子.
5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同.在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分.和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势.大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释.而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析.当然,这中情况也可以使用因子得分做到.所以这中区分不是绝对的.
总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的.主成分分析一般很少单独使用:a,了解数据.(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化.(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性.
在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分).
(1)了解如何通过SPSS因子分析得出主成分分析结果.首先,选择SPSS中Analyze-Data Reduction-Factor…,在Extraction…对话框中选择主成分方法提取因子,选择好因子提取个数标准后点确定完成因子分析.打开输出结果窗口后找到Total Variance Explained表和Component Matrix表.将Component Matrix表中第一列数据分别除以Total Variance Explained表中第一特征根值的开方得到第一主成分表达式系数,用类似方法得到其它主成分表达式.打开数据窗口,点击菜单项的Analyze-Descriptive Statistics-Descriptives…,在打开的新窗口下方构选Save standardized values as variables,选定左边要分析的变量.点击Options,只构选Means,点确定后既得待分析变量的标准化新变量.选择菜单项Transform-Compute…,在Target Variable中输入:Z1(主成分变量名,可以自己定义),在Numeric Expression中输入例如:0.412(刚才主成分表达式中的系数)*Z人口数(标准化过的新变量名)+0.212*Z第一产业产值+…,点确定即得到主成分得分.通过对主成分得分的排序即可进行各个个案的综合评价.很显然,这里的过程分为四个步骤:Ⅰ.选主成分方法提取因子进行因子分析.Ⅱ.计算主成分表达式系数.Ⅲ.标准化数据.Ⅳ.计算主成分得分.
我们的程序也将依该思路展开开发.(2)对为何要将Component Matrix表数据除以特征根开方的解释我们学过主成分分析和因子分析后不难发现,原来因子分析时的因子载荷矩阵就是主成分分析特征向量矩阵乘以对应特征根开方值的对角阵.而Component Matrix表输出的恰是因子载荷矩阵,所以求主成分特征向量自然是上面描述的逆运算.
成功启动程序后选定分析变量和主成分提取方法即可在数据窗口输出得分和在OUTPUT窗口输出主成分表达式.
3,聚类分析(Cluster Analysis)
聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术 .
在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作.
4.判别分析(Discriminatory Analysis)
判别分析(Discriminatory Analysis)的任务是根据已掌握的1批分类明确的样品,建立较好的判别函数,使产生错判的事例最少,进而对给定的1个新样品,判断它来自哪个总体.根据资料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、贝叶斯、距离等判别方法.
费歇(FISHER)判别思想是投影,使多维问题简化为一维问题来处理.选择一个适当的投影轴,使所有的样品点都投影到这个轴上得到一个投影值.对这个投影轴的方向的要求是:使每一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大.贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断.所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率.它是对先验概率修正后的结果.
距离判别思想是根据各样品与各母体之间的距离远近作出判别.即根据资料建立关于各母体的距离判别函数式,将各样品数据逐一代入计算,得出各样品与各母体之间的距离值,判样品属于距离值最小的那个母体.
5.对应分析(Correspondence Analysis)
对应分析是一种用来研究变量与变量之间联系紧密程度的研究技术.
运用这种研究技术,我们可以获取有关消费者对产品品牌定位方面的图形,从而帮助您及时调整营销策略,以便使产品品牌在消费者中能树立起正确的形象.
这种研究技术还可以用于检验广告或市场推广活动的效果,我们可以通过对比广告播出前或市场推广活动前与广告播出后或市场推广活动后消费者对产品的不同认知图来看出广告或市场推广活动是否成功的向消费者传达了需要传达的信息.
为您推荐:
其他类似问题
扫描下载二维码}

我要回帖

更多关于 统计分析法 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信