《第一章 多元统计分析 绪论.ppt》由会员分享,可在线阅读,更多相关《第一章 多元统计分析 绪论.ppt(11页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章 绪论n n 第一节第一节第一节第一节 多元统计分析的作用多元统计分析的作用多元统计分析的作用多元统计分析的作用n n 一、什么是多元统计分析一、什么是多元统计分析一、什么是多元统计分析一、什么是多元统计分析n n 在工业、农业、医学、经济、管理等众多领域,常常要同时观测在工业、农业、医学、经济、管理等众多领域,常常要同时观测在工业、农业、医学、经济、管理等众多领域,常常要同时观测在工业、农业、医学、经济、管理等众多领域,常常要同时观测多个指标。例如,在经济管理中,要对国有企业资本金效绩进行评价,多个指标。例如,在经济管理中,要对国有企业资本金效绩进行评价,多个指标。例如,在经济管理中,
2、要对国有企业资本金效绩进行评价,多个指标。例如,在经济管理中,要对国有企业资本金效绩进行评价,需观测净资产收益率、总资产报酬率、总资产周转率、流动资产周转需观测净资产收益率、总资产报酬率、总资产周转率、流动资产周转需观测净资产收益率、总资产报酬率、总资产周转率、流动资产周转需观测净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率等多个指率、资产负债率、已获利息倍数、销售增长率和资本积累率等多个指率、资产负债率、已获利息倍数、销售增长率和资本积累率等多个指率、资产负债率、已获利息倍数、销售增长率和资本积累率等多个指标。在实践中,受多个指标影
3、响的现象大量存在标。在实践中,受多个指标影响的现象大量存在标。在实践中,受多个指标影响的现象大量存在标。在实践中,受多个指标影响的现象大量存在.在统计学上,通常在统计学上,通常在统计学上,通常在统计学上,通常将指标称为变量,变量有确定性变量和随机性变量。将指标称为变量,变量有确定性变量和随机性变量。将指标称为变量,变量有确定性变量和随机性变量。将指标称为变量,变量有确定性变量和随机性变量。n n 如何同时对多个随机变量的观测数据进行有效的分析和研究呢?如何同时对多个随机变量的观测数据进行有效的分析和研究呢?如何同时对多个随机变量的观测数据进行有效的分析和研究呢?如何同时对多个随机变量的观测数据
4、进行有效的分析和研究呢?传统的方法是把多个随机变量分开进行分析和研究,一次只处理一个传统的方法是把多个随机变量分开进行分析和研究,一次只处理一个传统的方法是把多个随机变量分开进行分析和研究,一次只处理一个传统的方法是把多个随机变量分开进行分析和研究,一次只处理一个变量,用这种方法对每个指标进行处理忽视了指标之间可能存在的相变量,用这种方法对每个指标进行处理忽视了指标之间可能存在的相变量,用这种方法对每个指标进行处理忽视了指标之间可能存在的相变量,用这种方法对每个指标进行处理忽视了指标之间可能存在的相关性,不仅会丢失很多信息,也不能取得较好的研究结果。而现代的关性,不仅会丢失很多信息,也不能取得
5、较好的研究结果。而现代的关性,不仅会丢失很多信息,也不能取得较好的研究结果。而现代的关性,不仅会丢失很多信息,也不能取得较好的研究结果。而现代的分析方法是对多个变量同时进行分析研究,通过对多个随机变量观测分析方法是对多个变量同时进行分析研究,通过对多个随机变量观测分析方法是对多个变量同时进行分析研究,通过对多个随机变量观测分析方法是对多个变量同时进行分析研究,通过对多个随机变量观测数据的分析,来研究变量之间的相互关系以及揭示变量内在的变化规数据的分析,来研究变量之间的相互关系以及揭示变量内在的变化规数据的分析,来研究变量之间的相互关系以及揭示变量内在的变化规数据的分析,来研究变量之间的相互关系
6、以及揭示变量内在的变化规律。律。律。律。nn 多元统计分析是研究多个随机变量之间相互依赖关系及内在统计规律性的一多元统计分析是研究多个随机变量之间相互依赖关系及内在统计规律性的一多元统计分析是研究多个随机变量之间相互依赖关系及内在统计规律性的一多元统计分析是研究多个随机变量之间相互依赖关系及内在统计规律性的一门统计学科。门统计学科。门统计学科。门统计学科。n n 多元统计分析研究的是多个变量的统计总体,这就使它能够一次性的处理多多元统计分析研究的是多个变量的统计总体,这就使它能够一次性的处理多多元统计分析研究的是多个变量的统计总体,这就使它能够一次性的处理多多元统计分析研究的是多个变量的统计总
7、体,这就使它能够一次性的处理多个变量的庞杂数据,而不需考虑异度量问题。个变量的庞杂数据,而不需考虑异度量问题。个变量的庞杂数据,而不需考虑异度量问题。个变量的庞杂数据,而不需考虑异度量问题。n n 二、多元统计分析方法的作用二、多元统计分析方法的作用二、多元统计分析方法的作用二、多元统计分析方法的作用n n (一)简化数据和数据结构(一)简化数据和数据结构(一)简化数据和数据结构(一)简化数据和数据结构n n 在不损失数据蕴含信息量的情况下,通过变换和够造模型剔除变量间相互在不损失数据蕴含信息量的情况下,通过变换和够造模型剔除变量间相互在不损失数据蕴含信息量的情况下,通过变换和够造模型剔除变量
8、间相互在不损失数据蕴含信息量的情况下,通过变换和够造模型剔除变量间相互制约的成分,尽可能简单地将被研究现象描述出来。主成分分析、因子分析等制约的成分,尽可能简单地将被研究现象描述出来。主成分分析、因子分析等制约的成分,尽可能简单地将被研究现象描述出来。主成分分析、因子分析等制约的成分,尽可能简单地将被研究现象描述出来。主成分分析、因子分析等均可达到这样的目的。如:将反映国有企业资本金效绩的多项指标转化为一个均可达到这样的目的。如:将反映国有企业资本金效绩的多项指标转化为一个均可达到这样的目的。如:将反映国有企业资本金效绩的多项指标转化为一个均可达到这样的目的。如:将反映国有企业资本金效绩的多项
9、指标转化为一个或少数几个综合指标。或少数几个综合指标。或少数几个综合指标。或少数几个综合指标。n n (二)能够进行分类和分组(二)能够进行分类和分组(二)能够进行分类和分组(二)能够进行分类和分组n n 根据所测量到的某些特征数据同时对研究现象进行分类或分组,是多元统根据所测量到的某些特征数据同时对研究现象进行分类或分组,是多元统根据所测量到的某些特征数据同时对研究现象进行分类或分组,是多元统根据所测量到的某些特征数据同时对研究现象进行分类或分组,是多元统计分析的另一目的之所在。聚类分析和判别分析等可达到这样的目的。计分析的另一目的之所在。聚类分析和判别分析等可达到这样的目的。计分析的另一目
10、的之所在。聚类分析和判别分析等可达到这样的目的。计分析的另一目的之所在。聚类分析和判别分析等可达到这样的目的。例如:例如:例如:例如:根据多个企业的经济效益对企业归类、分组。根据多个企业的经济效益对企业归类、分组。根据多个企业的经济效益对企业归类、分组。根据多个企业的经济效益对企业归类、分组。n n nn (三)能够研究变量间的相互依赖关系(三)能够研究变量间的相互依赖关系(三)能够研究变量间的相互依赖关系(三)能够研究变量间的相互依赖关系n n 究竟所有的变量都是相互独立?还是一个变量或一些变量依赖于其究竟所有的变量都是相互独立?还是一个变量或一些变量依赖于其究竟所有的变量都是相互独立?还是
11、一个变量或一些变量依赖于其究竟所有的变量都是相互独立?还是一个变量或一些变量依赖于其他变量?如果是后者,这种依赖关系是怎样的?这通常是通过样本模他变量?如果是后者,这种依赖关系是怎样的?这通常是通过样本模他变量?如果是后者,这种依赖关系是怎样的?这通常是通过样本模他变量?如果是后者,这种依赖关系是怎样的?这通常是通过样本模型表示出来。型表示出来。型表示出来。型表示出来。n n (四)进行预测(四)进行预测(四)进行预测(四)进行预测n n 变量之间关系的建立,为从一些变量观测值预测另一个或一些变量变量之间关系的建立,为从一些变量观测值预测另一个或一些变量变量之间关系的建立,为从一些变量观测值预
12、测另一个或一些变量变量之间关系的建立,为从一些变量观测值预测另一个或一些变量值提供了可能。值提供了可能。值提供了可能。值提供了可能。n n (五)能够进行假设检验(五)能够进行假设检验(五)能够进行假设检验(五)能够进行假设检验n n 检验多元总体参数表示的某种统计假设,可以证实某种假设的合理检验多元总体参数表示的某种统计假设,可以证实某种假设的合理检验多元总体参数表示的某种统计假设,可以证实某种假设的合理检验多元总体参数表示的某种统计假设,可以证实某种假设的合理性或支持事先树立的某种信念。性或支持事先树立的某种信念。性或支持事先树立的某种信念。性或支持事先树立的某种信念。n n 三、多元统计
13、分析在现实生活中经常处理的实际问题三、多元统计分析在现实生活中经常处理的实际问题三、多元统计分析在现实生活中经常处理的实际问题三、多元统计分析在现实生活中经常处理的实际问题n n (一)在经济分析中经常处理的实际问题(一)在经济分析中经常处理的实际问题(一)在经济分析中经常处理的实际问题(一)在经济分析中经常处理的实际问题n n 1 1 1 1要对我国大型工业企业的经济效益进行综合评价,首先是选取要对我国大型工业企业的经济效益进行综合评价,首先是选取要对我国大型工业企业的经济效益进行综合评价,首先是选取要对我国大型工业企业的经济效益进行综合评价,首先是选取能够反映经济效益的代表性指标,如:百元
14、固定资产实现利税、资金能够反映经济效益的代表性指标,如:百元固定资产实现利税、资金能够反映经济效益的代表性指标,如:百元固定资产实现利税、资金能够反映经济效益的代表性指标,如:百元固定资产实现利税、资金产值率、资金利税率、全员劳动生产率等,根据这些指标进行分类,产值率、资金利税率、全员劳动生产率等,根据这些指标进行分类,产值率、资金利税率、全员劳动生产率等,根据这些指标进行分类,产值率、资金利税率、全员劳动生产率等,根据这些指标进行分类,可给出对企业的评价。(聚类分析)可给出对企业的评价。(聚类分析)可给出对企业的评价。(聚类分析)可给出对企业的评价。(聚类分析)2 2要对我国大型工业企业经济
15、效益进行综合评价,评选出前要对我国大型工业企业经济效益进行综合评价,评选出前要对我国大型工业企业经济效益进行综合评价,评选出前要对我国大型工业企业经济效益进行综合评价,评选出前500500强,同样是先选取能够反映经济效益的代表性指标,如:百元固定资强,同样是先选取能够反映经济效益的代表性指标,如:百元固定资强,同样是先选取能够反映经济效益的代表性指标,如:百元固定资强,同样是先选取能够反映经济效益的代表性指标,如:百元固定资产实现利税、资金产值率、资金利税率、全员劳动生产率等,根据这产实现利税、资金产值率、资金利税率、全员劳动生产率等,根据这产实现利税、资金产值率、资金利税率、全员劳动生产率等
16、,根据这产实现利税、资金产值率、资金利税率、全员劳动生产率等,根据这些指标采用主成分分析或因子分析法即可达到此目的。些指标采用主成分分析或因子分析法即可达到此目的。些指标采用主成分分析或因子分析法即可达到此目的。些指标采用主成分分析或因子分析法即可达到此目的。3 3给出美国、日本、英国等经济发达国家和印度、罗马尼亚、给出美国、日本、英国等经济发达国家和印度、罗马尼亚、给出美国、日本、英国等经济发达国家和印度、罗马尼亚、给出美国、日本、英国等经济发达国家和印度、罗马尼亚、南非等发展中国家反映其经济发展程度的若干指标,如:人均国内生南非等发展中国家反映其经济发展程度的若干指标,如:人均国内生南非等
17、发展中国家反映其经济发展程度的若干指标,如:人均国内生南非等发展中国家反映其经济发展程度的若干指标,如:人均国内生产总值、人均收入、人均消费支出等,要根据这些指标判断中国所属产总值、人均收入、人均消费支出等,要根据这些指标判断中国所属产总值、人均收入、人均消费支出等,要根据这些指标判断中国所属产总值、人均收入、人均消费支出等,要根据这些指标判断中国所属类型,应用的是判别分析法。类型,应用的是判别分析法。类型,应用的是判别分析法。类型,应用的是判别分析法。4 4某一产品质量的好坏可用多个指标进行衡量,而影响产品质量某一产品质量的好坏可用多个指标进行衡量,而影响产品质量某一产品质量的好坏可用多个指
18、标进行衡量,而影响产品质量某一产品质量的好坏可用多个指标进行衡量,而影响产品质量好坏的因素亦有多个,要揭示影响产品质量的多个因素与衡量产品质好坏的因素亦有多个,要揭示影响产品质量的多个因素与衡量产品质好坏的因素亦有多个,要揭示影响产品质量的多个因素与衡量产品质好坏的因素亦有多个,要揭示影响产品质量的多个因素与衡量产品质量的多个指标之间的依赖关系,需要用典型相关分析法,如果它们之量的多个指标之间的依赖关系,需要用典型相关分析法,如果它们之量的多个指标之间的依赖关系,需要用典型相关分析法,如果它们之量的多个指标之间的依赖关系,需要用典型相关分析法,如果它们之间存在相关关系,这时要用多重多元回归分析
19、法建立回归模型,以便间存在相关关系,这时要用多重多元回归分析法建立回归模型,以便间存在相关关系,这时要用多重多元回归分析法建立回归模型,以便间存在相关关系,这时要用多重多元回归分析法建立回归模型,以便进行预测预报。进行预测预报。进行预测预报。进行预测预报。5 5、不同原料生产的两种产品,其寿命有无显著差异,可用假设、不同原料生产的两种产品,其寿命有无显著差异,可用假设、不同原料生产的两种产品,其寿命有无显著差异,可用假设、不同原料生产的两种产品,其寿命有无显著差异,可用假设检验。检验。检验。检验。(二)在其它领域研究中的应用(二)在其它领域研究中的应用(二)在其它领域研究中的应用(二)在其它领
20、域研究中的应用第二节第二节第二节第二节 常用统计量常用统计量常用统计量常用统计量 一、样本均值一、样本均值一、样本均值一、样本均值 设:设:设:设:为第一个变量的样本均值。为第一个变量的样本均值。为第一个变量的样本均值。为第一个变量的样本均值。n np p个变量有个变量有个变量有个变量有p p个样本均值,一般地:个样本均值,一般地:个样本均值,一般地:个样本均值,一般地:i=1i=1,2 2,3 3,.,P.,Pn n 方差阵中将排在对角线上,二、样本方差二、样本方差 对第一个变量的对第一个变量的对第一个变量的对第一个变量的n n个观察值,个观察值,个观察值,个观察值,当当当当I=jI=j时,
21、样本协方差就是样本方差,对于所有的时,样本协方差就是样本方差,对于所有的时,样本协方差就是样本方差,对于所有的时,样本协方差就是样本方差,对于所有的i i,j j三、样本相关系数三、样本相关系数三、样本相关系数三、样本相关系数第第第第i i个和第个和第个和第个和第j j个变量的样本相关系数为:个变量的样本相关系数为:个变量的样本相关系数为:个变量的样本相关系数为:其中:i=1,2,3.p,j=1,2,3,p对于所有的i,j,n n由由由由p p个变量的个变量的个变量的个变量的n n组观测值计算出的统计量,可用矩阵来记:组观测值计算出的统计量,可用矩阵来记:组观测值计算出的统计量,可用矩阵来记:
22、组观测值计算出的统计量,可用矩阵来记:样本均值阵:样本方差和协方差阵:样本相关系数矩阵:例例1根据表1资料计算样本均值阵、样本方差和协方差矩阵、样本相关系数矩阵。表表1 20031 2003年年1515家上市公司盈利资料家上市公司盈利资料主营业务利润(万元)营业利润(万元)利润总额(万元)净利润(万元)中原高速48457.8341614.7542088.0427126.34中原油气84061.0769453.226059952165.27安阳钢铁175514.79128972.69126422.2182439.22神火股份31436.5723968.0223842.2416289.6新乡化纤3
23、1121.2322463.6922408.3619310.49安彩高科69994.7539903.3539315.6623036.17许继电气53048.4525881.1926769.4216877.17羚锐股份15639.45892.911842.921417.61华兰生物9001.814241.094175.643549.03瑞贝卡11480.397222.467168.264723.31双汇发展95295.7840315.5242493.9926368.5竹林众生8379.92921.841661.321477.24焦作万方34086.9420451.5122562.6614290.0
24、3思达高科12769.173820.984308.773195.9郑州煤电27296.3613007.4312863.378512.59合计707584.51443130.65438521.86300778.47n n1 1、数据编辑窗口(数据编辑窗口(数据编辑窗口(数据编辑窗口(data editordata editordata editordata editor)n n窗口主菜单、工具栏、数据编辑区、系统状态显示区文件以窗口主菜单、工具栏、数据编辑区、系统状态显示区文件以窗口主菜单、工具栏、数据编辑区、系统状态显示区文件以窗口主菜单、工具栏、数据编辑区、系统状态显示区文件以.savsav
25、为为为为扩展名扩展名扩展名扩展名n n2 2、输出窗口输出窗口输出窗口输出窗口(Viewer)Viewer)Viewer)Viewer)n n以以以以.spospo为扩展名为扩展名为扩展名为扩展名n n3 3、数据编辑器数据编辑器数据编辑器数据编辑器n n1.1.定义变量定义变量定义变量定义变量n n2.2.输入数据输入数据输入数据输入数据n n3.3.数据编辑数据编辑数据编辑数据编辑n n4.4.数据保存数据保存数据保存数据保存n n 每一个新变量的默认名都是以每一个新变量的默认名都是以每一个新变量的默认名都是以每一个新变量的默认名都是以VARVAR开头的开头的开头的开头的,后面加上五位数字
26、后面加上五位数字后面加上五位数字后面加上五位数字,如如如如VAR00001,VAR00002VAR00001,VAR00002 第三节第三节 SPSSSPSS有关知识有关知识有关知识有关知识一、一、一、一、SPSS SPSS 窗口窗口窗口窗口n n二、定义变量的方法二、定义变量的方法n n单击下方的单击下方的“variable view”variable view”n n定义变量名应注意的问题定义变量名应注意的问题n n1.1.变量名必须以字母、汉字或字符变量名必须以字母、汉字或字符开头开头,剩下的字符可剩下的字符可以是字母、数字、或以是字母、数字、或、#、_ _、$等符号等符号n n2.2.
27、变量名不能以句点结尾变量名不能以句点结尾n n3.3.空格和特殊字符不能被用空格和特殊字符不能被用,如如?、!、*n n4.4.每一个变量名必须是唯一的每一个变量名必须是唯一的,重复的变量名是不被允许重复的变量名是不被允许的的n n5.5.变量名无大小写之分变量名无大小写之分n n6.6.下列关键词不能用作变量名:下列关键词不能用作变量名:all NE EQ TO le all NE EQ TO le lt lt by or by or gtgt and not with and not with n n三、数据变换三、数据变换三、数据变换三、数据变换n nTransform-compute-compute variableTransform-compute-compute variablen n算术运算算术运算n n关系运算关系运算