多元统计课程设计.pdf

上传人:赵** 文档编号:37788537 上传时间:2022-09-02 格式:PDF 页数:14 大小:521.29KB
返回 下载 相关 举报
多元统计课程设计.pdf_第1页
第1页 / 共14页
多元统计课程设计.pdf_第2页
第2页 / 共14页
点击查看更多>>
资源描述

《多元统计课程设计.pdf》由会员分享,可在线阅读,更多相关《多元统计课程设计.pdf(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、多元统计析分课程设计多元统计析分课程设计题目:题目:多元统计分析方法在各地区经济发展中的应用学生姓名:章浩良学生姓名:章浩良学学号:号:4040系(部):金融学院系(部):金融学院专业班级:应用统计学(专业班级:应用统计学(1 1)班)班指导教师:许广魁指导教师:许广魁教师职称:讲师教师职称:讲师起止时间:起止时间:淮南师范学院金融学院制淮南师范学院金融学院制课程设计任务及评语课程设计任务及评语系(部):金融学院学生姓名课程设计题目章浩良学 号40专业班级应用统计学(1)班多元统计分析方法在各地区经济发展中的应用(1)收集数据进行处理和分析;(2)利用 SPSS 软件对数据进行统计分析;(3)

2、对数据进行聚类分析和因子分析;(4)对运行后的信息进行整理;(5)找出数据的相关联系; ;课程设计任务(6)对课程设计的总结和感受.多元统计分析方法在各地区经济发展中的应用学生:章浩良指导老师: 许广魁金融学院摘要:本文以2014 年中国统计年鉴的数据为来源,通过对各地区多项经济指标进行因子分析。随着社会经济的快速发展和社会主义建设的不断推进,我国经济社会得到了又快又好的发展,人民生活水平也得到了很大的提高,但是,由于我国各地区的经济发展背景、社会背景和环境背景等都存在着些许差异,从而导致了各地区生产总值、生活消费水平也参差不齐。为了客观了解我国各地区的经济发展状况,本文应用 SPSS 软件中

3、的各种分析方法对我国各地区的经济发展状况进行科学的分析,并进行分类,并为各地区经济发展规划与决策提出了相应的政策建议。关键词:各地区经济发展状况SPSS聚类分析因子分析MultivariateMultivariate statisticalstatistical analysisanalysis methodmethod in in thethe applicationapplication ofofthe regional economic developmentthe regional economic developmentStudent:zhanghaoliangFaculty Adv

4、iser:xuguangkuiInstitute of FinanceAbstractAbstract: based on the 2014 China statistical yearbook data for the source, throughthe study of the factor analysis of regional economic indicators. With therapid development of social economy and the advancement of the socialistconstruction of our country

5、got fast and good economic and socialdevelopment, peoples living standard has been greatly improved, however,due to Chinas regional economic development, social background andenvironment background there are some differences, leading to a regionalGDP, life consumption level is uneven. In order to ob

6、jectively understandthe status of the regional economic development in our country, thispaper using analysis method of SPSS software in various regional economicdevelopment of our country scientific analysis, and classification, and forthe regional economic development plan and decision put forward

7、thecorresponding policy recommendations.Keywords:Keywords:Regional economic development t SPSS cluster analysisfactor analysis目录前言11.数据的分析1数据的收集与整理1变量的注释32.数据的处理方法3聚类分析3因子分析43.总结7参考文献7前言改革开放以来, 全国各地区的经济发展很快, 人民生活水平有了很大的提高。但是不同区域之间人民的生活水平存在很大差异,各地区生产总值也不相同,这也是各地区经济发展不平衡的比表现。随着社会经济的快速发展和社会主义建设的不断推进,我国

8、经济社会得到了又快又好的发展,人民生活水平也得到了很大的提高,但是,由于我国各地区的经济发展背景、社会背景和环境背景等都存在着些许差异,从而导致了各地区生产总值、生活消费水平也参差不齐。1.数据的分析数据的收集与整理下表是进行处理的 31 各省市的各国各地区经济发展状况的原始数据,数据来源于2014 中国统计年鉴。表 1地区北京市天津市河北省山西省内蒙古自治区辽宁省吉林省黑龙江省上海市江苏省X1X2X3X4X5X6X7X8浙江省安徽省福建省江西省山东省河南省湖北省湖南省广东省广西壮族自治区海南省重庆市四川省贵州省云南省西藏自治区陕西省甘肃省青海省宁夏回族自治区新疆维吾尔自治区数据来源:国家统计

9、局变量注释X1:第一产业增加值X2:第二产业增加值X3:第三产业增加值X4:农林牧渔业增加值X5:工业增加值X6:建筑业增加值X7:金融业增加值X8:住宿和餐饮业增加值2.数据处理方法聚类分析聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q 型聚类和 R 型聚类,Q 型聚类是对样品进行分类处理,R 型聚类是对变量进行分类处理。全国 31 个省市的全国各地区经济发展状况样品分别对 8 个变量的观测数据如表 1 所示,在 SPSS 中利用系统聚类法对其进行样品聚类分析。系统聚类法的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类过程一直进行下去,每个样品

10、(或变量)总能聚成合适的类中。系统聚类法过程是:假设总共有 n 个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有 n 类;第二步根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其他的样品(或变量)仍各自聚为一类,共聚成 n-1 类;第三步将“距离”最近的两个类进一步聚成一类,共聚成 n-2;.;以上步骤一直进行下去,最后将所有的样品(或变量)聚成一类。为了直观地反映以上的系数聚类过程,可以把整个分类系统地画成一张谱系图。所以有时系统聚类也为谱系分析。因子分析因子分析也是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中

11、的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。因子分析的内容非常丰富,常用的因子分析类型是 R 型因子分析和 Q型因子分析。R 型因子分析是对变量进行因子分析,Q 型因子分析是对样品进行因子分析。 R 型因子分析中的公共因子是不可直接观测但又客观存在的共同影响因素,每一个变量都可以表示成公共因子的线性函数与特殊因子之和,即式中的示为这里称为公共因子,称为的特殊因子。该模型可用矩阵表模型中的称为因子“载荷”,是第 i 个变量在第 j 个因子上的负荷,矩阵 A

12、称为因子载荷阵。利用 SPSS 进行因子分析,结果如下:表 2 变量共同度表 2Communalities 表示给出变量共同度,反映每个变量对所提取的所有公共因子的依赖程度,此数值是因子载荷阵中每一行的因子载荷量的平方和,提取的因子个数不同,变量共同度也不同.表 3 特征根与方差贡献率表 3 中的 Initial Eigenvalues 给出初始相关矩阵或协方差阵的特征值,用于确定哪些因子应该被提取,共有三项:Total列为各因子对应的特征值,本文中共有三个因子对应的特征值大于 1,因此应提取相应的三个公因子; % of Variance 列为各因子的方差贡献率;Cumulative %列为各

13、因子的累积方差贡献率,由表可以看出,前两个因子已经可以解释%的方差子。表 4 因子得分系数据矩阵根据表 6 中的因子得分系数和原始变量的标准化值可以计算每个观测值的各因子的得分数,并可以据此对观测量进行进一步的分析。本文中旋转后的因子得分表达式可以写成:=+总结多元统计分析是建立在概率统计的基础之上,特别是多元正态分布。一般的问题模式都是有多个对象,每个对象有多种属性,每个属性都是默认为服从多元正态分布,因此一般的样本模式都是一个矩阵的形式。聚类分析是在提供上面的矩阵式样本下,通过建立一定的统计量,进行统计描述的。聚类分析首先建立不同对象的距离的定义,进而给出有一些对象组成的类与类之间距离的定义,进而根据距离小,划分为一类,距离大,则化为分另一类。聚类分析又可以细分为系统聚类,和 K 均值聚类为代表的两大类。主成分析是在对象属性很大的情况下,通过坐标正交变换,使新的属性具有大方差,不相关的特性。多元分析的理论体系是分析问题的原点。参考文献:【1】多元统计分析,何晓群 编著中国人民大学出版社;【2】中国统计年鉴(2014),中国统计出版社;【3】多元统计分析论文,中央财经学院。课程设计评语课程设计评语课程设计指导教师评语课程设计成绩成绩:指导教师签字:年月日备注

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁