多元统计分析 (课程论文).docx

上传人:豆**** 文档编号:23889776 上传时间:2022-07-02 格式:DOCX 页数:25 大小:464.23KB
返回 下载 相关 举报
多元统计分析 (课程论文).docx_第1页
第1页 / 共25页
多元统计分析 (课程论文).docx_第2页
第2页 / 共25页
点击查看更多>>
资源描述

《多元统计分析 (课程论文).docx》由会员分享,可在线阅读,更多相关《多元统计分析 (课程论文).docx(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date多元统计分析 (课程论文)多元统计分析 (课程论文)HUNAN UNIVERSITY课 程 论 文 论文题目: 有关我国居民消费因素的分析指导老师: 马守荣 学生名字: 姚定坤 学生学号: 201318040128 专业班级: 经济统计1301 学院名称: 金融与统计学院 -目 录概述 1一、引言 2二、数据概述系 .2三、分析方法 .3四、数据分析 .3(一)相关分

2、析 .3(二)因子分析 .10(三)聚类分析 .15五、分析与建议 .18六、心得体会 .19参考文献 .20有关我国居民消费因素的分析概 述生活离不开消费,随着社会发展,生活水平提高,消费也在逐渐变化,并且随着经济发展,各个地区的发展水平的差异,消费也产生了不同的变化,此篇论文主要目的是利用多元统计的方法,借助spss软件,对我国31个地区的居民消费情况进行分析。了解我国31个地区的居民消费情况与统计指标食品烟酒、衣着、居住等8个指标之间的一些联系。并且通过因子得分,计算并排列出消费因素的综合得分,最后通过聚类分析,对我国31个地区的居民消费情况做一个大致分类,进而对各个地区分类后的情况做一

3、个分析和总结并结合文献以及资料提出一些意见和看法。一.引言消费在宏观经济学中,指某时期一人或一国用于消费品的总支出。与经济活动有着密不可分的关系,消费作为社会再生产的最终阶段,是生产者生产产品的目的和导向。如果没有了消费,生产的存在也会变得毫无意义,消费促进了生产,给生产带来了源动力。消费者的消费需求,也推动了生产的发展。并且消费促进了货币流通,提供了就业岗位,降低失业率,拉动了经济增长,最终有助于提高人民的生活水平。 消费是国民经济保持增长的动力,只有拉动消费需求的增长,才能促进投资,促进产业结构的调整、宏观经济的增长,满足人民的物质生活的需求,实现生活水平的提高。故消费和生活水平有着密切的

4、关系,从而,通过对我国居民消费水平的分析,不但可以直观了解到我国总的消费趋向,各地区不同的消费主导因素,还能客观反映我国总的生活水平也就是经济发展的大致情况。统计年鉴中的八项指标:食品烟酒、衣着、居住、生活用及服务、交通通信、教育文化娱乐、医疗保健、其他用品及服务。囊括了居民消费的全部项目,居民日常消费可以清楚地从数据中了解到。再通过分析和整合,最终可以大致分析我国总体的消费倾向以及各个地区的异同点。再结合文献资料了解分析产生异同的原因,进而对我国的总体消费水平做一个最终概括。二.数据概述数据来源:2015年中国统计年鉴指标:变量名称对应自变量食品烟酒X1衣着X2居住X3生活用品及服务X4交通

5、通信X5教育文化娱乐X6医疗保健X7其他用品及服务X8指标均来源于统计年鉴中,分地区居民消费中所统计的数据,对于居民消费分成了8个类别,这8个类别基本概括了我们日常的消费支出项目、三.分析方法基于对于消费因素的分析的目的,针对我国31个地区的8项消费支出数据,主要运用因子分析和聚类分析,首先运用因子分析将数据进行降维,提取,将大量繁琐的数据简化,用主要因子来对我国31个地区的消费支出做一个大致了解,然后在对简化的数据进行聚类分析,运用聚类分析的方法研究区域性的消费结构问题,以此来研究我国消费支出的构成情况及地区性差异,并从中发现统计规律与变化特点,以便提出好的政策与建议。四.数据分析(一)相关

6、分析(1)实验结果1.1.1对应表地区食品烟酒衣着居住生活用品及服务交通通信教育文化娱乐医疗保健其他用品及服务有效边际北京7467.82359.89497.72041.43578.63268.31914.2975.231103天津7376.61859.348731295.52904.71833.81584.5615.522342.9河北3263.7971.82727.7773.61749.31144.51027.5273.511931.6山西2940.51084.82198.8619.41214.71484.61008.6312.410863.8内蒙古4746.416882795.21008.

7、92405.11813.21319.7481.516258辽宁4554.81477.83400.5918.71949.71834.41419.2512.916068吉林3531.61228.92561.3689.51636.31550.81458369.613026黑龙江3537.91292.82689.6670.91588.41406.81258.3324.112768.8上海9011.6161310789.11531.63596.53311.42223.9987.633064.7江苏5591.71385.24126.71107.22869.32238.21331.351419163.6浙江

8、6569.21587.15577.21117.73670.621691358.2503.122552.1安徽4003.1870.32541.8694.21324.91157.3870265.311726.9福建6081.91097.54278.51032.320671667.2926.8493.117644.3江西3785.8853.42576.6679.31164.31151.1635243.411088.9山东3932.31168.92825.8993.61821.91303989.6293.713328.8河南3202.41111.82208.6875.11225.51160.89292

9、87.111000.3湖北4139.71009.72810.2813.41339.81479.81056.2279.312928.1湖南4240.5914.12708.4796.91600.21764.9972.2291.413288.6广东6589.81014.64300.21116.52795.11965890.5533.919205.6广西3680.1460.52341.56141198.31115.3679.3185.310274.3海南4915549.92558.26861437.41358.4716.8248.812470.5重庆4971.91275.92554.4978.8147

10、6.21319.3966.1268.113810.7四川4548.2974.32217.3879.614371061964.5286.512368.4贵州3151.9666.31826.9619.11080.41222572164.79303.3云南3211.55672018.5568.41513.61096.7739.4154.49869.5西藏3370.2733.71311.5399.7796266.7197.6241.57316.9陕西3405.1944.62585.8796.21535.41500.41178.2257.912203.6甘肃3218.2884.22015652.1107

11、2.21092.4737.2203.39874.6青海3854.411532374.5733.51790.112931071.233512604.7宁夏3555.611702214.4797.91763.51416.41239.9326.712484.4新疆38551205.62226.4669.21624.51102.2978.3242.411903.6有效边际140304.435173.8101731.327170.257226.547547.933213.211471.2453838.5表1.1.1可以看出上海、北京、天津,三个地区都是高消费地区,贵州、云南、西藏、甘肃都属于消费水平较低

12、的地区,而其余地区基本属于中间消费段落,由于处于中间段落消费地区的城市也存在差距,之后会通过处理,具体再做说明。比较显而易见的就是,食品烟酒占了消费支出的大部分,其余消费都基本没有太多显著变化。需要说明的是,在北京,上海两地的居住消费支出都超过了食品烟酒的消费支出。这在其他地区是不存在的。1.1.2维数奇异值惯量卡方Sig.惯量比例置信奇异值解释累积标准差相关21.106.011.427.427.002.0192.091.008.310.737.0013.051.003.099.8374.049.002.090.9275.032.001.038.9646.025.001.024.9897.01

13、7.000.0111.000总计.02712040.582.0001.0001.000表1.1.2中可知,7个维度的奇异值分别为0.106、0.091、0.051、0.049、0.032、0.025、0.017;惯量展示了行列关系的强度,7个维度的惯量分别为0.011、0.008、0.003、0.002、0.001、0.001、0.001,其中第一个惯量的值最大,意味着它解释各别差异的能力最强,地位最重要,其他惯量的重要性依次下降,惯量的总和为0.027;卡方、显著性是对交叉列联表作卡方检验的卡方观测值(12040.582),认为行变量和列变量有显著的相关性关系;惯量比例中的考虑情况展示了各个

14、惯量的方差贡献率,第一个特征根的方差贡献率为0.427,方差贡献率是最高的,惯量累计就是各惯量的累计方差贡献率,由于前两个特征根就已经解释了各类别差异的73.7%,因此最终提取2个因子是可行的,信息丢失少,足够对数据进行描述。1.1.3概述行点概述行点a地区质量维中的得分惯量贡献12点对维惯量维对点惯量1212总计北京.069-.601.230.003.232.040.773.096.870天津.049.082-.142.000.003.011.098.248.346河北.026-.014.240.000.000.017.002.459.460山西.024.170.467.001.006.05

15、8.100.647.747内蒙古.036.388.271.001.051.029.572.237.810辽宁.035.099.298.000.003.035.090.696.786吉林.029.227.520.001.014.086.156.693.849黑龙江.028.164.408.001.007.052.133.705.839上海.073-.784-.011.005.421.000.956.000.956江苏.042-.003.083.000.000.003.000.079.079浙江.050-.200-.038.001.019.001.214.007.221安徽.026.080-.17

16、8.000.002.009.118.501.618福建.039-.162-.378.001.010.061.171.792.963江西.024-.033-.264.000.000.019.011.568.579山东.029.119.096.000.004.003.188.104.292河南.024.235.243.000.013.016.285.261.545湖北.028.075.015.000.001.000.083.003.086湖南.029.094-.009.000.002.000.082.001.083广东.042-.100-.408.001.004.078.043.611.653广西

17、.023-.080-.398.001.001.039.027.568.595海南.027.070-.611.001.001.113.012.748.759重庆.030.366-.228.001.038.017.564.187.751四川.027.372-.283.001.035.024.547.270.817贵州.020.167-.169.000.005.006.154.135.289云南.022.088-.121.000.002.003.046.074.120西藏.016.454-1.058.003.031.199.130.602.732陕西.027.084.325.000.002.031.

18、049.622.670甘肃.022.197-.016.000.008.000.463.003.466青海.028.278.150.000.020.007.665.165.830宁夏.028.352.372.001.032.042.484.460.944新疆.026.356.052.000.031.001.720.013.733有效总计1.000.0271.0001.000由表1.1.3可知,总惯量为0.27,各地区对总惯量的贡献度几乎接近0。从贡献中的点对维惯量中可以看出,第一维度中主要反映了“北京”23.2%、“上海”42.1%,第二维度主要反映了“海南”11.3%,“西藏”19.9%;从维

19、对点惯量中可以看出,第一维度主要反映了“北京”77.3%,“内蒙古”57.2%,“上海”95.6%,“重庆”56.4%,“四川”54.7%,“青海”66.5%,“新疆”72.0%及其他类别,第二维度主要反映了“山西”64.7%,“辽宁”69.6%,“吉林”69.3%,“黑龙江”70.5%,“海南”74.8%,“西藏”60.2%,“陕西”62.2%及其他类别。1.1.4概述列点维中的得分贡献点对维惯量维对点惯量种类质量12惯量1212总计食品烟酒0.3090.19-0.3850.0050.1050.5040.2180.7590.977衣着0.0780.4470.3810.0040.1460.12

20、40.4290.2650.694居住0.224-0.5660.0160.0080.6740.0010.9810.0010.982生活品及服务0.060.1540.0370.0010.0130.0010.170.0080.178交通通信0.1260.0760.0730.0020.0070.0070.0350.0270.063教育文化娱乐0.1050.0080.2690.00200.08400.3190.319医疗保健0.0730.2560.5820.0030.0450.2730.150.6580.808其他用品及服务0.025-0.20.140.0010.0090.0050.1440.0610.

21、205有效总计10.02711由表1.1.4可知总惯量为0.27,各地区对总惯量的贡献相近且都接近于0。从贡献中的点对维惯量中可以看出,第一维度主要反映了“衣着”14.6%,“居住”67.4%,以及其他类别,第二维度主要反映了“食品烟酒”52.1%及其他类别;从维对点惯量中可以看出,第一维度主要反映了“衣着”42.9%,“居住”98.1%,“生活用品及服务”17.0%,“医疗保健”15.0%,“其他用品及服务”14.4%,第二维度主要反映了“食品烟酒”75.9%,“教育文化娱乐”31.9%,“医疗保健”65.8%。上图为“维数1转换的地区类别图”是各个地区在第1个维度上的得分图,由图可知“西藏

22、(26)”与“内蒙古(5)”的得分最高;上图为“维数2转换的地区类别图”是地区在第2个维度上的得分图,由图可知“吉林”的得分最高;上图为“维数1转换的种类类别图”是消费种类在第1个维度上的得分图,由图可知“衣着”类的得分最高;上图为“维数2转换的种类类别图”是消费种类在第2个维度上的得分图,由图可知“医疗保健”类的得分最高;如上图所示经过对数据的分析和简化,在图中可以清楚地看出来,各个地区的不同消费支出倾向,正如开始对数据简单观察上得出的结论,北京上海这两个地区的消费支出和居住有着密切关系,而其他地区并不是特别明显。大部分地区的主要消费还是偏向于食品烟酒。西藏的消费支出情况与其他地区明显不是一

23、类。(二)因子分析1.2.1相关矩阵 食品烟酒衣着居住生活用品及服务交通通信教育文化娱乐医疗保健其他用品及服务相关食品烟酒1.000.655.889.855.880.822.676.885衣着_.6551.000.699.832.780.745.836.825居住.889.6991.000.893.859.920.797.943生活用品及服务.855.832.8931.000.862.886.782.912交通通信.880.780.859.8621.000.880.791.881教育文化娱乐.822.745.920.886.8801.000.867.916医疗保健.676.836.797.78

24、2.791.8671.000.843其他用品及服务.885.825.943.912.881.916.8431.000表1.2.1为相关矩阵表,由表可知,8个指标之间存在着高度相关关系,其中居住和其他用品及服务的相关系数最大为0.943,衣着和食品烟酒的相关系数最小为0.655,各指标相关程度都十分高,因此可以进行因子分析。1.2.2 KMO 和 Bartlett 的检验KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.848Bartlett 的球形度检验近似卡方363.131df28Sig.000由表1.2.2可知,KMO值为0.8480.6,效度

25、较高,通过了检验,Sig为0.000,因此可以进行因子分析。1.2.3 公因子方差 初始提取食品烟酒1.000.936衣着1.000.926居住1.000.938生活用品及服务1.000.901交通通信1.000.884教育文化娱乐1.000.906医疗保健1.000.902其他用品及服务1.000.949表1.2.3可知,这8个指标对所提取的公因子的依赖程度都大于0.8,可以看出所有指标对提取公因子的依赖程度都很高。1.2.4解释的总方差解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %16.86485.80085.800

26、6.86485.80085.8004.20852.59852.5982.4785.97491.774.4785.97491.7743.13439.17591.7743.2503.13094.9034.1612.01396.9165.1081.35498.2706.067.83399.1047.047.58299.6858.025.315100.000表1.2.4可知,第一个因子的特征值大于1,若在提取时选用基于特征值法提取,则只能提取到第一个i,故采用固定因子数量,提取到前两个因子,第一个因子贡献度85.8%,两因子累计贡献度为91.774%,而其他6个因子所占贡献度不足10%,故两因子足够解

27、释。1.2.5 成份矩阵成份矩阵a 成份12食品烟酒.901-.352衣着.857.437居住.947-.201生活用品及服务.949-.021交通通信.937-.081教育文化娱乐.951-.035医疗保健.888.336其他用品及服务.974-.036表1.2.5,8个指标在第一个公因子上的载荷都很高,说明它们与第一个公因子的相关程度很高,第一个因子很重要;而与第二个因子相关性均很小,它对原有指标的解释不显著。因子的意义含糊不清,不利于对因子进行解释,因此进行旋转。1.2.6 旋转成份矩阵旋转成份矩阵a 成份12食品烟酒.916.312衣着.373.887居住.854.457生活用品及服务

28、.739.596交通通信.768.542教育文化娱乐.750.587医疗保健.463.829其他用品及服务.768.600表1.2.6,经过旋转以后,因子系数有了比较明显的分化,意义明显,第一个因子主要解释了,食品烟酒,居住,生活用品及服务,交通通信,教育文化娱乐,其他用品及服务,这6个指标在第一个因子上均有较大载荷,并且这6个因子与我们的日常消费密切相关,代表了大部分的主要消费支出,也体现了以食品烟酒消费为主的主要消费形态。第二个因子主要解释了衣着和医疗保健,这两个消费是我们对生活需求较为必要的消费。1.2.7 成份得分系数矩阵成份得分系数矩阵 成份12食品烟酒.576-.479衣着-.49

29、4.780居住.377-.233生活用品及服务.134.056交通通信.214-.042教育文化娱乐.153.033医疗保健-.354.620其他用品及服务.158.033表1.2.7,成份得分系数,由此可算出各地区在两因子下的得分。F1=0.576*X1-0.494*X2+0.377*X3+0.134*X4+0.214*X5+0.153*X6-0.354*X7+0.158*X8;F2=-0.479*X1+0.780*X2-0.233*X3+0.056*X4-0.042*X5+0.033*X6+0.620*X7+0.033*X8。各地区的因子得分与排名如下表地区F1排名F2F2排名FF排名北京

30、1.8822.3511.912天津0.7661.1940.796河北-0.59220.0318-0.5522山西-1.02290.4111-0.9329内蒙古-0.54211.472-0.4120辽宁-0.46201.223-0.3518吉林-1.1311.165-0.9531黑龙江-1.07300.946-0.9430上海3.1510.6882.991江苏0.6980.590.687浙江1.2540.42101.24安徽-0.2313-0.6223-0.2514福建1.25-0.86241.075江西-0.1411-0.9525-0.1911山东-0.35180.1716-0.3217河南-

31、0.87270.2713-0.828湖北-0.3216-0.0919-0.316湖南0.0410-0.43210.0110广东1.883-1.24281.673广西0.149-1.6290.039海南0.727-1.76310.558重庆-0.24140.0617-0.2213四川-0.1912-0.3820-0.212贵州-0.3317-1.1426-0.3819云南-0.2415-1.1527-0.315西藏-0.4419-1.6730-0.5221陕西-0.63240.2115-0.5824甘肃-0.6725-0.522-0.6625青海-0.61230.3112-0.5523宁夏-0.

32、88280.747-0.7727新疆-0.81260.2514-0.7426通过对我国城镇居民消费支出情况的因子分析,我们可以将我国31个地区的居民消费结构按照排名顺序可分为三类,第一类为北京、上海、浙江、福建、广东等经济发达地区为一类,因为这些省市的综合得分都在1分以上;第二类为天津、江苏、湖南、广西、海南等经济一般地区为一类,因为这些省份的综合得分都在0分以上,1分以下;第三类为其余的城市,基本属于经济较为落后地区,城市化水平不高,这部分城市大多属于中西部欠发达城市被归为一类,因为这些省份的综合得分均在0分以下。得分越高,居民消费支出的综合水平越高。我们可以看出,消费支出得分及排名结果显示

33、出与目前我国的经济发展状况相类似,得分较高的地区如北京、上海是我国的政治中心和经济中心,紧随其次的得分较为突出的城市,均属于东南沿海,西南沿海城市,他们的发展速度快,经济实力强,经济结构稳定,导致其消费支出状况也较为良好,而0分以下地区,均属于中和西部欠发达城市,如新疆、陕西、甘肃等较为偏远地区,相对比沿海城市,所欠缺的还有很多。还有如河南、山东、安徽等人口较多的省份,得分均为负值,这说明虽然是人口的大省,但是在消费支出上的得分可以看出,其发展程度,经济实力也都十分薄弱,但是相对于西部欠发达城市还是有一定发展优势。基本位于中部地区,是各个地方的经济流通纽带,从而使这些地区的经济发展要快于西部。

34、(三)聚类分析1.3.1 案例处理汇总案例处理汇总a,b案例有效缺失总计N百分比N百分比N百分比31100.00.031100.01.3.1由表可知,数据样本容量为31,没有无效样本。1.3.2 聚类表聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 2北京2425.0000013天津411.0000014河北1631.000008山西322.0010018内蒙古26.001009辽宁1527.0020016吉林1823.0030015黑龙江1629.0053016上海27.0065021江苏930.0080020浙江2026.0100017安徽1314.0140023福建

35、1924.0200123江西410.0262022山东1828.0327019河南1516.0406822湖北2021.05111026湖南317.0634024广东1218.08801528广西89.12501025海南25.1829025重庆415.255141624四川1319.344121326贵州34.568182228云南28.960212027西藏13201.660231730陕西123.13202529甘肃3124.620241929青海1311.854272830宁夏11330.000292601.3.2表可知,这次聚类过程共进行了31步,如1阶的第16个样本和第29个样本聚为一类,此时有30类,聚合以后的下一阶为9阶。由树状图,把数据分成4个类别进行分析类别地区第一类北京

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁