应用统计学PPT课件教案资料.ppt

上传人:豆**** 文档编号:77562573 上传时间:2023-03-15 格式:PPT 页数:317 大小:3.60MB
返回 下载 相关 举报
应用统计学PPT课件教案资料.ppt_第1页
第1页 / 共317页
应用统计学PPT课件教案资料.ppt_第2页
第2页 / 共317页
点击查看更多>>
资源描述

《应用统计学PPT课件教案资料.ppt》由会员分享,可在线阅读,更多相关《应用统计学PPT课件教案资料.ppt(317页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、应用统计学PPT课件2022/11/122无处不在的统计n在诺贝尔经济学获奖者中,2/3以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书经济学12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。n1981年,首届国际红楼梦研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对红楼梦后40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。2022/11/123无处不在的统计(续)n大仲马的作品多曲折感人,而他又多私生子。取笑讥讽他的人

2、,往往把他的作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每次举统计数字的例子,总是说大仲马的情妇和私生子有多少。有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了。于是他请求参加年会,获得了批准。果然不出大仲马所料,李昂纳又举他的情妇和私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却破例登台说:“所有统计数字都是撒谎的,包括有关本人的数字在内”。听众哄堂大笑。2022/11/124统计的应用n学者不能离开统计而研究n政治家不能离开统计而施政n企业家不能离开统计而执业 -马寅初2022/11/125

3、2 如何学统计学nCultivateyourstatisticalawarenessinyourdailylife.numeric information on newspaper,TV program,websnReadsomegoodbooksonstatistics books magazinesnPracticestatisticalskillsbyexercisesandcomputersoftware.Excel Spss Sas2022/11/1263 教材及参考文献n应用统计学,施金龙、吕洁,南京大学出版社,2005n统计学,贾俊平、何晓群、金勇进,中国人民大学出版社,2002

4、n统计学概论,曾五一,首都经济贸易大学出版社,2003n统计学的世界,戴维S穆尔,中信出版社,2003nTheBasicPracticeofStatistics,DavidS.Moore,W.H.FreemanCompany出版社,20042022/11/1274 课程成绩评定n期末书面考试成绩(70%)n平时各项表现成绩(30%)课堂参与(10%)作业完成(20%)2022/11/1285 课程主要内容 第一章 绪论 第二章 统计调查 第三章 统计整理 第四章 综合指标 第五章 变异与均衡指标 第六章 时间数列2022/11/129 课程主要内容(续)第七章 指数 第八章 抽样分布 第九章

5、参数估计 第十章 假设检验 第十一章 方差分析 第十二章 相关分析2022/11/1210第一章 绪论n一、统计涵义n二、统计工作n三、统计资料n四、统计科学那些默默无闻的统计学家们已经改变了我们的世界,不是由发现新的事实或技术,而是改变了我们推理和试验的方法,以及我们对这个世界的观念的形成方式。哈克英2022/11/1211一、统计涵义Statistics:(1)Numericdata,whenusedaspluralofstatistic.(2)Ascientificprocedureusedinthestudyandevaluationofnumericdata.统计:(1)统计工作(2

6、)统计资料(3)统计科学2022/11/1212二、统计工作工作任务:调查、分析,服务、监督工作职能:信息,咨询,监督工作过程:设计,调查,整理,分析工作组织:集中、分散,综合、专业2022/11/1213三、统计资料n数据计量:定类、定序,定距、定比。n定类尺度是按照客观现象的某种属性对其进行分类。例如,人口按性别分为男女,用“1”表示男性,用“0”表示女性。定类尺度的主要数学特征是“=”或“”。n定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。例如,学生成绩可以分为优、良、中、及格和不及格等五类。定序尺度的主要数学特征是“”。2022/11/1214数据计量n定距尺度是对现象类别或

7、次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度使用的计量单位一般为实物单位(自然或物理)或者价值单位。定距尺度的主要数学特征是“+”或“”。统计中的总量指标就是运用定距尺度计量的。n定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。定比尺度的主要数学特征是“”或“”。2022/11/1215数据类型nQuanti

8、tative(ormeasurement)datanQualitative(orcategorical)datanDiscretedata,Continuousdatan横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。数据信息知识智慧2022/11/1216四、统计科学n1 统计学发展简史n2 统计学对象方法n3 统计学基本概念2022/11/12171 统计学发展简史英国(1690),威廉配第,政治算术德国(1749),阿亨瓦尔,国势学比利时(19世纪中),凯特勒,

9、数理统计德国(19世纪中),恩格尔,社会统计2022/11/1218理论统计学和应用统计学n历经300多年的发展,统计学目前已经成为横跨社会科学和自然科学领域的多科性的科学。n统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。n从横向看,各种统计学都具有上述共同点,因而能够形成一个学科“家族”。从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学。n现代统计学可以分为两大类:一类是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法的理论统计学;另一类是以各个不同领域的具体数量为研究对象的应用统计学。2022

10、/11/1219统计学学科体系 经济学社会学教育学其他社科物理学生物学医学其他理工农经济统计社会统计教育统计其他社科统计统计学物理统计生物统计医药统计其他理工农统计统计学家未必是经济学家,统计学家未必是经济学家,经济学家也未必是统计学家。经济学家也未必是统计学家。但经济统计学家应当但经济统计学家应当-既是统计学家又是经济学家。既是统计学家又是经济学家。2022/11/12202 统计学对象方法对象:实质性学科与方法论学科 理论统计学与应用统计学方法:特殊方法论与通用方法论 描述统计学与推断统计学 大量观察,平均分析,归纳推断2022/11/1221统计学家与数学家的对话n一名统计学家遇到一位数

11、学家,统计学家调侃数学家,说道:“你们不是说若且,则吗,那么想必你若是喜欢一个女孩,那个女孩喜欢的男生你也会喜欢了?”n数学家想了一下,反问道:“如果你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里,想来你也没事吧!因为它们平均不过是五十度而已!”2022/11/1222DescriptiveandInferentialStatisticsn描述统计:研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。n推断统计:研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行表书的基础上,对统计总

12、体的未知数量特征做出以概率形式表述的推断。2022/11/12233 统计学基本概念n总体、个体、样本n标志、指标、变量n同质、变异、分布n统计量、参数 同质性是总体的前提 变异性是统计的前提。样样本本总总体体2022/11/1224第二章 统计调查n一、统计调查概述 n二、统计调查方案n三、统计调查体系数据胜过自封的专家。戴维穆尔2022/11/1225一、统计调查概述n调查概念:直接搜集资料n调查要求:准确、及时、系统、方便n调查用意:为研究提供素材 对表现进行衡量 用数据阐明问题2022/11/1226DataSources数据数据来源来源直接来源直接来源间接来源间接来源试验试验出版物出

13、版物(或者网上或者网上)问卷问卷观察观察2022/11/1227调查方法n观察法:现场,直接n询问法:采访,问卷,通讯,网上n报告法:行政,向上n实验法:随机,双盲,重复2022/11/1228二、统计调查方案n目的、任务:为什么调查n对象、单位:向谁调查n项目、表格:调查什么n时间、期限:什么时候调查 什么时候的资料2022/11/1229QuestionnaireDesignn问题内容n问题措辞n问题次序n答问方式n版面设计 2022/11/1230 普查全面报表抽样调查重点调查典型调查周期性调查一次性调查普查抽样调查重点调查典型调查全面调查非全面调查连续(经常性)调查不连续调查定期报表专

14、门调查调 查范围调 查时间组 织形式统计调查种类统计调查种类2022/11/1231三、统计调查体系n统计报表:定报,年报n普 查:一次,专门n抽样调查:随机,推断n重点调查:重点,大体n典型调查:典型,细致2022/11/1232统计调查体系改革n我国长期以来,基本上依靠全面统计报表采集统计资料。改革开放后,抽样调查等非全面调查虽然有所发展,但应用的领域不很广泛。这种以全面统计报表为主的统计调查体系,面对日益发展的多种经济成分、多种经营方式等复杂多样的调查对象已经难以适应。n统计调查体系改革的目标模式是:建立以必要的周期性普查为基础,经常性的抽样调查为主体,重点调查、科学推算等为补充的多种方

15、式综合运用的统计调查体系。2022/11/1233第三章 统计整理n一、整理程序n二、统计分组n三、频数分布n四、统计图表数字不会说谎,但说谎的人会想出办法。格罗夫纳 2022/11/1234一、整理程序n审核:计算审核,逻辑审核n分组:分类,分组n汇总:手工汇总,电子汇总n表现:列表,图示2022/11/1235 二、统计分组n概念:划分一个总体为若干组n原则:穷尽,互斥n作用:划分类型,研究结构,分析关系n方法:品质标志分组,数量标志分组2022/11/1236 三、频数分布n概念:总体单位在各组的分布状况n种类:品质数列,变量数列 单项数列,组距数列n编制:全距,组距,组限,频数n类型:

16、钟型,U型,J型2022/11/1237 组距数列编制举例 某生产车间50名工人日加工零件数如下:1171221241291391071171301221251081311251171221331261221181081101181231261331341271231181121121341271231191131201231271351371141201281241151391281241212022/11/1238n第一步,对数据进行排序,计算全距(R)107108108110112112113114135137139139 n第二步,确定组数(k)和组距(i)k=4i=Rki=10k=1

17、+3.3LgN n第三步,设置组限(u,l)离散变量与连续变量的不同要求n第四步,计算各组次数(f)组距数列编制举例(续1)2022/11/1239组距数列编制举例(续2)按零件数分组 次数(频数)频率 (%)向上累计 向下累计次数频 率(%)次数频 率(%)110以下以下 3 6 3 6 50 100110120 13 26 16 32 42 84120130 24 48 40 80 20 40130140 10 20 50 100 4 8合计合计 50 100 50名工人日产零件数2022/11/1240分布数列类型-钟型分布日产量日产量 (件件)2022/11/1241分布数列类型-型分

18、布2022/11/1242 分布数列类型-J型分布(1)价格需求2022/11/1243分布数列类型-J型分布(2)价格供应2022/11/1244四、统计图表n统计表:主词栏、宾词栏 简单表、分组表、复合表n统计图:分布图、条形图、圆形图 2022/11/1245统计表举例主词总标题横行标题纵栏标题数字资料宾词2022/11/1246统计图举例直方图2022/11/1247 统计图举例(续1)条形图2022/11/1248 统计图举例(续2)19982002年我国进出口总额(亿美元)复合条形图2022/11/1249统计图举例(续3)圆形图2022/11/1250ErrorsinPresen

19、tingDatanChartJunk 垃圾数图表nNoRelativeBasis 无相对基准nCompressingVerticalAxis 压缩纵轴nNoZeroPointonVerticalAxis 纵轴无零点2022/11/1251垃圾数图表差的表示好的表示1960:$1.001970:$1.601980:$3.101990:$3.80最低工资最低工资0241960197019801990$2022/11/1252无相对基准好的表示按年级统计的A按年级统计的A差的表示0100200300大一大一大二大二 大三大三 大四大四频数频数0%10%20%30%大一大一大二大二 大三大三 大四大四

20、%2022/11/1253压缩纵轴好的表示季度销售季度销售差的表示025501季季2季季3季季 4季季$01002001季季 2季季3季季 4季季$2022/11/1254纵轴无零点好的表示月销售量月销售量差的表示0204060一一 三三 五五 七七 九九 十一十一$36394245一一 三三 五五 七七 九九 十一十一$2022/11/1255第四章 综合指标n一、总量指标n二、相对指标n三、平均指标统计学家通常醉心于平均数,而不着迷于更广泛的考虑。这一点很像一些英格兰人对瑞士的回忆:如果可以将它的山脉扔进它的湖泊,那么两种讨厌的东西将立即去除。高尔顿2022/11/1256一、总量指标n概

21、念:反映总体规模、水平;绝对数n分类:时期指标、时点指标n计量:实物单位,价值单位n计算:直接计算、间接推算2022/11/1257总量指标举例n国内生产总值简称GDP,是由本国常住单位所创造的社会最终产品的价值总量,同时又是全社会各常住单位所创造的增加值的总和。nGDP(各部门总产出该部门中间消耗)各部门的增加值nGDP总消费总投资净出口nGNP GDP付给国外的要素收入+来自国外的要素收入 GDP+来自国外的要素收入净额 2022/11/1258二、相对指标n1 相对指标意义n2 相对指标形式n3 相对指标种类n4 相对指标原则2022/11/12591 相对指标意义n相对指标是将两个性质

22、相同或互有关联的指标数值通过对比求得的商数或比率;用以反映事物内部的结构、比例,事物发展的程度、强度,事物之间的联系、区别。n对比是统计分析的基本方法。通过对比显示事物的相对水平,可以更深入地说明事物发展的程度和差别,弥补总量指标的不足;提供事物之间共同的比较基础,便利对事物的鉴别和分析。所以说,相对指标具有说明和比较两大作用。2022/11/12602 相对指标形式n相对指标的指标数值大多是相对数,或称无名数。无名数是一种抽象化的数值,分为系数、倍数、成数、百分数、干分数等。n相对指标是由两个指标分别作为分子项与分母项对比而成的,其分母项作为比较的基础,故称为基数。系数和倍数是将基数抽象为l

23、而计算出来的相对数。成数、百分数、干分数是将基数抽象为10、100、1000计算的相对数,其中百分数最常用。n像人口密度、人均国民生产总值这类相对指标,将其分子项与分母项的计量单位同时使用,即以(人平方公里)、(元人)作为数值形式,此称有名数或名数。2022/11/12613 相对指标种类n计划完成相对指标n结构相对指标n比例相对指标n比较相对指标n动态相对指标n强度相对指标2022/11/12624 相对指标原则n保持可比性 n结合绝对数 n运用多指标 2022/11/1263 三、平均指标n 意义 一般水平,坐落位置n 种类 静态平均数,动态平均数 n 作用 说明,比较,判断n计算 数值平

24、均数,位置平均数2022/11/1264 1数值平均数n算术平均数n调和平均数n几何平均数2022/11/1265日产量日产量(公斤)公斤)工人数工人数 f组中值组中值 x日产总量日产总量 x f 3030以下以下 1010?*10?*1030304040 7070 3535 2450245040405050 9090 4545 4050405050506060 3030 5555 16501650合合 计计 200200 84008400某车间200名工人日产量资料:算术平均数计算举例2022/11/1266 算术平均数n基本公式:标志总量/总体总量n计算形式:简单平均,加权平均n数学性质:

25、离差、离差平方之和n是非标志:成数是特殊的平均数 2022/11/1267 两个平均数是否矛盾 工人 件/小时 分钟/件 甲320 乙230 平均2.5252022/11/1268 调和平均数n概念:倒数平均数n应用:算术平均数的变形n结论:对逆指标求平均2022/11/1269 企企 业业产值计划产值计划完成完成(%)(%)x x计划产值计划产值(万元万元)m/xm/x 实际产值实际产值(万元万元)(m)(m)甲甲95 300285 乙乙105 900945 丙丙115 300345合计合计 15001575某局所属的三个企业的资料:调和平均数计算举例2022/11/1270 两个平均数是否

26、矛盾(续)商品P1P0P1/P0(%)P0/P1(%)A8420050B3650200平均1251252022/11/1271 几何平均数n概念:对数平均数n性质:受极端值影响小n结论:对比率、速度求平均2022/11/1272车间车间投入量投入量 产出量产出量 合格率合格率(%)x 一一1000800 80 二二 800 720 90 三三720 504 70某企业三个连续作业车间的合格率:几何平均数计算举例2022/11/1273 2 位置平均数n众数n中位数n四分位数2022/11/1274 众数n概念:频数最大的标志值n计算:单项数列,组距数列n公式:上限公式,下限公式 2022/11

27、/1275 年人均纯收入年人均纯收入 (千元)(千元)农户数农户数(户)(户)5以下2405648067110078700893209以上160合计3000众数计算举例2022/11/1276 中位数n概念:序列正中间的标志值n计算:单项数列,组距数列n公式:上限公式,下限公式2022/11/1277 四分位数n四分位数:数据分为四份n十分位数:数据分为十份n百分位数:数据分为百份2022/11/1278 平均指标的关系和原则n 关系 数值平均数之间的关系 数值平均数与位置平均数的关系n 原则 正视同质性 补充组平均 运用多指标2022/11/1279第五章 变异与均衡指标n一、变异指标n二、

28、偏度峰度n三、均衡指标当事实改变时,我就改变主意。你呢?凯恩斯2022/11/1280一、变异指标n概念 反映总体内部差异程度或离散程度n作用 评价平均指标的代表性 测度现象发展过程的均衡性、稳定性 揭示总体分布的离中趋势 2022/11/1281n全距 n四分位差n平均差 n方差n标准差 n标准差系数变异指标种类代表着国内军舰建造最高水平的171“海口”号导弹驱逐舰 2022/11/1282标准差计算举例日产量(公斤)工人数f组中值x20301025288030407035343040509045810506030555070合 计200121902022/11/1283标准差系数计算举例组

29、别平均数标准差标准差系数%甲70(件)7.07(件)10.1乙7(台)3.41(台)48.7甲组日产量(件):60、65、70、75、80乙组日产量(台):2、5、7、9、122022/11/1284二、偏度峰度n1 统计动差n2 偏度指标n3 峰度指标2022/11/12851 统计动差n动差(又称矩),原是物理学上用以表示力与力臂对重心关系的术语。统计学上标志值与权数对平均数的关系,与此种关系十分相似。因此,统计学借用动差概念,描述次数分布的某些性质或特征。n一般地说,标志值与任意数(A)之差的K次方的算术平均数,称为标志值关于的K阶动差。n一阶原点动差即为算术平均数,二阶中心动差即为方差

30、(标准差的平方)。所以,次数分布的集中趋势和离中趋势等特征,皆可由动差描述。2022/11/12862 偏度指标n笼统地说,偏度是指频数分布的非对称形态及程度。频数分布的非对称形态依算术平均数与众数的大小关系分为两种:一为右偏态分布,简称右偏或正偏;一为左偏态分布,简称左偏或负偏。左、右偏缘于频数分布曲线向左、右方拖长尾巴,正、负偏缘于算术平均数与众数之差为正、负值。n严格地说,偏度是指偏态分布(包括正偏、负偏)的偏斜程度。而偏度的描述或测定,就是运用适当的指标或方法,度量分布偏斜程度的大小,揭示分布的形态特征。2022/11/1287 偏度指标计算n皮尔逊指标 以标准差为单位的算术平均数与众

31、数的离差。n三阶中心动差 分布负偏,三阶中心动差为负数;分布正偏,则为正数。为消除三阶中心动差立方单位的影响,也为不同水平数列偏度的直接比较,须将三阶中心动差除以标准差的三次方,以获得数列偏度的相对度量。2022/11/1288频数分布(非)对称状况Right-Skewed右偏的Left-Skewed左偏的Symmetric对称的 均值均值=中位数中位数=众数众数均值均值 中位数中位数 众数众数众数众数 中位数中位数 均值均值2022/11/12893 峰度指标n峰度是频数分布的一种性质或特征。这一特征是指,某一数列的分布曲线与正态分布曲线相比较,是尖顶,还是平顶,其尖顶或平顶的程度如何。n峰

32、度通常分为三种:尖顶峰度、正态峰度和平顶峰度。当标志值的次数,更密集分布于众数左右,使分布曲线较正态分布曲线更为尖耸的,为尖顶峰度;当标志值的次数,完全符合正态分布的规律,分布曲线与正态分布曲线完全一致,为正态峰度,又称为标准峰度;当标志值的次数,更离散分布于众数左右,使分布曲线较正态分布曲线更为平坦的,为平顶峰度。2022/11/1290峰度指标计算n偶数阶中心动差有一特点,即不论数列的离差为正或负,经偶数次乘方后,皆为正值。由于离差经偶数次乘方后,必加重较大离差的分量,能使它在度量分布的峰度中发挥作用。n可以取数列的偶数阶中心动差,作为分布峰度的测度指标。偶数阶中心动差只能作为峰度的绝对度

33、量,还必须经适当处理,形成一种峰度的相对度量的指标。n可以证明,正态分布的四阶中心动差与其标准差的四次方之比值为3。所以,通常以数列的四阶中心动差与其标准差的四次方之比,作为测度峰度的指标。2022/11/1291尖顶与平顶n峰度指标=3,分布为正态峰度,当峰度指标3时,表示频数分布比正态分布更集中,分布呈尖峰状态,3)(=3)(F,则拒绝原假设H0,表明平均数值之间的差异是显著的,所检验的因素(A)对观察值有显著影响。若FF ,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响。2022/11/12238多重比较多重比较是通过对总体平均数之间的配对比较来进一步检验到底哪些均值之

34、间存在差异。Fisher提出的最小显著差异方法(LSD)可用于判断到底哪些均值之间有差异。LSD方法是对检验两个总体平均数是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到的。2022/11/12239多重比较的步骤提出假设:H0:i=j(第i个总体的平均数等于第j个总体的平均数)H1:i j(第i个总体的平均数不等于第j个总体的平均数)计算检验统计量:做出决策:若|t t|t t,拒绝H H0 0;若|t t|F3.4903,拒绝原假设H0,说明彩电的品牌对销售量有显著影响;FB2.100846F3.2592,接受原假设H0,说明销售地区对彩电的销售量没有显著影响2022/1

35、1/12249第十二章 相关分析n一、基本问题n二、相关系数n三、回归方程有其父必有其子。中国谚语2022/11/12250一、基本问题n概念:函数关系、相关关系n类型:简单相关、复杂相关n任务:相关分析、回归分析2022/11/12251函数关系n一一对应的确定关系。n设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x。当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量。n各观测点落在一条上。x xy y2022/11/12252相关关系 变量间关系不能用函数关系精确表达。一个变量的

36、取值不能由另一个变量唯一确定。当变量 x 取某个值时,变量 y 的取值可能有几个。各观测点分布在直线周围。x xy y2022/11/12253 相关关系类型相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相关完全相关不相关不相关2022/11/12254相关分析任务n对经济、管理现象之间相关关系的统计研究,主要解决两个方面的问题,或完成两个方面的任务:n其一,测定相关关系的密切程度,一般称为相关分析;n其二,揭示相关变量的互动规律,一般称为回归分析。2022/11/12255二、相关系数n概念:对两个变量之间线性相关程度和相关方向的度量。n公式

37、:n举例:下页。2022/11/12256 我国人均国民收入与人均消费金额数据我国人均国民收入与人均消费金额数据 单位单位:元元年份年份人均人均国民收入国民收入人均人均消费金额消费金额年份年份人均人均国民收入国民收入人均人均消费金额消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相关系数举例为为研研究

38、究我我国国人人均均消消费费水水平平的的问问题题,把把人人均均消消费费额额记记为为y y,把把人人均均国国民民收收入入记记为为x x。收收集集到到1981198119931993年年的的样样本本数数据据(x xi i ,y yi i),i i=1,2,=1,2,,1313,数据见下表。试计算相关系数。,数据见下表。试计算相关系数。2022/11/12257相关关系计算结果n根据样本相关系数的计算公式有n人均国民收入与人均消费金额之间的相关系 数为 0.9987。2022/11/12258相关系数取值及其意义r的取值范围是-1,1|r|=1,为完全相关 r=1,为完全正相关 r=-1,为完全负相关

39、 r=0,不存在线性相关关系 -1r0,为负相关 0 t t,拒绝拒绝H H0 0 若若 t t =64.9809t t(13-2)=2.201(13-2)=2.201,拒绝拒绝H H0 0,人均人均 消费金额与人均国民收入之间的相关关系显著。消费金额与人均国民收入之间的相关关系显著。2022/11/12261三、回归方程n概念:对变量之间互动规律的具体模式的量化描述。n类型:一元回归,多元回归。n举例:下页。n评价:判定系数,估计标准误差。2022/11/12262回归方程类型一个自变量一个自变量两个及以上自变量两个及以上自变量回归方程回归方程多元回归多元回归一元回归一元回归线性线性回归回归

40、非线性非线性回归回归线性线性回归回归非线性非线性回归回归2022/11/12263回归方程举例 根据前例数据,配合人均消费金额对人均国民收入的一元线性回归方程,并以最小平方法求解方程中的两个参数,得y=54.22286+0.52638x2022/11/12264回归方程图示y=54.22286+0.52638x2022/11/12265判定系数 回归平方和占总离差平方和的比例评价回归直线的拟合程度取值范围在0,1之间 r21,说明回归方程拟合得越好r20,说明回归方程拟合得越差判定系数等于相关系数的平方,即r2(r)22022/11/12266估计标准误差 估计标准误差是实际观察值与回归估计值

41、离差平方和的均方根,反映实际观察值在回归直线周围的分散状况。它从另一个角度说明了回归直线的拟合程度。其计算公式为:上例的计算结果为14.9496782022/11/12267利用回归方程进行估计或预测 利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的平均值的一个估计值E(y0),这就是估计或预测。前例子中,当人均国民收入为 2000元时,我们可以估计人均消费金额的的平均值为2022/11/12268相关分析与回归分析的区别n相关分析中,变量x变量y 处于平等的地位;回归分析中,变量y 称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化。n相关分析中所涉及

42、的变量 x 和 y 都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。n相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。2022/11/12269正确运用相关分析n相关分析只是一种重要的研究工具、分析手段,在运用它于具体研究对象时,必须以有关的科学理论、专业知识为指导。n变量间的相随变动或共同变动,可能确实彼此之间存有因果关系或互为因果,也可能没有直接关系。例,由于观察资料的偶然巧合,可能会出现诸如某地白酒消费量与自杀者人数同时增加、卷烟销售量与患肺病人数同时上

43、升的数据。其实,它们之间并无直接关联。所以,必须在定性分析的基础上,正确运用相关分析方法。2022/11/12270第十三章 统计综合评价n一、综合评价概述 n二、评价指标选择n三、指标权重确定n四、综合评价结果2022/11/12271一、综合评价概述n单项评价是利用一个统计指标对事物的某一个方面作出判断。n综合评价,则是根据研究的目的,建立一个统计指标体系,对事物的各个方面进行定量分析,得出概括性的结论,从而揭示事物的本质及其发展规律。n综合评价的基本步骤:建立评价指标体系量化处理评价指标确定评价指标权重综合最终评价结果。2022/11/12272二、评价指标选择n定性选择方法有综合法和分

44、析法:综合法一般是通过研讨会或征询意见的方式,集中专家们的意见,以确定评价指标。分析法是将评价的对象划分为若干个组成部分或不同的侧面,对每一侧面分别选用一个或若干个指标以反映评价对象的特征。n定量选择方法有试算法和系统聚类法:(下页)2022/11/12273 n试算法是通过历史资料的试算来判断指标的有效性。n系统聚类法是通过判断指标之间的相似程度来筛选指标的一种方法。n系统聚类法的具体操作步骤:度量指标(类)间的相似程度度量指标(类)间的距离确定最具有代表性的指标(类)。试算法、系统聚类法2022/11/12274三、量化处理评价指标n在综合评价中,有些评价指标本来属于定性评价,对这些指标应

45、进行量化处理。n量化处理常用的方法是:先对评价的各等级赋予不同的分值,再聘请足够数量的评议者,请评议者对评价对象进行评议,在所列的评语等级中选择一个他认为最恰当的等级,而后计算各等级得票数,再用得票数对比总票数,计算出得票频率。n对定量指标,必要时应进行同度量处理。主要有相对化处理、标准化处理、功效系数法处理。2022/11/12275 相对化处理n进行相对化处理,必须先对每个评价指标确定一个标准值,而后计算实际值与标准值之比。n指标有“正”、“逆”之分,对于正指标,以实际值对比标准值;对于逆指标,以标准值对比实际值。n标准值的选择:可用参加评价单位某一时期的平均值或最优值作为标准值,也可选择

46、国际先进水平、历史最高水平或计划规定水平等作为标准值。2022/11/12276 标准化处理n进行标准化处理的基本前提是变量必须服从正态分布。n将变量值(指标值)转化为数学期望为0、方差为1的标准化数值。n经标准化处理后的数值围绕着0上下波动,数值大于0的说明高于平均水平,数值小于0的说明低于平均水平。2022/11/12277 功效系数法处理n功效系数法借助功效系数,把确定要评价的各项指标值转化为可以度量的评判分数。n利用功效系数法进行消除量纲影响的处理,必须对评价的指标确定一对阈值,包括一个下限值(不容许值)和一个上限值(满意值)。n可采用历年来最差值、最优值作为不容许值、满意值;或以第i

47、项指标数列中较差(好)的10%的数值平均数确定。2022/11/12278功效系数计算公式n功效系数n式中,为第i个指标实际值;为第i个指标的不容许值;为第i个指标的满意值,为第i 项指标单项评分。2022/11/12279三、指标权重确定n在综合评价的一个论域中,对目标值起权衡轻重作用的数值即权重,也称权数。确定权重的方法有:n统计平均法。根据专家们对各评价指标所赋予的相对重要性系数分别求其算术平均数,所得的平均数作为各指标的权重。n最大组中值法。评价指标体系U中含有u1,u2,un个指标,请有关专家(m30人组成)根据权数分配表,对U中的各项指标,提出自己认为最合适的权数。再根据专家估测的

48、资料,进行单因素的权数统计。2022/11/12280 指标权重确定方法n确定权重的方法还有:n层次分析法(AnalyticHierarchyProcess,AHP)。将复杂的评价对象表示为一个有序的递阶层次结构的整体,通过人们在各个评价项目间进行两两的比较、判断,进而计算各个评价项目的相对重要性系数,即权数。n变异系数法。在评价指标体系中,指标取值差异越大的也就是越难实现的指标。差异越大的指标越重要,因为它更能反映出参加评价的各单位的差距。2022/11/12281四、综合评价结果n综合评价结果的方法有:n总分评定法 定序尺度、定距尺度、定比尺度的指标n加权平均法 算术平均、几何平均n最优值

49、距离法 正指标、逆指标2022/11/12282 总分评定法n总分评定法是通过将变量值转化为分值,而后将各个评价对象的分值加总的方法。n对于以定距尺度或定比尺度计量的评价指标,例如动态对比指标,以报告期值对比基期值,可采用三档记分:报告期对比基期增加者,记满分;报告期与基期持平者,减半记分;报告期比基期下降者计零分。n对于以定序尺度计量的评价项目,一般把该项目划分为若干个评分等级,并对不同等级赋予适当的分值,然后请足够多的评判者按预定的评分等级对该项目评分。n最后综合评判结果,即把各指标(或各项目)得分加总,得到该评价对象的总分。2022/11/12283 加权平均法n加权算术平均法n加权几何

50、平均法 n 左式中,评价指标体系的容量为nn xi为已经经同度量处理过的第i个评价指标的相对值n wi为各项指标的权重。n i=1,2,n2022/11/12284 最优值距离法n最优值距离法是以各项评价指标的实际值与最优值(或标准值)之间距离的大小来衡量评价对象效益的高低。对评价指标体系中的各评价指标进行相对化处理后,运用距离法进行综合,其综合值反映了各评价指标与相应的最优值(或标准值之间的距离)。n计算公式是Sj=2022/11/12285Sj 值的含义nSj值越小,与最优值越接近,表明效益越佳;Sj值越大,越远离最优值,表明效益越低。n上式中,xij=Xij/Xi0,为经相对化处理后的变

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁