《《统计学》(第四版)课件PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计学》(第四版)课件PPT课件.ppt(277页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学主讲:合肥学院经济系凌斌电话:13909698714信箱:时间:2011年8月29日起1一、约法三章一、约法三章(一)对教师的约法三章章序章序约法三章内容约法三章内容1认真备课2理论联系实际3传道授业解惑21、每课必有新内容2、力争案例化教学3、传道授业解惑3(二)对学生的约法三章章序章序约法三章内容约法三章内容1认真笔记2勤学多问3切勿做假4做笔记专业知识诚实5二、课程内容(二、课程内容(54学时)学时)第一章总论Introduction4学时第二章统计调查Statisticalsurveys4学时第三章统计整理Statisticaldatearrangement4学时第四章统计指标分
2、析StatisticalIndicatorAnalysis8学时6第五章统计抽样Sampling8学时第六章统计相关与回归分析Correlationandregression10学时第七章时间数列分析Timeseriesanalysis8学时第八章统计指数分析Indexnumbersanalysis8学时78三、课程考试方式:N+2统计调查方案、问卷、报告(20);测验一(15);测验二(15);笔记(10);期终考试(40)。9四、参考书目:示范:1罗美萍.我国高校大学生创业教育的现状与对策J.浙江工商大学学报.2006(2):74-782张志娟,李世兵.省城学校垃圾蕴藏10亿“蛋糕”N.安
3、徽商报,2008-09-02(B04)3贾俊平.统计学(第三版)M.北京:中国人民大学出版社,2008.10五、学习准备(我国进出口贸易)112006年我国进出口贸易结构考证:报关员;报检员;外销员;国际商务师;单证员;跟单员。12拉动我国经济增长的“三驾马车”投资消费净出口13第一章第一章总总论论Introduction第一节第一节统计学的产生和发展统计学的产生和发展一、统计学的产生一、统计学的产生(一)统计实践古埃及:公元前3000年,有文献记载,存在人口财产统计;古希腊:公元前600年,有人口普查;中国:公元前2000年有人口、土地、贡赋统计。14(二)统计学起源的两大流派:记述学派(德
4、)政治算术学派(英)151、记述学派a代 表 人 物:康 令(德 国 人 16061681)HermannConring;阿亨华尔(德国人1716-1772)GottfriedAchenwall。b主要观点:要用文字记述国情国力,内容涉及国家组织、人口、军队、领土、财政经济、政治、艺术等方面,作为国家管理的依据。c主要问题:没有涉及现在统计学中的数量分析方法,有统计学的名字,没有统计学的实质。16由于Achenwall是德国哥廷根大学的教授,因此,此派又称为德意志大学教授派,Statistiks在德语中意为国势又是统计。d代表文章:G.Achenwall的近代欧洲各国国势学概论。2、政治算术学
5、派a代表人物:威廉.配第(英国人16231687)William Petty 约翰.格朗特(英国人16201674)Johan Grunt17b主要观点:是用“数量、重量尺度来说话”。因为首创了数量对比分析方法(统计学的方法论基础)所以此派有统计之实,无统计之名。c代表文章:J.Grunt的对死亡率公报的自 然 观 察 和 政 治 观 察 (1662),J.Grunt是名商人,W.Petty的好朋友。d有人认为1850年德国人克尼斯A.Knies定义了名称:分别为国势学与统计学,结束了近200年的争论。也有人认为是18世纪后期齐默尔曼(E.A.W.Zimmerman)将英语Statistics
6、作为德语的释文传入英国。18二、统计学的发展二、统计学的发展数理统计学派社会统计学派19(一)数理统计学派a.代表人物:阿道夫凯特勒(比利时人,1796-1874)LambertAdolpheJacquesQuetelet,凯特勒师从P.S.Laplace学习概率论。b.三本著作:论人类(1835)、概率论书简(1846)、社会物理学(1869)。c.最大贡献:把概率论引进统计学,产生数理统计,使统计学产生质的飞跃。20d.自19世纪起,F.Galton,高尔登提出了回归与相关的概念,K.Pearson皮尔 逊 发 展 了 这 个 理 论;戈 塞 特(W.S.Gosset)发展了抽样原理和实践
7、。21(二)社会统计学派代表人物:恩格尔(德国人)(1821-1896)ChristianLonrenzErnstEngel,和梅尔(德国人)GeorgVonMayr。恩格尔系数(结构相对数)食品消费开支占生活消费开支的比重。是针对城镇居民而言。60为贫困线,50为温饱线;40为小康线;30为富裕线。(2006年长沙市32.6%)221953年RichardStoneandWassilyLeontief的SNA核算体系。ASystemofNationalAccountsandSupportingTables国民账户体系及辅助表1968年提名获奖,1993年进一步修改。23GDP指标、CPI指数
8、等CPI:居民消费价格指数Consumer Price Index,是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平。一般说来当CPI3%的增幅时我们称为INFLATION,就是通货膨胀;而当CPI5%的增幅时,我们把他称为SERIOUS INFLATION,就是严重的通货膨胀。(注:我国2008年7月是6.3。)24三、统计学的研究对象三、统计学的研究对象(Theobjectsofstudyofstatistics)(一)统计的含义(Theconceptsofstatistics)统计一词有三个含义:统计工作例:统计一下今天到多少人?统计资料例:请把今天的
9、统计结果给我。统计学例:今天上“统计学”课25(二)统计学定义1998年国家教育部在“普通高等学校本科专业目录和专业设置”中定义:统计学是研究如何搜集数据,分析数据,以便得出正确认识结论的方法论科学。统计学是方法论;应用范围涉及自然科学与社会科学;研究对象既可以是确定性的数量特征,又可以是随机性的数量特征。26第二节统计学的基本概念(ThebasicconceptsofSTAT)一、统计总体与总体单位统计总体(Population):凡是客观存在的、在同一性质基础上结合起来的许多个别事物的整体。总体单位(Populationunits):构成统计总体的个别事物称为总体单位。27二、统计标志和标
10、志表现(MarkandMarkExpression)标志:说明总体单位特征的名称。是总体单位共同具有的属性和特征,有数量标志和品质标志之分。品质标志(QualitativeMarks):不能用数量值表现的标志数量标志(QuantitativeMarks):可用数量值表现的标志28例:前三个是QualitativeMarks,后三个是QuantitativeMarks姓名年龄性别身高籍贯体重问题:填入的内容是什么?如:凌斌,男,合肥。是不是Qualitative Marks?45岁,171厘米,71公斤。是不是Quantitative Marks?29三、变量与变异变量:可变的数量标志。按性质分
11、为确定性与随机性;按变量值分为连续与离散。变异:标志之间的差异。四、统计指标(StatisticalIndicator)指标:说明社会经济现象总体的数量特征的概念。可以用数值来表现。指标的构成要素:例 2006年我国国内生产总值209407亿元。30指标名称:GDP;指标数值:209407;计量单位:亿元;时间要素(限制)2006年;空间限制:我国(不包括港澳台);计算方法:加总。例:到2020年末我国人均GNP达到8000美元或者:合肥市到2010年GDP要达到2000亿元区别:具备指标六要素,但不具备客观性,它不是统计指标。是计划或规划指标。31五、统计指标的分类(一)统计指标按其所说明的
12、总体现象内容的不同分为:1、数量指标:反映社会经济现象范围的广度、规模大小和数量多少的指标,表现绝对数。例如GDP、全社会固定资产投资总额、全社会零售品消费总额。2、质量指标:反映社会经济现象的相对水平或工作质量的统计指标,表现为相对值和平均值。例如城镇居民人均可支配收入、农民人均纯收入。32(二)统计指标按其功能不同可以分为:描述指标、评价指标和预警指标。1、描述指标是用于反映社会经济现实状况,反映社会生产生活的过程和结果的统计指标;如:GDP,进出口贸易总额等。2、评价指标是用于对社会经济行为的结果进行比较、评估、考核,以检查其工作质量和经济效益的统计指标;如:出勤率、资金周转率、劳动生产
13、率、单位产品成本、资金利润率等企业经济评价指标;以及GDP增长率、社会积累率、投资使用率等国民经济平均指标。333、预警指标主要用于对宏观经济运行的监测,并根据指标数值的变化预报国民经济即将出现的不平衡状态、突发事件以及某些结构性障碍。如:我国GDP的增长速度与经济过热或过冷的现象;基尼系数与分配不公平现象;恩格尔系数与城镇居民的生活水平等等。(三)按作用和表现形式的不同分为:总量指标、相对指标、平均指标。(四)按其在管理上所起作用不同分为:考核指标和非考核指标。34第二章第二章统计调查(统计调查(Statisticalsurveys)统计工作的一般程序:统计设计统计调查统计整理统计分析第第一
14、一节节统统计计调调查查的的种种类类Typesofstatisticalsurveys一、统计调查的基本概念(一)统计调查:按照预定的任务,采用科学方法,有计划、有组织地向客观实际搜集各种原始资料的过程。它是统计工作的基础环节,是统计整理的前提。35统计调查的要求:准确、及时、全面、系统(二)按照包含总体单位的范围分有:全面性调查和非全面性调查。按调查的组织方式分有:统计报表制度和专门调查。统计报表:根据国家有关法规,自上而下统一的布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目、统一的报送时间和报送程序,自下而上地逐级定期提供基本统计资料的一种调查方式。目前,是我国搜集统计资料的主
15、要方式。专门调查:有普查,重点调查,抽样调查三种。36二、按调查方法分有直接观察法;报告法(美国的人口普查);采访法或访问法(我国的人口普查)。第第二二节节统统计计调调查查方方案案 Statistical surveyplans一般包含的内容一、调查目的Surveyobjectives二、调查对象和单位 Survey objects andsurveyunits(一)调查对象:需要调查的社会经济现象的总体。(二)调查单位:构成上述总体的个体。37三、调查项目和调查表Surveyitemsandenumerationforms(一)调查项目是能反映调查单位统计特征的标志。这是调查方案的主体。例1
16、982年第三次全国人口普查有19项项目,其中按人登记的有13项,按户登记的有6项。(二)调查项目通常以表格形式表示,即调查表,调查表有两种:单一表:它反映一个调查单位的情况,内容可以深入。单一表如体检表、学籍表表等。38一览表:反映多个调查多个情况内容不深入。一览表如工资表、考勤表等。设立调查项目的原则:少而精城镇职工家庭生活调查(1984年开始实行)四、调查时间和调查方法Surveytimeandsurveymethods(一)调查时间有两个客观时间:资料所属时间主观时间:调查工作时间39(二)调查方法有直接观察法、报告法、采访法。五、调 查 的 组 织 实 施 计 划 Plans ofor
17、ganizingandimplementingasurvey有组织领导、机构设置、工作步骤、人员培训、经费开支等。示例:40第三节专门调查及问卷设计专门调查及问卷设计一、普查(Generalsurveys):普查是专门组织的一次性的全面性调查。主要用于全面性统计报表不宜或不能反映的全面性资料的调查。如人口普查、工业普查、经济普查等。普查的项目多、资料较细、工作量大,花费多,不能经常进行。41二、重点调查(Keypointsurveys)是非全面性调查,是对等标志量占绝大比重的单位进行的非全面性调查。三、抽样调查用样本指标来推及总体相应指标的非全面性调查。四、调查问卷及设计调查问卷是指按询问提纲
18、及要求选择填写答案的调查表,基本结构有四个部分组成:开头部分、甄别部分、主体部分、背景部分。42开头部分有问候语、说明词、编号等。甄别部分一般以S编号打头。主体部分一般以Q编号打头,有单选题;多选题;排序题;评分题;封闭题;限制题等。背景部分一般以T编号打头,有联系电话;地址等。/(一)、问卷提问的主要类型(二)、提问应注意的事项(三)、问卷答案设计的基本方法43大学生消费调查问卷的错误范例本人因写毕业论文,急需大学生消费数据,希望大家抽出宝贵的时间填写下面的问卷。1.您所在年级?A.大一B.大二C.大三D.大四()2.您平均一个月用去多少生活费?A.300元以下B.300500元(包含500
19、元)C.5001000元(包含1000元)D.1000-1500元E1500元以上()3.您每月消费的主要项目是什么?(可多选)A.伙食B.交通、通讯(电话、上网)C.购物(服装、饰品)D.学习费用(书籍)E.娱乐F.交际G.其他()444.您平均每月购买衣物的花费?A50元以下B50-100元C100-150元D150-200元E200-250元F250-300元G300元以上()5.您平均每月的伙食费(包括零食饮料)为多少?A150元以下B150-200元C200-250元D250-280元E280-300元F300-350元G350-400元H400-450元I450-500J500-5
20、50元K550-650元L650-800元M800元以上()6.您平均每周上网的次数A.从不上网B.2次以下C.2次-5次D.5次以上()如果你上网,平均每周上网_小时,费用_元457.您平均每月的电话费(公用电话、电话卡)为多少?A.10元以下B.10-20元C.20-30元D30-40元E40-60元F60-100元G100元以上()8您平均每月购买日常用品的花费为多少?A20元以下B20-40元C40-60元D60-100元E100元以上()9.您平均每月的交通费为多少?A10元以下B10-20元C20-30元D30-40元E40-50元F50-70元G70-100元H100-150元I
21、150元以上()10.您目前是否拥有手机?A是B否()若上题选A,您在大学期间更换过几部手机?11.您平均每月的手机费为多少?A20元以下B20-30元C30-40元D40-50元E50-70元F70-100元G100-150元H150-250元I250元以上()4612.若您拥有电脑,其价格为元,何时购买?A大一B大二C大三D大四()13.您平均每月购买化妆品的消费为多少?A10元以下B10-20元C20-30元D30-50元E50-80元F80-100元G100-150元H150元以上()14.您平均每月的娱乐(包括电影、KTV、打球等)费用为多少?A20元以下B20-40元C40-60元
22、D60-100元E100-200元F200元以上()15.您每月学习方面的花费(包括文具、书籍、复印等)为多少?A20元以下B20-50元C50-80元D80-120元E120-200元F200元以上()4716.您一个学期的旅游费用为多少?A50元以下B50-100元C100-150元D150-200元E200-250元F250-300元G300-400元H400-600元I600-800元J800-1500元K1500元以上()17.若您上过课外培训班,平均每学期的培训费用为多少?A50元以下B50-200元C200-300元D300-500元E500-800元F800-1500元G150
23、0-2500元H2500元以上()18.您平均每学期赠送给朋友礼物的费用为多少?A50元以下B50-80元C80-150元D150-250元E250-400元F400-800元G800元以上()4819.您是否有定期出去聚餐的习惯或请朋友吃饭的行为?如果有,平均每月用于这方面的支出为多少?A.20以下B.20-50C.50-100D.100-150E150-200F200以上()20.您目前是否拥有电子词典?A是B否()若上题选A,其价格为多少?何时购买?A大一B大二C大三D大四()21.您目前是否拥有MP3?A是B否()若上题选A,其价格为多少?何时购买?A大一B大二C大三D大四()22.您
24、目前是否拥有复读机?A是B否()若上题选A,其价格为多少?何时购买?A大一B大二C大三D大四()23.其他花费(请写明原因及每月花费金额):49第三章第三章统计整理统计整理StatisticalDateArrangement第一节第一节统计整理的基本概念统计整理的基本概念一、统计整理的概念根据统计研究的目的,将统计调查所得的原始结果(rawdate)加以分组、汇总、列表的过程。二、统计整理的内容:分组、汇总、编表三、统计整理的作用:从对个体资料具体表现的认识上升到对总体资料的数量表现的认识。从对现象的感性认识上升到对现象的理性认识。50第二节第二节统计分组统计分组Statisticalgrou
25、ping一、统计分组的概念(definition):根据统计研究目的与任务,按一定标志区分总体的方法。二、统计分组的作用(purpose)区分现象质的差异(统计分组dategrouping)(一)发现统计资料的特点与规律;如高中低收入。(二)将资料划分为性质不同的各种类型;如第一、二、三产业的划分。(三)分析总体中各个组成部分的结构情况;如第三产业的比重占60。(四)揭示现象间的依存关系。产量与成本51三、统计分组的关键选择分组的标志;划分各组的界限。四、统计分组和体系(一)简单分组和平行分组体系简单分组:将总体按一个标志进行的分组平行分组体系:对同一个总体选择两个或两个以上标志分别进行的简单
26、分组。(二)复合分组和复合分组体系:将总体按两个或两个以上标志进行层叠分组。gm52第三节次次数数分分配配、次次数数分分布布Frequencydistribution一、次数分布的概念:在统计分组的基础上,将总体所有单位按各组归类整理,形成总体中各个单位数在各组中的分布。各组的总体单位数叫次数、频数、权数(权衡轻重的影响)。二、分配数列的种类按分组标志不同可分为品质数列、变量数列;按变量值不同可分为离散型数列、连续型数列。前者可编成单项式或者组距式,后者只可以编成组距式。53三、影响次数分布的要素(一)组距与组数(成反比)1、组距I(classwidth)=本组上限(upper limit)本
27、组下限(lowlimit)全距R=变量最大质变量最小值例:本班上学期管理学成绩最高分=100分,最低分=50分,全距=100-50=50全距常见于产品的质量与控制如:75020ml542、组数=全距/组距每组组距均相等称为等距数列,反之则为异距数列在比较等距数列与异距数列的次数分布时常用:次数密度=本组次数/本组组距例1:06国贸统计学考试成绩如下:8988769974608260898693999492777997789582878479659867597284855681777365668363797055要求:等距数列,组距10分,5组,闭口数列分析。06国贸统计学考试成绩表考分人数向上
28、累计向下累计50-60224060-70793870-8011203180-9012322090-1008408合计40-56要求:等距数列,组距10分,5组,开口数列分析。06国贸统计学考试成绩表考分人数向上累计向下累计60以下224060-70793870-8011203180-9012322090以上8408合计40-57(二)组限与组中值1.组限例:10名学生每周生活费分别为45、49、54、56、58、60、62、64、69、69元。要求:分为高端、中端、低端消费三个组,组距为10元。方法一:消费额(元)学生数40-50250-60360-705合计1058方法二:消费额(元)学生数
29、45-55355-65565-752合计10问:方法一与方法二的结果不同,哪一个正确?为什么?592.组中值classmidpoint组中值=(本组上限+本组下限)/2或:组中值=(本组假定上限+本组假定下限)/2例:西瓜重量(斤/500克)个数组中值2斤以下50?2-6斤15046-10斤300810斤以上200?合计700-60第四章第四章统计指标分析统计指标分析StatisticalIndicatorAnalysis4-1总量指标总量指标一、总量指标的概念(definition):反映社会经济现象的总体规模和水平的指标。用绝对数表示。常见:销售额=销售数量单价=营业员人数营业员人均销售额
30、(两因素构成的总量指标)=营业员人数营业员人均工作小时营业员人均每小时销售额 (多因素构成的总量指标)总成本=产品产量单位成本 =产量单位产品消耗单价 61二、总量指标作用:TheFunctionsoftotalamountindicator1、是我们认识社会经济现象的起点。例如:我国石油进口资料年份石油进口量(万吨)200164902002694120039112世界能源机构预测,我国的石油进口量2010年为1.5亿吨,2020年为4亿吨。622、是管理国民经济的依据例如:2002年人均石油消费量国别人均石油消费(吨)美国3.75日本2.227中国0.177我国GDP消耗石油量比美国高30,
31、是日本的2倍。节约能源势在必行。633、计算相对指标和平均指标基础2003年中部六个省会城市数据表城市GDP(亿元)占全省比重%合肥48512.2武汉166230.8长沙92820郑州110215.6太原51621南昌64122.664城市2009年GDP(亿元)合肥2102.12武汉4560.62长沙3744.76郑州3300.40太原1545.24南昌1837.5065三、总量指标的种类(Variety)(一)、按总量指标反映的时间分:时期总量指标(timeperiodindicator):钢产量、营业额等。时点总量指标(timepointindicator):仓库里库存钢材数量;出勤人数
32、等。区别:相加有无意义,能否直接相加。(二)、反映总体内容不同分:总体单位总量指标(populationsize)。例:市交行储蓄网点18个。总体标志总量指标(populationmark)。例:市交行储蓄余额200亿。66四、总量指标的计量单位MeasureUnitofTotalAmountIndicator例:GDP(国内生产总值)的不变价格可以以“0”年为基准,故2003年GDP有两个计量单位:以当年价为计算标准与以2000年价为计算标准。总量指标的计量单位还有实物单位、劳动时间单位等。总量指标的线性的推算法。/gm674-2相对指标RelativeIndicator一、相对指标的概念(
33、definition):两个有联系的总量指标的比率,表现为相对数。是相关事物间数量联系程度的综合指标。二、相对指标表现形式:有名数人/Km2:人口密度;全员劳动生产率:元/人无名数:系数、倍数、成数、百分数和千分数等。常见的相对数:DowJones,Standard&Poors,NASDAQ,上证指数,深证指数。68三、相对指标的种类(一)结构相对数structurerelativeindicator(二)比例相对数ratiorelativeindicator(三)比 较 相 对 数 comparison relativeindicator(四)强度相对数intensityrelativein
34、dicator(五)计划完成相对数relativequantitiesoffulfillmentofplan69例:建筑单位成本计划下降5%,实际下降6%,计划完成情况如何?解答一:单位成本比计划要求多(少)1%完成了。解答二:单位成本计划完成程度=5%/6%=83.33%即单位成本计划比要求降低了16.67%完成了。解答三:单位成本计划完成程度=106%/105%=100.95%单位成本计划完成程度=94%/95%=98.95%704-3算术平均数与调和平均数ArithmeticalAverageandHarmonicMean一、ArithmeticalAverage计算形式:=总体标志总量
35、/总体单位总量(一)简单均数SimpleMean(二)加权均数WeightedMean71二、ArithmeticalAverage的数学性质三、调和平均数Harmonic Mean(一)简单调和平均数(二)加权调和平均数72例1:某集团辖下有三个子公司,2006年资金利润率情况如下,求集团的资金利润率。子公司资金利润率%资金占用额(万元)甲12500乙15800丙241500合计?2800分析:集团的资金利润率=集团的资金利润总额/集团的资金占用总额73集团的资金占用总额已知(2800万元,分母项)。利润总额需要求知,可以用加权算术平均数的公式求解。即jr解:列表计算有子公司x(%)fxf甲
36、1250060乙15800120丙241500360合计19.2857280054074例:如果题目改为子公司资金利润率%利润额(万元)甲1260乙15120丙24360合计?540求集团的资金利润率。75集团的利润总额已知(540万元,分子项)。资金占用总额需要求知,可以用加权调和平均数的公式求解。即gm子公司x(%)mm/x甲1260500乙15120800丙243601500合计19.28575403600解:列表计算有76例2:大学生消费情况调查77784-4几何平均数、众数、中位数GeometricMean、Mode、Median一、几何平均数统计学中一般用G表示。有:简单几何平均数
37、与加权几何平均数之分。例:某汽车发动机厂有四个流水作业车间:铸造车间、粗加工车间、精加工车间、总装车间,各车间的产品合格率分别为95%、90%、93%、97%,则产品的平均合格率?解:=93.71416%79例:某工程使用银行贷款。一年之中,头三个月的贷款利率为6.39%,后五个月的贷款利率为7.10%,其余四个月的贷款利率为7.45%,问:平均贷款利率为多少?附:复利计息公式Future=Present(1+i)n解:设平均贷款利率为i,有(1+i)12=(1+6.39%)3(1+7.1%)5(1+7.45%)4 =2.261910729 有i=7.038403%80二、ModeandMed
38、ian众数与中位数(一)众数:是一组数据中频数最大的变量值,直观地反映了数据的集中趋势。是度量定类数据集中趋势的测度。一般用Mo表示。(二)中位数:是位于有序数据正中间位置上的变量值,体现集中趋势的中心数值的特征。一般用Me表示。81(三)Mean、Median、Mode 的关系。1、对称(正态)分布是三者相等;2、左偏(负偏)分布是小于顺序;3、右偏(正偏)分布是大于顺序。824-5VarianceandStandardDeviation方差和标准差一、方差:是度量数值变量离散程度的基本测度,一般用表示,或V(x)表示。计算公式有简单式与加权式之分:分别为:83由于方差的量纲是变量原有量纲的
39、平方,所以为保持量纲一致,有时会选择标准差来进行测度。二、方差的重要数学性质最小二乘法的数学根据843.n个同性质独立变量和的方差等于各个变量方差之和。4.n个同性质独立变量平均数的方差等于各变量方差平均数的1/n。85例:调查30名同学每天的生活费用,有15、20、25、9、11、13、12、30、18、6、14、10、11、14、15、12、19、17、16、15、16、15、11、7、40、45、10、12、15、18、19、20、21。求:1.每天平均生活费用;2.每天平均生活费用的方差;3.每天平均生活费用的标准差。/jr解:练习使用Excel工具整理数据并求解。86例:假设调查结果
40、如下,使用Excel有:87要求:1.按加权平均法计算这500名大学生的月伙食费。(10分)2.计算这500名大学生月伙食费的标准差。(10分)解:1、月伙食费 (元)2、月伙食费的标准差/gm =65.76(元)88三、离散系数标准差有量纲,存在不可比的问题。因此有选择离散系数作为测度。例:甲企业劳动生产率为15000元,标准差为600元;乙企业劳动生产率为36000元,标准差为1200元。哪个企业的技术水平比较均衡?甲=4%;乙=3.33%89四、偏态系数与峰度系数SkewnessandKurtosis(一)偏态系数。计算公式有两个偏态系数为0时,数据是对称分布;偏态系数为负数时,数据是左
41、偏分布,也称为负偏态;偏态系数为正数时,数据是右偏分布,也称为正偏态。偏态系数越大表明偏离程度越大。90(二)峰度系数。计算公式峰度系数为3时,数据是对称分布;峰度系数大于3时,数据是尖峰分布;峰度系数小于3时,数据是平峰分布。案例分析:91五、是非标志的标准差 例:某机械厂铸造车间生产300吨铸件,合格的27吨,铸件合格率为90%,求合格是非标志的平均数和标志差。令“1”表示“是”(合格)令“0”表示“非”(不合格)令“N”表示“总付单位数300吨 N1 具有“是”标志值的单位数 N0 具有“非”标志值的单位数 92P=N1/N=270/300=90%q=N0/N=30/300=10%有p+
42、q=1 93第五章第五章统计抽样统计抽样 SamplingSampling 5-1 5-1 统计抽样的基础统计抽样的基础一、什么是统计抽样 按随机原理,从总体中抽出部分单位取得的数据,以取得的数据推及总体的全面的相应数量特征并做出具有一定可靠性估计的方法。1891年由挪威人基也尔提出实施(称为统计抽样第一人);1897年,第六届国际统计年会成立论证小组;1903年第九届国际统计年会在全世界推广应用。94二、统计抽样的特点(一)按照随机原理从总体中抽取样本单位,样本单位具有同等可能性,排除了主观因素的作用。而重点调查是根据统计任务有选择的抽取调查单位,带有主观性。(二)以部分实际资料对全部总体的
43、数量特征做出估计。属于非全面调查。相比全面调查可以节约人力、物力、财力。(三)抽样推断的误差可以人为计算并加以控制。95三、统计抽样的理论基础简介 (一)车比雪夫定理 (Chebyshev Theorem)设随机变量X具有数学期望MX=,方差DX=,且对于任意小正数 (常数),不等式为:96例:100捆编织带,平均长度90米,标准差0.6米,求1、实际长度与平均长度超过3米的概率?2、实际长度与平均长度不超过3米的概率?解:1、即实际长度与平均长度超过3米的概率小于4;972、解即实际长度与平均长度不超过3米的概率肯定大于或等于96。(二)正态分布直线函数;指数曲线函数;抛物线函数的介绍。98
44、1、正态分布函数 称x服从参数 的正态分布。记随机变量XN()992、标准正态分布函数 时,有:记随机变量XN(0,1)图形:1003、中心极限定理(CentralLimitTheorem)中的李亚普罗夫定理如果x服从N(),则 101在标准正态分布中,设102当t1=-t t2=+t时(两个相反的定数),有查正态分布概率表(有些书本未列)。t1时,有F(1)=0.6827=68.27%t2时,有F(2)=0.9545=95.45%t3时,有F(3)=0.9973=99.73%t=1.96,F(1.96)=0.95=95%103例:大学生伙食消费中,样本(500名)平均数500为196元,标准
45、差为65.76元。假设消费是正态分布,t=1时,总体(1万)平均数的区间为130.24元至261.76元,在这个范围内的可靠性为68.27%;t=2时,64.48元327.52元,可靠性为95.45%;t=3时,0393.28元,可靠性为99.73%。/gm104例:上例87米93米的概率 105例:某小型电站供应一万台空调用电,已知夜间每台空调开机的概率是0.7,并且开和关的时间彼此孤立,求同时开着的空调的数量在6800台-7200台的概率。(二项分布的正态近似)解:(1).车比雪夫定理方法ChebyshevTheorem106=10000*p=10000*0.7=7000(台),21000
46、0*pq=10000*0.7*0.321007200-7000200或7000-6800200则 1 2/2=1 2100/2002=1 0.052594.75%即概率大于或等于94.75107(2)中心极限定理方法 Central LimitTheorem=F(4.3644)=查正态分布概率表99.999即只要发7000台空调的电力,可以满足10000台空调的运行。在统计抽样中,双侧检验(Two-sidestest)属于此类型。1084、非对称的x取值条件下,标准正态分布概率函数(讲解图形)。109110例:水果一批,重量符合正态分布(非标准化)测得平均重量为140克,标准差12.2克。问水
47、果不小于130克的概率。解:F(X130),取标准有P()即P(x-0.82)P(x-0.82)1P(xZa)=1-=有=1-常见0.05,=1-0.05=0.95查正态分布分位表,有Z0.05=1.644854;=0.01,查表=1-0.010.99有Z0.01=2.326348;常见还有:0.90;0.975;统计抽样中的单侧检验(One-sidesTest)常用。112113(三)正态分布的派生(t、K)1、t分布小样本条件下(样本单位数小于30个)的正态分布 出自1908年W.S.Gosset(1876-1937)用笔名Student发表小样本条件下的正态分布研究的论文。t分布也是左右
48、对称的钟形图形。t分布与标准正态分布相比,中心部位较低,两尾部分较高。n-1称为自由度,自由度越小,t分布越趋于扁平;自由度越大,越趋于正态分布。114t分布可用于总体方差未知时正态总体均值的估计与检验,及线形回归模型中回归系数的显著性检验。2、分布及图形。kai 1863年Abbe首先提出;1875年Hermert;1900年Karl Pearson分别推导出。一般为正偏分布,用于方差估计与检验,及非参数统计中拟和优度检验和独立性检验。图形:1153、F分布随即变量X(n),Y(m)且相互独立,则F=X/n/Y/m的分布为F分布。F分布一般用于两个正态总体方差的比较检验、方差分析和线性回归模
49、型的检验。常见为正偏分布。jgx116117四、随机变量的概率分布(一)离散型随机变量的概率分布(二项分布、超几何分布、泊松分布)1、二项分布(binomialdistribution):互斥现象;独立事件;每次成功概率为p(不成功概率为q)。n次试验,成功x次,每次成功的概率p,则成功x次的概率P为118例:某公司金牌业务员业务成功的平均概率为0.2。现在王伟(金牌业务员)在与6名客户洽谈业务,则恰好成功4次业务的概率是:1192、超几何分布(hypergeometricdistribution)样本抽取后不放回时的离散型概率分布。N个总体有T次成功次数,则抽取n次中有x次成功的概率。例:6
50、名业务骨干中的3人在职时间超过了5年。随机抽取这6人中的4人,恰好有2人在职时间超过了5年的概率。1203、泊松分布(Poissondistribution)事件在一段时(空)间内连续发生时指定次数事件的概率。例:某网店平均每小时接单5个。现在随机抽取1小时观察,恰好接3个定单的概率是121(二)连续性随机变量的概率分布(正态分布、指数分布)1、正态概率分布(normalprobabilitydistribution)2、指数概率分布(exponentialprobabilitydistribution)122 5-2 统计抽样误差一、统计抽样指标(一)、总 体(Population);总 体