《第十一章学案统计优秀课件.ppt》由会员分享,可在线阅读,更多相关《第十一章学案统计优秀课件.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十一章学案统计第1页,本讲稿共28页名师伴你行第2页,本讲稿共28页1.1.随机抽样、系统抽样和分层抽样随机抽样、系统抽样和分层抽样(1)简单随机抽样)简单随机抽样一一般般地地,设设 一一 个个 总总 体体的的个个体体数数为为 N,如如 果果通通过过 的方法从中抽取一个样本,且每次抽取时的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率各个个体被抽到的概率 ,就称这样的抽,就称这样的抽样为简单随机抽样样为简单随机抽样.实现简单随机抽样,主要有两种方法:实现简单随机抽样,主要有两种方法:和和 .逐个抽取逐个抽取 相等相等 抽签法抽签法 随机数表法随机数表法 名师伴你行返回目录返回目录 第
2、3页,本讲稿共28页用随机数表进行抽样的三个步骤:用随机数表进行抽样的三个步骤:第一步是将总体中的个体编号;第一步是将总体中的个体编号;第二步是选定开始的数字;第二步是选定开始的数字;第三步是获取样本号码第三步是获取样本号码.(2)系统抽样)系统抽样当总体中的个体数较多时,将总体分成当总体中的个体数较多时,将总体分成 的几个部分,然后按照预先定出的规则,从每一部分抽的几个部分,然后按照预先定出的规则,从每一部分抽取取 个个体,得到所需要的样本,这种抽样叫做系统抽样个个体,得到所需要的样本,这种抽样叫做系统抽样.系统抽样的步骤可概括为:系统抽样的步骤可概括为:()采用随机的方式将总体中的个体编号
3、;)采用随机的方式将总体中的个体编号;()确定分段间隔;)确定分段间隔;均衡均衡 1 名师伴你行返回目录返回目录 第4页,本讲稿共28页()在第)在第1段用简单随机抽样确定起始的个体编号;段用简单随机抽样确定起始的个体编号;()按照事先确定的规则抽取样本)按照事先确定的规则抽取样本.(3)分层抽样)分层抽样当已知总体由的当已知总体由的 几部分组成时,常将几部分组成时,常将总体分成几部分,然后按照各部分总体分成几部分,然后按照各部分 进行抽样,这种抽样叫做分层抽样,其中所分成的各部进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做分叫做 .差异明显差异明显 所占的比所占的比 层层 2.2.利
4、用样本频率估计总体分布利用样本频率估计总体分布(1)用样本频率分布估计总体分布)用样本频率分布估计总体分布当总体中的个体取不同数值很少时,其频率分布表当总体中的个体取不同数值很少时,其频率分布表由所取的样本不同数值及相应的频率表示,其几何表由所取的样本不同数值及相应的频率表示,其几何表示就是相应的示就是相应的 .条形图条形图 名师伴你行返回目录返回目录 第5页,本讲稿共28页 当当 总总 体体 中中 的的 个个 体体 取取 不不 同同 数数 值值 较较 多多 时时,用用 频频 率率 来表示相应样本的频率分布来表示相应样本的频率分布.(2)累积频率分布)累积频率分布累积频率是指累积频率是指 ,因
5、此在频率分布表中常增加一列累积频率,而且常在,因此在频率分布表中常增加一列累积频率,而且常在频率分布直方图下画出累积频率分布图频率分布直方图下画出累积频率分布图.3.3.正态分布正态分布(1)正态分布与正态曲线正态分布与正态曲线如果连续型随机变量如果连续型随机变量的概率密度为的概率密度为f(x)=x(-,+).式中实数式中实数,(0)是参数,分别表示总体的是参数,分别表示总体的平均数与标准差,则称平均数与标准差,则称的分布叫的分布叫 ,上面函数,上面函数f(x)的图象叫的图象叫 .分布直方图分布直方图 小于某一数值的频率小于某一数值的频率 正态分布正态分布 正态曲线正态曲线 名师伴你行返回目录
6、返回目录 第6页,本讲稿共28页(2)标准正态总体)标准正态总体在正态总体的概率密度函数中,当在正态总体的概率密度函数中,当=,=时,时,正态总体称为标准正态总体,这时相应的函数正态总体称为标准正态总体,这时相应的函数f(x)=,x(-,+).相应的曲线称为标准正态曲线相应的曲线称为标准正态曲线.(3)正态曲线具有的性质)正态曲线具有的性质曲线在曲线在x轴上方,与轴上方,与x轴轴 .曲线关于直线曲线关于直线 对称对称.曲线在曲线在x=时位于最高点时位于最高点.0 1 不相交不相交 x=名师伴你行名师伴你行返回目录返回目录 第7页,本讲稿共28页当当x时,曲线时,曲线 .并且当曲线向左、右两边无
7、限延伸时,以并且当曲线向左、右两边无限延伸时,以x轴为渐近线,轴为渐近线,向它无限靠近向它无限靠近.当当一定时,曲线的形状由一定时,曲线的形状由确定确定.越越 ,曲线,曲线越越“矮胖矮胖”,表示总体的分布越分散;,表示总体的分布越分散;越越 ,曲,曲线越线越“高瘦高瘦”,表示总体的分布越集中,表示总体的分布越集中.上升上升 下降下降 大大 小小 名师伴你行返回目录返回目录 第8页,本讲稿共28页4.线性回归(1)相关关系与函数关系自变量取值一定时,因变量的取值带有一定的随性,这两个变量之间的关系叫 .它与函数关系是不同的,相关关系是一种非确定性关系.对具有相关关系的两个变量进行统计分析的方法叫
8、 .(2)回归直线方程y=bx+a,其中a,b是待确定的参数,这时表示方法与一次函数的习惯相反.相关关系相关关系 回归分析回归分析 名师伴你行返回目录返回目录 第9页,本讲稿共28页考点一 随机抽样的概念 【例【例1】某公司在甲、乙、丙、丁四个地区分别有某公司在甲、乙、丙、丁四个地区分别有150个、个、120个、个、180个、个、150个销售点个销售点,公司为了调查产品销售的公司为了调查产品销售的情况情况,需从这需从这600个销售点中抽取一个容量为个销售点中抽取一个容量为100的样本的样本,记记这项调查为这项调查为;在丙地区中有在丙地区中有20个特大型销售点个特大型销售点,要从中抽要从中抽取取
9、7个调查其销售收入和售后服务等情况个调查其销售收入和售后服务等情况,记这项调查为记这项调查为.则完成则完成、这两项调查宜采用的抽样方法依次是(这两项调查宜采用的抽样方法依次是()A.分层抽样法分层抽样法,系统抽样法系统抽样法 B.分层抽样法分层抽样法,简单随机抽样简单随机抽样法法C.系统抽样法系统抽样法,分层抽样法分层抽样法 D.简单随机抽样法简单随机抽样法,分层抽样分层抽样法法名师伴你行返回目录返回目录 第10页,本讲稿共28页【分析】【分析】从三种抽样方法的定义入手,寻找宜采用的方从三种抽样方法的定义入手,寻找宜采用的方法法.【解析】【解析】对于调查对于调查,各个地区之间的销售点差异较大,
10、各个地区之间的销售点差异较大,宜用分层抽样法;对于调查宜用分层抽样法;对于调查,总体容量较小,宜用简,总体容量较小,宜用简单随机抽样法单随机抽样法.故应选故应选B.【评析】【评析】认真阅读三种抽样方法的比较表,选取恰当方认真阅读三种抽样方法的比较表,选取恰当方法法.各方法适用的范围是选择抽样方法的重要依据各方法适用的范围是选择抽样方法的重要依据.名师伴你行返回目录返回目录 第11页,本讲稿共28页对应演练某初级中学有学生某初级中学有学生270人人,其中一年级其中一年级108人人,二、三年级二、三年级各各81人人,现要利用抽样方法抽取现要利用抽样方法抽取10人参加某项调查人参加某项调查,考虑考虑
11、选用简单随机抽样、分层抽样和系统抽样三种方案选用简单随机抽样、分层抽样和系统抽样三种方案.使使用简单随机抽样和分层抽样时用简单随机抽样和分层抽样时,将学生按一、二、三年将学生按一、二、三年级依次统一编号为级依次统一编号为1,2,3,270;使用系统抽样时使用系统抽样时,将学生将学生统一随机编号为统一随机编号为1,2,3,270.并将整个编号依次分为并将整个编号依次分为10段段,如果抽得号码有下列四种情况如果抽得号码有下列四种情况:名师伴你行返回目录返回目录 第12页,本讲稿共28页D(分层抽样时分层抽样时,一、二、三年级被抽取的人数比为一、二、三年级被抽取的人数比为433,即,即1108内内4
12、个个,109189内内3个个,190270内内3个个.显然显然均可能为分层抽样均可能为分层抽样,排除排除B;系统抽样时系统抽样时,127内内,2854内内,243270内各一个内各一个,排除排除A,C.7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中关于上述样本的下列结论中,正确的是正确的是()A.都不能为系统抽样都不能为系统抽样 B
13、.都不能为分层抽都不能为分层抽样样C.都可能为系统抽样都可能为系统抽样 D.都可能为分层抽都可能为分层抽样样D 名师伴你行返回目录返回目录 第13页,本讲稿共28页考点二 分层抽样 【例【例2】某工厂生产某工厂生产A,B,C三种不同型号的产品三种不同型号的产品,产品产品数量之比依次为数量之比依次为2:3:5.现用分层抽样方法抽出一个容现用分层抽样方法抽出一个容量为量为n的样本的样本,样本中样本中A种型号产品有种型号产品有16件件.那么此样本的那么此样本的容量容量n=.【分析】【分析】分层抽样的定义中要求抽取样本时,要按照各分层抽样的定义中要求抽取样本时,要按照各部分所占的比例进行抽样部分所占的
14、比例进行抽样.名师伴你行返回目录返回目录 第14页,本讲稿共28页【评析】【评析】分层抽样通常在组成总体的各个部分差异明显分层抽样通常在组成总体的各个部分差异明显时使用,各部分应抽取的样本,由各部分所占的比例进时使用,各部分应抽取的样本,由各部分所占的比例进行分配行分配,因此解决好本题的关键是,因此解决好本题的关键是A种型号的样本占总种型号的样本占总体的比例体的比例.【解析】【解析】A种型号的样本所占比例为种型号的样本所占比例为 ,由题意可得由题意可得 n=16,n=80.名师伴你行返回目录返回目录 第15页,本讲稿共28页对应演练一工厂生产了某种产品一工厂生产了某种产品16 800件件,它们
15、来自甲、乙、丙它们来自甲、乙、丙3条生产线,为检查这批产品的质量条生产线,为检查这批产品的质量,决定采用分层抽决定采用分层抽样的方法进行抽样,已知从甲、乙、丙样的方法进行抽样,已知从甲、乙、丙3条生产线抽取条生产线抽取的个体数组成一个等差数列的个体数组成一个等差数列,则乙生产线生产了则乙生产线生产了 件产品件产品.(由题意,设从甲、乙、丙三条生产线抽取的产品分别由题意,设从甲、乙、丙三条生产线抽取的产品分别为为x-a,x,x+a件件.则则(x-a)+x+(x+a)=16 800,求得求得x=5 600(件件).)5 600 名师伴你行返回目录返回目录 第16页,本讲稿共28页考点三 频率分布直
16、方图及其应用 【例【例3】对某电子元件进行寿命追踪调查,情况如下:对某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表;)列出频率分布表;(2)画出频率分布直方图;)画出频率分布直方图;(3)估计电子元件寿命在)估计电子元件寿命在100,400)h以内的概率;以内的概率;(4)估计电子元件寿命在)估计电子元件寿命在400 h以上的概率以上的概率.寿命(h)100,200)200,300)300,400)400,500)500,600)个数(个)2030804030名师伴你行返回目录返回目录 第17页,本讲稿共28页【分析】【分析】按要求列表、绘图,用样本的分布估计总体的按要求列表、绘图
17、,用样本的分布估计总体的分布分布.【解析】【解析】(1)样本频率分布表如下:)样本频率分布表如下:寿命(h)频数频率100,200)200.10200,300)300.15300,400)800.40400,500)400.20500,600)300.15合 计2001.00名师伴你行返回目录返回目录 第18页,本讲稿共28页(2)频率分布直方图)频率分布直方图(如图如图11-3-3)(3)由频率分布表可以看出,寿命在)由频率分布表可以看出,寿命在100,400)内的电内的电子元件出现的频率为子元件出现的频率为0.65,所以我们估计电子元件寿命在所以我们估计电子元件寿命在100,400)h内的
18、概率为内的概率为0.65.(4)由频率分布表可知,寿命在)由频率分布表可知,寿命在400 h以上的电子元件出以上的电子元件出现的频率为现的频率为0.20+0.15=0.35,故我们估计电子元件寿命故我们估计电子元件寿命在在400 h以上的概率为以上的概率为0.35.图图11-3-3名师伴你行返回目录返回目录 第19页,本讲稿共28页【评析】【评析】(1)列频率分布表时要注意区分频数、频率的)列频率分布表时要注意区分频数、频率的意义意义.(2)画频率分布直方图时注意纵、横坐标代表的意义及)画频率分布直方图时注意纵、横坐标代表的意义及单位单位.(3)通过本题可以掌握总体分布估计的各种常见步骤和)通
19、过本题可以掌握总体分布估计的各种常见步骤和方法方法.(4)解决总体分布估计问题的一般步骤如下:)解决总体分布估计问题的一般步骤如下:先确定分组的组数;先确定分组的组数;分别计算各组的频数及频率(频率分别计算各组的频数及频率(频率=频数总数);频数总数);画出频率分布直方图,并作出相应的估计画出频率分布直方图,并作出相应的估计.名师伴你行返回目录返回目录 第20页,本讲稿共28页对应演练观察新生婴儿的体重,其频率分布直方图如图观察新生婴儿的体重,其频率分布直方图如图1所示,所示,则新生婴儿的体重在则新生婴儿的体重在2 700,3 000的频率为的频率为 .0.3(频率频率=频率组距频率组距组距,
20、组距,频率频率=0.001(3 000-2 700)=0.3.)名师伴你行返回目录返回目录 第21页,本讲稿共28页考点四 正态分布【例【例4】某城市从南郊某地乘公共汽车前往北区火车站有某城市从南郊某地乘公共汽车前往北区火车站有两条路线可走,第一条路线穿过市区,路线较短,但交两条路线可走,第一条路线穿过市区,路线较短,但交通拥挤,所需时间(单位为分)服从正态分布通拥挤,所需时间(单位为分)服从正态分布N(50,102);第二条路线沿环城公路走,路程较长,但交通阻塞);第二条路线沿环城公路走,路程较长,但交通阻塞少,所需时间服从正态分布少,所需时间服从正态分布N(60,42)(1)若只有)若只有
21、70分钟可用,问应走哪条路线?分钟可用,问应走哪条路线?(2)若只有)若只有65分钟可用,又应走哪条路线?分钟可用,又应走哪条路线?(2)=0.9772,(2.5)=0.9938,(1.5)=0.9332,(1.25)=0.8944名师伴你行返回目录返回目录 第22页,本讲稿共28页【分析】【分析】最佳路线是在允许时间内有较大概率及时赶最佳路线是在允许时间内有较大概率及时赶 到火车站的那条路线到火车站的那条路线.【解析】【解析】设设为行车时间为行车时间(1)走第一条路线及时赶到的概率为)走第一条路线及时赶到的概率为P(070)=()-()()=(2)=0.9772;走第二条路线及时赶到的概率为
22、走第二条路线及时赶到的概率为P(070)()=(2.5)=0.9938.因此在这种情况下应走第二条路线因此在这种情况下应走第二条路线.名师伴你行返回目录返回目录 第23页,本讲稿共28页【评析】【评析】(1)若)若N(,2),则,则=N(0,1),这就告,这就告诉我们如何把一个服从一般正态分布的变量化为服从标准诉我们如何把一个服从一般正态分布的变量化为服从标准正态分布,因此我们有:若正态分布,因此我们有:若的累积分布函数为的累积分布函数为(x),的的分布函数为分布函数为0(x),则,则(x)=0().(2)若)若N(,2),则有,则有P(b1b2)=(b2)-(b1)=0()-0().(2)走
23、第一条路线及时赶到的概率为)走第一条路线及时赶到的概率为P(065)()=(1.5)=0.9332;走第二条路线及时赶到的概率为走第二条路线及时赶到的概率为P(065)()=(1.25)=0.8944.因此在这种情况下应走第一条路线因此在这种情况下应走第一条路线.名师伴你行返回目录返回目录 第24页,本讲稿共28页对应演练已知随机变量已知随机变量服从正态分布(,服从正态分布(,),),()0.84,则(,则()()A.0.16 B.0.32 C.0.68 D.0.84(P()0.84,故(,故().16.()()()0.16.故应选故应选A.)名师伴你行返回目录返回目录 第25页,本讲稿共28
24、页1.统计的基本思想方法是用样本估计总体,即用局部推统计的基本思想方法是用样本估计总体,即用局部推断整体,这就要求样本应具有很好的代表性,而样本的断整体,这就要求样本应具有很好的代表性,而样本的良好客观代表性,则完全依赖抽样方法良好客观代表性,则完全依赖抽样方法.弄清简单随机弄清简单随机抽样、系统抽样和分层抽样的客观合理性,从而会在不抽样、系统抽样和分层抽样的客观合理性,从而会在不同的情况下采用适当的抽样方法同的情况下采用适当的抽样方法.2.频率分布与累积频率分布从不同角度反映一组数据的频率分布与累积频率分布从不同角度反映一组数据的分布情况,两者起着相互补充的作用,当样本容量无限分布情况,两者
25、起着相互补充的作用,当样本容量无限增大时,频率分布直方图就会趋近于一条光滑曲线增大时,频率分布直方图就会趋近于一条光滑曲线总体密度曲线,相应地,累积频率分布图也会趋近于一总体密度曲线,相应地,累积频率分布图也会趋近于一条光滑曲线条光滑曲线累积分布曲线累积分布曲线.名师伴你行返回目录返回目录 第26页,本讲稿共28页3.本部分内容是与生产实际联系非常密切的一部分内本部分内容是与生产实际联系非常密切的一部分内容,应重点掌握在生产过程中的质量控制图的意义,容,应重点掌握在生产过程中的质量控制图的意义,以及用概率事件原理来分析和计算以及用概率事件原理来分析和计算N(,2)的有关数的有关数据据.4.频率分布直方图中的纵轴对应的是频率分布直方图中的纵轴对应的是 ,图中图中每一个矩形的面积就是相应的频率每一个矩形的面积就是相应的频率.返回目录返回目录 名师伴你行频率组距第27页,本讲稿共28页名师伴你行第28页,本讲稿共28页