《高二数学必修3《统计》课件ppt.ppt》由会员分享,可在线阅读,更多相关《高二数学必修3《统计》课件ppt.ppt(81页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数学数学3 3(必修)(必修)本章内容本章内容 本章介绍了从总体中抽取样本的常用方法,并通过本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的实例,研究了如何利用样本对总体的分布规律、整体分布规律、整体水平、稳定程度及相关关系水平、稳定程度及相关关系等特性进行估计和预测等特性进行估计和预测总体总体抽样抽样分析分析估计估计简简单单随随机机抽抽样样 系系 统统 抽抽 样样 分分 层层 抽抽 样样 样样 本本 分分 布布样样 本本 特特 征征 数数 总总 体体 分分 布布 总总 体体 特特 征征 数数 当总体容量大或检测具有一定的破坏性时,可以从总体中当总体容量大或检测具有
2、一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的抽取适当的样本,通过对样本的分析、研究,得到对总体的估计,这就是统计分析的基本过程而用样本估计总体就是估计,这就是统计分析的基本过程而用样本估计总体就是统计思想的本质统计思想的本质 要准确估计总体,必须合理地选择样本,我们学习的是最要准确估计总体,必须合理地选择样本,我们学习的是最常用的三种抽样方法获取样本数据后,将其用频率分布表、常用的三种抽样方法获取样本数据后,将其用频率分布表、频率直方图、频率折线图或茎叶图表示后,蕴含于数据之中频率直方图、频率折线图或茎叶图表示后,蕴含于数据之中的规律得到直观的揭示运用样本的
3、平均数可以对总体水平的规律得到直观的揭示运用样本的平均数可以对总体水平作出估计,用样本的作出估计,用样本的极差、方差(标准差)极差、方差(标准差)可以估计总体的可以估计总体的稳定程度稳定程度 对两个变量的样本数据进行相关性分析,可发现存在于现对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象用实世界中的回归现象用最小二乘法研究回归现象最小二乘法研究回归现象,得到的,得到的线性回归方程可用于预测和估计,为决策提供依据线性回归方程可用于预测和估计,为决策提供依据 总之,统计的基本思想是从样本数据中发现统计规律,实总之,统计的基本思想是从样本数据中发现统计规律,实现对总体的估计现对
4、总体的估计2.1 2.1 抽样方法抽样方法1.简单随机抽样简单随机抽样()抽签法()抽签法 为了了解高一为了了解高一(1)班班50名学生的视力状况,从中抽名学生的视力状况,从中抽取取10名学生进行检查如何抽取呢?通常使用抽签名学生进行检查如何抽取呢?通常使用抽签法,方法是:将法,方法是:将50名学生从名学生从1到到50进行编号,再制进行编号,再制作到作到50的的50个号签,把个号签,把50个号签集中在一起并充个号签集中在一起并充分搅匀,最后随机地从中抽分搅匀,最后随机地从中抽10个号签对编号与抽个号签对编号与抽中的号签的号码相一致的学生进行视力检查中的号签的号码相一致的学生进行视力检查一般一般
5、地,地,抽签法抽签法是从个体个数为是从个体个数为 N的总体中抽取一个容的总体中抽取一个容量为量为k的样本的过程。其步骤为:的样本的过程。其步骤为:说明:说明:1.抽样公平性原则抽样公平性原则等概率等概率随机性;随机性;2.抽签法适用与总体中个数抽签法适用与总体中个数N不大的情形不大的情形.1.将总体中的所有个体编号(号码可以从到将总体中的所有个体编号(号码可以从到);2.将到将到 这这 个号码写在形状、大小相同的号签上个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);(号签可以用小球、卡片、纸条等制作);3.将号签放在同一箱中,并搅拌均匀;将号签放在同一箱中,并搅拌均匀;4
6、.从箱中每次抽出个号签,并记录其编号,连续抽从箱中每次抽出个号签,并记录其编号,连续抽取次;取次;5.从总体中将与抽到的签的编号相一致的个体取出从总体中将与抽到的签的编号相一致的个体取出.2.1 抽样方法(2).随机数表法:随机数表法:下面我们用随机数表法求解本节开头的问题下面我们用随机数表法求解本节开头的问题()对()对50个同学进行编号,编号分别为个同学进行编号,编号分别为01,02,03,50;()在随机数表中随机地确定一个数作为开始,如第行第()在随机数表中随机地确定一个数作为开始,如第行第29列的列的数开始为便于说明,我们将附表中的第行至第行摘录如下:数开始为便于说明,我们将附表中的
7、第行至第行摘录如下:16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02
8、 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28 第第29列列第行第行()从数开始向右读下去,每次读两位,凡不在()从数开始向右读下去,每次读两位,凡不在01到到50中的数跳过中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到去不读,遇到已经读过的数也跳过去,便可依次得到12,07,44,39,38,33,21,34,29,42这这10个号码,就是所要抽取的个号码,就是所要抽取的10个样本个体的号码个样本个体的号码将总体中的将总体中的N个个体编号时个个体编号时可以从可以从0开
9、始开始,例如当,例如当N=100时时,编号可以是编号可以是00,01,02,99.这样,总体中的所有个体均可用两位这样,总体中的所有个体均可用两位数字号码表示,便于使用随机数表数字号码表示,便于使用随机数表 当随机地选定开始的数后,读数的方向可以向右,也可以向当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:()对总体中的个体进行编号(每个号码位数一致);()对总体中的个体进行编号(每个号码位数一致);()在随机数表中任选一个数作为开始;()在随机数表中任选一个数作为开始;()从选
10、定的数开始按一定的方向读下去,得到的数码()从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满的号码前面已经取出,也跳过;如此继续下去,直到取满为止;为止;()根据选定的号码抽取样本()根据选定的号码抽取样本小结:小结:1.抽样无放回;抽样无放回;2.抽样公平性;抽样公平性;3.抽签法,随机数表法抽签法,随机数表法简单的随机抽样简单的随机抽样.第四步将编号为第四步将编号为 ,+10,+20,+610 的个体抽出,组成样本的个体抽出,组成样本第三步在第一
11、段第三步在第一段000,001,002,009这十这十个编号中用简单随机抽样确定起始号码个编号中用简单随机抽样确定起始号码 ;因为因为624的的10约为约为62,624不能被不能被62整除,为整除,为了保证了保证“等距等距”分段,应先剔除人分段,应先剔除人2.系统抽样:系统抽样:例例 某单位在岗职工共某单位在岗职工共624人,为了调查工人用于上班途中人,为了调查工人用于上班途中的时间,决定抽取的时间,决定抽取10的工人进行调查如何采用系统抽的工人进行调查如何采用系统抽样方法完成这一抽样?样方法完成这一抽样?分析分析:第一步将第一步将624名职工用随机方式进行编号;名职工用随机方式进行编号;解:
12、解:第二步从总体中剔除人(剔除方法可用随机数表第二步从总体中剔除人(剔除方法可用随机数表法),将剩下的法),将剩下的620名职工重新编号(分别为名职工重新编号(分别为000,001,002,619),并分成),并分成62段;段;系统抽样的步骤为:系统抽样的步骤为:()采用随机的方式将总体中的个体编号;()采用随机的方式将总体中的个体编号;()将整个的编号按一定的间隔(设为()将整个的编号按一定的间隔(设为k)分段,)分段,当当 (N为总体中的个体数,为总体中的个体数,n为样本容量)是整数为样本容量)是整数时,时,k=;当;当 不是整数时,从总体中剔除一些个不是整数时,从总体中剔除一些个体,使剩
13、下的总体中个体的个数体,使剩下的总体中个体的个数能被能被 整除,这整除,这时时k=,并将剩下的总体重新编号;,并将剩下的总体重新编号;()在第一段中用简单随机抽样确定起始的个体编()在第一段中用简单随机抽样确定起始的个体编号号l;()将编号为()将编号为l l,l l+k,l l+2k,l l+(n-1)k的个的个体抽出体抽出小结:小结:1.适用与总体中个体无明显的层次差异适用与总体中个体无明显的层次差异;2.系统抽样系统抽样等距抽样等距抽样.3.分层抽样分层抽样例某电视台在因特网上就观众对某一节目的喜爱例某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为程度进行调查,参
14、加调查的总人数为12000人,其人,其中持各种态度的人数如下表所示:中持各种态度的人数如下表所示:很喜爱喜爱一般不喜爱2435456739261072电视台为进一步了解观众的具体想法和意见,打算从电视台为进一步了解观众的具体想法和意见,打算从中抽取中抽取60人进行更为详细的调查,应怎样进行抽样?人进行更为详细的调查,应怎样进行抽样?分析:分析:因为总体中人数较多,所以不宜采用简单随机因为总体中人数较多,所以不宜采用简单随机抽样又由于持不同态度的人数差异较大,故也不宜抽样又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥用系统抽样方法,而以分层抽样为妥解可用分层抽样方法,其
15、总体容量为解可用分层抽样方法,其总体容量为12000“很喜爱很喜爱”占占“喜爱喜爱”占占“一般一般”占占“不喜爱不喜爱”占占 因此,采用分层抽样的方法在因此,采用分层抽样的方法在“很喜爱很喜爱”、“喜爱喜爱”、“一般一般”和和“不喜爱不喜爱”的的2435人、人、4567人、人、3926人和人和1072人中分别抽取人中分别抽取12人、人、23人、人、20人和人和5人人 一般地,当总体由差异明显的几个部分组成时,一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,中的个体
16、按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样然后按各部分在总体中所占的比实施抽样,这种抽样方法叫方法叫分层抽样分层抽样(stratified sampling),其中所分),其中所分成的各个部分称为成的各个部分称为“层层”分层抽样的步骤是:分层抽样的步骤是:()将总体按一定标准分层;()将总体按一定标准分层;()计算各层的个体数与总体的个体数的()计算各层的个体数与总体的个体数的比;比;()按各层个体数占总体的个体数的比确定()按各层个体数占总体的个体数的比确定各层应抽取的样本容量;各层应抽取的样本容量;()在每一层进行抽样(可用简单随机抽样()在每一层
17、进行抽样(可用简单随机抽样或系统抽样)或系统抽样)说明:说明:1.适用与总体中个体有明显的层次差异,层次适用与总体中个体有明显的层次差异,层次分明的特点;分明的特点;2.总体中个体数总体中个体数 N较大时,系统抽样,分层抽样较大时,系统抽样,分层抽样二者选其一二者选其一.类别类别特点特点相互联系相互联系适用范围适用范围共同点共同点简单随简单随机抽样机抽样l从总体中逐个从总体中逐个抽取抽取l总体中总体中的个体个的个体个数较少数较少l抽样抽样过程中过程中每个个每个个体被抽体被抽到的可到的可能性相能性相同同系统系统抽样抽样l将总体平均分将总体平均分成几部分,按事成几部分,按事先确定的规则分先确定的规
18、则分别在各部分中抽别在各部分中抽取取l在起始部在起始部分抽样时,采分抽样时,采用用 简简 单随机单随机抽样抽样l总体中总体中的的 个体个体个数较多个数较多分层分层抽样抽样l将总体分成几将总体分成几层,按各层个体层,按各层个体数之比抽取数之比抽取l各层抽样时各层抽样时采用简单随机采用简单随机抽样或系统抽抽样或系统抽样样l总体由总体由差差 异明异明显的显的 几几部分组成部分组成 以上我们学习了三种抽样方法,这些抽样方法以上我们学习了三种抽样方法,这些抽样方法的特点及适用范围可归纳如下:的特点及适用范围可归纳如下:例例1下列问题中,采用怎样的抽样方法较为合理?下列问题中,采用怎样的抽样方法较为合理?
19、()从台冰箱中抽取()从台冰箱中抽取3台进行质量检查;台进行质量检查;()某电影院有()某电影院有32排座位,每排有排座位,每排有40个座位,座位个座位,座位号为号为140有一次报告会坐满了听众,报告会结束以有一次报告会坐满了听众,报告会结束以后为听取意见,需留下后为听取意见,需留下32名听众进行座谈;名听众进行座谈;()某学校有()某学校有160名教职工,其中教师名教职工,其中教师120名,行政名,行政人员人员16名,后勤人员名,后勤人员24名为了了解教职工对学校在名为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为校务公开方面的意见,拟抽取一个容量为20的样本的样本分析分析()总体
20、容量比较小,用抽签法或随机数表法都很方便()总体容量比较小,用抽签法或随机数表法都很方便()总体容量比较大,用抽签法或随机数表法比较麻烦由于人()总体容量比较大,用抽签法或随机数表法比较麻烦由于人员没有明显差异,且刚好排,每排人数相同,可用系统抽样员没有明显差异,且刚好排,每排人数相同,可用系统抽样()由于学校各类人员对这一问题的看法可能差异较大,故应()由于学校各类人员对这一问题的看法可能差异较大,故应采用分层抽样方法采用分层抽样方法例例2.假设要考察某公司生产的假设要考察某公司生产的500克袋状牛奶的质量是克袋状牛奶的质量是否达标,现从否达标,现从800袋牛奶中抽取袋牛奶中抽取60袋进行检
21、验,利用随袋进行检验,利用随机数表抽样本时,先将机数表抽样本时,先将800袋牛奶按袋牛奶按000,001,799进行编号,如果从随机表第进行编号,如果从随机表第8行第行第18列的数开始向列的数开始向右读,请你依次写出最先检测的右读,请你依次写出最先检测的5牛奶的编号牛奶的编号(下面摘取了一随机数表的第(下面摘取了一随机数表的第7行至第行至第9行)行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 8
22、6 73 58 07 44 39 62 58 7973 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 06 13 42 99 66 02 79 54 1.现有以下两项调查:现有以下两项调查:某装订厂平均每某装订厂平均每小时大约装订图书小时大约装订图书362册,要求检验员每册,要求检验员每小时抽取小时抽取40册图书册图书,检查其装订质量状况;检查其装订质量状况;某市有大型、中型与小型的商店共某市有大型、中型与小型的商店共1500家家,三者数量之比为三者数量之比为1 5 9为了调查全为了调查全市商店每日零售额情况,抽取其中市商店每日零售额情况,抽取
23、其中15家进家进行调查行调查.完成完成、这两项调查宜采用的这两项调查宜采用的抽样方法依次是抽样方法依次是 ()A、简单随机抽样法,分层抽样法、简单随机抽样法,分层抽样法 B、分层抽样法,简单随机抽样法、分层抽样法,简单随机抽样法C、分层抽样法,系统抽样法、分层抽样法,系统抽样法 D、系统抽样法,分层抽样法、系统抽样法,分层抽样法D2.要从已编号(要从已编号(160)的)的60枚最新枚最新研制的某型导弹中随机抽取研制的某型导弹中随机抽取6枚来进枚来进行发射试验行发射试验,用每部分选取的号码间用每部分选取的号码间隔一样的系统抽样方法确定所选取隔一样的系统抽样方法确定所选取的的6枚导弹的编号可能是枚
24、导弹的编号可能是 ()A5,10,15,20,25,30 B3,13,23,33,43,53 C1,2,3,4,5,6 D2,8,14,20,26,32B3.某校有行政人员、教学人员和教辅某校有行政人员、教学人员和教辅人员共人员共200人,其中教学人员与教辅人,其中教学人员与教辅人员的比为人员的比为10 1,行政人员有,行政人员有24人,人,现采取分层抽样容量为现采取分层抽样容量为50的样本,那的样本,那么行政人员应抽取的人数为么行政人员应抽取的人数为 ()A 3 B 4 C 6 D 8C教学人员和教辅人员应抽取的人数教学人员和教辅人员应抽取的人数分别为分别为_和和_.404统计的基本思想方法
25、:统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,用样本估计总体,即通常不直接去研究总体,而是通过而是通过从总体中抽取一个样本从总体中抽取一个样本,根据样本的根据样本的情况去估计总体的相应情况情况去估计总体的相应情况.统计的核心问题:统计的核心问题:如何根据样本的情况对总体的情况作出一种如何根据样本的情况对总体的情况作出一种推断推断.这里包括两类问题:这里包括两类问题:一类是如何从总体中抽取样本一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分另一类是如何根据对样本的整理、计算、分析析,对总体的情况作出推断对总体的情况作出推断.用样本的有关情况去估计总体的相应情况用
26、样本的有关情况去估计总体的相应情况,这种估计大体分为两类,这种估计大体分为两类,一类是用样本频率分一类是用样本频率分布估计总体分布布估计总体分布,一类是用样本的某种数字特一类是用样本的某种数字特征(例如平均数、方差等)征(例如平均数、方差等)去估计总体的相应去估计总体的相应数字特征。数字特征。整体介绍:整体介绍:国际奥委会国际奥委会2003年年6月月29日决定,日决定,2008年北京年北京奥运会举办的日期比原定日期推迟两周,改在奥运会举办的日期比原定日期推迟两周,改在8月月8日至日至8月月24日举行原因是日举行原因是7月末月末8月初北京地区月初北京地区得气温高于得气温高于8月中下旬月中下旬下表
27、是随机抽取的近年来北京地区下表是随机抽取的近年来北京地区7月月25日至日至8月月24日的日最高气温,得到如下样本日的日最高气温,得到如下样本(单位:单位:C)7月月25日至日至8月月10日日41.937.535.735.437.238.134.733.733.332.534.633.030.831.028.631.528.88月月8日至日至8月月24日日28.631.528.833.232.530.330.229.833.132.829.425.624.730.030.129.530.3l怎样通过上表中的数据,分析比较两时间段的高温(怎样通过上表中的数据,分析比较两时间段的高温(33)状)状况
28、呢?况呢?问题引入:问题引入:知识新授:知识新授:1.频数与频率频数与频率 频数频数是指一组数据中,某范围内的数据出现是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到的次数;把频数除以数据的总个数,就得到频率频率.2.频率分布表频率分布表 当总体很大或不便于获得时,可以用样本的当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布频率分布估计总体的频率分布.我们把反映总体我们把反映总体频率分布的表格称为频率分布的表格称为频率分布表频率分布表.说说明明:样样本本频频率率分分布布与与总总体体频频率率分分布布有什么关系?有什么关系?通过样本的通过样本的频数分布、频率
29、分布频数分布、频率分布可以可以估计总体的频率分布估计总体的频率分布.7月月25日至日至8月月10日日41.937.535.735.437.238.134.733.733.332.534.633.030.831.028.631.528.88月月8日至日至8月月24日日28.631.528.833.232.530.330.229.833.132.829.425.624.730.030.129.530.3时间时间总天数总天数高温天数高温天数频率频率7月月25日至日至8月月10日日17110.6478月月8日至日至8月月24日日1720.118频率分布表频率分布表:3.频率分布条形图频率分布条形图时间
30、时间总天数总天数高温天数高温天数频率频率7月月25日至日至8月月10日日17110.6478月月8日至日至8月月24日日1720.118 各长方形长条的宽度要相同各长方形长条的宽度要相同.相邻长条的间距要适当相邻长条的间距要适当.长方形长条的高度表示取各长方形长条的高度表示取各值的频率值的频率.0.10.20.30.40.50.60.77/25-8/10时间时间频率频率8/8-8/24一幅图胜一幅图胜过一千字过一千字引例引例从某校高一年级的从某校高一年级的1002名新生中用系统抽样的方法抽取一名新生中用系统抽样的方法抽取一个容量为个容量为100的身高样本,数据如下(单位:的身高样本,数据如下(
31、单位:cm)试作出该样)试作出该样本的频率分布表本的频率分布表16816517116717016517015217517416517016816917116616415516415817015516615815516016016415616216017016816417417116517916317218017417315916317216716016416915116815816817615516516516916217715817516516915116316616316717816515817016915915516315315516716316415816816716116216716
32、8161165174156167166162161164166 这个例子与前面问题是不同的,这里的总体可以在一个实数这个例子与前面问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体区间取值,称为连续型总体.样本的频率分布表示形式有:样本的频率分布表示形式有:频率分布表和频率分布直方图频率分布表和频率分布直方图S1 计算数据中最大值与最小值的差计算数据中最大值与最小值的差(极差),确定(极差),确定全距全距.S2 根据全距,决定组数和组距根据全距,决定组数和组距.S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且
33、使分点比数据多一位小数取闭区间,且使分点比数据多一位小数.S4 登记频数,计算频率,列出频率分布表登记频数,计算频率,列出频率分布表.算法算法:1.频率分布表频率分布表168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165
34、158170169159155163153155167163164158168167161162167168161165174156167166162161164166S1 计算数据中最大值与最小值的差(极差),确定全距计算数据中最大值与最小值的差(极差),确定全距.极差极差极差极差1801801511512929;全距全距全距全距3030;取值区间取值区间取值区间取值区间150.5150.5,180.5180.5;组距和组数与数据的数量有关一般数据较多,分的组数也组距和组数与数据的数量有关一般数据较多,分的组数也多;数据较少,分的组数也少当数据个数在多;数据较少,分的组数也少当数据个数在50
35、以内,分以内,分58组;组;当数据个数在当数据个数在50100之间,分之间,分812组应当注意的是如果组内组应当注意的是如果组内没有数据出现,就应当放宽组距,保证每个组内都有数据,且没有数据出现,就应当放宽组距,保证每个组内都有数据,且每个数据只属于确定的一组在决定组数时,往往不是一次就每个数据只属于确定的一组在决定组数时,往往不是一次就能成功的,要有一个观察、尝试的过程,一般分点比已知数据能成功的,要有一个观察、尝试的过程,一般分点比已知数据多一位小数,并且第一组的起点要稍稍减小只有合理地确定多一位小数,并且第一组的起点要稍稍减小只有合理地确定组距与组数,才能使数据分布的规律性比较明显地呈现
36、出来;组距与组数,才能使数据分布的规律性比较明显地呈现出来;S2 根据全距,决定组数和组距根据全距,决定组数和组距.组数组数组数组数1010;组距组距组距组距3 3;S3 分组:通常对组内数据所在区间取左闭右开区间,最后分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数一组取闭区间,且使分点比数据多一位小数.分组分组频数统计频数统计频数频数频率频率150.5,153.5)153.5,156.5)156.5,159.5)159.5,162.5)162.5,165.5)165.5,168.5)168.5,171.5)171.5,174.5)174.5,177.5
37、)177.5,180.5合合 计计488112219147430.040.080.080.110.220.190.140.070.040.03412203153728693971001001练习练习:1.一个容量为一个容量为32的样本,已知某组样本的频率为的样本,已知某组样本的频率为0.125,那么该组样本的频数为(那么该组样本的频数为()A2 B4 C6 D82.为了分析一次数学考试的情况,全班抽了为了分析一次数学考试的情况,全班抽了50人,将分人,将分数分为数分为5组第一组到第三组的频数分别是组第一组到第三组的频数分别是10,23,1,第四组的频率是第四组的频率是0.08,那么落在第五组的
38、频数是,那么落在第五组的频数是_,频率是频率是_,全年级,全年级800人中分数落在第五组的约有人中分数落在第五组的约有_人人(1)频率,已知其中任意两个量就可以求出第三个量频率,已知其中任意两个量就可以求出第三个量(2)各小组的频率和等于样本容量的频率和等于各小组的频率和等于样本容量的频率和等于1(3)由样本的频率可以估计总体的频率,从而估计出总体的频数由样本的频率可以估计总体的频率,从而估计出总体的频数 B120.241923.一个容量为一个容量为20的样本数据,分组后组距与频数如下:的样本数据,分组后组距与频数如下:(10,20),),2;(;(20,30),),3;(;(30,40),)
39、,4;(40,50),),5;(;(50,60),),4;(;(60,70),),2。则。则样本在区间(样本在区间(10,50上的频率为(上的频率为()A.5%B.25%C.50%D.70%4.已知样本已知样本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12,那么频率为,那么频率为0.2的的范围是(范围是()A.5.5-7.5 B.7.5-9.5 C.9.5-11.5 D.11.5-13.5DDS1 作出频率分布表,然后作直角坐标系,以横轴表示数据,纵作出频率分布表,然后作直角坐标系,以横轴表示数据,纵 轴表示轴表示“频率组距频率组距”;S
40、2 把横轴分为若干段,每一线段对应一个组的组距,把横轴分为若干段,每一线段对应一个组的组距,S3 以此线段为底作一矩形,它的高等于该组的频率以此线段为底作一矩形,它的高等于该组的频率/组距组距,这样得这样得 出一系列的矩形,每个矩形的面积恰好是该组上的频率出一系列的矩形,每个矩形的面积恰好是该组上的频率这些矩形就构成了频率分布直方图这些矩形就构成了频率分布直方图 所有矩形的面积和为所有矩形的面积和为1 算法算法:2.频率分布直方图频率分布直方图177.5身高身高cm150.5 153.5 156.5 159.5 162.5 165.5 168.5 171.5 174.5180.5频率频率组距组
41、距0.020.040.060.08频率分布的条形图和频率分布直方图的区别频率分布的条形图和频率分布直方图的区别 两者是不同的概念;两者是不同的概念;横轴:两者表示内容相同横轴:两者表示内容相同.思考:思考:频率分布条形图和频率分布直方图是两个相同的概念吗?频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?有什么区别?纵轴:两者表示的内容不相同纵轴:两者表示的内容不相同.频率分布条形图的纵轴(长方形的高)表示频率频率分布条形图的纵轴(长方形的高)表示频率;频率分布直方图的纵轴(长方形的高)表示频率与组距频率分布直方图的纵轴(长方形的高)表示频率与组距的比值的比值.其相应组距上的频率等
42、于该组距上长方形的面积其相应组距上的频率等于该组距上长方形的面积.12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.5)的概率是)的概率是多少多少?练习练习:2.一个容量为一个容量为100的样本的样本,数据的分组和各组的相数据的分组和各组的相关信息如下表关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个
43、空格.0.06分组 频数 频率 频率累计12,15)615,18)0.0818,21)0.3021,24)2124,27)0.6927,30)1630,33)0.1033,36 1.00合计合计 100 1.000.0680.140.16160.210.510.18180.160.85100.950.055课堂小结课堂小结编制频率分布直方图的步骤编制频率分布直方图的步骤:找最大值与最小值。找最大值与最小值。决定组距与组数决定组距与组数决定分点决定分点登记频数,计算频率,列表,画直方图登记频数,计算频率,列表,画直方图说明说明:(1)确定分点时确定分点时,使分点比数据多一位小数使分点比数据多一位
44、小数,并且把第并且把第1小组的起点小组的起点稍微再小一点稍微再小一点.一一、求求极差,极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数:组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间,最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表画一组数据的频率分布直方图画一组数据的频率分布直方图,可以按以可以按以下的步骤进行下的步骤进行:五、画出频率分布直方图(纵轴表示五、画出频率分布直方图(纵轴表示频率组距频率组距)频率分布直
45、方图频率分布直方图应用应用步骤步骤1.1.求极差求极差2.2.决定组距与组数决定组距与组数3.3.将数据分组将数据分组4.4.列频率分布表列频率分布表5.5.画频率分布直方图画频率分布直方图小结:小结:1.频率直方图中矩形条的面积频率直方图中矩形条的面积=组距组距=频率;频率;2.频率分布表频率分布表 频率直方图频率直方图 后者更直观后者更直观形象地反映样本的分布规律形象地反映样本的分布规律.例例 有同一型号的汽车有同一型号的汽车100辆,为了解这种汽车每耗油辆,为了解这种汽车每耗油1所行路程所行路程的情况,现从中随机抽出的情况,现从中随机抽出10辆在同一条件下进行耗油辆在同一条件下进行耗油1
46、所行路程所行路程试验,得到如下样本数据(单位:):试验,得到如下样本数据(单位:):13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4并分组如下:并分组如下:分分 组组频频 数数频频 率率合合 计计12.4512.9513.4513.9514.450.20.40.60.81路程(km)频率组距(1)完成上面频率分布表;)完成上面频率分布表;(2)根据上表在给定坐标系中画出频率分布直方)根据上表在给定坐标系中画出频率分布直方图,并根据样本估计总体数据落在中的概率;图,并根据样本估计总体数据落在中的概率;(3)据样本对总体的期望值进行估计。)据样本对
47、总体的期望值进行估计。10101.甲、乙两种冬小麦甲、乙两种冬小麦试验试验品种品种连续连续5年的年的平均平均单单位面位面积产积产量如下量如下(单单位:位:)品种品种第一第一年年第二第二年年第三第三年年第四第四年年第五第五年年甲甲9.89.910.11010.2乙乙9.410.310.89.79.8产产量量较较高的是:高的是:_;产产量比量比较稳较稳定的是:定的是:_.乙品种乙品种甲品种甲品种2.在一次文艺比赛中,在一次文艺比赛中,12名专业人员名专业人员和和12名观众代表各组成一个评判小组,名观众代表各组成一个评判小组,给参赛选手打分,下面是两个评判组对给参赛选手打分,下面是两个评判组对同一名
48、选手的打分:同一名选手的打分:小组小组A:42,45,48,46,52,47,49,55,42,51,47,45;小组小组B:55,36 ,70,66,75,49,46,68,42,62,58,47.通过计算说明小组通过计算说明小组A、B哪个更像是由专哪个更像是由专业人士组成的评判小组业人士组成的评判小组.A 3.3.为了了解小学生的体能情况,抽取了某小学同年级部分学为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别图(如下图),已知图中从左到
49、右的前三个小组的频率分别是是0.10.1,0.30.3,0.4.0.4.第一小组的频数是第一小组的频数是5.5.频率频率组距组距49.5 74.599.5 124.5 149.5(1)(1)求第四小组的频率和参加这次测试的学生人数;求第四小组的频率和参加这次测试的学生人数;(2)(2)在这次测试中,学生跳绳次数的中位数落在第几小在这次测试中,学生跳绳次数的中位数落在第几小组内?组内?(3)参加这次测试跳绳次数在参加这次测试跳绳次数在100次以上为优秀,试估计该次以上为优秀,试估计该校此年级跳绳成绩的优秀率是多少?校此年级跳绳成绩的优秀率是多少?50第第3小组小组60%2.3 总体特征数的估计1
50、.平均数平均数2.方差,标准差方差,标准差设一组样本数据设一组样本数据 ,其平均数为其平均数为 ,则称,则称为这个样本的方差,其算术平方根为这个样本的方差,其算术平方根 为样本的标准差为样本的标准差,分别简称样本方差、样本标准差分别简称样本方差、样本标准差小结:小结:1.方差,标准差是用来刻画样本的稳定性;方差,标准差是用来刻画样本的稳定性;2.比较的标准比较的标准越小越好。越小越好。例例1 下面是某校学生日睡眠时间的抽样频率分布表下面是某校学生日睡眠时间的抽样频率分布表(单位(单位:h),试估计该校学生的日平均睡眠时间),试估计该校学生的日平均睡眠时间睡眠时间人数频率6,6.5)50.056