《统计与正态分布.ppt》由会员分享,可在线阅读,更多相关《统计与正态分布.ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、制作人:亳州一中制作人:亳州一中 李晓慧李晓慧主要内容主要内容统计统计抽样方法抽样方法统计图表统计图表数据的数数据的数字特征字特征相关性相关性最小二乘估计最小二乘估计主要内容主要内容统计案例统计案例回归分析回归分析独立性检验独立性检验相关系数相关系数可线性化可线性化回归分析回归分析12.1抽样方法,数字的数据抽样方法,数字的数据特征,统计图表与正态分布。特征,统计图表与正态分布。复习目标复习目标1)理解随机抽样的必要性和重要性;5)了解正态分布的性质。2)了解分层抽样和系统抽样方法;3)了解分布的意义和作用,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点;4)理解样本数据的数字特征
2、的意义和作用,会计算数据的数字特征。一、抽样方法一、抽样方法主干知识整合主干知识整合1 1)简单随机抽样)简单随机抽样 一个总体含有一个总体含有N N个个体,从中逐个不放回地抽取个个体,从中逐个不放回地抽取n n个个体作为样本个个体作为样本(n nN N),如果每次抽取时总体内,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样法叫做简单随机抽样2 2)分层抽样)分层抽样 当当总总体体由由差差异异明明显显的的几几部部分分组组成成时时,为为了了使使样样本本充充分分地地反反映映总总体体的的情情况况,常常将将总总体体分分成成
3、几几部部分分,然然后后按按照照各各部部分分所所占占的的比比例例进进行行抽抽样样。这这种种方方法法称称之之为为分分层抽样层抽样。例例1 1:一一个个单单位位的的职职工工有有500500人人,其其中中不不到到3535岁岁的的有有125125人人,35354949岁岁的的有有280280人人,5050岁岁以以上上的的有有9595人人。为为了了了了解解该该单单位位职职工工年年龄龄与与身身体体状状况况的的有有关关指指标标,从中抽取从中抽取100100名职工作为样本,应该怎样抽取?名职工作为样本,应该怎样抽取?25:56:1925:56:193 3)系统抽样)系统抽样 当总体的个数较多时,采用简单随机当总
4、体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中然后按照预先定出的规则,从每一部分中抽取抽取1 1个个体,得到所需要的样本,这种抽个个体,得到所需要的样本,这种抽样称为系统抽样样称为系统抽样 例例2 2:要从已经编号要从已经编号(1(160)60)的的6060枚最新研制的某枚最新研制的某种型号导弹中随机抽取种型号导弹中随机抽取6 6枚来进行发射试验,用每部枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选的分选取的号码间隔一样的系统抽样方法确定所选的6 6枚导弹的编号可能是枚导弹的编号可
5、能是()A A5,10,15,20,25,30 B5,10,15,20,25,30 B2,12,22,32,42,522,12,22,32,42,52C C6,13,38,31,45,58 D6,13,38,31,45,58 D5,10,23,33,43,595,10,23,33,43,59B类别类别简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样相同点相同点不同点不同点相互联系相互联系适用范围适用范围从总体中从总体中逐个抽取逐个抽取将总体均分成几部将总体均分成几部分,按事先确定的分,按事先确定的规则在各部分抽取规则在各部分抽取将总体分成将总体分成几层,分层几层,分层进行抽取进行抽取在
6、起始部分抽在起始部分抽样时采用简单样时采用简单随机抽样随机抽样各层抽样时采各层抽样时采用简单随机抽用简单随机抽样或系统抽样样或系统抽样总体中的个总体中的个体数较少体数较少总体中的个总体中的个体数较多体数较多总体由差异明显总体由差异明显的几部分组成的几部分组成三种抽样方法的比较三种抽样方法的比较 1)1)抽样过程中每个个体被抽取的概率是相同的抽样过程中每个个体被抽取的概率是相同的。2)2)样样本中个体的都是不放回的逐一抽取。本中个体的都是不放回的逐一抽取。二二 数据基本的数字特征数据基本的数字特征 平均数:平均数:方差与方差与标准差标准差 考察样本数据的分散程度的大小,最常用的统计量是标准差考察
7、样本数据的分散程度的大小,最常用的统计量是标准差标准差是样本数据到平均数的一种平均距离,一般用标准差是样本数据到平均数的一种平均距离,一般用s s表示表示 _._.方差的算术平方根叫做方差的算术平方根叫做标准差。标准差。其中其中x xn n是是_,n n是是_,是是_第第n n个数个数样本容量样本容量平均数平均数S=三三、统计图表统计图表茎叶图,频率分布直方图。茎叶图,频率分布直方图。基本统计图表:条形图,折线图,扇形图,基本统计图表:条形图,折线图,扇形图,甲班甲班:平均数平均数74;74;乙班乙班:平均数平均数80.7.80.7.乙班的成绩好乙班的成绩好 例例3 3:下图是从甲乙两个班各随
8、下图是从甲乙两个班各随机的抽取十名同学的成绩列成的茎机的抽取十名同学的成绩列成的茎叶图,试分析那个班的成绩好?叶图,试分析那个班的成绩好?频率分布直方图和折线图如图所示:频率分布直方图和折线图如图所示:例例4 4:从某校从某校500500名学生数学成名学生数学成绩中随机抽取绩中随机抽取5050名同学的成绩,名同学的成绩,情况如图情况如图 1 1)试估计该校)试估计该校成绩在成绩在7070 8080 之之间的人数;间的人数;2 2)求)求从该校任取一名从该校任取一名学生成绩在学生成绩在6060分分以上的概率。以上的概率。四 正态分布100100个产品尺寸的个产品尺寸的频率分布直方图频率分布直方图
9、25.23525.29525.35525.41525.47525.535 产品 尺寸(mm)频率组距2 20000个产品尺寸的个产品尺寸的频率分布直方图频率分布直方图25.23525.29525.35525.41525.47525.535 产品 尺寸(mm)频率组距频率分布直方图频率分布直方图频率组距产品 尺寸(mm)分布密度曲线1、正态曲线正态曲线:函数函数函数函数f(x)f(x)称为正态函数称为正态函数f(xf(x)的图像称为正态曲线的图像称为正态曲线可以记作可以记作X XN N(,2 2)其中:其中:是圆周率;是圆周率;e e是自然是自然对数的底;对数的底;x x是随机变量的取值;是随机
10、变量的取值;为正态分布的为正态分布的期望期望;是正态分布的标准差是正态分布的标准差=0.5012-1-2xy-33X=1=2(4 4)当)当 x x时时,曲线下降曲线下降.并且当曲并且当曲线向左、右两边无限延伸时线向左、右两边无限延伸时,以以x x轴为渐近线轴为渐近线,向它无限靠向它无限靠近近.(2 2)曲线关于直线)曲线关于直线x x=对称对称.(1 1)曲线在)曲线在x x轴的上方,与轴的上方,与x x轴不相交轴不相交,无限趋向于无限趋向于x轴轴.(3 3)曲线在)曲线在x x=处达到峰值处达到峰值(最高点最高点)期望期望相等、相等、标准标准差差不等的正态分布图示不等的正态分布图示=0.5
11、=1=2=0若若 固定固定,大大时时,曲线矮而胖;曲线矮而胖;小时小时,曲线瘦曲线瘦而高而高,故称故称 为形状参数。为形状参数。标准标准差相等、差相等、期望期望不等的正态分布图示不等的正态分布图示213=-1=0=1若若 固定固定,随随 值值的变化而的变化而沿沿x轴平轴平移移,故故 称为位置称为位置参数;参数;正态曲线下的面积规律正态曲线下的面积规律X X轴与正态曲线所夹面积恒等于轴与正态曲线所夹面积恒等于1 1对称区域面积相等对称区域面积相等例例6 6)某年级的一次信息技术测验成绩近似的服某年级的一次信息技术测验成绩近似的服从正态分布从正态分布 N(70,10N(70,100 0),如果规定低于,如果规定低于6060分为分为不及格,求:不及格,求:(1 1)成绩不及格的人数占成绩不及格的人数占总体的比例是总体的比例是多少?多少?(2 2)成绩在)成绩在80809090内的学生内的学生人数人数占占总体的总体的多少多少?70608050901 1抽样方法;抽样方法;2 2数据的数字特征;数据的数字特征;3 3统计图表;统计图表;4 4正态分布正态分布课时小节课时小节 请同学们认真完成“三年高考两年模拟”189191作业课后作业课后作业