《统计复习课(教育精品).ppt》由会员分享,可在线阅读,更多相关《统计复习课(教育精品).ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、一、抽样调查方案一、抽样调查方案注意:关键注意:关键步骤步骤和和字眼字眼一定要有,用比较严格一定要有,用比较严格 的语言表达,不能口语化的语言表达,不能口语化.练:请用恰当的抽样方法写抽样方案练:请用恰当的抽样方法写抽样方案1、从、从850颗种子中抽取颗种子中抽取10颗进行发芽率的考察颗进行发芽率的考察2、某校高一、高二、高三各有学生、某校高一、高二、高三各有学生1000名、名、800名名 和和700名,抽取样本容量为名,抽取样本容量为100的样本调查全校的样本调查全校 学生的视力情况学生的视力情况.3、某公司、某公司324人,为了了解他们的作息时间,抽取人,为了了解他们的作息时间,抽取 10
2、的人进行调查,如何用系统抽样方法完成?的人进行调查,如何用系统抽样方法完成?公式公式样本数据:样本数据:平均数:平均数:标准差:标准差:三、数据特征三、数据特征注意:公式和计算器相结合;统计量的单位注意:公式和计算器相结合;统计量的单位2)求数据)求数据x1+a,x2+a,,xn+a的平均数和方差的平均数和方差3)从上面的计算,你得到什么结论)从上面的计算,你得到什么结论?2、设数据、设数据x1,x2,,xn的平均数和方差分别是的平均数和方差分别是 和和s 1)求数据)求数据2x1,2x2,,2xn平均数和方差平均数和方差普查:指一个国家或一个地区专门组织的一次普查:指一个国家或一个地区专门组
3、织的一次 大规模的全面调查。大规模的全面调查。抽样:从调查对象中按照一定的方法抽取一部分,抽样:从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调进行调查或观测,获取数据,并以此对调 查对象的某项指标做出推断查对象的某项指标做出推断.其中,调查对象的全体称其中,调查对象的全体称“总体总体”;被抽取的部分称被抽取的部分称“样本样本”.“普查普查”与与“抽样抽样”的优劣对比:的优劣对比:方式方式普查普查抽样抽样优点优点缺点缺点得到的信息全得到的信息全面、系统面、系统迅速;及时;迅速;及时;节约人力,物节约人力,物力,财力力,财力工作量大,时间长工作量大,时间长耗人力、物力、
4、耗人力、物力、财力财力获得的信息不够获得的信息不够全面、系统全面、系统普查:对象很少时,最好普查:对象很少时,最好抽样:对象很多,或检验对对象具有破坏性抽样:对象很多,或检验对对象具有破坏性1、收集数据常用方法、收集数据常用方法“普查普查”和和“抽样抽样”2、对象很少时,普查、对象很少时,普查 对象多,调查有破坏性时,抽样对象多,调查有破坏性时,抽样3、抽样时要主要样本的、抽样时要主要样本的”代表性代表性“收集数据的方法:普查、抽样收集数据的方法:普查、抽样抽样抽样简单随机抽样简单随机抽样系系 统统 抽抽 样样分分 层层 抽抽 样样简单随机抽样简单随机抽样 在抽取的过程中,保证每个个体被抽到的
5、概在抽取的过程中,保证每个个体被抽到的概率相等,这样的方法叫率相等,这样的方法叫“简单随机抽样简单随机抽样”。特点:每一个个体被抽到的概率相等。特点:每一个个体被抽到的概率相等。简单随机抽样的类型简单随机抽样的类型一、抽签法一、抽签法:把总体中的个体的代号写在形状、大小把总体中的个体的代号写在形状、大小相同的签上,然后将这些签放在不透明的容相同的签上,然后将这些签放在不透明的容器内均匀搅拌,每次随机地从中抽取一个器内均匀搅拌,每次随机地从中抽取一个(不放回),然后将签均匀搅拌,再进行下(不放回),然后将签均匀搅拌,再进行下一次抽取。如此下去,直到抽到预先设定的一次抽取。如此下去,直到抽到预先设
6、定的样本数。样本数。步骤:步骤:1、编号、编号 2、抽签、抽签(随机,机会均等)(随机,机会均等)3、测量或调查、测量或调查二、随机数表法(产生随机数)二、随机数表法(产生随机数)把总体中的把总体中的N个个体依次编上个个体依次编上 0、1、2、-、N1 的号码,然后利用工具产生的号码,然后利用工具产生 0、1、2、-、N1 中的数,产生几,就中的数,产生几,就选几作为个体,并把它写在空白纸上,直到选几作为个体,并把它写在空白纸上,直到抽到预先规定的样本数,这样抽到预先规定的样本数,这样 得到的数表叫得到的数表叫做随机数表。做随机数表。如课本的随机数表如课本的随机数表 编号编号 定位定位 选数选
7、数小结:小结:简单随机抽样简单随机抽样分层抽样分层抽样系统抽样系统抽样抽签法抽签法产生随机数产生随机数收集数据收集数据普查普查抽样抽样几种抽样方法比较:类别共同点各自特点相互关系适用范围简单随机抽样系统抽样分层抽样抽样过程中每个个体被抽取的可能性相等。从总体中逐个抽取。不填总体中个体数较少。将总体均分成几部分,按事先规定的规则在各部分抽取。将总体分成几层,分层进行抽取。总体中个体数较多。总体中由差异明显的几部分组成。在起始部分抽样时采用简单随机抽样 各层抽样时采用简单随机抽样或系统抽样。结论:结论:1、总体由几个层次组成、总体由几个层次组成分层抽样分层抽样2、总体容量较小、总体容量较小抽签法抽
8、签法3、总体容量大,样本容量小、总体容量大,样本容量小随机数表法随机数表法4、总体容量大,样本容量也大、总体容量大,样本容量也大系统抽样法系统抽样法在实际操作中,为了使样本具有代表性,通常在实际操作中,为了使样本具有代表性,通常要同时使用几种抽样方法要同时使用几种抽样方法.1、变量之间除了函数关系外,还有相关关系。、变量之间除了函数关系外,还有相关关系。例例:(:(1)商品销售收入与广告支出经费之间的关系)商品销售收入与广告支出经费之间的关系 (2)粮食产量与施肥量之间的关系)粮食产量与施肥量之间的关系 (3)人体内脂肪含量与年龄之间的关系)人体内脂肪含量与年龄之间的关系不同点:不同点:函数关
9、系是一种确定的关系;而函数关系是一种确定的关系;而 相关关系是一种非确定关系相关关系是一种非确定关系.相关关系与函数关系的异同点:相关关系与函数关系的异同点:相同点:相同点:均是指两个变量的关系均是指两个变量的关系2、两个变量之间产生相关关系的原因是受、两个变量之间产生相关关系的原因是受许多不确许多不确定的随机因素的影响。定的随机因素的影响。3、需要通过样本来判断变量之间是否存在相、需要通过样本来判断变量之间是否存在相关关系关关系若有若有n个样本点:(个样本点:(x1,y1),(xn,yn),),可以用下面的表达式来刻画这些点与直线可以用下面的表达式来刻画这些点与直线ya+bx的接近程度的接近
10、程度:使上式达到最小值的直线就是所求的直线使上式达到最小值的直线就是所求的直线.此时:此时:练习:下面是两个变量的一组数据练习:下面是两个变量的一组数据x x1 12 23 34 45 56 67 78 8y y1 14 49 91616 2525 3636 4949 6464请用最小二乘法求出两个变量之间的线性回归方程请用最小二乘法求出两个变量之间的线性回归方程概括:用最小二乘法时,先作散点图(判断是否概括:用最小二乘法时,先作散点图(判断是否 线性相关),若散点图呈现一定的规律,线性相关),若散点图呈现一定的规律,则用这个规律来拟合曲线则用这个规律来拟合曲线;如果线性相关,如果线性相关,则
11、用最小二乘法;若非线性相关,则用其他则用最小二乘法;若非线性相关,则用其他 工具拟合曲线工具拟合曲线.练习:某种水稻施化肥量练习:某种水稻施化肥量x与产量与产量y之间有如下对之间有如下对 应数据(单位:应数据(单位:kg)x x1515 2020 2525 3030 3535 4040 4545y y33330 034345 536365 540405 544445 545450 045455 5(1)作出散点图,检验相关性)作出散点图,检验相关性(2)如果)如果y与与x之间具有线性相关关系,求回归方程之间具有线性相关关系,求回归方程x对对y的的线性回归方程问题的的线性回归方程问题5个地区的汽
12、车拥有量个地区的汽车拥有量x(单位:万辆)与汽车配(单位:万辆)与汽车配件销售额件销售额y(单位:万元)之间有如下对应数据:(单位:万元)之间有如下对应数据:x x2.072.073.13.14.144.145.175.176.26.2y y128128194194273273372372454454若若y与与x之间具有线性相关关系,求之间具有线性相关关系,求1)y对对x的回归方程,以了解汽车配件销售额随的回归方程,以了解汽车配件销售额随 汽车拥有量的变化而变化的情况汽车拥有量的变化而变化的情况.2)x对对y的回归方程,以了解售后服务体系对汽车的回归方程,以了解售后服务体系对汽车 拥有量的影响
13、拥有量的影响.温故:常见的统计图表有温故:常见的统计图表有条形图条形图、折线图折线图、扇形图扇形图条形图:条形图:50人的智商统计情况人的智商统计情况人数人数/人人智商智商折线图:折线图:9002年年10万人口中高校人数统计万人口中高校人数统计年份年份人数人数/人人知新:知新:茎叶图茎叶图问题引入:从甲、乙两个城市所有的自动售货机问题引入:从甲、乙两个城市所有的自动售货机 中分别随机抽取了中分别随机抽取了10台,记录下上午台,记录下上午 8:0011:00间各自的销售情况间各自的销售情况 (单位:元)数据见(单位:元)数据见P25分析数据(分析数据(茎叶图茎叶图):):竖线左边为十位数,竖线左边为十位数,右边为个位数右边为个位数8 6 58 8 4 0 07 5 20 03 18甲甲优点:优点:1.1.反映了收集到的全部数据,没有信息的反映了收集到的全部数据,没有信息的损失;损失;2.2.可以随时记录,方便表示与比较可以随时记录,方便表示与比较.不足:当数据量很大或有多组数据时,用其表示不足:当数据量很大或有多组数据时,用其表示不太方便不太方便.坚持就是胜利!趣味来自努力!成绩证明一切,分高不是能力低!如果你不相信,看谁夺得第一!谁把谁抱怨,谁把谁欺骗,谁对谁捣乱,谁看谁完蛋。