《统计、统计案例.ppt》由会员分享,可在线阅读,更多相关《统计、统计案例.ppt(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计、统计案例统计、统计案例主干知识整合主干知识整合1统计统计(1)抽样方法:简单随机抽样、系统抽样、抽样方法:简单随机抽样、系统抽样、分层抽样分层抽样(2)利用样本频率分布估计总体分布利用样本频率分布估计总体分布频率分布表和频率分布直方图频率分布表和频率分布直方图总体密度曲线总体密度曲线茎叶图茎叶图(3)用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征众数、中位数众数、中位数2两个变量间的相关关系两个变量间的相关关系两个变量间的相关关系中,主要是作出散点图,两个变量间的相关关系中,主要是作出散点图,根据给出的线性回归方程系数公式建立线性回根据给出的线性回归方程系数公式建立
2、线性回归方程,体会回归分析及独立性检验的基本思归方程,体会回归分析及独立性检验的基本思想想3独立性检验独立性检验(1)22列联表列联表一般地,假设有两个分类变量一般地,假设有两个分类变量X和和Y,它们的值,它们的值域分别为域分别为x1,x2和和y1,y2,其样本频数列联,其样本频数列联表为:表为:y1y2总计总计x1ababx2cdcd总计总计acbdabcd高考热点讲练高考热点讲练抽样方法抽样方法 某高校甲、乙、丙、丁四个专业分别有某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生为了解学生的就业倾向,名学生为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取用分
3、层抽样的方法从该校这四个专业共抽取40名名学生进行调查,应在丙专业抽取的学生人数为学生进行调查,应在丙专业抽取的学生人数为_【答案答案】16【归纳拓展归纳拓展】(1)解决有关随机抽样问题首先解决有关随机抽样问题首先要深刻理解各种抽样方法的特点和适用范围,要深刻理解各种抽样方法的特点和适用范围,如分层抽样,适用于数目较多且各部分之间具如分层抽样,适用于数目较多且各部分之间具有明显差异的总体有明显差异的总体(2)系统抽样中编号的确定和分层抽样中各层人系统抽样中编号的确定和分层抽样中各层人数的确定是高考重点考查的内容数的确定是高考重点考查的内容变式训练变式训练1高三高三(1)班共有班共有56人,学号
4、依次为人,学号依次为1,2,3,56,现用系统抽样的办法抽取一个,现用系统抽样的办法抽取一个容量为容量为4的样本已知学号为的样本已知学号为6,34,48的同学在的同学在样本中,那么还有一个同学的学号应为样本中,那么还有一个同学的学号应为_解析:由题意可知,可将学号依次为解析:由题意可知,可将学号依次为1,2,3,56的的56名同学分成名同学分成4组,每组组,每组14人,抽取的样人,抽取的样本中,若将他们的学号按从小到大的顺序排列,本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差彼此之间会相差14.故还有一个同学的学号应为故还有一个同学的学号应为61420.答案:答案:20 从某学校高三
5、年级从某学校高三年级800名学生中随机抽取名学生中随机抽取50名测量身高,被抽取的学生的身高全部介于名测量身高,被抽取的学生的身高全部介于155 cm和和195 cm之间,将测量结果按如下方式之间,将测量结果按如下方式分成八组:分成八组:频率分布直方图与频率分布表频率分布直方图与频率分布表第一组第一组155,160);第二组;第二组160,165);第八第八组组190,195,如图是按上述分组方法得到的频,如图是按上述分组方法得到的频率分布直方图率分布直方图(1)根据已知条件填写下面表格:根据已知条件填写下面表格:(2)估计这所学校高三年级估计这所学校高三年级800名学生中身高在名学生中身高在
6、180 cm以上以上(含含180 cm)的人数的人数组别组别12345678样本数样本数【解解】(1)由频率分布直方图得第七组的频率由频率分布直方图得第七组的频率为:为:1(0.00820.01620.0420.06)50.06,第七组的人数为第七组的人数为0.06503.同理可得各组人数如下:同理可得各组人数如下:组别组别12345678样本数样本数24101015432( 2 ) 由 频 率 分 布 直 方 图 得 后 三 组 的 频 率 为由 频 率 分 布 直 方 图 得 后 三 组 的 频 率 为0.01650.060.00850.18.估计这所学校高三年级身高在估计这所学校高三年级
7、身高在180 cm以上以上(含含180 cm)的人数为的人数为8000.18144.【归纳拓展归纳拓展】频率分布直方图直观形象地表频率分布直方图直观形象地表示了样本的频率分布情况,从这个直方图上可示了样本的频率分布情况,从这个直方图上可以求出样本数据在各个组的频率分布根据频以求出样本数据在各个组的频率分布根据频率分布直方图估计样本率分布直方图估计样本(或者总体或者总体)的平均值时,的平均值时,一般是采取组中值乘以各组的频率的方法一般是采取组中值乘以各组的频率的方法变式训练变式训练2如图是某学校学生体重的频率分布如图是某学校学生体重的频率分布直方图,已知图中从左到右的前直方图,已知图中从左到右的
8、前3个小组的频率个小组的频率之比为之比为123,第,第2小组的频数为小组的频数为10,则抽取,则抽取的学生人数是的学生人数是()A10B20C30 D40茎叶图与特征数字茎叶图与特征数字 以下茎叶图记录了甲、乙两组各四名同学的以下茎叶图记录了甲、乙两组各四名同学的植树棵数乙组记录中有一个数据模糊,无法确认,植树棵数乙组记录中有一个数据模糊,无法确认,在图中以在图中以X表示表示.(2)记甲组四名同学为记甲组四名同学为A1,A2,A3,A4,他们植,他们植树的棵数依次为树的棵数依次为9,9,11,11;乙组四名同学为;乙组四名同学为B1,B2,B3,B4,他们植树的棵数依次为,他们植树的棵数依次为
9、9,8,9,10.分别从甲、乙两组中随机选取一名同学,所有分别从甲、乙两组中随机选取一名同学,所有可能的结果有可能的结果有16个,它们是:个,它们是:(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(A3,B1),(A3,B2),(A3,B3),(A3,B4),(A4,B1),(A4,B2),(A4,B3),(A4,B4),【归纳拓展归纳拓展】(1)茎叶图的特点茎叶图的特点茎叶图的优点是保留了原始数据,便于记录茎叶图的优点是保留了原始数据,便于记录及表示,能反应数据在各段上的分布情况及表示,能反应数据在各段上的分布
10、情况在做茎叶图或读茎叶图时,首先要弄清楚在做茎叶图或读茎叶图时,首先要弄清楚“茎茎”和和“叶叶”分别代表什么分别代表什么根据茎叶图,我们可方便地求出数据的众数根据茎叶图,我们可方便地求出数据的众数与中位数,大体上估计出两组数据平均数的大与中位数,大体上估计出两组数据平均数的大小与稳定性的高低小与稳定性的高低 某地最近十年粮食需求量逐年上升,下表是某地最近十年粮食需求量逐年上升,下表是部分统计数据:部分统计数据:线性回归方程线性回归方程年份年份20022004 2006 2008 2010需求量需求量(万吨万吨)236246257276286【解解】(1)由所给数据看出,年需求量与年份由所给数据
11、看出,年需求量与年份之间是近似直线上升的,下面求回归直线方之间是近似直线上升的,下面求回归直线方程为此对数据预处理如下:程为此对数据预处理如下:年份年份200642024需求量需求量257211101929【归纳拓展归纳拓展】(1)正确理解计算正确理解计算b、a的公式和的公式和准确的计算,是求线性回归方程的关键准确的计算,是求线性回归方程的关键(2)在分析两个变量的相关关系时,可根据样本在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线相关关系,若具有线性相关关系,则可通过线性回归方程估
12、计和预测变量的值性回归方程估计和预测变量的值变式训练变式训练4下表提供了某厂节能降耗技术改造下表提供了某厂节能降耗技术改造后在生产后在生产A产品过程中记录的产量产品过程中记录的产量x(吨吨)与相应与相应的生产能耗的生产能耗y(吨吨)的几组对应数据:的几组对应数据:x3456y2.5t44.5为了解某班学生喜爱打篮球是否与性别有关,为了解某班学生喜爱打篮球是否与性别有关,对本班对本班50人进行了问卷调查得到了如下的人进行了问卷调查得到了如下的22列列联表:联表:独立性检验独立性检验喜爱打篮球喜爱打篮球不喜爱打篮球不喜爱打篮球合计合计男生男生5女生女生10合计合计50【解解】(1)22列联表补充如
13、下:列联表补充如下:喜爱打篮球喜爱打篮球 不喜爱打篮球不喜爱打篮球 合计合计男生男生20525女生女生101525合计合计302050【归纳拓展归纳拓展】(1)独立性检验的关键是根据独立性检验的关键是根据22列联表准确计算列联表准确计算K2(2),若,若22列联表没有列出来,列联表没有列出来,要先列出此表要先列出此表(2)学习独立性检验时,要根据实际问题,深刻体学习独立性检验时,要根据实际问题,深刻体会独立性检验的思想会独立性检验的思想变式训练变式训练5某中学对高二甲、乙两个同类班级某中学对高二甲、乙两个同类班级进行进行“加强加强语文阅读理解语文阅读理解训练对提高训练对提高数数学应用题学应用题
14、得分率的作用得分率的作用”的试验,其中甲班的试验,其中甲班为试验班为试验班(加强语文阅读理解训练加强语文阅读理解训练),乙班为对比,乙班为对比班班(常规教学、无额外训练常规教学、无额外训练),在试验前的测试中,在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试一致,试验结束后,统计几次数学应用题测试的平均成绩的平均成绩(均取整数均取整数)如下表所示:如下表所示:60分以分以下下6170分分7180分分8190分分91100分分甲班甲班(人数人数)36111812乙班乙班(人数人数)48131510现规定平均
15、成绩在现规定平均成绩在80分以上分以上(不含不含80分分)的为优的为优秀秀(1)试分别估计两个班级的优秀率;试分别估计两个班级的优秀率;(2)由以上统计数据填写下面由以上统计数据填写下面22列联表,并问是列联表,并问是否有否有75%的把握认为的把握认为“加强加强语文阅读理解语文阅读理解训训练对提高练对提高数学应用题数学应用题得分率得分率”有帮助有帮助.优秀人数优秀人数非优秀人数非优秀人数合计合计甲班甲班乙班乙班合计合计(2)优秀人数优秀人数 非优秀人数非优秀人数合计合计甲班甲班302050乙班乙班252550合计合计5545100考题解答技法考题解答技法【答案答案】B【名师指招名师指招】(1)本题为频率分布直方图、分本题为频率分布直方图、分层抽样问题,在本题中易忽略各矩形的高是频层抽样问题,在本题中易忽略各矩形的高是频率率/组距误当作频率,从而导致错解组距误当作频率,从而导致错解(2)在频率分布直方图、分层抽样中,常见的易在频率分布直方图、分层抽样中,常见的易忽略的误区有:忽略的误区有:频率分布直方图中,不会根据频率分布直方频率分布直方图中,不会根据频率分布直方图估计样本的众数、中位数、平均数图估计样本的众数、中位数、平均数在解决分层抽样中各层的人数问题时,确定在解决分层抽样中各层的人数问题时,确定抽样比出现失误,导致错解抽样比出现失误,导致错解