《【数学 】分类变量与列联表课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册.pptx》由会员分享,可在线阅读,更多相关《【数学 】分类变量与列联表课件-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册.pptx(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第八章成对数据的统计分析8.3列联表与独立性检验8.3.1分类变量与列联表分类变量与列联表学习目标素养要求1.通过实例,理解22列联表的统计意义数学抽象2.理解判断两个分类变量是否有关系的常用方法数据分析自学导引我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为_.分类变量的取值可以用_表示【预习自测】下列不是分类变量的是()A近视B成绩C血压D饮酒【答案】B【解析】近视变量有近视与不近视两种类别,血压变量有高、正常、低三种类别,饮酒变量有饮酒与不饮酒两种类别分类变量分类变量实数是否吸烟、是否患肺癌是什么变量?提示:分类变量1定义一对分类变量X和Y,我们整理数据如下表所
2、示:交叉分类频数22列联表XY合计Y0Y1X0ababX1cdcd合计acbdabcd像这种形式的数据统计表称为22列联表222列联表给出了成对分类变量数据的_.【预习自测】某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如22列联表所示(单位:人),则其中m_,n_班级分数合计80分及80分以上80分以下试验班321850对照班24m50合计5644n【答案】26100等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的_特征,依据_的原理,我们可以推断结果频率等高堆积条形
3、图频率稳定于概率【预习自测】观察下列各图,其中两个分类变量x,y之间关系最强的是()【答案】D【解析】在四幅图中,选项D的图中两个深色条的高相差最明显,说明两个分类变量之间关系最强课堂互动某大学通过随机询问100名性别不同的大学生是否爱好某项运动后发现:爱好该项运动的男生有40人,接受调查的45名女生中有25人不爱好该项运动请作出22列联表解:列表如下:题型1列22联表是否爱好性别合计男女爱好402060不爱好152540合计5545100分清类别是作列表的关键步骤表中排成两行两列的数据是调查得来的结果1在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃
4、甜食的为117人,女性中喜欢吃甜食的为492人请作出性别与喜欢吃甜食的列联表解:列表如下:性别甜食合计喜欢不喜欢男117413530女492178670合计6095911200题型2用22列联表分析两分类变量间的关系解:22列联表如下:饮食情况年龄合计在六十岁以上在六十岁以下以蔬菜为主432164以肉类为主273360合计7054124显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系1作22列联表时,关键是对涉及的变量分清类别计算时要准确无误2假设有两个分类变量X与Y,它们的可能取值分别为x1,x2和y1,y2,其22列联表为则当m取下面何值时,X与Y的关系最弱()
5、A8B9C14D19项目y1y2x11018x2m26【答案】C【解析】由102618m,解得m14.4,所以当m14时,X与Y的关系最弱某学校对高三学生作的一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高堆积条形图,利用图形判断考前心情紧张与性格类型是否有关系题型3用等高堆积条形图分析两分类变量间的关系解:作列联表如下:考前心情性格合计内向外向紧张332213545不紧张94381475合计4265941020相应的等高堆积条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数
6、的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关利用等高堆积条形图判断两个分类变量是否相关的步骤3在调查的480名男性中有38名患色盲,520名女性中有6名患色盲,试利用等高堆积条形图来判断色盲与性别是否有关解:根据题目给出的数据作出如下的列联表:性别色盲情况合计色盲不色盲男38442480女6514520合计449561000根据列联表作出相应的等高堆积条形图:从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此我们可以认为患色盲与性别是有关系的某工厂有工人1000名,其中
7、250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层随机抽样的方法(按A类、B类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表1:A类工人生产能力的频数分布表规范答题样板生产能力分组110,120)120,130)130,140)140,150)人数8x32表2:B类工人生产能力的频数分布表(1)确定x,y的值;(2)完成下面22列联表:生产能力分组110,120)120,130)130,140)140,150)人数6y2718工人类别生产能力分组合计110,130)130,150)A类
8、B类合计【解题思路探究】第一步,审题审结论明确解题方向,确定x,y的值,可用分层随机抽样解决审条件,挖解题信息,已知工厂中A,B类工人的人数和抽取工人数,进行分层随机抽样,可直接计算A,B类工人样本数第二步,确定解题步骤分层随机抽样确定A,B类工人抽取数求x,y的值完成列联表第三步,规范解答解:(1)从该工厂的工人中抽取100名工人,且该工厂中有250名A类工人,750名B类工人,要从A类工人中抽取25名,从B类工人中抽取75名,x2583212,y756271824.(2)根据所给的数据可以完成列联表,如下表所示:工人类别生产能力分组合计110,130)130,150)A类20525B类30
9、4575合计5050100素养达成1(题型2)某机构调查中学生的近视情况,了解到某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时,最有说服力的方法是()A平均数B方差C回归分析D列联表【答案】D2(题型2,3)与表格相比,能更直观地反映出相关数据总体状况的是()A列联表B散点图C残差图D等高堆积条形图【答案】D3(题型3)(多选)下图是调查某地区男女中学生喜欢理科的等高堆积条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A性别与喜欢理科无关B女生中喜欢理科的比为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的比为40%【答案】
10、CD【解析】由题图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故B不正确由题图知,男生比女生喜欢理科的可能性大些4(题型3)根据如图所示的等高堆积条形图可知吸烟与患肺病_关系(填“有”或“没有”).【答案】有【解析】从等高堆积条形图上可以明显地看出:吸烟患肺病的频率远远大于不吸烟患肺病的频率5(题型1,2)(2022年临汾一模)在某医院,因为患心脏病而住院的600名男性病人中,有200人秃顶,而另外750名不是因为患心脏病而住院的男性病人中有150人秃顶填写下列秃顶与患心脏病列联表:项目患心脏病患其他病合计秃顶不秃顶合计据表中数据估计秃顶病患中患心脏病的概率P1和不秃顶病患中患心脏病的概率P2,并用两个估计概率判断秃顶与患心脏病是否有关解:项目患心脏病患其他病合计秃顶200150350不秃顶4006001000合计6007501350