《第二课时 列联表与独立性检验.pptx》由会员分享,可在线阅读,更多相关《第二课时 列联表与独立性检验.pptx(63页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二课时列联表与独立性检验成套的课件成套的教案成套的试题成套的微专题尽在高中数学同步资源大全QQ群552511468也可联系微信fjmath加入百度网盘群4000G一线老师必备资料一键转存自动更新永不过期 1.掌握分类变量的含义.2.通过实例,理解22列联表的统计意义.3.通过实例,了解22列联表独立性检验及其应用.CONTENTS/目录目录CONTENTS010102020303/目录目录知识知识 逐点夯实逐点夯实考点考点 分类突破分类突破课时课时 过关检测过关检测目录0101目录1.分类变量与列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;目录(2)
2、列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件X0和X1,Y表示相互对立的两个事件Y0和Y1,其中a,b,c,d是事件Xx,Yy(x,y0,1)的频数,n是样本量,其样本频数列联表(称为22列联表)如表所示:XY合计Y0Y1X0abab目录XY合计Y0Y1X1cdcd合计acbdnabcd目录2.独立性检验(1)小概率值的临界值:对于任何小概率值,可以找到相应的正实数x,使得关系P(2x)成立.我们称x为的临界值,这个临界值可作为判断2大小的标准.概率值越小,临界值x越大;(3)独立性检验:利用2的取值推断分类变量X和Y是否独立的方法称为2独
3、立性检验,读作“卡方独立性检验”,简称独立性检验;(4)基于小概率值的检验规则:当2x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当2x时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中x为的临界值);目录(5)应用独立性检验解决实际问题的主要环节:提出零假设H0:X和Y相互独立,并给出在问题中的解释;根据抽样数据整理出22列联表,计算2的值,并与临界值x比较;根据检验规则得出推断结论;在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.(6)独立性检验中几个常用的小概率值和相应的临界值:0.10.050.010.0050.001
4、x2.7063.8416.6357.87910.828目录1.判断正误.(正确的画“”,错误的画“”)(1)分类变量中的变量与函数的变量是同一概念.()答案:(1)(2)等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中2取值则可通过统计表从数据上说明两分类变量的相关性的大小.()(3)独立性检验的方法就是用的反证法.()(4)2的大小是判断事件A与B是否相关的统计量.()答案:(2)答案:(3)答案:(4)目录2.观察下面各等高堆积条形图,其中两个分类变量关系最强的是()目录解析:B通过等高堆积条形图可知,选项B中y1,y2的差异最大,故两个分类变量关系最强.故选B.目录3.(多选
5、)若在研究吸烟与患肺癌的关系中,通过收集、整理、分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析:AD独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.目录4.下面是一个22列联表:XY合计y1y2x1a2173x2222547合计b46120则表中的a,b.解析:a2173,a52.又a
6、22b,b74.答案:5274目录5.已知变量X,Y,由它们的样本数据计算得到24.328,2的部分临界值表如下:0.100.050.0250.0100.005x2.7063.8415.0246.6357.879则最大有的把握说变量X,Y有关系(填百分数).解析:因为24.3283.841x0.05,所以在犯错误的概率不超过0.05的前提下认为变量X,Y有关系.所以最大有95%的把握说变量X,Y有关系.答案:95%目录0202目录分类变量与列联表1.(多选)根据如图所示的等高堆积条形图,下列叙述正确的是()A.吸烟患肺病的频率约为0.2B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于
7、0.05D.吸烟与患肺病无关系解析:ABC从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率.A、B、C都正确.目录2.(2023安阳一模)如下是一个22列联表,则mn.XY合计y1y2x1a3545x27bn合计m73s解析:根据22列联表可知a3545,解得a10,则ma717,又由35b73,解得b38,则n7b45,故mn174562.答案:62目录练后悟通分类变量的两种统计表示形式(1)等高堆积条形图:根据等高堆积条形图的高度差判断两分类变量是否有关联及关联强弱;(2)22列联表:直接利用22列联表中的数据进行计算分析,用定量的方式判断两分类变量是否有关联及
8、关联强弱.目录分类变量关联性的判断【例1】某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:患心脏病无心脏病秃发20300不秃发5450根据表中数据得到215.968,因为210.828,则断定秃发与患心脏病有关系.那么这种判断出错的可能性为()A.0.001B.0.05C.0.025D.0.01解析因为210.828x0.001,因此判断出错的可能性为0.001,故选A.答案A目录解题技法如果2x,则“X与Y有关系”这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“
9、X与Y有关系”.目录某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算得26.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是()A.90%B.95%C.99%D.99.5%解析:B由临界值表,得6.0233.841x0.05,所以可断言市民收入增减与旅游愿望有关系的可信程度为95%.目录独立性检验的应用【例2】(2022全国甲卷改编)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030目录(1)根据上表,分别估计这
10、两家公司甲、乙两城之间的长途客车准点的概率;目录(2)根据小概率值0.1的独立性检验,能否认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?0.1000.0500.010 x2.7063.8416.635目录解(2)零假设为H0:甲、乙两城之间的长途客车是否准点与客车所属公司无关,列联表如下表所示:公司班次是否准点合计准点班次数未准点班次数A24020260B21030240合计45050500目录目录为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班级进行教学实验.为了比较教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进
11、行统计,结果如下表.记成绩不低于70分的为“成绩优良”.分数50,60)60,70)70,80)80,90)90,100甲班频数56441乙班频数13655目录由以上统计数据列出22列联表,并判断能否依据小概率值0.05的2独立性检验认为“成绩优良与教学方式有关”.解:由题意,列联表如下:成绩班级合计甲班乙班优良91625不优良11415合计202040目录目录0303目录1.对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到如下的列联表,则2约为()班级数学成绩合计优秀不优秀甲班113445乙班83745合计197190A.0.600B.0.828C.2.712D.6.014
12、目录2.为考察A,B两种药物预防某疾病的效果,进行药物实验,分别得到如下等高堆积条形图:目录A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果解析:B从等高堆积条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,预防效果更好.根据图中信息,在下列各项中,说法最佳的一项是()目录3.两个分类变量X和Y,值域分别为x1,x2和y1,y2,其样本频数分别是a10,b21,cd35.若X与Y有关系的可信程度不小于97.5%,则c()A.3B.4C.5D.6目录解析:A列22列
13、联表如下:XY合计y1y2x1102131x2cd35合计10c21d66目录4.(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”小波同学为了验证“日落云里走,雨在半夜后”,观察了A地区的100天日落和夜晚天气,得到如下22 列联表,并计算得到219.05,下列小波对A地区天气的判断正确的是()日落云里走夜晚天气下雨未下雨出现255未出现2545目录C.依据0.005 的独立性检验,认为“日落云里走”是否出现与夜晚天气有关D.依据0.005 的独
14、立性检验,若出现“日落云里走”,则认为夜晚一定会下雨目录目录5.(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表,经计算24.762,则可以推断出()满意不满意男3020女4010B.调研结果显示,该学校男生比女生对食堂服务更满意C.认为男、女生对该食堂服务的评价有差异此推断犯错误的概率不超过0.05D.认为男、女生对该食堂服务的评价有差异此推断犯错误的概率不超过0.01目录目录6.(多选)有两个分类变量X,Y,其22列联表如下所示:XY合计y1y2x1a20a20 x215a30a45合计155
15、065其中a,15a均为大于5的整数,若依据小概率值0.05的独立性检验,认为X,Y有关,则a的值为()A.6B.7C.8D.9目录目录7.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层随机抽样的方法抽取23人,则抽取的男生人数为.目录答案:15目录8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出零假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得23
16、.918,经查临界值表知x0.053.841.则下列结论中,正确结论的序号是.认为“这种血清能起到预防感冒的作用”犯错误的概率不超过0.05;若某人未使用该血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.解析:23.9183.841x0.05,所以认为“这种血清能起到预防感冒的作用”,这种推断犯错误的概率不超过0.05.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.答案:目录9.某高校统计初步课程的教师随机调查了选该课的学生情况,调查数据如下表:非统计专业统计专业男1310女720为了
17、判断是否主修统计专业与性别的关系,根据表中的数据,计算得到2(保留三位小数),所以判定(填“能”或“不能”)在犯错误的概率不超过0.05的前提下,认为是否主修统计专业与性别有关.答案:4.844能目录10.(2021全国甲卷改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?目录(2)依据小概率值0.01的独立性检验,能否以此推断甲机床的产品质量与乙机床的产
18、品质量有差异?目录A.25B.45C.60D.75目录解析:BCD设男生的人数为5n(nN*),根据题意列出22列联表如下所示:是否喜欢航天性别合计男生女生喜欢航天4n3n7n不喜欢航天n2n3n合计5n5n10n目录12.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:性别休闲方式合计读书健身女243155男82634合计325789在犯错误的概率不超过的前提下认为性别与休闲方式有关系.答案:0.1目录13.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中
19、有50名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过.目录解析:由题意,可得如下22列联表:考试情况培训方式合计集中培训分散培训一次考试通过503080一次考试未通过52025合计5550105答案:0.001目录14.某城市地铁将于2024年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:月收入(单位:百元)15,25)25,35)35,45)45,55)55,65)65,75赞成定价者人数123534认为价格偏高者人数4812521目录(
20、1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);目录(2)由以上统计数据列出22列联表,依据小概率值0.01的独立性检验,可否认为“月收入以55百元为分界点对地铁定价的态度有差异”?0.10.050.010.005x2.7063.8416.6357.879目录解:(2)根据条件可得22列联表如下:对地铁定价的态度人均月收入合计不低于55百元的人数低于55百元的人数认为价格偏高者32932赞成定价者71118合计104050目录15.一家大型超市委托某机构调查该超市的顾客使用移动支付的情况.调查人员从年龄在20岁至60岁的顾客中,随机抽取了200人,调查结果如图:(1)补全下面列联表,并根据列联表判断在小概率值0.001的独立性检验下,能否推断使用移动支付与年龄有关?移动支付年龄合计年龄40年龄40使用不使用合计200目录解:(1)补全列联表如下:移动支付年龄合计年龄40年龄40使用8540125不使用106575合计95105200目录(2)现从该超市这200位顾客年龄在55,60的人中,随机抽取2人,记这两人中使用移动支付的顾客为X人,求X的分布列.目录X的分布列为X012P33581129358T TH HA AN NK K.YOU.YOU