《2019数学新设计人教A选修1-2课件:第一章 统计案例 1.2 .ppt》由会员分享,可在线阅读,更多相关《2019数学新设计人教A选修1-2课件:第一章 统计案例 1.2 .ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、1.2独立性检验的基本思想及其初步应用,1.分类变量与列联表(1)分类变量如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表列出两个分类变量的频数表,称为列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:,【做一做1】下面是一个22列联表.,则表中p的值等于.解析:依题意有33+m=83,33+n=60,所以m=50,n=27,于是a=50+25=75,b=27+25=52,从而p=60+75=83+52=135.答案:135,2.等高条形图(1)图形与表格相比,更能直观地反映出两个分类变
2、量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图,如果发现相差很大,就判断两个分类变量之间有关系.,【做一做2】下列关于等高条形图的叙述中,正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的大小C.从等高条形图中可以粗略地判断两个变量是否有关系D.以上说法均不正确答案:C,3.独立性检验,名师点拨独立性检验原理与反证法原理比较(1)反证法原理:在假设H0下,如果推出一个矛盾,就证明了H0不成立.(2)独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超
3、过小概率.,【做一做3】某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生,将他们的身高和体重制成22列联表,根据列联表中的数据,可以在犯错误的概率不超过的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.,思考辨析判断下列说法是否正确,正确的在后面的括号内打“”,错误的打“”.(1)列联表中的数据是两个分类变量的频数.()(2)事件A与B的独立性检验无关,即两个事件互不影响.()(3)K2的大小是判断分类变量A与B是否相关的统计量.()(4)在等高条形图中,如果非常接近,说明两个变量之间有关系.()(5)利用列联表求得的K2的值越大,说明两个变量有关
4、系的可能性越大.()答案:(1)(2)(3)(4)(5),探究一,探究二,探究三,思维辨析,列联表【例1】为了调查胃病是否与生活规律有关系,在某地对540名40岁以上的人进行了调查,结果显示:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人,试根据以上数据列出22列联表.思路分析:先确定两个分类变量,再分别计算分类变量的取值,最后作出列联表.,解:由已知可列22列联表如下:,探究一,探究二,探究三,思维辨析,反思感悟列22列联表,实质就是列出两个变量取值的频数表.一般地,假设有两个变量A和B,它们的取值分别为A1,A2和
5、B1,B2,其样本频数列联表(称为22列联表)为:,探究一,探究二,探究三,思维辨析,变式训练1关于男女生喜欢武打剧的列联表如下:,则表中A=,B=,C=,D=.解析:A=105-39=66,B=100-39=61,C=66+34=100,D=105+95=200.答案:6661100200,探究一,探究二,探究三,思维辨析,利用等高条形图进行独立性检验【例2】在一项有关医疗保健的社会调查中,一共调查了男性530人,女性670人,其中男性喜欢吃甜食的为117人,女性喜欢吃甜食的为492人.请根据以上数据作出性别与喜欢吃甜食的列联表,并用等高条形图判断二者之间是否有关系.思路分析:先根据题意确定
6、分类变量,作出列联表,再画等高条形图,最后给出判断.,探究一,探究二,探究三,思维辨析,解:根据已知的数据,可以作出列联表如下:,等高条形图如下:从等高条形图可以看出,男性中不喜欢吃甜食的比例明显高于女性中不喜欢吃甜食的比例,因此可以认为性别与喜欢吃甜食之间有关系.,探究一,探究二,探究三,思维辨析,反思感悟1.利用等高条形图进行直观判断的步骤(1)作出22列联表;(2)计算出相应的频率;(3)作出等高条形图;(4)最后结合图形进行判断.2.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的,两列的数据对应不同颜色.,探究一,探究二,探究三,思维辨析,变式
7、训练2下面是调查某地区男女中学生喜欢理科情况的等高条形图,由图形可知()A.性别与喜欢理科无关B.女生中喜欢理科的比例为80%C.男生比女生喜欢理科的可能性大些D.男生中不喜欢理科的比例为60%解析:由题图知女生中喜欢理科的比例为20%,男生中喜欢理科的比例为60%,故选项B,D不正确.由题图知,男生比女生喜欢理科的可能性大些.答案:C,探究一,探究二,探究三,思维辨析,利用列联表进行独立性检验【例3】下表是对某地区的一种传染病与饮用水的调查表:,(1)这种传染病是否与饮用水的卫生程度有关系?请说明理由.(2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22
8、人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关系,并比较两种样本在反映总体时的差异.思路分析:根据列联表,通过公式计算K2的观测值,然后与临界值进行比较,得出结论.,探究一,探究二,探究三,思维辨析,解:(1)假设H0:传染病与饮用水的卫生程度没有关系.把表中数据代入公式得,在H0成立的情况下,P(K210.828)0.001,是小概率事件,所以拒绝H0.因此我们在犯错误的概率不超过0.001的前提下,可以认为该地区这种传染病与饮用不干净水有关系.,探究一,探究二,探究三,思维辨析,(2)依题意得22列联表如下:,因为5.7855.024,P(K25.024)0.025,所以我们在犯错
9、误的概率不超过0.025的前提下,可以认为该种疾病与饮用不干净水有关系.两个样本都能统计得到传染病与饮用不干净水有关系这一相同结论.但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握认为该疾病与饮用不干净水有关系.,探究一,探究二,探究三,思维辨析,反思感悟解决独立性检验问题的思路解决一般的独立性检验问题,首先由题目所给的22列联表确定a,b,c,d,n的值,然后代入随机变量K2的计算公式求出观测值k,最后将k与临界值k0进行对比,从而确定在犯错误的概率不超过多少的前提下(或有多大的把握)认为“两个分类变量有关系”.,探究一,探究二,探究三,思维辨析,变式训练3
10、某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下22列联表:,如果说其亲属的饮食习惯与年龄有关系,那么犯错误的概率不超过()A.0.1B.0.05C.0.01D.0.001解析:K2=106.635,所以如果说其亲属的饮食习惯与年龄有关系,那么犯错误的概率不超过0.01.答案:C,探究一,探究二,探究三,思维辨析,对独立性检验的原理理解不清致误【典例】某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得K23.918,经查临界值表知P(K23.
11、841)0.05.则下列结论中,正确结论的序号是.在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”;若某人未使用该血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.错解分析:本题常见的错解是由对独立性检验的原理理解不清,对检验结果的概率性描述不准确导致的.解析:由独立性检验的思想方法,知正确.答案:,探究一,探究二,探究三,思维辨析,纠错心得注意独立性检验结果的概率性描述,在独立性检验中,当随机变量K2的观测值k与临界值k0比较,满足kk0时,我们就可以在犯错误概率不超过P(K2k0)的前提下认为两个变量有关系
12、,或者说有1-P(K2k0)100%的把握认为两个变量有关系,即认为两个变量没有关系的概率为P(K2k0).,探究一,探究二,探究三,思维辨析,跟踪训练利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005的前提下认为事件A和B有关系,则具体计算得出的数据k应满足()A.k6.635B.k6.635C.k7.879D.k6.635,而P(K26.635)0.01,所以有99%的把握说两个变量有关系,即两个变量有关系的可能性不小于99%.答案:99%,5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.(1)将22列联表补充完整.,(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?,解:(1)列22列联表:,根据临界值表知P(K22.706)0.10.因此在犯错误的概率不超过0.1的前提下,认为婴儿的性别与出生的时间有关系.,