《8.3 列联表与独立性检验 -(人教A版2019选择性必修第二、三册) (教师版).docx》由会员分享,可在线阅读,更多相关《8.3 列联表与独立性检验 -(人教A版2019选择性必修第二、三册) (教师版).docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、列联表与独立性检验知识剖析1 2x2列联表设/ ,B为两个变量,每一个变量都可以取两个值,变量/ : 4 ,人2 =& 变量B : Br f B2 = Br通过观察得到右表所示数据:分类变量AA合计Baba + bBcdc + d合计a + cb + d?i = Q + b + c + d并将形如此表的表格称为2 X 2列联表.2独立性检验根据2 x 2列联表中的数据判断两个变量/ ,8是否独立的问题叫2 x 2列联表的独立性检验.3 f的计算公式2n(ad be)?X (a + b)(c + d)(a + c)(b + d)若要推断的论述为“A与8有关系”,则f的值越大,说明“与8有关系”成
2、立的可能性越大.如下表,若f = 8时,因为87.879 ,所以有1 0.005 = 99.5%的把握认为4与8之间有关;而8 xa)0.10.050.0100.0050.0012.7063.8416.6357.87910.8284应用独立性检验解决实际问题大致应包括以下几个主要环节(I)提出另假设为:x和y相互独立,并给出在问题中的解释;(II)根据抽样数据整理出2x2列联表,计算/的值,并与临界值力比较;(III)根据检验规则得出推断结论;(W)在x和y不独立的情况下,根据需要,通过比较相应的频率,分析x和丫间的影响规津45岁以上203050合计55451002 _ n(Qd-bc)2(a
3、+b)(a+c)(c+d)(b+d)100x(35x30-15x20)255x45x50x509.097,87.故有99.5%把握认为该地区市民是否考虑单车与他(她)是不是“青年人”有关;方案一:选择自行车,走无障碍自行车道以19切血的速度直达上班地点.则所需时间为:九=工,方案二:开车以30加的速度上班,但要经过A、B、C三个易堵路段,分别令三个路段堵车的事件为A、 8、 C,因为三个路段堵车的概率分别是j j且是相互独立的,并且每次堵车的时间都是10分钟(假设除了堵车时间其他时间都是匀速行驶)则在路上遇上堵车的概率为:1125P=i-PB - B)=1-P(4)-(B)(-1 - 1 -P
4、(A) 11 -P(Q=1 - - x - x -=故选择方案二上班所需时间为Z2= + |xi = /z,306636因为力 打;若仅从时间的角度考虑,应选方案二省时间.”)202。年初,新型冠状病毒(2019-TiCoV)肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人 与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原 体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的 潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为2.252.如果认为超过8天的潜伏期属于 “长潜伏期”,按照年龄统
5、计样本,得到下面的列联表:年龄/人数长期潜伏非长期潜伏40岁以上3011040岁及40岁以下2040是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X服从正态分布N(,。2),其中近似为样本平均数礼M近似为样本方差s2.现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(4)以题目中的样本频率估计概率,设1000个病例中恰有做k e N*)个属于“长期潜伏”的概率是g(k),当k为何值时,g(/c)取得最大值.附.X2 = 九(ad-bc)2m : 一 (a+b)(c+d)(a+c)(a+d)P(X2 %0)0.10.050.010x02.7063.8416.
6、635若 f N(42),则 P( oVfV + b) = 0.6862. P( 2o f V + 2。)= 0.9544, P( 3) f V + 3。) = 0.9974.【答案】(1)没有95%的把握认为“长期潜伏”与年龄有关(2) 250【解析】X2 =【解析】X2 =200x(30x40 - 110x20)250X150X140X603.175 13.85) =;= 0.0013.由于P的值很小,故对入境旅客要求隔离14天合理.(可以样本频率估计概率,则任意抽取一个病例,属于“长期潜伏”的概率为券=%g =普00。(y1*若g(k)最大,则g(k) g(k - 1) gWg(k +
7、iyciooo(/y- ciooo(/yrkr31000-fc、k + 1 八、k+1 r3999-Zcciooo(/y- cioooy叩解得? /c k0)0.100.050.0250.0100.0050.001ko2.7063.8415.0246.6357.87910.828Pg k0)0.100.050.0250.0100.0050.001ko2.7063.8415.0246.6357.87910.828n(ad-bc)2(a+匕)(c+d)(a+c)(b+d)根据以上数据,得到的结论正确的是()【典题1】为了考察某种病毒疫苗的效果,现随机抽取100只小白鼠进行试验,得到如下2x2列联表
8、:感染未感染总计服用104050未服用203050总计3070100附:K2 =其中九= a + b + c + d.A.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗有关”B.在犯错误的概率不超过2.5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗无关”C.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗有关”D.有95%的把握认为“小白鼠是否被感染与有没有服用疫苗无关”【解析】由列联表中数据,计算长2=曾当土展=若、4.762,且3.8414.762 k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415
9、.0246.6357.87910.828参考数据及公式如下:(K2 =n(ad-bc)2(a+b)(c+d)(a+c)(b+d)其中九= a + b + c + d)对服务好评对服务不满意合计对商品好评8040120对商品不满意701080合计15050200【解析】(I )由题意可得关于商品和服务评价的2X2列联表:得K2=200x(80x10 -40x70)2 150X50X120X8011.11110.828,可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关;每次购物时,对商品和服务全好评的概率为0.4,且X的取值可以是0, 1, 2, 3, 4, 5, X3(5, 0
10、.4).P(X=0)=0.65; P(X=l)=C50A0.64; P(X=2)=C50A0.63;P(X=3)=C53*0.430.440.6; P(X=5)=0.45,X的分布列EX = 5xOA = 2, DX = 5x 0.4 x 0.6 = 1.2.X012345P0.65C5L0406C52*0.420.63C530.430.440.60.45【典题3近期,湖北省武汉市等多个地区发生新型冠状病毒感染的肺炎疫情.为了尽快遏制住疫情,我 国科研工作者坚守在科研一线,加班加点、争分夺秒与病毒抗争,夜以继日地进行研究.新型冠状病毒的潜 伏期检测是疫情控制的关键环节之一 .在传染病学中,通常
11、把从致病刺激物侵入机体或对机体发生作用起, 到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.钟南山院士带领的研究团 队统计了武汉市某地区10000名医学观察者的相关信息,并通过咽拭子核酸检测得到1000名确诊患者的信 息如表格:潜伏期(单位:天)0 ,7(7 ,14(14 ,21(21 ,28人数80019082求这1000名确诊患者的潜伏期样本数据的平均数款同一组数据用该组数据区间的中点值代表).新型冠状病毒的潜伏期受诸多因素影响,为了研究潜伏期与患者性别的关系,以潜伏期是否超过7天为标准进行分层抽样,从上述1000名患者中抽取100名,得到如下列联表.请将列联表补充完
12、整,并根据列联表判断是否有90%的把握认为潜伏期与患者性别有关.总计潜伏期7天男性患者女性患者总计男性患者女性患者总计1250100由于采样不当、标本保存不当、采用不同类型的标本以及使用不同厂家试剂都可能造成核酸检测结果假阴性”而出现漏诊.当核酸检测呈阴性时,需要进一步进行血清学/gM/gG抗体检测,以弥补核酸检 测漏诊的缺点.现对10名核酸检测结果呈阴性的人员逐一地进行血清检测,记每个人检测出是 近期感染的标志)呈阳性的概率为p(0 p k0)0.1000.0500.0250.0100.0050.001k。2.7063.8415.0246.6357.87910.828附:K2 =Mad-bc
13、y(a+b)(c+d)(a+c)(匕+d)其中九= a + b + c + d.【解析】元=3.5 x翳+ 10.5 X盘+ 17.5 X就+ 24.5 X就=4.984.(相当于求频率直方图中的平均数,其等于每组组中值x每组概率)潜伏期V 7天潜伏期,7天总计男性患者381250女性患者42850总计8020100补充完整的2 x 2列联表如下所示,.K2 =100X(38X8-12X42)2=1 2.706,50x50x80x20 .不能有90%的把握认为潜伏期与患者性别有关.(套用公式求出K2值,再查表确认分类变量是否有关)(3)由f (p) = p(l - p)8 + p(l - p)
14、9,化简得f (p) = p(l - p)8(2 - p),令 1 p = X 6 (0 ,1),则p = 1 %, f(p) = (1 x)x8(l + x) = (1 %2)%8,令g(x) = (1 x2)x8, x G (0 ,1),则gQ) = 2x7(4 5x2),令0x 令令(%) VO,则衅 V% k。)0.500.400.250.150.100.050.025 0.010.0050.001k。0.455 0.7081.323 2.0722.706 3.8415.024 6.6357.87910.83A. 1%B. 5%C. 95%D. 99%【答案】B【解析】根据题意知,心=
15、3.9363.841,所以判定玩手机游戏与学习成绩有关系,这种判断出错的可能性为5%.故选:B.3 (巧为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2x2列联表进行 独立性检验,经计算K2=8.01,附表如表:P(K2 k0)0.1000.0500.0250.0100.0012.7063.8415.0246.63510.828参照附表,得到的正确的结论是()A.有99%以上的把握认为“喜欢乡村音乐与性别有关”B.有99%以上的把握认为“喜欢乡村音乐与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“喜欢乡村音乐与性别有关”D.在犯错误的概率不超过0.1%的
16、前提下,认为“喜欢乡村音乐与性别无关”【答案】A【解析】片=8016.635,在犯错误概率不超过0.01的前提下认为“喜欢乡村音乐与性别有关”,即有99%以上的把握认为“喜欢乡村音乐与性别有关力故选:A.%)【多选题】“一粥一饭,当思来之不易”,道理虽简单,但每年我国还是有2000多亿元的餐桌浪费, 被倒掉的食物相当于2亿多人一年的口粮.为营造“节约光荣,浪费可耻”的氛围,某市发起了“光盘行动”.某 机构为调研民众对“光盘行动”的认可情况,在某大型餐厅中随机调查了 90位来店就餐的客人,制成如表 所示的列联表,通过计算得到Y的观测值为9.已知P(K2 6.635) = 0.010 fP(K2
17、10.828) = 0,001,则 下列判断正确的是()认可不认可40岁以上(含40岁)4010A.在该餐厅用餐的客人中大约有66.7%的客人认可“光盘行动”B.在该餐厅用餐的客人中大约有99%的客人认可“光盘行动”C.有99%的把握认为“光盘行动”的认可情况与年龄有关D.在犯错误的概率不超过0.001的前提下,认为“光盘行动”的认可情况与年龄有关【答案】AC【解析】:心的观测值为9,且尸侬2次.635尸0.010, P(7C210.828)=0.001,XV96.635,但 9v 10.828,有99%的把握认为“光盘行动”的认可情况与年龄有关,或者说,在犯错误的概率不超过0.01。的前提下
18、,认为“光盘行动”的认可情况与年龄有关,所以选项。正确,选项。错误,由表可知认可“光盘行动”的人数为60人,所以在该餐厅用餐的客人中认可“光盘行动”的比例为,x 100%=66.7%, 90故选项A正确,选项8错误,故选:AC.5()某网络平台从购买该平台某课程的客户中,随机抽取了 100位客户的数据,并将这100个数据按学时数,客户性别等进行统计,整理得到如表;学时数5, 10)10, 15)15, 20)20, 25)25, 30)30, 35)35, 40)男性181299642女性24827134(1)根据上表估计男性客户购买该课程学时数的平均值(同一组中的数据用该组区间的中点值作代表
19、,结果 保留小数点后两位);从这100位客户中,对购买该课程学时数在20以下的女性客户按照分层抽样的方式随机抽取7人,再从 这7人中随机抽取2人,求这2人购买的学时数都不低于15的概率.将购买该课程达到25学时及以上者视为“十分爱好该课程者”,25学时以下者视,为“非十分爱好该课程 者请根据已知条件完成以下2 x 2列联表,并判断是否有99.9%的把握认为“十分爱好该课程者”与性别 有关?非十分爱好该课程者十分爱好该课程者合计男性 女性合计100附:(2 =-,n = a + b + c + d(a+b)(c+d)(a+c)(匕+d)Pg k。)0.1000.0500.0250.0100.00
20、1kO2.7063.8415.0246.63510.828【答案】(1) 16.92(2) |(3)有99.9%的把握认为“十分爱好该课程者”与性别有关【解析】(1)由题意知,在100位购买该课程的客户中,男性客户购买该课程学时数的平均值为元=1点(7.5x 18+12.5x12+17.5x9+22.5x9+27.5x6+32.5x4+37.5x2)x16.92;所以估计男性客户购买该课程学时数的平均值为16.92.(2)设“所抽取的2人购买的学时数都不低于15为事件4依题意按照分层抽样的方式分别在学时数为5, 10), /0, 15), 15, 20)的女性客户中抽取1人(设为,2人(设为A
21、, B)4人,(设为口,。2, C3,。4),从7人中随机抽取2人所包含的基木事件为:aA, aB, ac9 讹2,AB, Ac, Ac?,Ac?, Ac4, Bc, Be?, 3c3, 5c4,口。2,。1。3,c(4,c2c3,c2c4,C3c4,共21种,其中事件A所包含的基本事件为:C|C2,C1C3,C1C4,c2c3,c2c4,c3c4,共6个,则事件A发生的概率P=5 = g.乙JL /依题意得2x2列联表如下非十分爱好该课程者十分爱好该课程者合计男性481260女性162440合计6436100则/=黑黑=弋:黑岩:空)246.6671。.828.故有99.9%的把握认为“十分
22、爱好该课程者”与性别有关./) “低碳出行。一种降低“碳”的出行,以低能耗、低污染为基础,是环保的深层次体现,在众多发达 国家被广大民众接受并执行,S市即将投放一批公共自行车以方便市民出行,减少污染,缓解交通拥堵,现先对100人做了是否会考虑选择自行车出行的调查,结果如表.如果把45周岁以下人群定义为“青年、完成下列2X2列联表,并问你有多少把握认为该地区市民是否 考虑单车与他(她)是不是“青年人,有关?年龄考虑骑车不考虑骑车15以下6315, 30)16630, 45)13645, 60)141660, 75)5975以上15合计5545骑车不骑车合计45岁以下45岁以上合计100p(K2
23、k)0.150.100.050.0250.0100.0050.001k2.072.703.845.026.637.8710.82参考:K2 =n(ad-bc)2 (a+b)(a+c)(c+d)(b+d)n = a + b + c + d.(2)S市为了鼓励大家骑自行车上班,为此还专门在几条平时比较拥堵的城市主道建有无障碍自行车道,该市市民小明家离上班地点lOkrn,现有两种.上班方案给他选择;方案一:选择自行车,走无障碍自行车道以的速度直达上班地点.方案二:开车以30忆租/1的速度上班,但要经过Z、B、。三个易堵路段,三个路段堵车的概率分别是33且是相互独立的,并且每次堵车的时间都是10分钟(假设除了堵车时间其他时间都是匀速行驶)若仅从时间的角度考虑,请你给小明作一个选择,并说明理由.【答案】(1)有99.5%把握认为该地区市民是否考虑单车与他(她)是不是“青年人”有关(2)方案二【解析】根据题目所给的数据填写2x2列联表如下:骑车不骑车合计