《2022年超几何分布和二项分布的联系和区别 .pdf》由会员分享,可在线阅读,更多相关《2022年超几何分布和二项分布的联系和区别 .pdf(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、超几何分布和二项分布的联系和区别开滦一中张智民在最近的几次考试中 , 总有半数的的学生搞不清二项分布和超几何分布, 二者到底该如何区分呢 ?什么时候利用二项分布的公式解决这道概率问题?什么时候用超几何分布的公式去解决呢 ?好多学生查阅各种资料甚至于上网寻找答案, 其实这个问题的回答就出现在教材上, 人教版新课标选修 2-3 从两个方面给出了很好的解释.诚可谓 : 众里寻他千百度 , 蓦然回首 , 那人却在灯火阑珊处 !一、两者的定义是不同的教材中的定义 : (一) 超几何分布的定义在 含 有 M 件 次 品的N 件 产 品 中 , 任 取 n 件 , 其 中 恰 有 X 件次 品 , 则 P(
2、X=k) =nNk-nM-NkMCCC,,2, 1 ,0k, m, 其中 m=minM,n, 且 nN,M N,n,M,NN,称随机变量 X服从超几何分布( 二) 独立重复试验和二项分布的定义1)独立重复试验:在相同条件下重复做的n 次试验 , 且各次试验试验的结果相互独立,称为 n次独立重复试验 , 其中 A(i=1,2,n) 是第次试验结果 , 则 P(A1A2A3 An)=P(A1)P(A2)P(A3) P(An)2)二项分布在 n次独立重复试验中 , 用 X表示事件 A发生的次数 , 设每次试验中事件A发生的概率为 P,则 P(X=k)=knkpp)1(Ckn(k=0,1,2,n),
3、此时称随机变量X 服从二项分布 , 记作XB(n,p), 并称 P为成功概率。1. 本质区别 (1) 超几何分布描述的是不放回抽样问题, 二项分布描述的是放回抽样问题; (2) 超几何分布中的概率计算实质上是古典概型问题; 二项分布中的概率计算实质上是相互独立事件的概率问题 2. 计算公式超几何分布 : 在含有 M件次品的 N件产品中 , 任取 n 件, 其中恰有 X 件次品 , 则 P(X=k) =nNk-nM-NkMCCC,,2, 1 ,0k, m,二项分布 : 在 n 次独立重复试验中 , 用 X表示事件 A发生的次数 , 设每次试验中事件A发生的概率为 P,则 P(X=k)=knkpp
4、)1(Ckn(k=0,1,2,n),温馨提示 : 当题目中出现“用样本数据估计XXX的总体数据”时 , 均为二项分布问题。比如2017-2018 高三上学期期末考试19 题。二、二者之间是有联系的人教版新课标选修2-3 第 59 页习题组第 3 题:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 6 页 - - - - - - - - - 例. 某批 n 件产品的次品率为2%,现从中任意地依次抽出3 件进行检验 , 问: (1) 当 n=500,5000,500000 时
5、, 分别以放回和不放回的方式抽取, 恰好抽到 1 件次品的概率各是多少 ? (2) 根据(1) 你对超几何分布与二项分布的关系有何认识?人教版配套的教学参考上给出了如下的答案与解释说明【解】(1) 在不放回的方式抽取中 , 每次抽取时都是从这n 件产品中抽取 , 从而抽到次品的概率都为. 次品数 XB(3, 恰好抽到 1 件次品的概率为P(X=1)=13C2=3。在不放回的方式抽取中 , 抽到的次品数X 是随机变量 ,X 服从超几何分布 ,X 的分布与产品的总数 n 有关, 所以需要分 3 种情况分别计算n=500时, 产品的总数为 500件, 其中次品的件数为 5002%=10,合格品的件数
6、为 490.从 500件产品中抽出 3 件, 其中恰好抽到 1 件次品的概率为057853. 049849950048949030)1(35002490110CCCXPn=5000时, 产品的总数为 5000件, 其中次品的件数为50002%=100, 合格品的件数为4900.从 5000件产品中抽出 3 件, 其中恰好抽到 1 件次品的概率为0576747.049984999500048994900300)1(35000249001100CCCXPn=50000时, 产品的总数为 50000件, 其中次品的件数为500002%=1000, 合格品的件数为 49000.从 50000 件产品中
7、抽出 3 件, 其中恰好抽到 1 件次品的概057626.049998499995000048999490003000)1(35000024900011000CCCXP(2) 根据 (1) 的计算结果可以看出, 当产品的总数很大时, 超几何分布近似为二项分布.这也是可以理解的 , 当产品总数很大而抽出的产品较少时, 每次抽出产品后 , 次品率近似不变, 这样就可以近似看成每次抽样的结果是互相独立的, 抽出产品中的次品件数近似服从二项分布【说明】由于数字比较大, 可以利用计算机或计算器进行数值计算. 另外本题目也可以帮助学生了解超几何分布和二项分布之间的关系:第一,n 次试验中 , 某一事件 A
8、出现的次数 X 可能服从超几何分布或二项分布. 当这 n 次试验是独立重复试验时 ,X 服从二项分布 ; 当这 n 次试验是不放回摸球问题 , 事件 A为摸到某种特性( 如某种颜色 )的球时 ,X 服从超几何分布。第二, 在不放回 n 次摸球试验中 , 摸到某种颜色的次数X服从超几何分布 , 但是当袋子中的球的数目 N 很大时 ,X 的分布列近似于二项分布, 并且随着 N的增加 , 这种近似的精度也增加。从以上分析可以看出两者之间的联系:当调查研究的样本容量非常大时, 在有放回地抽取与无放回地抽取条件下, 计算得到的概率非常接近 , 可以近似把超几何分布认为是二项分布下面看相关例题例 1.(2
9、016 漯河模拟 ) 寒假期间 , 我市某校学生会组织部分同学, 用“10 分制”随机调查“阳光花园”社区人们的幸福度. 现从调查人群中随机抽取16名, 如图所示的茎叶图记录了他们的幸福度分数 (以小数点前的一位数字为茎, 小数点后的一位数字为叶), 若幸福度分名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 6 页 - - - - - - - - - 数不低于分 , 则称该人的幸福度为“幸福”(1) 求从这 16人中随机选取 3 人, 至少有 2 人为“幸福”的概率;(2
10、)以这 16 人的样本数据来估计整个社区的总体数据, 若从该社区 (人数很多 ) 任选 3 人,记表示抽到“幸福”的人数, 求的分布列及数学期望先不要急于看答案 , 大家先自己解一下这道题再往下看, 会有意想不到的收获哦 错解(1) 由茎叶图可知 , 抽取的 16 人中“幸福”的人数有12 人, 其他的有 4 人; 记“从这16 人中随机选取 3 人, 至少有 2 人是“幸福” , ”为事件 A.由题意得140121709140111)(3161122431634CCCCCAP(2)的可能取值为0,1,2,3则14015604)0(31601234CCCP;70956072) 1(316112
11、24CCCP;7033560264)2(31621214CCCP;2811560220) 3(31631204CCCP;所以的分布列为 错解分析 第二问的选人问题是不放回抽样问题, 按照定义先考虑超几何分布, 但是题目中又明确给出 : “以这 16 人的样本数据来估计整个社区的总体数据, 从该社区 ( 人数很多 ) 任选3 人” , 说明不是从 16 人中任选 3人, 而是从该社区 ( 人数很多 ) 任选 3 人, 所以可以近似看作是 3 次独立重复试验 , 应该按照二项分布去求解 , 而不能按照超几何分布去处理【正解】 (1) (1)由茎叶图可知 , 抽取的 16 人中“幸福”的人数有12
12、人, 其他的有 4 人; 记“从这 16人中随机选取 3 人, 至少有 2 人是“幸福” , ”为事件 A.由题意得140121709140111)(3161122431634CCCCCAP2)由茎叶图知任选一人 , 该人幸福度为“幸福”的概率为43,的可能取值为 0,1,2,3,显然)43,3(B则64141)0(3P;6494143) 1(213CP;64274143)2(223CP;642743)3(3P;从以上解题过程中我们还发现, 错解中的期望值与正解中的期望值相等, 好多学生都觉得不可思议 , 怎么会出现相同的结果呢?其实这还是由于前面解释过的原因, 超几何分布与二项分布是有联系的
13、 , 看它们的期望公式: (1) 在含有 M件次品的 N件产品中 , 任取 n 件, 其中恰有 X件次品 , 随机变量服从超几名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 6 页 - - - - - - - - - 何分布 , 超几何分布的期望计算公式为EX=NnM( 可以根据组合数公式以及期望的定义推导);(2) 随机变量 X服从二项分布 , 记作 XB(n,p), EX=np;当超几何分布中的N时,pNM, 此时可以把超几何分布中的不放回抽样问题,近似看作是有放回抽
14、样问题, 再次说明 N时, 可以把超几何分布看作是二项分布。总结:综上可知 , 当提问中涉及 “用样本数据来估计总体数据”字样的为二项分布。高考解题中 , 我们还是要分清超几何分布与二项分布的区别, 以便能正确的解题, 拿到满分。相信各位同学们手中都应该有历年真题卷和2018 的模拟试卷吧 , 快去找几道二项分布和超几何分布的概率大题试试吧, 争取概率满分,加油!再比如:18.( 本小题满分 12 分) (百所名校高考模拟金典卷五)为了调查观众对某电视娱乐节目的喜爱程度, 某人在甲、乙两地各随机抽取了8 名观众做问卷调查 ( 满分 100分), 现将结果统计如下图所示 (1)计算甲、乙两地被抽
15、取的观众的问卷得分的平均分以及方差, 并根据统计知识简单说明丽甲、乙两地观众对该电视娱乐节目的喜爱程度; (2)以频率估计概率 , 若从甲地观众中 再随机抽取3 人进行问卷调查 , 记问卷分数超过80 分的人数为 E,求的分布列与数学期望请看原题答案,居然是错解:正解: (1)同上。(2)因为题中说: 以频率估计概率 , 即以该频率来估计甲地区的整体情况, “若从甲地观众中再随机抽取 3 人”即时强有力的证据,所以此题应为二项分布,而非超几何分布。超过 80分的频率为34,即概率 p=34,的可能取值为 0,1,2,3 ,331(0)1464P x,1213319(1)4464P xC,223
16、3127(2)4464P xC,3327(3)464P x;所以 X的分布列为X0123P16496427642764E(X)=np=94。而下面这道题,就应该是超几何分布啦!18.( 本小题满分 12分)(2018石家庄质检一) 某学校为了解高三复习效果, 从高三第一学期期中考试成绩中随机抽取50 名考生的数学成绩 , 分成 6 组制成频率分布直方图如图所名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 6 页 - - - - - - - - - 示:(1) 求 m的值;
17、 并且计算这 50 名同学数学成绩的样本平均数( ) 该学校为制定下阶段的复习计划, 从成绩在 130,150 的同学中选出3 位作为代表进行座谈 , 记成绩在 140,150 的同学人数为 , 写出的分布列 , 并求出期望。18.解() 由题0.0040.0120.0240.040.012101m解得0.008m 3 分950.004 10105 0.01210 1150.024 10125 0.04101350.012 101450.008 10 x121.8 6 分() 成绩在130,140的同学人数为6,, 在140,150的同学人数为4,从而的可能取值为 0,1,2 ,3,03463
18、10106C CPC,1246310112C CPC21463103210C CPC30463101330C CPC所以的分布列为0123P161231013010 分113160123.6210305E12 分18.( 本小题满分 12分)(2018 百所名校示范卷五)“共享单车”是城市慢行系统的一种模一A城市 B 城市式创新 , 对于解决民众出行“最后一公 1 公里”的问题特别见效 , 由于停取方便、租用价格低廉, 各种共享单车受到人们的热捧. 某机构为了调查人们对此种交通方式的满意度, 从交通拥堵的A 城市和交通严重拥堵的 B 城市分别随机调查了20 个用户 , 得到了一个用户满意度评分
19、的样本, 若评分不低于80分, 则认为该用户对此种交通方式“认可”, 否则认为该用户对此种交通方式“不认可”, 并绘制出茎叶图如图。 (1)请根据此样本完成下面的22 列联表 ,并据此样本分析是否能在犯错的概率不超过10% 的情况下认为交通拥堵与认可共享单车有关; (2)若以 A城抽取的这 20 个用户的样本数据来估计整个A城的总体数据 , 现从 A城任选3 名用户 , 记 X表示抽到用户为对此种交通方式“认可”的人数, 求 X的分布列及数学期望参考公式 :22(),()()()()n adbcKab cdac bd其中 n=a+b+c+d.参考数据 :P(K2 k0)k0名师资料总结 - -
20、 -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 6 页 - - - - - - - - - 解: (1)K2的观测值k=240(5 1010 15)82.706,2020 15253所以不能在犯错误的概率不超过10% 的情况下认为城市拥堵与认可共享单车有关。(2)X的可能取值为 0,1,2,33327(0)464P x,2131327(1)4464P xC,223139(2)4464P xC,311(3)464P x;所以 X的分布列为X0123P27642764964164E(X)=np=34。AB合计认可51015不认可151525合计202040名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 6 页 - - - - - - - - -