《统计学率抽样误差和可信区间PPT课件.ppt》由会员分享,可在线阅读,更多相关《统计学率抽样误差和可信区间PPT课件.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于统计学率的抽样误差与关于统计学率的抽样误差与可信区间可信区间第一张,PPT共四十八页,创作于2022年6月二项分布二项分布(扩展)扩展)Binomial Distribution第二张,PPT共四十八页,创作于2022年6月 Bernoulli试验(贝努里试验)试验(贝努里试验)这类事件往往具有以下特点:这类事件往往具有以下特点:每次试验的结果,只能是互斥的两个结果每次试验的结果,只能是互斥的两个结果之之一一(或或);在试验条件不变的前提下,每次试验结果在试验条件不变的前提下,每次试验结果(或(或)发生的概率)发生的概率是恒定的;是恒定的;每次试验的结果是相互独立的,即本次结每次试验的结果
2、是相互独立的,即本次结果与前次结果无关;果与前次结果无关;第三张,PPT共四十八页,创作于2022年6月二项分布二项分布是指在只会产生两种可能结果之一的是指在只会产生两种可能结果之一的 重重Bernoulli试验中。出现试验中。出现“阳性阳性”的次的次数数X=0,1,2,n 的一种概率分的一种概率分布。布。在医学种类似如这种在医学种类似如这种 重重Bernoulli试试验的情形较为多见。验的情形较为多见。第四张,PPT共四十八页,创作于2022年6月数学中二项式定理数学中二项式定理第五张,PPT共四十八页,创作于2022年6月流行病学调查结果中某病的发病与不流行病学调查结果中某病的发病与不发病
3、;发病;染毒试验中动物的生存与死亡;染毒试验中动物的生存与死亡;化验结果的阳性与阴性;化验结果的阳性与阴性;药品质量检查结果的合格与不合格;药品质量检查结果的合格与不合格;常见的二项分布现象常见的二项分布现象:第六张,PPT共四十八页,创作于2022年6月二项分布计算二项分布计算已证明已证明在在 次试验中次试验中,事件事件 恰好发生恰好发生 次次,(0 n)的概率为:)的概率为:式中,式中,:阳性率,:阳性率,:阳性数,:阳性数,:样本:样本例数,例数,:从:从 抽出抽出 个的组合数。个的组合数。第七张,PPT共四十八页,创作于2022年6月 例题:已知小白鼠接受一定剂量的某种例题:已知小白鼠
4、接受一定剂量的某种毒物后,其死亡率为毒物后,其死亡率为80%80%。根据概率的乘法法则根据概率的乘法法则(几个独立事件同时几个独立事件同时发生的概率,等于各独立事件的概率之积发生的概率,等于各独立事件的概率之积),按下式可算出每种结果的概率:,按下式可算出每种结果的概率:第八张,PPT共四十八页,创作于2022年6月求小鼠死亡数求小鼠死亡数X=X=0 0,1 1,2 2,3 3只的概率?只的概率?本例n=3,P=0.8,X X=0=0,1 1,2 2,3 3第九张,PPT共四十八页,创作于2022年6月又又由由于于每每次次试试验验的的结结果果只只能能是是两两种种互互斥斥的的结结果果之之一一(生
5、生或或死死)。则则根根据据概概率率的的加加法法法法则则(互互不不相相容容事事件件和和的的概概率率等等于于各各事事件件的的概概率率之之和和),于于是是算算得得死死亡亡数数分别为分别为0,1,2,3时的概率;见下表:时的概率;见下表:第十张,PPT共四十八页,创作于2022年6月三只小白鼠存亡的排列和组合方式及其概率的计算三只小白鼠存亡的排列和组合方式及其概率的计算 所有可出所有可出现能结果现能结果 甲甲 乙乙 丙丙 每种结果的概率每种结果的概率 死亡数死亡数生存数生存数 不同死亡数不同死亡数的概率的概率(1 1)(2 2)(3 3)(4 4)(5 5)生生 生生 生生 0.20.20.2=0.0
6、08 0 3 0.0080.20.20.2=0.008 0 3 0.008生生 生生 死死 0.20.20.8=0.0320.20.20.8=0.032生生 死死 生生 0.20.80.2=0.032 1 2 0.0960.20.80.2=0.032 1 2 0.096死死 生生 生生 0.80.20.2=0.0320.80.20.2=0.032生生 死死 死死 0.20.80.8=0.1280.20.80.8=0.128死死 生生 死死 0.80.20.8=0.128 2 1 0.80.20.8=0.128 2 1 0.3840.384死死 死死 生生 0.80.80.8=0.1280.80
7、.80.8=0.128死死 死死 死死 0.80.80.8=0.512 0.80.80.8=0.512 3 0 3 0 0.5120.512 第十一张,PPT共四十八页,创作于2022年6月课堂练习:课堂练习:已知用某种药物治疗某种疾病的有效率为已知用某种药物治疗某种疾病的有效率为0.60。仅用该药治疗病患者。仅用该药治疗病患者20人,试计算其人,试计算其中有中有12人有效的概率。人有效的概率。第十二张,PPT共四十八页,创作于2022年6月二项分布的性质二项分布的性质 在二项分布资料中,当在二项分布资料中,当 和和 已知时,已知时,它的均值它的均值 、方差、方差 及其标准差及其标准差 可由可
8、由下式算出。下式算出。总体均数为总体均数为总体方差为总体方差为总体标准差为总体标准差为第十三张,PPT共四十八页,创作于2022年6月用率表示则:用率表示则:样本率样本率 P P 的总体均数为的总体均数为P P 总体方差为总体方差为P P 总体标准差为总体标准差为一般情况下,是未知的一般情况下,是未知的以以样样本率本率P P 来估来估计计,则则 的估计值为的估计值为第十四张,PPT共四十八页,创作于2022年6月 求平均死亡鼠数及平均死亡数的标准差。求平均死亡鼠数及平均死亡数的标准差。以 =0.8,=3代入式得:平均死亡鼠数 =30.8=2.4(只)标准差为:第十五张,PPT共四十八页,创作于
9、2022年6月例题:某年某地随机抽查例题:某年某地随机抽查4 4岁儿童岁儿童5050名,患龋齿者名,患龋齿者4141名,名,求该地求该地4 4岁儿童龋齿患病率的标准误。岁儿童龋齿患病率的标准误。该该地地4岁岁儿儿童童龋龋齿齿患患病病率率P=41/50=0.82P=41/50=0.82,n=50n=50,代入公式得:,代入公式得:该地该地4 4岁儿童龋齿患病率的标准误为岁儿童龋齿患病率的标准误为0.0540.054。第十六张,PPT共四十八页,创作于2022年6月二项分布的累计概率:二项分布的累计概率:最多有最多有k k 例阳性的概率例阳性的概率为为最少有最少有k k 例阳性的概率例阳性的概率为
10、为第十七张,PPT共四十八页,创作于2022年6月例题:已知某药对某病的有效率是例题:已知某药对某病的有效率是60%60%,现同,现同时收治该病患者时收治该病患者5 5人,求:人,求:最多有最多有3 3例有效的概率例有效的概率 第十八张,PPT共四十八页,创作于2022年6月最少有最少有3 3例有效的概率例有效的概率第十九张,PPT共四十八页,创作于2022年6月二项分布的图形二项分布的图形二项分布示意图二项分布示意图第二十张,PPT共四十八页,创作于2022年6月二项分布的应用二项分布的应用 -统计推断统计推断总体率区间估计总体率区间估计样本率与总体率的比较样本率与总体率的比较两样本率的比较
11、两样本率的比较第二十一张,PPT共四十八页,创作于2022年6月一、总体率区间估计一、总体率区间估计查表法查表法正态分布法正态分布法 (近似正态分布的条件)(近似正态分布的条件)公式:公式:第二十二张,PPT共四十八页,创作于2022年6月 二、样本率与总体率的比较二、样本率与总体率的比较例题:新生儿染色体异常率为例题:新生儿染色体异常率为0.010.01,随机抽,随机抽取某地取某地400400名新生儿,发现名新生儿,发现1 1名染色体异常,名染色体异常,请问当地新生儿染色体异常是否低于一般?请问当地新生儿染色体异常是否低于一般?分析题意,选择合适的计算统计量的方法。分析题意,选择合适的计算统
12、计量的方法。第二十三张,PPT共四十八页,创作于2022年6月正态近似法:正态近似法:第二十四张,PPT共四十八页,创作于2022年6月例:已知某地例:已知某地40岁以上成人高血压患病率为岁以上成人高血压患病率为8%,经健康教育数年后,随机抽查,经健康教育数年后,随机抽查2000人,人,查出高血压患者查出高血压患者100例,问健康教育是否有例,问健康教育是否有效?效?第二十五张,PPT共四十八页,创作于2022年6月 三、两样本率的比较三、两样本率的比较 统计量统计量u u的计算公式:的计算公式:第二十六张,PPT共四十八页,创作于2022年6月例例:为研究某地男女学生的肺吸虫感染率是否为研究
13、某地男女学生的肺吸虫感染率是否存在差别,研究者随机抽取该地存在差别,研究者随机抽取该地8080名男生和名男生和8585名女生,查得感染人数男生名女生,查得感染人数男生2323人,女生人,女生1313人,人,请问男女之间的感染是否有差别?请问男女之间的感染是否有差别?第二十七张,PPT共四十八页,创作于2022年6月 Poisson-distribution 泊松分布第二十八张,PPT共四十八页,创作于2022年6月PoissonPoisson分布的意义分布的意义盒子中装有盒子中装有999999个黑棋子,一个白棋子,在个黑棋子,一个白棋子,在一次抽样中,抽中白棋子的概率一次抽样中,抽中白棋子的概
14、率1/10001/1000在在100100次抽样中,抽中次抽样中,抽中1 1,2 2,1010个白棋子个白棋子的概率分别是的概率分别是第二十九张,PPT共四十八页,创作于2022年6月放射性物质单位时间内的放射次数放射性物质单位时间内的放射次数单位体积内粉尘的计数单位体积内粉尘的计数单位面积内细菌计数单位面积内细菌计数人群中患病率很低的非传染性疾病的患病数人群中患病率很低的非传染性疾病的患病数特点:罕见事件发生数的分布规律特点:罕见事件发生数的分布规律第三十张,PPT共四十八页,创作于2022年6月主要内容PoissonPoisson的概念的概念PoissonPoisson分布的条件分布的条件
15、PoissonPoisson分布的特点分布的特点PoissonPoisson分布的应用分布的应用第三十一张,PPT共四十八页,创作于2022年6月Poisson的概念常用于描述单位时间、单位平面或单位空常用于描述单位时间、单位平面或单位空间中罕见间中罕见“质点质点”总数的随机分布规律。总数的随机分布规律。罕见事件的发生数为罕见事件的发生数为X X,则,则X X服从服从PiossonPiosson分布。分布。记为:记为:X X P P()。第三十二张,PPT共四十八页,创作于2022年6月PiossonPiosson分布的总体均数分布的总体均数为为 PiossonPiosson分布的均数和方差相
16、等。分布的均数和方差相等。2 2 第三十三张,PPT共四十八页,创作于2022年6月Poisson分布的条件由于由于PoissonPoisson分布是二项分布的特例,所以,二分布是二项分布的特例,所以,二项分布的三个条件也就是项分布的三个条件也就是PoissonPoisson分布的适用条分布的适用条件。件。另外,单位时间、面积或容积、人群中观察事另外,单位时间、面积或容积、人群中观察事件的分布应该均匀,才符合件的分布应该均匀,才符合PoissonPoisson分布。分布。第三十四张,PPT共四十八页,创作于2022年6月Poisson分布的特点PoissonPoisson分布的图形分布的图形P
17、oissonPoisson分布的可加性分布的可加性PoissonPoisson分布与正态分布及二项分布的关系。分布与正态分布及二项分布的关系。第三十五张,PPT共四十八页,创作于2022年6月()取不同值时的)取不同值时的PoissonPoisson分布图分布图 第三十六张,PPT共四十八页,创作于2022年6月Poisson分布的可加性 观察某一现象的发生数时,如果它呈观察某一现象的发生数时,如果它呈PoissonPoisson分布,那么把若干个小单位合并分布,那么把若干个小单位合并为一个大单位后,其总计数亦呈为一个大单位后,其总计数亦呈PoissonPoisson分布。分布。第三十七张,P
18、PT共四十八页,创作于2022年6月PoissonPoisson分布与正态分布及二项分布的分布与正态分布及二项分布的关系关系当当 较小时,较小时,PoissonPoisson分布呈偏态分布,分布呈偏态分布,随着随着 增大,迅速接近正态分布,当增大,迅速接近正态分布,当2020时时,可以认为近似正态分布。,可以认为近似正态分布。PoissonPoisson分布分布是二项分布的特例是二项分布的特例,某现象的发生率,某现象的发生率 很小,而样本例数很小,而样本例数n n很大时,则二项分布接近于很大时,则二项分布接近于PoissonPoisson分布。分布。第三十八张,PPT共四十八页,创作于2022
19、年6月例:据以往经验,新生儿染色体异常率为例:据以往经验,新生儿染色体异常率为1%,求,求100名新生儿中发生名新生儿中发生x例(例(x=0,1,2)染色体异常的概率。染色体异常的概率。第三十九张,PPT共四十八页,创作于2022年6月X XP P(X X)二二项分布分布PiossonPiosson分布分布0 00.36600.36600.36790.36791 10.36970.36970.36790.36792 20.18490.18490.18390.18393 30.06100.06100.06130.06134 40.01490.01490.01530.01535 50.00290.
20、00290.00310.00316 60.00050.00050.00050.00057 70.00010.00010.00010.0001880.00000.00000.00000.00001.00001.00001.00001.0000第四十张,PPT共四十八页,创作于2022年6月PoissonPoisson分布的应用分布的应用总体均数的区间估计总体均数的区间估计样本均数与总体均数的比较样本均数与总体均数的比较两样本均数的比较两样本均数的比较第四十一张,PPT共四十八页,创作于2022年6月总体均数的区间估计总体均数的区间估计查表法:查表法:将一个面积为将一个面积为100cm100cm2
21、 2的培养皿置于某病房,的培养皿置于某病房,1 1小时后小时后取出,培养取出,培养2424小时,查得小时,查得8 8个菌落,求该病房平均个菌落,求该病房平均1 1小时小时100cm100cm2 2细菌数的细菌数的9595的可信区间。的可信区间。正态近似法:正态近似法:当样本计数当样本计数X(X(亦即亦即 )较大时,)较大时,PoissonPoisson分分布近似正态分布,可用公式:布近似正态分布,可用公式:第四十二张,PPT共四十八页,创作于2022年6月样本均数与总体均数的比较样本均数与总体均数的比较直接概率法:直接概率法:例:一般人群食管癌的发生率为例:一般人群食管癌的发生率为8/1000
22、08/10000。某研。某研究者在当地随机抽取究者在当地随机抽取500500人,结果人,结果6 6人患食管癌。人患食管癌。请问当地食管癌是否高于一般?请问当地食管癌是否高于一般?第四十三张,PPT共四十八页,创作于2022年6月样本均数与总体均数的比较样本均数与总体均数的比较正态近似法:统计量正态近似法:统计量 例题:某溶液原来平均每毫升有细菌例题:某溶液原来平均每毫升有细菌8080个,现想了解某个,现想了解某低剂量辐射能的杀菌效果。研究者以此剂量照射该溶低剂量辐射能的杀菌效果。研究者以此剂量照射该溶液后取液后取1 1毫升,培养得细菌毫升,培养得细菌4040个。请问该剂量的辐射能个。请问该剂量
23、的辐射能是否有效?是否有效?第四十四张,PPT共四十八页,创作于2022年6月假设检验过程假设检验过程1.1.建立假设:建立假设:H H0 0 :=80=80 H H1 1 :80802.2.确定显著性水平,确定显著性水平,取取0.050.05。3.3.计算统计量计算统计量u u :4.4.求概率值求概率值P P:单侧:单侧5.5.做出推论做出推论第四十五张,PPT共四十八页,创作于2022年6月两样本均数的比较两样本均数的比较两个样本观察单位相同时:计算统计量两个样本观察单位相同时:计算统计量两个样本观察单位不同时:两个样本观察单位不同时:第四十六张,PPT共四十八页,创作于2022年6月例题:例题:为研究两个水源被污染的情况是否相同,在为研究两个水源被污染的情况是否相同,在每个水源各取每个水源各取10ml10ml水坐细菌培养,结果甲水水坐细菌培养,结果甲水源样品中测得菌落源样品中测得菌落890890个,乙水源样品测得个,乙水源样品测得菌落菌落785785个。请问两个水源的污染情况是否个。请问两个水源的污染情况是否不同?不同?第四十七张,PPT共四十八页,创作于2022年6月感感谢谢大大家家观观看看第四十八张,PPT共四十八页,创作于2022年6月