《概率与数理统计第16讲.ppt》由会员分享,可在线阅读,更多相关《概率与数理统计第16讲.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章第五章 极限定理极限定理下面的强大数定律将下面的强大数定律将(2.1)(2.1)进行了推广进行了推广.是是n n次试验中的成功次数次试验中的成功次数.则则在在n n次独立重复试验中次独立重复试验中,引入引入由概率的频率定义知道由概率的频率定义知道,对于成功的频率对于成功的频率,有有5.2 大数律大数律.称随机变量的序列称随机变量的序列为为随机序列随机序列(random sequence).(random sequence).其含义是其含义是n n很大时很大时,与与 有非零差距的可能性有非零差距的可能性很小。很小。定义定义2.1.2.1.设设 是随机序列,是随机序列,是随机变量,是随机变量
2、,如果对如果对任意的任意的 0 0,有,有则称序列则称序列 依概率收敛于依概率收敛于 .记为记为 设随机序列设随机序列 独立同分布独立同分布,并且并且 有限,则有有限,则有 定理定理2.1.通常把类似于通常把类似于2.52.5的结论称为的结论称为弱大数律弱大数律(weak law of large numbers).(weak law of large numbers).例例1.(接接4.1 4.1 的例的例1.41.4)在赌对子时在赌对子时,甲每次下注甲每次下注100100元元.如果他连续如果他连续下注下注n n次次,证明他的盈利证明他的盈利SnSn满足满足 和定理和定理2.12.1得到得到
3、,n ,n 时时,证明证明:用用XiXi表示甲第表示甲第i i次下注的盈利次下注的盈利,则则X1,X2,X1,X2,XnXn独立同分布独立同分布.由由4.14.1的例的例1.41.4知知利用利用P(Sn 18n)P(|0.6)于是于是,P(Sn 18n)=1 P(Sn 18n)1.说明下注的次数说明下注的次数n n越多越多,至少输至少输18n18n元的概率越大。元的概率越大。设设 是随机序列是随机序列,是随机变量是随机变量,定义定义2.2.如果如果则称序列则称序列 以概率以概率1 1收敛于收敛于 .wp1 或或 a.s.。记为记为 类似于类似于(2.6)(2.6)的结果称为的结果称为强大数律强
4、大数律 (strong law(strong law of large numbers).of large numbers).从强大数律结论从强大数律结论(2.6)(2.6)知道概知道概率的频率定义是合理的。率的频率定义是合理的。定理定理2.32.3.如果如果 wp1.则则强大数律结论比弱大数律结论要强强大数律结论比弱大数律结论要强:设随机序列设随机序列 独立同分布独立同分布,并且并且 ,则有则有 定理定理2.22.2.证明证明:设设 p p 是任意小的正数是任意小的正数,事件事件A1,AA1,A22相互独立相互独立,P(Ai)=P(Ai)=p.p.用用 I IAi Ai 表示表示AiAi的示
5、性函数,则的示性函数,则 IAiIAi 独立同分布独立同分布.由强大数律得到:由强大数律得到:所以所以说明有无穷个说明有无穷个AiAi发生的概率是发生的概率是1.1.例例2 2.在多次独立重复试验过程中在多次独立重复试验过程中,小概率事件必然发小概率事件必然发生生.5.3 中心极限定理中心极限定理 强大数律和弱大数律分别讨论了随机序列部分和强大数律和弱大数律分别讨论了随机序列部分和的依概率收敛和以概率的依概率收敛和以概率1 1收敛收敛.中心极限定理讨论对充分大的中心极限定理讨论对充分大的n,n,随机变量序列随机变量序列部分和部分和 X1+X2+Xn X1+X2+Xn 的概率分布问题的概率分布问
6、题.令令 Sn=X1+X2+Xn.则则SnSn为为n n次独立试验中成功的次数次独立试验中成功的次数,Sn B(n,p)。从演示看出从演示看出 时时,Sn,Sn的分布形状很象正态分布的分布形状很象正态分布。例例3.3.二项分布二项分布 则则Xj iid B(1,p)(两点分布两点分布)。独立地重复某一试验,设独立地重复某一试验,设 若若Xjiid P(),Xjiid P(),则由则由3.43.4的例的例4.14.1知道部分和知道部分和例例4.4.Poisson(Poisson(泊松泊松)分布分布从演示看出从演示看出 时时,Sn,Sn的分布形状很象正态分布的分布形状很象正态分布。例例5.5.几何
7、分布部分和几何分布部分和 设设XjXj独立同分布都服从几何分布独立同分布都服从几何分布上述分布称为上述分布称为帕斯卡分布帕斯卡分布.可以将可以将 Sn=X1+X2+Xn Sn=X1+X2+Xn 设想成第设想成第n n次击中次击中目标时的射击次数目标时的射击次数(参考几何分布的背景参考几何分布的背景),),于是得到于是得到从演示看出从演示看出 时时,Sn,Sn的分布形状很象正态分布的分布形状很象正态分布。注:得到第注:得到第n n次成功前失败的次数次成功前失败的次数Y Y的分布称为的分布称为负二项分布负二项分布,易见,易见且且Sn=Y+n.定理定理3.13.1.(中心极限定理中心极限定理)这里这
8、里 是标准正态分布的分布函数是标准正态分布的分布函数.设随机序列设随机序列 Xj 独立同分布独立同分布,有共同有共同的数学期的数学期望望 和方差和方差 .部分和部分和Sn=X1 X2 Xn,则则SnSn的标准化的标准化依分布收敛依分布收敛到到标准正态分布标准正态分布.即对任何即对任何x,x,(3.2)我们把结论我们把结论(3.2)(3.2)记成记成 ,其中其中的的d d表示依分布收敛表示依分布收敛.中心极限定理是概率论中最著名的结果之一,中心极限定理是概率论中最著名的结果之一,它不仅提供了计算独立随机变量之和的近似概率的它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释简单方
9、法,而且有助于解释为什么很多自然群体的为什么很多自然群体的经验频率呈现出钟形曲线经验频率呈现出钟形曲线这一值得注意的事实这一值得注意的事实.中心极限定理的应用中心极限定理的应用:可以用可以用 N(0,1)N(0,1)近似计算关于近似计算关于 的概率,的概率,用用N(n ,n 2)近似计算关于近似计算关于 SnSn 的概率的概率。例例6.6.近似计算近似计算 当辐射的强度超过每小时当辐射的强度超过每小时0.50.5毫伦琴毫伦琴(mr)(mr)时时,辐辐射会对人的健康造成伤害射会对人的健康造成伤害.设一台彩电工作时的平设一台彩电工作时的平均辐射强度是均辐射强度是0.036(mr/h),0.036(
10、mr/h),方差是方差是0.0081.0.0081.则家庭则家庭中一台彩电的辐射一般不会对人造成健康伤害中一台彩电的辐射一般不会对人造成健康伤害.但但是彩电销售店同时有多台彩电同时工作时是彩电销售店同时有多台彩电同时工作时,辐射可能辐射可能对人造成健康伤害对人造成健康伤害.现在有现在有1616台彩电同时工作台彩电同时工作,问这问这 1616 台彩电的辐射量可以对人造成健康伤害的概率台彩电的辐射量可以对人造成健康伤害的概率.例例6.6.近似计算近似计算(续续)近似服从近似服从N(0,1)N(0,1)分布分布,于是于是解解:用用XiXi表示第表示第i i台彩电的辐射量台彩电的辐射量(mr/h),(
11、mr/h),则则XiXi的数学期望的数学期望 =0.036,=0.036,方差方差 =0.0081.0.0081.Sn=X1+X2+Sn=X1+X2+X16+X16 是是n=16n=16台彩电的辐射量台彩电的辐射量.题目要求题目要求P(Sn 0.5).P(Sn 0.5).认为认为 XiXi独立同分布时独立同分布时,按照定理按照定理3.1,3.1,例例6 6.近似计算近似计算(续续)这这1616台彩电以大约台彩电以大约58%58%的概率会对人造成健康的概率会对人造成健康伤害伤害.二项分布的正态近似二项分布的正态近似推论推论3.33.3.设设Sn B(n,p),p=1-q (0,1),则则 例例7
12、.7.用正态分布计算二项分布用正态分布计算二项分布 设设Sn B(n,p),则则SnSn近似近似 N(np,npq)分布分布,设设X N(np,npq),设设a,ba,b为非负整数。由中心极限定为非负整数。由中心极限定理理,n,n 较大时较大时但是注意但是注意SnSn是取整数值的,所以是取整数值的,所以上式右端用正态近似和上式右端用正态近似和(*)(*)不同。不同。例例7.7.用正态分布计算二项分布用正态分布计算二项分布(续续)为此取折衷,令为此取折衷,令称为连续性校正。此近似公式应在称为连续性校正。此近似公式应在 n n 充分大时使用,充分大时使用,实际规则可以用实际规则可以用 min(np
13、,nq)5 min(np,nq)5。例例7.7.用正态分布计算二项分布用正态分布计算二项分布(续续)特别地,特别地,某药厂试制了一种新药某药厂试制了一种新药,声称对贫血的治疗有效率达声称对贫血的治疗有效率达到到80%.80%.医药监管部门准备对医药监管部门准备对100100个贫血患者进行此药个贫血患者进行此药的疗效试验的疗效试验,若这若这100100人中至少有人中至少有7575人用药有效人用药有效,就批就批准此药的生产准此药的生产.如果该药的有效率确实达到如果该药的有效率确实达到 80%,80%,此此药被批准生产的概率是多少药被批准生产的概率是多少?解解:用用 Sn Sn表示这表示这n(=10
14、0)n(=100)个患者中用药后有效的人数个患者中用药后有效的人数.如果该药的有效率确实是如果该药的有效率确实是 p=80%,p=80%,则则 Sn B(n,p).由由 100p=805,100(1-p)=205,100p=805,100(1-p)=205,知道可用近似公式知道可用近似公式(3.4)(3.4).于是于是例例8.8.例例8 8.(续)续)如果有效率如果有效率p80%,p80%,则获得批准的概率则获得批准的概率92%(92%(参考习参考习题题7.29).7.29).统计学的做法分为两种:统计学的做法分为两种:描述性统计描述性统计推断性统计推断性统计 第六章第六章 描述性统计描述性统
15、计6.1 6.1 总体和参数总体和参数A.总体、个体和均值总体、个体和均值所要调查的对象全体叫做所要调查的对象全体叫做总体总体(population),(population),总体中每个成员叫做总体中每个成员叫做个体个体。总体一般用随机变量作为数学模型。总体一般用随机变量作为数学模型。总体参数总体参数是描述总体特性的指标,简称是描述总体特性的指标,简称参数参数。总体平均总体平均或或总体均值总体均值是参数。常用是参数。常用 表示。表示。如果知道总体的全部个体如果知道总体的全部个体 则则总体方差总体方差是参数。常记为是参数。常记为 。如果知道总体的全部个体如果知道总体的全部个体 则则 称为称为总
16、体标准差总体标准差。B.样本与估计样本与估计如果总体只有有限个样本如果总体只有有限个样本,虽然可以测量所有样本虽然可以测量所有样本计算总体参数,但可能会消耗过大。计算总体参数,但可能会消耗过大。有些总体有无限个个体,比如,对某放射性物质测量有些总体有无限个个体,比如,对某放射性物质测量固定长度时间内放射出的粒子数,每试验一次就有一固定长度时间内放射出的粒子数,每试验一次就有一个不同结果。个不同结果。为了得到总体的信息,可以从总体中抽取一个为了得到总体的信息,可以从总体中抽取一个有有代表性代表性的个体的集合的个体的集合,称为总体的一个称为总体的一个样本样本。也。也叫叫观测数据观测数据。样本中个体
17、的个数叫做样本中个体的个数叫做样本量样本量(sample size)(sample size)。试图用样本的情况去判断总体的情况。试图用样本的情况去判断总体的情况。从总体中抽取样本的工作叫做从总体中抽取样本的工作叫做抽样抽样(sampling)(sampling)。设一个样本为设一个样本为 ,可计算可计算样本均值样本均值和和样本样本方差方差s s 称为称为样本标准差样本标准差。6.26.2 抽样调查方法抽样调查方法A.抽样调查的可行性和必要性抽样调查的可行性和必要性抽样的可行性:汤的例子抽样的可行性:汤的例子样本的随机性样本的随机性(代表性代表性)适当的样本量。适当的样本量。样本量不必随总体增
18、大而增大。样本量不必随总体增大而增大。6.26.2 抽样调查方法抽样调查方法A.抽样调查的可行性和必要性抽样调查的可行性和必要性为为了从样本推断总体的情况,样本的代表性是最关键了从样本推断总体的情况,样本的代表性是最关键的问题。的问题。调查全部总体不现实或不必要,如调查全部总体不现实或不必要,如:寿命试验。寿命试验。抽样调查因为工作量较小所以有时比普查可以更准确。抽样调查因为工作量较小所以有时比普查可以更准确。B.B.随机抽样随机抽样如果总体中的每个个体都有相同的机会被抽中,就称这如果总体中的每个个体都有相同的机会被抽中,就称这样的抽样方法为样的抽样方法为随机抽样随机抽样方法。方法。简单地分,
19、抽样分为有放回抽取和无放回抽取。无放回简单地分,抽样分为有放回抽取和无放回抽取。无放回抽取从实现上和从精度上更好,总体容量抽取从实现上和从精度上更好,总体容量(N)(N)很大时两很大时两者差异很小。者差异很小。提高样本量可以提高估计精度,但不是总体越大样本量提高样本量可以提高估计精度,但不是总体越大样本量也需要随之增大也需要随之增大。C.C.随机抽样的无偏性随机抽样的无偏性从总体从总体 X X 中等可能地随机抽取,不论是有放回还是中等可能地随机抽取,不论是有放回还是无放回,得到的无放回,得到的 X1,X2,X1,X2,Xn,Xn看成随机变量,都看成随机变量,都可以证明可以证明 。样本在需要讨论
20、其分布性质时看成随机变量,记做大样本在需要讨论其分布性质时看成随机变量,记做大写的写的X1,X2,X1,X2,Xn,Xn,在讨论样本的具体取值时看成普在讨论样本的具体取值时看成普通数值,记做小写的通数值,记做小写的 x1,x2,xn x1,x2,xn。例:例:“文学摘要文学摘要”杂志调查失败的原因:代表性发生偏杂志调查失败的原因:代表性发生偏差。差。D.D.分层抽样方法分层抽样方法总体当中分为不同人群时总体当中分为不同人群时(如城镇和乡村如城镇和乡村),虽然仍然,虽然仍然进行等可能随机抽样,但这样会产生混杂。进行等可能随机抽样,但这样会产生混杂。好的作法是按人口比例在不同人群中分别进行随机抽好的作法是按人口比例在不同人群中分别进行随机抽样。样。计算平均值等统计量时要用计算平均值等统计量时要用加权加权求和(平均)计算。求和(平均)计算。D.D.分层抽样方法分层抽样方法优点优点:同时得到分层的统计量。同时得到分层的统计量。容易保证样本代表性从而提高精度。容易保证样本代表性从而提高精度。实施容易。实施容易。E.E.系统抽样系统抽样 根据某种固定规律抽取根据某种固定规律抽取。作业:作业:149149页页 5.12;5.16;5.18.5.12;5.16;5.18.179179页页 6.66.6.