《概率概率分布与抽样分布学习教案.pptx》由会员分享,可在线阅读,更多相关《概率概率分布与抽样分布学习教案.pptx(108页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1概率概率(gil)概率概率(gil)分布与抽样分布分布与抽样分布第一页,共108页。3.1.1 试验试验(shyn)、事件与样本空、事件与样本空间间第1页/共108页第二页,共108页。必然必然(brn)现象现象与随机现象与随机现象n n必然现象(确定性现象)必然现象(确定性现象)n n变化结果是事先可以确定的,一定的条件必然导致某一变化结果是事先可以确定的,一定的条件必然导致某一结果结果n n这种关系通常可以用公式或定律来表示这种关系通常可以用公式或定律来表示n n随机随机(su j)(su j)现象(偶然现象、不确定现象)现象(偶然现象、不确定现象)n n在一定条件下可能发生也可能
2、不发生的现象在一定条件下可能发生也可能不发生的现象n n个别观察的结果完全是偶然的、随机个别观察的结果完全是偶然的、随机(su j)(su j)会而定会而定n n大量观察的结果会呈现出某种规律性大量观察的结果会呈现出某种规律性n n (随机(随机(su j)(su j)性中寓含着规律性)性中寓含着规律性)统计规律性统计规律性十五的夜晚(ywn)能看见月亮?十五的月亮比初十圆!第2页/共108页第三页,共108页。随机随机(su j)试验试验n n严格意义上的随机试验满足三个条件:n n试验可以在系统条件下重复(chngf)进行;n n试验的所有可能结果是明确可知的;n n每次试验前不能肯定哪一
3、个结果会出现。n n广义的随机试验是指对随机现象的观察(或实验)。n n实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。第3页/共108页第四页,共108页。随机随机(su j)事件(事件)事件(事件)n n随机事件(简称(jinchng)事件)n n随机试验的每一个可能结果n n常用大写英文字母A、B、来表示n n基本事件(样本点)n n不可能再分成为两个或更多事件的事件n n样本空间()n n基本事件的全体(全集)第4页/共108页第五页,共108页。随机随机(su j)事件(续)事件(续)n n复合事件复合事件n n由某些基本事件组合而成的事件由某些基本事件组合而成的事件n
4、 n样本空间中的子集样本空间中的子集n n随机事件的两种特例随机事件的两种特例n n必然事件必然事件n n在一定条件下,每次试验都必然发生在一定条件下,每次试验都必然发生的事件的事件n n只有样本空间只有样本空间 才是必然事件才是必然事件 n n 不可能事件不可能事件n n在一定条件下,每次试验都必然不会在一定条件下,每次试验都必然不会发生的事件发生的事件n n不可能事件是一个不可能事件是一个(y(y )空集(空集()第5页/共108页第六页,共108页。3.1.2 事件事件(shjin)的的概率概率 1.1.1.古典古典古典(g(g(g di didi n)n)n)概率概率概率 2.2.2.
5、统计概率统计概率统计概率 3.3.3.主观概率主观概率主观概率 第6页/共108页第七页,共108页。随机随机(su j)事件的概率事件的概率n n概率n n用来(yn li)度量随机事件发生的可能性大小的数值n n必然事件的概率为1,表示为P()=1n n不可能事件发生的可能性是零,P()=0n n随机事件A的概率介于0和1之间,0P(A)1,P(A)+P(B)1,显然显然P(AP(AB)P(A)B)P(A)P(B)P(B)n n因为因为(yn wi)A(yn wi)A和和B B存在共同部分存在共同部分ABAB5,7,95,7,9,P(AB)P(AB)3/103/10。在。在P(A)+P(B
6、)P(A)+P(B)中中P(AB)P(AB)被重复计算了。被重复计算了。n n正确计算是:正确计算是:n n P(A P(AB)B)5/105/106/106/103/103/108/108/100.80.8第21页/共108页第二十二页,共108页。3.1.4 3.1.4 条件条件(tiojin)(tiojin)概率与事件的概率与事件的独立性独立性n n用于计算两个事件(shjin)同时发生的概率。n n也即“A发生且B发生”的概率 P(AB)n n先关注事件(shjin)是否相互独立 第22页/共108页第二十三页,共108页。(1)条件)条件(tiojin)概概率率n n条件概率(gil
7、)在某些附加条件下计算的概率(gil)n n在已知事件B已经发生的条件下A发生的条件概率(gil)P(A|B)n n条件概率(gil)的一般公式:其中(qzhng)P(B)0 第23页/共108页第二十四页,共108页。【例例3-5】n n某公司甲乙两厂生产某公司甲乙两厂生产(shngch(shngch n)n)同种产品。甲厂生产同种产品。甲厂生产(shngch(shngch n)400n)400件,其中一级品为件,其中一级品为280280件;乙厂生产件;乙厂生产(shngch(shngch n)600n)600件,其中一级品有件,其中一级品有360360件。若要从该厂的全部产品件。若要从该厂
8、的全部产品中任意抽取一件,试求:中任意抽取一件,试求:已知抽出产品为一级品的条件下该产品已知抽出产品为一级品的条件下该产品出自甲厂的概率;出自甲厂的概率;已知抽出产品出自甲厂的条件下该产品为一级已知抽出产品出自甲厂的条件下该产品为一级品的概率。品的概率。n n解:设解:设A A“甲厂产品甲厂产品”,B B“一级品一级品”,则:,则:n n P(A)P(A)0.40.4,P(B)P(B)0.640.64,P(AB)P(AB)0.280.28n n 所求概率为事件所求概率为事件B B发生条件下发生条件下A A发生的条件概率发生的条件概率n n P(A|B)P(A|B)0.28/0.640.28/0
9、.64n n所求概率为事件所求概率为事件A A发生条件下发生条件下B B发生的条件概率发生的条件概率n n P(B|A)P(B|A)0.28/0.40.28/0.4第24页/共108页第二十五页,共108页。n nP(A|B)在B发生(fshng)的所有可能结果中AB发生(fshng)的概率n n即在样本空间中考虑的条件概率P(A|B),就变成在新的样本空间B中计算事件AB的概率问题了(1)条件)条件(tiojin)概概率(续)率(续)一旦(ydn)事件B已发生ABABBAB第25页/共108页第二十六页,共108页。乘法公式乘法公式(gngsh)的一般形式:的一般形式:P(AB)P(A)P(
10、B|A)或 P(AB)P(B)P(A|B)【例3-6】对例3-1中的问题(wnt)(从这50件中任取2件产品,可以看成是分两次抽取,每次只抽取一件,不放回抽样)解:A1第一次抽到合格品,A2第二次抽到合格品,A1A2抽到两件产品均为合格品P(A1 A2)P(A1)P(A2|A1)第26页/共108页第二十七页,共108页。事件事件(shjin)的独立性的独立性n n两个事件两个事件(shjin)(shjin)独立独立n n一个事件一个事件(shjin)(shjin)的发生与否并不影响另一的发生与否并不影响另一个事件个事件(shjin)(shjin)发生的概率发生的概率n nP(A|B)P(A|
11、B)P(A)P(A),或,或 P(B|A)P(B|A)P(B)P(B)独立(dl)事件的乘法公式:P(AB)P(A)P(B)推广到推广到n n 个独立事件,有:个独立事件,有:P P P P(A A A A1 1A A A An n)P P P P(A A A A1 1)P P P P(A A A A2 2)P P P P(A A A An n)第27页/共108页第二十八页,共108页。3.1.5 3.1.5 全概率全概率(gil)(gil)公式与逆概率公式与逆概率(gil)(gil)公公式式n n完备事件组n n事件A1、A2、An互不相容,n nAA2Ann n且P(Ai)0(i=1、2
12、、.、n)n n对任一事件B,它总是与完备事件组A1、A2、An之一同时发生(fshng),则有求P(B)的全概率公式:第28页/共108页第二十九页,共108页。例例3-7n n假设有一道(ydo)四选一的选择题,某学生知道正确答案的可能性为2/3,他不知道正确答案时猜对的概率是1/4。试问该生作出作答的概率?n n解:设 A知道正确答案,B选择正确。“选择正确”包括:n n“知道正确答案而选择正确”(即AB)n n“不知道正确答案但选择正确”(即 )n nP(B)(2/3)1(1/3)(1/4)3/4第29页/共108页第三十页,共108页。全概率全概率(gil)公式公式贝叶斯贝叶斯公式公
13、式n n全概率公式的直观意义:n n每一个Ai的发生都可能导致B出现,每一个Ai 导致B发生的概率为,因此作为结果的事件B发生的概率是各个“原因(yunyn)”Ai 引发的概率的总和 n n相反,在观察到事件B已经发生的条件下,确定导致B发生的各个原因(yunyn)Ai的概率n n贝叶斯公式(逆概率公式)n n (后验概率公式)第30页/共108页第三十一页,共108页。贝叶斯公式贝叶斯公式(gngsh)n n若A1、A2、An为完备事件组,则对于任意(rny)随机事件B,有:计算(j sun)事件Ai在给定B条件下的条件概率公式。公式中,P(Ai)称为事件Ai的先验概率P(Ai|B)称为事件
14、Ai的后验概率 第31页/共108页第三十二页,共108页。3.2 随机变量随机变量(su j bin lin)及其概率及其概率分布分布第32页/共108页第三十三页,共108页。3.2.1 随机变量随机变量(su j bin lin)n n随机变量(su j bin lin)表示随机试验结果的变量n n取值是随机的,事先不能确定取哪一个值 n n一个取值对应随机试验的一个可能结果n n用大写字母如X、Y、Z.来表示,具体取值则用相应的小写字母如x、y、z来表示 n n根据取值特点的不同,可分为:n n离散型随机变量(su j bin lin)取值可以一一列举n n连续型随机变量(su j b
15、in lin)取值不能一一列举第33页/共108页第三十四页,共108页。3.2.2 离散离散(lsn)型随机变量的概率分布型随机变量的概率分布n nX的概率(gil)分布X的有限个可能取值为xi与其概率(gil)pi(i=1,2,3,n)之间的对应关系。n n概率(gil)分布具有如下两个基本性质:n n (1)pi0,i=1,2,n;n n (2)第34页/共108页第三十五页,共108页。离散离散(lsn)型概率分布的表示:型概率分布的表示:n n概率函数:P(X=xi)=pin n分布(fnb)列:n n分布(fnb)图X=xix1x2xnP(X=xi)=pip1p2pn0.60.30
16、0 1 2 xP(x)图图3-5 例例3-9的概率分布的概率分布第35页/共108页第三十六页,共108页。3.2.2 3.2.2 3.2.2 3.2.2 离散离散离散离散(lsn)(lsn)(lsn)(lsn)型随机变量的数学期望和型随机变量的数学期望和型随机变量的数学期望和型随机变量的数学期望和方差方差方差方差n n又称均值n n描述(mio sh)一个随机变量的概率分布的中心位置n n离散型随机变量 X的数学期望:n n相当于所有可能取值以概率为权数的平均值n n连续型随机变量X 的数学期望:第36页/共108页第三十七页,共108页。数学数学(shxu)期望的主要数学期望的主要数学(s
17、hxu)性质性质n n若k是一常数,则n n E(k X)k E(X)n n对于(duy)任意两个随机变量X、Y,有n n E(X+Y)E(X)E(Y)n n若两个随机变量X、Y相互独立,则n n E(XY)E(X)E(Y)第37页/共108页第三十八页,共108页。2.随机变量随机变量(su j bin lin)的方的方差差n n方差是它的各个可能取值偏离其均值的离差平方的均值,记为D(x)或2n n公式:n n离散(lsn)型随机变量的方差:n n连续型随机变量的方差:第38页/共108页第三十九页,共108页。方差方差(fn ch)和标准差(续)和标准差(续)n n标准差方差的平方根n
18、n方差和标准差都反映随机变量取值的分散程度。n n它们的值越大,说明(shumng)离散程度越大,其概率分布曲线越扁平。n n方差的主要数学性质:n n若k是一常数,则 D(k)0;D(kX)k2 D(X)n n若两个随机变量X、Y相互独立,则n n D(X+Y)D(X)D(Y)第39页/共108页第四十页,共108页。【例例3-10】n n试求优质品件数的数学(shxu)期望、方差和标准差。n n解:0.6xi012pi0.10.60.3第40页/共108页第四十一页,共108页。3.两个两个(lin)随机变量的协方差和相关系数随机变量的协方差和相关系数n n协方差的定义(dngy)如果如果
19、X,Y独立(不相关),则独立(不相关),则 Cov(X,Y)0 即即 E(XY)E(X)E(Y)协方差在一定协方差在一定(ydng)程度上反映了程度上反映了X、Y之间的之间的相关性相关性协方差受两个变量本身量纲的影响。协方差受两个变量本身量纲的影响。第41页/共108页第四十二页,共108页。相关系数相关系数n n相关系数具有如下的性质:n n相关系数是一个无量(wling)纲的值n n 0|0n n当=0,两个变量不相关(不存在线性相关)n n当|=1,两个变量完全线性相关 第42页/共108页第四十三页,共108页。3.2.4 几种常见几种常见(chn jin)离散型率离散型率分布分布 1
20、.1.二项分布二项分布(fnb)(fnb)2.2.泊松分布泊松分布(fnb)(fnb)3.3.超几何分布超几何分布(fnb)(fnb)第43页/共108页第四十四页,共108页。1.二项分布(背景二项分布(背景(bijng))n n(背景)n重贝努里试验(shyn):n n一次试验(shyn)只有两种可能结果n n用“成功”代表所关心的结果,相反的结果为“失败”n n每次试验(shyn)中“成功”的概率都是 pn n n 次试验(shyn)相互独立。第44页/共108页第四十五页,共108页。1.二项分布二项分布n n在n重贝努里试验中,“成功”的次数(csh)X服从参数为n、p的二项分布,记
21、为 X B(n,p)n n二项分布的概率函数:二项分布的数学期望(qwng)和方差:n1时,二项分布(fnb)就成了二点分布(fnb)(0-1分布(fnb))第45页/共108页第四十六页,共108页。二项分布图形二项分布图形(txng)p0.5时,二项分布是以均值为中心对称(zhn xn du chn)p0.5时,二项分布总是非对称的p0.5时峰值在中心的右侧随着n无限增大,二项分布趋近于正态分布p=0.3p=0.5p=0.7二项分布图示二项分布图示第46页/共108页第四十七页,共108页。【例例3-11】n n某单位有4辆汽车,假设(jish)每辆车在一年中至多只发生一次损失且损失的概率
22、为0.1。试求在一年内该单位:(1)没有汽车发生损失的概率;(2)有1辆汽车发生损失的概率;(3)发生损失的汽车不超过2辆的概率。n n解:每辆汽车是否发生损失相互独立的,且损失的概率相同,因此,据题意,在4辆汽车中发生损失的汽车数X B(4,0.1)。第47页/共108页第四十八页,共108页。利用利用Excel计算计算(j sun)二项分二项分布概率布概率n n进入进入(jnr)Excel(jnr)Excel表格界面,点击任一空白单元格表格界面,点击任一空白单元格(作为输出单元格)(作为输出单元格)n n点击表格界面上的点击表格界面上的 fx fx 命令命令 n n在在“选择类别选择类别”
23、中点击中点击“统计统计”,在,在“选择函数选择函数”中中点击点击“BINOMDIST”“BINOMDIST”n n在在Number_sNumber_s后填入试验成功次数后填入试验成功次数 x(x(本例为本例为2)2);n n在在TrialsTrials后填入总试验次数后填入总试验次数 n(n(本例为本例为4)4);n n在在Probability_sProbability_s后填入成功概率后填入成功概率 p(p(本例为本例为0.1)0.1);n n在在CumulativeCumulative后填入后填入0(0(或或FALSE)FALSE),表示计算成功次数等,表示计算成功次数等于指定值的概率于
24、指定值的概率“BINOMDIST(2,4,0.1,0)”用用EXCEL计算计算(j sun)二项分布的概二项分布的概率率第48页/共108页第四十九页,共108页。2.泊松分布泊松分布(fnb)n nX 服从(fcng)泊松分布,记为XP():E(X)=D(X)=当 很小时,泊松分布呈偏态,并随着(su zhe)增大而趋于对称当为整数时,和(-1)是最可能值第49页/共108页第五十页,共108页。泊松分布泊松分布(fnb)(应用背景)(应用背景)n n通常是作为稀有事件发生次数通常是作为稀有事件发生次数X X的概率分布模型。的概率分布模型。n n一段时间内某繁忙十字路口发生交通事故的次数一段
25、时间内某繁忙十字路口发生交通事故的次数n n一定时间段内某电话交换台接到的电话呼叫次数一定时间段内某电话交换台接到的电话呼叫次数n n服从泊松分布的现象的共同特征服从泊松分布的现象的共同特征n n在任意两个很小的时间或空间区间内事件发生次数是相互独立的;在任意两个很小的时间或空间区间内事件发生次数是相互独立的;n n各区间内事件发生次数只与区间长度各区间内事件发生次数只与区间长度(chngd)(chngd)成比例,与区间起成比例,与区间起点无关;点无关;n n在一段充分小的区间内事件发生两次或两次以上的概率可以忽略不在一段充分小的区间内事件发生两次或两次以上的概率可以忽略不计计第50页/共10
26、8页第五十一页,共108页。【例例3-12】n n 设某种报刊的每版上错别字个数服从 =2的泊松分布。随机翻看一版,求:n n(1)没有错别字的概率(gil);n n(2)至多有5个错别字的概率(gil)。n n解:设X每版上错别字个数,则所求概率(gil)为:利用利用EXCEL计算泊松分布计算泊松分布(fnb)的概的概率率第51页/共108页第五十二页,共108页。二项分布的泊松近似二项分布的泊松近似(jn s)n n【前提】当【前提】当n n很大而很大而 p p又很小时,二项分布可用参数又很小时,二项分布可用参数 np np 的泊松分的泊松分布近似布近似 n n【例【例3-133-13】一
27、工厂有某种设备】一工厂有某种设备(shbi)80(shbi)80台,配备了台,配备了3 3个维修工。假个维修工。假设每台设备设每台设备(shbi)(shbi)的维修只需要一个维修工,设备的维修只需要一个维修工,设备(shbi)(shbi)发生故障发生故障是相互独立的,且每台设备是相互独立的,且每台设备(shbi)(shbi)发生故障的概率都是发生故障的概率都是0.010.01。求设。求设备备(shbi)(shbi)发生故障而不能及时维修的概率是多少?发生故障而不能及时维修的概率是多少?n n解:解:XB(n=80XB(n=80,p=0.01)p=0.01),由于,由于np=0.8np=0.8很
28、小,可以用很小,可以用 0.80.8的泊松分的泊松分布来近似计算其概率布来近似计算其概率:第52页/共108页第五十三页,共108页。3.超几何超几何(j h)分布分布n n N个单位的有限总体中有M个单位具有某特征。用不重复抽样方法从总体中抽取(chu q)n个单位,样本中具有某种特征的单位数X服从超几何分布,记为XH(n,N,M)数学期望(qwng)和方差:N很大而n相对很小时,趋于二项分布(p=M/N)第53页/共108页第五十四页,共108页。3.2.5 3.2.5 概率密度函数与连续型随机变量概率密度函数与连续型随机变量概率密度函数与连续型随机变量概率密度函数与连续型随机变量(su
29、j bin lin(su j bin lin)n n连续型随机变量的概率分布只能表示(biosh)为:n n数学函数概率密度函数f(x)和分布函数F(x)n n 图 形概率密度曲线和分布函数曲线n n概率密度函数f(x)的函数值不是概率。n n连续型随机变量取某个特定值的概率等于0n n只能计算随机变量落在一定区间内的概率n n由x轴以上、概率密度曲线下方面积来表示(biosh)第54页/共108页第五十五页,共108页。概率密度概率密度f(x)的性质的性质(xngzh)n n(1)f(x)0。概率密度是非(shfi)负函数。n n(2)所有区域(qy)上取值的概率总和为1。随机变量随机变量X
30、在一定区间(在一定区间(a,b)上的概率:)上的概率:f f(x x)xab第55页/共108页第五十六页,共108页。3.分布分布(fnb)函数函数n n适用于两类随机变量概率分布的描述n n分布函数(hnsh)的定义:F(x)PXx连续型随机变量连续型随机变量(su j bin lin)的分布函数的分布函数离散型随机变量的分布函数 F(x)f f(x x)xx0F F(x x0 0 )分布函数分布函数与与概率密度概率密度第56页/共108页第五十七页,共108页。3.2.6 3.2.6 常见常见常见常见(chn(chn jin)jin)的连续型随机变量的概的连续型随机变量的概的连续型随机变
31、量的概的连续型随机变量的概率分布率分布率分布率分布n n1.均匀分布n nX只在一有限区间(q jin)a,b 上取值n n且概率密度是一个常数n n其概率密度为:X 落在子区间 c,d 内的概率与该子区间的长度(chngd)成正比,与具体位置无关f(x)a c d b xP(cXd)第57页/共108页第五十八页,共108页。2.正态分布正态分布n nXN(、2),其概率密度为:正态分布的均值(jn zh)和标准差:均值(jn zh)E(X)=方差 D(X)=2 -x 3 的概率很小,因此可认为正态随机变量的取值几乎全部集中在-3,+3 区间内n n广泛应用:n n产品质量控制(kngzh)
32、n n判断异常情况n n图图3-12 常用的正态概率值常用的正态概率值(在一般正态分布及标准正态分布中)(在一般正态分布及标准正态分布中)-3 -2 -1 0 +1 +2+3 z -3 -2 -+2+3 x99.73%95.45%68.27%第63页/共108页第六十四页,共108页。正态分布最常用正态分布最常用(chn yn)、最重要最重要n n大千世界中许多常见的随机现象服从或近似服从正态分大千世界中许多常见的随机现象服从或近似服从正态分布布n n例如,测量误差,同龄人的身高、体重例如,测量误差,同龄人的身高、体重(t(t zhng)zhng),一,一批棉纱的抗拉强度,一种设备的使用寿命,
33、农作物的产批棉纱的抗拉强度,一种设备的使用寿命,农作物的产量量n n特点是特点是“中间多两头少中间多两头少”n n由于正态分布特有的数学性质,正态分布在很多统计理由于正态分布特有的数学性质,正态分布在很多统计理论中都占有十分重要的地位论中都占有十分重要的地位n n正态分布是许多概率分布的极限分布正态分布是许多概率分布的极限分布n n统计推断中许多重要的分布(如统计推断中许多重要的分布(如22分布、分布、t t分布、分布、F F分布)分布)都是在正态分布的基础上推导出来的。都是在正态分布的基础上推导出来的。第64页/共108页第六十五页,共108页。用正态分布近似用正态分布近似(jn s)二项分
34、布二项分布n nX XB(nB(n,p)p),当,当n n充分大时,充分大时,n n X XN(n pN(n p,np(1-p)np(1-p)n n【例【例3-153-15】假设有一批种子的发芽】假设有一批种子的发芽(f y)(f y)率为率为0.70.7。现有这种种子现有这种种子10001000颗,试求其中有颗,试求其中有720720颗以上发颗以上发芽芽(f y)(f y)的概率。的概率。n n解:设解:设X X发芽发芽(f y)(f y)种子颗数,种子颗数,X XB(1000B(1000,0.7)0.7)。近似地。近似地 X XN(700N(700,210)210)。n n P(X720)
35、P(X720)P(Z1.38)P(Z1.38)1 1P(Z1.38)P(Z1.38)n n 1 10.91620.91620.0838 0.0838 第65页/共108页第六十六页,共108页。用正态分布近似用正态分布近似(jn s)二项分布二项分布n n用正态分布近似二项分布的前提n nn很大,n np不能太接近 0 或 1(否则二项分布太偏)n n一般要求np和np(1-p)都要大于5n n如果np或np(1-p)小于5,二项分布可以(ky)用泊松分布来近似 第66页/共108页第六十七页,共108页。计算计算(j sun)正态分布的概率值正态分布的概率值n n方法一:先标准化查标准正态分
36、布函数值表n n方法二:利用(lyng)Excel来计算(不必标准化)n n插入函数fx选择“统计”“NORMDIST”,进入“函数参数”对话框中,n n在X后填入正态随机变量的取值区间点;n n在Mean后填入正态分布的均值;n n在Standard_dev后填入正态分布的标准差;n n在Cumulative后填入1(或TRUE),表示计算随机变量取值小于等于指定值x的累积概率值。第67页/共108页第六十八页,共108页。n n也可在选定的输出单元格中,顺次输入函数名和参数值即可n n如输入“=NORMDIST(500,1050,200,1)”,确定后即可得到所求概率值0.0029798。
37、n n根据概率值F(Xx)求随机变量取值的区间(q jin)点 x,选择函数“NORMINV”。n n 如输入“=NORMINV(0.0029798,1050,200)”,显示计算结果为500。计算计算(j sun)正态分布正态分布的概率值的概率值第68页/共108页第六十九页,共108页。3.3 常用(chn yn)的抽样方法3.3.1 简单简单(jindn)随机抽样随机抽样3.3.2 分层抽样分层抽样3.3.3 系统抽样系统抽样3.3.4 整群抽样整群抽样第69页/共108页第七十页,共108页。抽样抽样(chu yn)方法方法第70页/共108页第七十一页,共108页。概率概率(gil)
38、抽样抽样(probability sampling)1.1.根根据据一一个个已已知知的的概概率率(gil(gil)来来抽取样本单位,也称随机抽样抽取样本单位,也称随机抽样2.2.特点特点3.3.按按一一定定的的概概率率(gil(gil)以以随随机机原原则抽取样本则抽取样本4.4.抽抽取取样样本本时时使使每每个个单单位位都都有有一一定的机会被抽中定的机会被抽中5.5.每每个个单单位位被被抽抽中中的的概概率率(gil(gil)是是已已知知的的,或或是是可可以以计计算算出出来来的的 6.6.当当用用样样本本对对总总体体目目标标量量进进行行估估计计时时,要要考考虑虑到到每每个个样样本本单单位位被抽中的
39、概率被抽中的概率(gil(gil)第71页/共108页第七十二页,共108页。简单简单(jindn)随机抽样随机抽样(simple random sampling)1.1.从从总总体体NN个个单单位位中中随随机机地地抽抽取取n n个个单单位位作作为为样样本本,使使得得每每一一个容量为样本都有相同的机会个容量为样本都有相同的机会(概率概率)被抽中被抽中 2.2.抽取元素的具体方法有重复抽样和不重复抽样抽取元素的具体方法有重复抽样和不重复抽样3.3.特点特点4.4.简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本5.5.用样本统计量对目标量进行估计比较方
40、便用样本统计量对目标量进行估计比较方便6.6.局限性局限性7.7.当当NN很大时,不易构造抽样框很大时,不易构造抽样框8.8.抽出的单位很分散,给实施调查增加抽出的单位很分散,给实施调查增加(zngji)(zngji)了困难了困难9.9.没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率第72页/共108页第七十三页,共108页。分层抽样分层抽样(stratified sampling)1.1.将 总 体 单 位 按 某 种 特 征(tzhng)或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本2.2.优点3.3.保证样本的结构与总体的结构比较相近,从而提高估
41、计的精度4.4.组织实施调查方便5.5.既可以对总体参数进行估计,也可以对各层的目标量进行估计第73页/共108页第七十四页,共108页。3.3.3系统抽样系统抽样(systematic samplingsystematic sampling)1.1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位2.2.先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位3.3.优点:操作简便,可提高(t go)估计的精度4.4.缺点:对估计量方差的估计比较困难第74页/共108页第七十五页,共1
42、08页。3.3.4 整群抽样整群抽样(chu yn)(cluster sampling)1.1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查2.2.特点3.3.抽样时只需群的抽样框,可简化工作量4.4.调查的地点相对集中,节省调查费用,方便调查的实施5.5.缺点是估计(gj)的精度较差第75页/共108页第七十六页,共108页。3.4 抽样(chu yn)分布 3.4.1 抽样分布的概念抽样分布的概念3.4.2 样本样本(yngbn)均值抽样分布均值抽样分布 3.4.3 样本样本(yngbn)比率抽样分布比率抽样分布 3.4.4 样本样本(yngbn
43、)方差抽样分布方差抽样分布3.4.5 两个样本两个样本(yngbn)统计量的统计量的分布分布 第76页/共108页第七十七页,共108页。1.1.样本统计量的概率分布,是一种理论分布样本统计量的概率分布,是一种理论分布2.2.在重复选取容量为在重复选取容量为n n的样本时,由该统计量的所的样本时,由该统计量的所有可能有可能(knng)(knng)取值形成的相对频数分布取值形成的相对频数分布 3.3.随机变量是随机变量是 样本统计量样本统计量4.4.样本均值样本均值,样本比例,样本方差等样本比例,样本方差等5.5.结果来自容量相同的所有可能结果来自容量相同的所有可能(knng)(knng)样本样
44、本6.6.提供了样本统计量长远而稳定的信息,是进行推提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据断的理论基础,也是抽样推断科学性的重要依据 3.4.1 抽样抽样(chu yn)分分布布(sampling distribution)第77页/共108页第七十八页,共108页。抽样分布抽样分布(fnb)的形成的形成过程过程(sampling distribution)总总体体计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量如:样本均值、比例、方差如:样本均值、比例、方差如:样本均值、比例、方差样样本本第78页/共108页第
45、七十九页,共108页。1.1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.2.一种理论概率分布3.3.推断(tudun)总体均值的理论基础样本均值的抽样样本均值的抽样(chu yn)分布分布第79页/共108页第八十页,共108页。样本均值的抽样样本均值的抽样(chu yn)分布分布(例题分析例题分析)【例例例例】设设设设一一一一个个个个总总总总体体体体,含含含含有有有有4 4个个个个元元元元素素素素(个个个个体体体体(gt)(gt),即即即即总总总总体体体体单单单单位位位位数数数数N=4N=4。4 4 个个个个个个个个体体体体(gt)(gt)分分分分别别别别为为
46、为为x1=1x1=1,x2=2x2=2,x3=3x3=3,x4=4 x4=4。总总总总体的均值、方差及分布如下体的均值、方差及分布如下体的均值、方差及分布如下体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2 2.3.3均值均值均值均值(jn zh)(jn zh)和和和和方差方差方差方差第80页/共108页第八十一页,共108页。现现现现从从从从总总总总体体体体中中中中抽抽抽抽取取取取n n2 2的的的的简简简简单单单单随随随随机机机机样样样样本本本本,在在在在重重重重复复复复抽抽抽抽样样样样(chu(chu yn)yn)条条条条件件件件下下下下
47、,共共共共有有有有42=1642=16个个个个样样样样本本本本。所所所所有有有有样样样样本的结果为本的结果为本的结果为本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)第81页/共108页第八十二页,共108页。计计计计算算算算出出出出各各各各样样样样本本本本(yngbn)(yngbn)的的的的均均均均值值值值,如如如如下下下下表表表表。并并并并给出样本给出样本给出样本给出样本(yngbn)(yngbn)均值的抽样分
48、布均值的抽样分布均值的抽样分布均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P (x x)1.51.53.03.04.04.03.53.52.02.02.52.5第82页/共108页第八十三页,共108页。=2.5=2.5 2 2=1.25=1.25总体总体总体总体(zngt)(zngt)分分分分布
49、布布布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x第83页/共108页第八十四页,共108页。抽样分布抽样分布(fnb)与总体分布与总体分布(fnb)的关系的关系总体总体总体总体(zngt)(zngt)分布分布分布分布正态分布正态分布非正态分布非正态分布大样本大样本(yngbn(yngbn)小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布第84页/共108页第八十五页,共108页。3.4.2 样本均值抽
50、样样本均值抽样(chu yn)分布的形式分布的形式 x x 的的的的 分分分分 布布布布(fnb)(fnb)趋趋趋趋 于于于于正正正正 态态态态 分分分分 布布布布(fnb)(fnb)的的的的 过过过过程程程程第85页/共108页第八十六页,共108页。3.4.3 样本均值抽样样本均值抽样(chu yn)分分布的特征布的特征 样本分布形式样本分布形式(xngsh)与总体分布有关,与总体分布有关,也与抽样方式有关(重复抽样或不重复抽样)也与抽样方式有关(重复抽样或不重复抽样)1.重复(chngf)抽样第86页/共108页第八十七页,共108页。检验检验(jinyn)例子例子比较比较比较比较(bj