《抽样和抽样分布.pptx》由会员分享,可在线阅读,更多相关《抽样和抽样分布.pptx(89页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四章第四章 抽样和抽样分布抽样和抽样分布 nnNAN= (1)(2)(1)nNPN NNNn=-+(1)(2) (1)!()! !nNN NNN nNCnN n n- +=-二、试验二、试验1.概念:概念:2.试验具有以下特点:试验具有以下特点:试验试验样本空间样本空间练习题四、事件及其概率四、事件及其概率5.事件的概率事件的概率v pnmAP)(例如,投掷一枚硬币,出现正面和反面的频率,例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数随着投掷次数 n 的增大,出现正面和反面的频率的增大,出现正面和反面的频率稳定在稳定在1/2左右左右 (1)离散型随机变量)离散型随机变量试验试验随机变
2、量随机变量可能的取值可能的取值抽查抽查100个个产品产品一家餐馆营业一天一家餐馆营业一天电脑公司一个月的销电脑公司一个月的销售售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾客数顾客数销售量销售量顾客性别顾客性别0,1,2, ,1000,1,2, 0,1, 2,男性为男性为0,女性女性为为1(2)连续型随机变量)连续型随机变量试验试验随机变量随机变量可能的取值可能的取值抽查一批电子元件抽查一批电子元件新建一座住宅楼新建一座住宅楼测量一个产品的测量一个产品的长度长度使用寿命使用寿命(小时小时)半年后工程完成的百分比半年后工程完成的百分比测量误差测量误差(cm)X 00 X 100X 0二
3、、离散型随机变量的概率分布二、离散型随机变量的概率分布X = xix1 ,x2 , ,xnP(X =xi)=pip1 ,p2 , ,pn11niip4.离散型随机变量的概率分布离散型随机变量的概率分布(实例)(实例)X = xi0 1 2 3P(X=xi) pi0.05 0.10 0.55 0.30取无穷个值)取有限个值)XpxXEXpxXEiiiniii()()(11iP2N2ii=1D(X) = EX - E(X)若 X是 离 散 型 随 机 变 量 , 则D(X) =x - E(X)2( )X离散型随机变量的方差离散型随机变量的方差(实例)(实例)X = xi1 2 3 4 5 6P(X
4、 =xi)=pi1/6 1/6 1/6 1/6 1/6 1/65 . 3616611)(61iiipxXE9167. 261) 5 . 36(61) 5 . 31 ()()(22612iiipXExXD三、连续型随机变量的概率分布三、连续型随机变量的概率分布在平面直角坐标系中画出在平面直角坐标系中画出f(x)的图形,则对的图形,则对于任何实数于任何实数 a b,P(a X b)是该曲线下是该曲线下从从a 到到 b的面积的面积()( )dbaPa X bf x x xab概率是曲线下的面积概率是曲线下的面积(二)密度函数具有以下性质:(二)密度函数具有以下性质:( )f x( )0f x 12(
5、 ,)x x2112()( )xxxP xXxfx d=12()P xXx12( ,)x xX- ()1xfx d- =(三)分布函数)(d)()()(xxttfxXPxF)()(d)()(aFbFxxfbXaPba分布函数与密度函数的图示(四)连续型随机变量的期望和方差(四)连续型随机变量的期望和方差xxxfXEd)()(22d)()()(xxfXExXD第三节第三节 抽样分布抽样分布样本统样本统计量计量总体未总体未知参数知参数样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统
6、样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量主要样本主要样本统计量统计量xp2S.参数和统计量参数和统计量(总体指标和抽样指标)(总体指标和抽样指标) 统计量(抽样指标)统计量(抽样指标)3.统计量的特点统计量的特点v统计量(抽样指标)是随机变量,随着抽统计量(抽样指标)是随机变量,随着抽到的样本单位不同其取值也会有变化。到的样本单位不同其取值也会有变化。v 统计量是样本变量的函数,用来估计总体统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应。参数,因此与总体参数相对应。要了解本班男同学的身高,从总共要了解本班男同学的身高,从总共30名男同名男同学中
7、抽取学中抽取5名同学测量他们的身高,用这名同学测量他们的身高,用这5名名同学的平均身高来估计本班男同学的身高。同学的平均身高来估计本班男同学的身高。样本点:样本点:样本空间:样本空间:样本统计量:样本统计量:4.统计量的计算统计量的计算v样本平均数:样本平均数:v样本方差:样本方差:v样本成数:样本成数:;xxfxnf222()();11x xx x fsnf1npn二、重置抽样分布二、重置抽样分布(一)样本平均数的分布(一)样本平均数的分布样本平均数的分布是总体中全部样本平均数的样本平均数的分布是总体中全部样本平均数的可能取值和与之相应的概率组成。可能取值和与之相应的概率组成。下面用一个例子
8、来说明该问题下面用一个例子来说明该问题某班组某班组5个工人的日工个工人的日工资为资为34、38、42、46、50元。元。)(42 元NXX)2(32)()(22元NXXX现用重置抽样的方法从现用重置抽样的方法从5人中随机抽人中随机抽2个构成样本。个构成样本。共有共有52=25个样本。个样本。)(42 元ff xx)(16)()(222元ffxxx)( 4)()(2元ffxxx样本平均数的均值、方样本平均数的均值、方差及标准差:差及标准差:抽样平均数的标准差反映所有的样本平均数与总体平均抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,又称为数的平均误差,又称为抽样平均误差抽样平均误
9、差,用,用 表示。表示。( )xXE xX,2()( )xxfxf2()xXffx()Xnx(二)两个重要结论:(二)两个重要结论:1.重置抽样的样本平均数的平均数等于总体平均重置抽样的样本平均数的平均数等于总体平均数数,即即2.重置抽样的抽样平均数的标准差等于总体标准重置抽样的抽样平均数的标准差等于总体标准差除以样本单位数的平方根。即差除以样本单位数的平方根。即X510样本抽样分布样本抽样分布原总体分布原总体分布xX以上两个结论具有普遍意义,其一般推导见课本以上两个结论具有普遍意义,其一般推导见课本p113。 这一等式可以看出两项重要事实这一等式可以看出两项重要事实(1)抽抽样平均误差比总体
10、标准差小的多,仅为其样平均误差比总体标准差小的多,仅为其 。例如一个县的粮食亩产高低悬殊,亩产标准差为例如一个县的粮食亩产高低悬殊,亩产标准差为80公公斤,如果随机抽取斤,如果随机抽取100亩求平均亩产,那么样本平均亩求平均亩产,那么样本平均亩产量的差异就显著减小,平均误差只及总体亩产标亩产量的差异就显著减小,平均误差只及总体亩产标准差的准差的 ,即,即所以用样本平均亩产来代表总体平均亩产是更有效的所以用样本平均亩产来代表总体平均亩产是更有效的.( )Xnx1n1110n 80 100 8( ) 斤(2)抽样平均误差与总体标准差成正比变)抽样平均误差与总体标准差成正比变化,而与样本容量化,而与
11、样本容量n的平方根成反比变化。的平方根成反比变化。例如在同一个总体中,如果抽样单位数扩大原例如在同一个总体中,如果抽样单位数扩大原来的来的4倍,则抽样平均误差就缩小一半,如果倍,则抽样平均误差就缩小一半,如果抽抽样平均误差增加一倍,则样本单位数只需要原样平均误差增加一倍,则样本单位数只需要原来的来的1/4。(三)总体成数的估计(三)总体成数的估计总体成数总体成数p是指具有某种特征的单位在总体中的比是指具有某种特征的单位在总体中的比重。在前面我们已经知道,成数是一个特殊平均重。在前面我们已经知道,成数是一个特殊平均数,设总体单位总数目是数,设总体单位总数目是N,总体中有该特征的单位总体中有该特征
12、的单位数是数是N N1 1。设。设X是是0、1变量,变量, 即:总体单位有该特征,则即:总体单位有该特征,则X取取1,否则取,否则取0,则有:,则有:现从总体中抽出现从总体中抽出n n个单位,如果其中有相应特征的单位个单位,如果其中有相应特征的单位数是数是n n1 1,则样本成数是:则样本成数是: 1NPXN1npn 成数成数 P也是一个随机变量,利用样本平均数的也是一个随机变量,利用样本平均数的分布性质结论,即有:分布性质结论,即有: (1)( )(1)( )PPPPPpnnn( )E pP例题Eg.已知某批零件的一级品率为已知某批零件的一级品率为80,现用重,现用重置抽样方法从中抽取置抽样
13、方法从中抽取100件,求样本一级品件,求样本一级品率的抽样平均误差。率的抽样平均误差。三、不重置抽样分布三、不重置抽样分布某班组某班组5个工人的日工资为个工人的日工资为34、38、42、46、50元。元。)(42 元NXX)(32)()(22元NXXX现用不重置抽样的方法从现用不重置抽样的方法从5人中随机抽人中随机抽2个构成样本。个构成样本。共有共有20个样本。个样本。)(42 元ff xx)(12)()(222元ffxxx)(464. 3)()(2元ffxxx不重置抽样样本平均数的不重置抽样样本平均数的平均数、方差及标准差:平均数、方差及标准差:(二)两个重要结论:1.不重置抽样分布虽然与重
14、置抽样分布不同,但不重置抽样分布虽然与重置抽样分布不同,但它们的样本平均数的平均数仍等于总体平均它们的样本平均数的平均数仍等于总体平均数,即:数,即:2.抽样平均数的标准差也是反映样本平均数与总体平均抽样平均数的标准差也是反映样本平均数与总体平均数的平均误差程度。即:数的平均误差程度。即:所以所以抽样平均数的标准差也可称为抽样平均误差抽样平均数的标准差也可称为抽样平均误差,或抽,或抽样标准误差,不重置抽样的抽样平均误差等于重置抽样样标准误差,不重置抽样的抽样平均误差等于重置抽样的平均误差乘以修正因子的平均误差乘以修正因子( )E xxX22( )()E xE xE xX1NnN2()()1(
15、)XN nnNxx)(xx)(464. 3)1525(232)1()(2元NnNnX)1 ()(,12NnnXNNN有很大时,当n/N称为抽样比。称为抽样比。)1 (2PPPPPXpE)(抽样平均误差为:抽样平均误差为:)1 ()1 ()1()1 (NnnPPNnNnPPpp对于(对于(0,1)分布的总体,总体平均数)分布的总体,总体平均数为:为: 总体方差为:总体方差为:从总体中抽取容量为从总体中抽取容量为n的样本,样本成数的样本,样本成数p的分布实质是样本平均数的分布。有:的分布实质是样本平均数的分布。有:PXP重置抽样不重置抽样样本平均数误差样本成数误差2()Xn2( )(1)XnnN抽
16、样平均误差公式汇编(1)PPn(1)(1)PPnnN第四节第四节 正态分布和正态逼近正态分布和正态逼近 一、正态分布一、正态分布v二、正态分布再生定理二、正态分布再生定理v三、中心极限定理三、中心极限定理 四、抽样分布的正态逼近四、抽样分布的正态逼近连续型随机变量的一种重要分布,它是统计推断连续型随机变量的一种重要分布,它是统计推断的基础的基础xxfxx,e21)(2221 (1)对称性;)对称性; (2)非负性;)非负性; (3)最大值;)最大值; (4)拐点;)拐点;f (x)xx x5 x 0 x5 x x x x2 1 50. (0,1)XNs2.标准正态分布的特点:标准正态分布的特点
17、:(1)分布的平均数(数学期望)为)分布的平均数(数学期望)为0;(2)分布的方差为)分布的方差为1。(3)密度函数为:)密度函数为:(4)分布函数:)分布函数:2/ 21( )2zf zep-=2/21( )2zzzF zedp- = ()2 N x 对于任意正态分布,作变换:sxx Z () N 0 1 ,( )xxF ZPZs骣-=桫Z 0( ) F Z -Z( )xxZPZs骣-F=桫Z 0( ) Z F ZF ( Z )( % )1.00068.271.64590.001.96095.002.00095.453.00099.73( )()()F zp z Z zp Zz 22022z
18、zed z例题:()()()()()()()()() X N 0 , 1 : 1 P X2 3 P 1X3 2 P X2 4 P X1. 5 - ()1 1F 2 2轾=-臌1 10 . 95452=-0 . 022752.275%=( )() 3 P 1X3 -( )( )1 F 1 F 3 2轾=+臌()1 0 . 6827 0 . 9973 2=+0 . 8484%=( )() 4 P X1.5 ()11F 1 . 5 22=+()1 10 . 8664 2=+0 . 933293 . 32 %=例题:()()()( )()2 XN 5 , 3 1 P X10 2 P 2X10 例:设求
19、XXX5Z3s-()() 1 P X10 解:105P Z3骣-=桫()P Z1.667=()1 1 F 1 . 667 2轾=+臌1 10 . 9051 0 . 952695 . 26 %2=+=( )() 2 P 2X10 解:()P 1Z1 . 67 =-()()1 F 1 F 1 . 667 2轾=+臌1 0 . 6827 0 . 9051 0 . 793979 . 39 %2=+=()( )2 X N 550 50 X550 X50 s=已知:小麦亩产,即公斤,公斤;XXX550 Z50s-=解: 设()525 550575 550P 525X575 P Z5050骣-=桫()()P
20、 0.5Z0.5 F 0.5 =-=0.3829 38.29 %= 525 550 575 F(x)( )N100 000 x175 x4 s=解:战士身高为正态分布,人又知公分 ,公分;XxX 175 Z4s-=解: 设()171 175179 175P 171 X 179 P Z44骣 -=桫()P 1 Z 1 =- ()F 1 = 68.27 %=( )NP 100 000 68.27 % 68 270 =套( ) X, X X 平均数为正态分布若服从总体标准差为s禳镲镲镲睚镲镲镲铪( )()2: XN X , X 也就是总体,s()() E xX x xsm禳镲=镲镲睚镲=镲镲铪平均数
21、,也服从正态分布,标准差取取容容量量为为n n的的样样本本, 那那么么,从从此此总总体体中中抽抽()2: xN X m样本平均数,n x2x3x1xNx x (x11 x1n )(x21 x2n)(xm1 xmn)x1x2xmx( )2 XN (X , X )s()2 xN X,mxXZm-=()ZN 0, 1 ( ) X X X s禳镲镲镲睚镲镲镲铪平均数为如变量的均为有限数,标准差为()()()2 n x E xX x x N X smm禳镲=镲镲睚镲=镲镲铪从总体中抽 取容量为的样本,样本平均数的正态分布,也就是,随着随着n 的增大而趋近于的增大而趋近于()()2P 01 P P 1P
22、s-分布成数()2P p N P , m样本成数ppP Z m-=标准化() ZN 0, 1 大样本大样本n 30n n()()P 1Pn P 1Pn1nNm-骣-桫 小结:小结:v正态分布再生定理:限定总体服从正正态分布再生定理:限定总体服从正 态分布,对样本容量态分布,对样本容量n无要求无要求;v中心极限定理:总体分布可不为正态中心极限定理:总体分布可不为正态 分布,甚至可以不知道总体的分布。分布,甚至可以不知道总体的分布。要求样本单位数要求样本单位数n很大(很大( 至少至少n30 ),),则样本平均数就趋近于正态分布。则样本平均数就趋近于正态分布。 v正态逼近正态逼近 v总体分布类型不清
23、楚时,只要样本容量相总体分布类型不清楚时,只要样本容量相当大,就可以用正态分布来近似地估计样当大,就可以用正态分布来近似地估计样本平均数和样本成数取值某个区间的概率本平均数和样本成数取值某个区间的概率v一般认为,一般认为, 时为大样本,抽样分布接近正态。时为大样本,抽样分布接近正态。30n( ) X550 X250 n100 s=已知 :总体分,分;样本人() P 540 x580 =求:?( )X250 25 n100sm=分5 5 0 Z2 5x -=设()P 540 x580 540 550580 550P 2525Z骣 -=桫()()( )1P 0 . 41 . 2 F 0 . 4F 1 . 2 2Z轾=-=+臌()1 0 . 31080 .7699 54 . 05%2=+= -0.4 0 1.2思考与练习(P130132)思考题:思考题:4.6 4.7 4.11 4.12 4.13练习题:练习题: 4.22,3 4.244.25