《抽样统计的基本概念精.ppt》由会员分享,可在线阅读,更多相关《抽样统计的基本概念精.ppt(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样统计的基本概念第1页,本讲稿共19页例如:两条正态分布的密度曲线 左边是N(-2,0.5)分布,右边是N(0,1)分布 第2页,本讲稿共19页 3.3.样本与样本容量样本与样本容量 可以从抽样框中抽取一部分个体进行观测统计,再根据这部分个体的观测信息推断总体的性质。(1)一个样本一个样本(Sample):注意:注意:由于Xi是从总体中随机抽取的,所以 X1,X2,Xn 是 n 个随机变量。(2)样本容量(样本容量(Sample Size):n 大样本:n 30 小样本:n 30 (3)样本值:样本值:一次实际抽取(x1,x2,xn)第3页,本讲稿共19页三、中心极限定理三、中心极限定理 T
2、he Central Limit Theorem 在服从任意分布的总体中,抽取容量为n的样本。,如果 则样本均值 和样本比例 都近似服从正态分布第4页,本讲稿共19页根据根据Chebyshev 定理定理可以推导出可以推导出:在以下在以下区间内,所包含的统计值的比例大于区间内,所包含的统计值的比例大于95%95%(-2,+2)第5页,本讲稿共19页(一)基本概念(一)基本概念1.总体参数总体参数 2.样本样本 3.样本容量样本容量 n 4.样本值样本值:5.估计值估计值 6.抽样误差:抽样误差:问题:如何测量抽样误差?问题:如何测量抽样误差?第6页,本讲稿共19页1.区间估计的概念区间估计的概念
3、Interval Estimation 在总体 X 抽取一个容量为 n 的随机样本 X:x1,x2,xn 利用样本构造两个统计量使得:置信区间置信区间 Confidence Interval:置信度置信度 Level of Confidence:1-第7页,本讲稿共19页在大样本的前提下:在大样本的前提下:总体均值的总体均值的95%95%的置信区间的半长大约是的置信区间的半长大约是:均值的置信区间的宽度取决于三个因素均值的置信区间的宽度取决于三个因素:1.置信度置信度(95%;99.7%)2.标准差标准差:3.样本容量样本容量:n (是可控制的是可控制的)总体均值的总体均值的99.7%的置信区
4、间的半长大约是的置信区间的半长大约是:第8页,本讲稿共19页 原则:原则:调查者不能根据主观意图挑选调查单位。而是在总体中,按照随机原则和纯粹偶然性的方法抽取样本。8.5 简单随机抽样方法简单随机抽样方法简单随机抽样:简单随机抽样:每一个容量为每一个容量为 n 的可能样本被抽到的概率都是一样的。的可能样本被抽到的概率都是一样的。方法方法:(1)抽签法 (2)乱数表法(随机数字表)抽签法抽签法:先将调查总体的每个单位编上号码,然后将号码写在卡片上搅拌均匀,任意从中先将调查总体的每个单位编上号码,然后将号码写在卡片上搅拌均匀,任意从中选取。抽到一个号码,就对上一个单位,直到抽足预先规定的样本数目为
5、止。选取。抽到一个号码,就对上一个单位,直到抽足预先规定的样本数目为止。第9页,本讲稿共19页(1)总体均值的估计总体均值的估计(大样本)(大样本)l放回抽样放回抽样 总体均值的总体均值的点估计点估计 95%的置信的置信区间估计区间估计(抽样误差)(抽样误差)抽样误差:抽样误差:第10页,本讲稿共19页不放回抽样不放回抽样总体均值的点估计总体均值的点估计 同样样本容量下,不放同样样本容量下,不放回抽样的误差更小!回抽样的误差更小!N总体中的个体数量n 样本容量95%的置信区间的置信区间第11页,本讲稿共19页(2)总体比例的估计总体比例的估计(大样本)大样本)l放回抽样放回抽样第12页,本讲稿
6、共19页不放回抽样不放回抽样第13页,本讲稿共19页 _(_._)_(3)样本容量的确定样本容量的确定估计总体均值时需要的样本容量估计总体均值时需要的样本容量在构造总体均值的置信度为 95%的置信区间置信区间的半长 D 等于放回抽样放回抽样第14页,本讲稿共19页如何确定调查所需要的精度如何确定调查所需要的精度 D应用时,由于存在量纲问题,可以采用相对误差:应用时,由于存在量纲问题,可以采用相对误差:所以常用的方法是:所以常用的方法是:第15页,本讲稿共19页不放回抽样不放回抽样置信区间:抽样误差范围:要求样本容量为:第16页,本讲稿共19页估计总体比率时需要的样本容量估计总体比率时需要的样本容量 置信度为 95%,总体比率 p 的置信区间为 95%的置信区间的宽度为 样本容量为 问题:问题:在调查之前在调查之前 是未知的是未知的 放回抽样放回抽样第17页,本讲稿共19页解决的办法:解决的办法:1 0.1 0.2 0.3 0.4 0.5 0.6.0 0.9 0.8 0.7 0.6 0.5 0.4.=0.5 =0.5 所以样本容量 n 的最大值是:取第18页,本讲稿共19页例题:例题:北京地区观众调查网的置信度要求95%,误差要求不超过3%。求所需要的样本容量。解解:D=0.03不放回抽样:不放回抽样:第19页,本讲稿共19页