1010 抽样方法 总体分布的估计.docx

上传人:修**** 文档编号:5394403 上传时间:2022-01-05 格式:DOCX 页数:9 大小:163.56KB
返回 下载 相关 举报
1010 抽样方法 总体分布的估计.docx_第1页
第1页 / 共9页
1010 抽样方法 总体分布的估计.docx_第2页
第2页 / 共9页
点击查看更多>>
资源描述

《1010 抽样方法 总体分布的估计.docx》由会员分享,可在线阅读,更多相关《1010 抽样方法 总体分布的估计.docx(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、10.10 抽样方法 总体分布的估计一、明确复习目标 1.会用随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本2.会用样本频率分布去估计总体分布 3.了解正态分布的意义及主要性质 4.了解线性回归的方法和简单应用二建构知识网络1.简单随机抽样:设一个总体的个体数为N如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样. 简单随机抽样的特点:逐个抽取,不放回抽样,各个个体被抽到的概率相等.简单随机抽样方法是其他更复杂抽样方法的基础(2)简单随机抽样的两种方法:抽签法:编号写签,搅拌均匀,逐个抽取.先后抽取概率均等.抽签法简便易行,

2、适用于个体数不太多总体 随机数表法:“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码 2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样系统抽样的步骤:(总体中的个体的个数为N,样本容量为n)采用随机的方式将总体中的个体编号.为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等 确定分段(部分)的间隔k当是整数时,k=;当不是整数时,先从总体中用简单随机抽样剔除一些个体,使剩下的总体中个体数能被n整除,取k=.在第一段用简单随机

3、抽样确定起始的个体编号. 按照事先确定的规则抽取样本(通常是将加上间隔k,得到第2个编号+k,第3个编号+2k,)与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.可以证明:当n不能整除N时,先刎除的个体与其它个体一样,被抽的概率也是1/N.3.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.简单随机抽样,系统抽样,分层抽样都是等概率抽样,简单随机抽样是基础,系统抽样的第一部分和分层抽样的每一层都采用简单随机抽样. 随机抽样、系统抽样、分层抽样都是不放回

4、抽样4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.5.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.总体分布是不易知道的,通常用“样本频率分布估计总体分布”,这是统计的基本思想方法,样本容量越大,估计越精确.总体密度曲线baxOy6.总体密度曲线:如果是连续型随机变量,就

5、把的取值区间分组,当样本容量无限增大,分组的组距无限缩小,各组的频率就越接近于总体在相应各组取值的概率,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线它反映了总体在各个范围内取值的概率根据这条曲线,可求出总体在区间(a,b)内取值的概率等于该区间上总体密度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。总体分布密度密度曲线函数y=f(x)的两条基本性质:f(x) 0(xR);由曲线y=f(x)与x轴围成面积为1。7.正态分布:象测量的误差、产品的尺寸等总体分布密度曲线可用,(0,-x)近似表示,这样的分布中正态分布, 记为,f(x)叫正态分布密度函数.其中是圆周率;

6、e是自然对数的底;x是随机变量的取值;为正态分布的均值;是正态分布的标准差.(1)正态分布由参数、唯一确定,如果随机变量N(,2),根据定义有:=E,=D。(2)正态曲线具有以下性质:在x轴的上方,与x轴不相交。关于直线x =对称。在x =时位于最高点。当x 时,曲线下降。并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。当一定时,曲线的形状由确定。越大,曲线越“矮胖”,表示总体越分散;越小,曲线越“瘦高”,表示总体的分布越集中。8.标准正态曲线:当=0、=l时,叫标准正态总体, 分布密度函数:,(-x+),相应的曲线叫标准正态曲线.标准正态总体N(0,1)中,总体取值小于的概率

7、,P(x0时,可由标准正态分布表查得.当时,;(0)=0.5.任何正态分布的概率问题均可通过转化成标准正态总体.9.假设检验的思想:小概率事件不能发生假设某种指标服从正态分布N(,2);(2)确定一次试验中的取值a;(2)作出统计推断:若a(3,+3),则接受假设,若a(3,+3),则拒绝假设.10线性回归:变量与变量之间的关系大致可分为为两类:确定的函数关系,和不确定的相关关系,不确定的两变量之间也有规律可循,回归分析就是研究这种相关关系的一种数理统计方法.如果n组数据(x1,y1), (x2,y2),(xn,yn)对应的点大致分布在一条直线附近,这条直线就叫回归直线,方程为,其中a、b是待

8、定系数,,三、双基题目练练手1.一个容量为n的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n的值为 ( )A.640 B.320 C.240 D.1602.(2006江苏)某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则xy的值为( )(A)1(B)2(C)3(D)4 3.(2006重庆)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为岁18岁的男生体重(),得到频率分布直方图如下:根据上图可得这100名学生中体重在的学生人数是 ( )(A)20 (B)30 (C)40 (D)504.某厂生产的零

9、件外直径N(8.0,1.52)(mm),今从该厂上、下午生产的零件中各随机取出一个,测得其外直径分别为7.9 mm和7.5 mm,则可认为A.上、下午生产情况均为正常B.上、下午生产情况均为异常C.上午生产情况正常,下午生产情况异常D.上午生产情况异常,下午生产情况正常5. 随机变量N(0,1),如果P(1)=0.8413,则P(10)=_.6.为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:(表中单位是千元)广告费1.04.06.010.014.0销售额19.044.040.052.053.0现要使销售额达到6万元,则需广告费用为_.(保留两位有效数字)答案:1-4.BD

10、CC; 4.根据3原则,在8+31.5=8.45,与831.5=7.55,之外时为异常.答案:C; 5.P(10)=P(01)=(1)(0)=0.84130.5=0.3413.6.先求出回归方程=bx+a,令=6,得x=1.5万元. 答案:1.5万元四、经典例题做一做【例1】某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1160编号,相应地制作1160号的160个签,从中随机抽20个.显

11、然每个个体被抽到的概率为=.(2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k号(1k8),则在其余组中分别抽取第k+8n(n=1,2,3,19)号,此时每个个体被抽到的概率为.(3)分层抽样法:按比例=,分别在一级品、二级品、三级品、等外品中抽取48=6个,64=8个,32=4个,16=2个,每个个体被抽到的概率分别为,即都是.综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是.点评:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.yaox3x21【例2】设随机变量

12、的概率密度函数为,求(1)常数a的值; (2)P(2)及F(x)=P(x)解(1)f(1)=a,f(3)=0,如图,密度曲线与x轴围成三角形面积.(2)f(2)=, f(2)=.F(x)=P(x)=【例3】将温度调节器放置在贮存着某种液体的容器内,调节器设定在d ,液体的温度(单位:)是一个随机变量,且N(d,0.52).(1)若d=90,求89的概率;(2)若要保持液体的温度至少为80 的概率不低于0.99,问d至少是多少?(其中若N(0,1),则(2)=P(2)=0.9772,(2.327)=P(2.327)=0.01).分析:需转化为标准正态分布的数值.解:(1)P(89)=F(89)=

13、()=(2)=1(2)=10.9772=0.0228.(2)由已知d满足0.99P(80),即1P(80)10.01,P(80)0.01.()0.01=(2.327).2.327. d81.1635.故d至少为81.1635.提炼方法:(1)若N(,),则=N(0,1).(2)标准正态分布的密度函数f(x)是偶函数,x0时,f(x)为减函数.【例4】 (2006湖北)在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布N(70,100)。已知成绩在90分以上(含90分)的学生有12名。()试问此次参赛的学生总数约为多少人?()若该校计划奖励竞赛成绩排在前50名的学生,试问设奖的分数约

14、为多少分?可供查阅的(部分)标准正态分布表x001234567891.20.88490.88690.88880.89070.89250.89440.89620.89800.89970.90151.30.90320.90490.90660.90820.90990.91150.91310.91470.91620.91771.40.91920.92070.92220.92360.92510.92650.92780.92920.93060.93191.90.97130.97190.97260.97320.97380.97440.97500.97560.97620.97672.00.97720.9778

15、0.97830.97880.97930.97980.98030.98080.98120.98172.10.98210.98260.98300.98340.98380.98420.98460.98500.98540.9857解:(1)设参赛学生的分布数为,因为N(70,100),由条件知: 这说明成绩在90分以上(含90分)的学生人数约占全体参赛人数的2.28因此,参赛总人数约为(2)假定设奖的分数线为分,则即,查表得,解得故设奖的分数线约为83分.【研讨.欣赏】 设有一样本x1,x2,xn,其标准差为sx,另有一样本y1,y2,yn,其中yi=3xi+2(i=1,2,n),其标准差为sy,求证

16、:sy=3sx.证明:=,=3+2.sy2=(y12+y22+yn2)n 2=(3x1+2)2+(3x2+2)2+(3xn+2)2n(3+2)2=9(x12+x22+xn2)+12(x1+x2+xn)+4nn(92+12+4)=(x12+x22+xn2)n2=9sx2.sx0,sy0, sy=3sx.五提炼总结以为师1、理解三种抽样方法的特点;2、用样本的频率去估计总体分布;3、正态分布的意义、主要性质及应用;4、了解线性回归的方法,会求线性回归方程。同步练习 10.10 抽样方法 总体分布的估计 【选择题】1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个

17、体入样的概率是A.B.C.D. 2. 某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为.则完成、这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法分析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.3

18、.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )A.0.6 hB.0.9 hC.1.0 hD.1.5 h4.如果随机变量N(,2),且E=3,D=1,则P(11)等于 ( ) A.2(1)1 B.(4)(2)C.(2)(4) D.(4)(2)【填空题】5.(2003全国)某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取_辆、_

19、辆、_辆.6.(2006全国)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图)。为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在(元)月收入段应抽出_人。练习简答:1-4.CBBB; 3.一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即=0.9 h.,答案:B4.对正态分布,=E=3,2=D=1,故P(11)=(13)(13)=(2)(4)=(4)(2).答案:B5. 分层抽样,抽样比例为=,分别有6辆、30辆、10辆; 6.25人.【解答题】7. 某批零件

20、共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.剖析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每个个体被取到的概率.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1160编号,相应地制作1160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为=.(2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k号(1k8),则在其余组中分

21、别抽取第k+8n(n=1,2,3,19)号,此时每个个体被抽到的概率为.(3)分层抽样法:按比例=,分别在一级品、二级品、三级品、等外品中抽取48=6个,64=8个,32=4个,16=2个,每个个体被抽到的概率分别为,即都是.综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是.评述:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.8. 已知连续型随机变量的概率密度函数,且f(x) 0,求常数k的值,并计算概率P(1.55)=1P(x5)=1F(5)=1()=1(1)=11(1)=(1)=0.8413.对第二个方案,有xN(6,22),于是P(x5)

22、=1P(x5)=1F(5)=1()=1(0.5)=(0.5)=0.6915.相比之下,“利润超过5万元”的概率以第一个方案为好,可选第一个方案.10.公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高N(173,72)(cm),问车门应设计多高?解:设公共汽车门的设计高度为x cm,由题意,需使P(x)1%.N(173,72),P(x)=()0.99.查表得2.33,x189.31,即公共汽车门的高度应设计为190 cm,可确保99%以上的成年男子头部不跟车门顶部碰撞.【探索题】已知测量误差N(2,100)(cm),必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过8 cm的频率大于0.9?解:设表示n次测量中绝对误差不超过8 cm的次数,则B(n,p).其中P=P(|0.9,n应满足P(1)=1P(=0)=1(1p)n0.9,n=2.75.因此,至少要进行3次测量,才能使至少有一次误差的绝对值不超过8 cm的概率大于0.9.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁