第四章抽样分布-孔秋生XXXX.pptx

上传人:修**** 文档编号:12420066 上传时间:2022-04-24 格式:PPTX 页数:86 大小:797.57KB
返回 下载 相关 举报
第四章抽样分布-孔秋生XXXX.pptx_第1页
第1页 / 共86页
第四章抽样分布-孔秋生XXXX.pptx_第2页
第2页 / 共86页
点击查看更多>>
资源描述

《第四章抽样分布-孔秋生XXXX.pptx》由会员分享,可在线阅读,更多相关《第四章抽样分布-孔秋生XXXX.pptx(86页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、Review离均差(离均差(deviation from mean)离均差的代数和等于零离均差的平方和最小1xx2xxnxxReview离均差平方和离均差平方和 (Sum of square, SS)2()iSSyy2()iSSy样本样本总体总体Review平均的离均差平方,称为均方或方差(平均的离均差平方,称为均方或方差(variance)样样本本总总体体221()NNniySS221()11niyySSsnnReview标准差标准差 (standard deviation)样本样本总体总体2yN21yySn(n-1)为自由度()为自由度(degree of freedom)Review10

2、0%sCVyChapter 4 理论分布和抽样分布理论分布和抽样分布田间试验设计与统计分析田间试验设计与统计分析 第一节第一节 事件、概率和随机变量事件、概率和随机变量田间试验设计与统计分析田间试验设计与统计分析 1、事件和事件的概率、事件和事件的概率 频率和概率:概率(Probability)记作P表示事件发生可能性大小的数值Deals with the relative likelihood that a certain event will or will not occur, relative to some other events频数:事件在若干次试验中出现的次数频率:频数与所进行

3、的试验总次数之比1、事件和事件的概率、事件和事件的概率 频率和概率:概率的统计定义(statistics probability): 随着试验次数n的逐渐增大,事件A的频率愈来愈稳定的接近定值P,于是定义P为事件A的概率The probability of an event is the proportion of times the event occurs in many repeated trials of a random phenomenonnaPn limA)(1、事件和事件的概率、事件和事件的概率 频率和概率:概率是一个常数,是理论值频率则是一具体数字,即经验值Chance be

4、havior is unpredictable in the short run but has a regular and predictable pattern in the long run1、事件和事件的概率、事件和事件的概率 频率和概率:实质上是统计数与参数的关系大数定律说明,样本容量越大或试验次数越多,统计数与参数之间的误差就越小Low of large numbersDraw observations at random from any population with finite mean . As the number of observations drawn incre

5、ases, the mean of the observed values gets closer and closer to mean of populationx1、事件和事件的概率、事件和事件的概率小概率事件实际不可能性原理 :随机事件的概率表现了事件的客观统计规律性,它反映了事件在一次试验中一次试验中发生可能性的大小,概率大表示事件发生的可能性大,概率小表示事件发生的可能性小。若事件A发生的概率较小,如小于0.05或0.01,则认为事件事件A在一次试验中不太可能发生在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。这里的0.05或0.01称为小概率标准,农业试

6、验研究中通常使用这两个小概率标准1、事件和事件的概率、事件和事件的概率小概率事件实际不可能性原理事件发生的可能性与试验结果是不同的事件发生的可能性 :事件可能发生的概率 试验结果:特定试验结果 实际结果可能是概率大的事件发生了,也可能概率小的事件发生了 请用“小概率原理”分析彩民的心态及投注策略1、事件和事件的概率、事件和事件的概率第二节第二节 二项分布二项分布田间试验设计与统计分析田间试验设计与统计分析 1 二项总体及二项分布二项总体及二项分布v 一般地,设一次试验有两种对立的结果A与 ,其中P(A)p,P( )q1pv 如果独立地重复进行 n 次该试验,事件A发生的次数X是一个随机变量,其

7、取值的范围是0,1,2,n(n1个值)v 每个取值对应的概率值可由二项式(pq)n的展开式中相应项求得,故X的概率分布叫做二项分布(贝努利分布)。v 变量X也称为服从二项分布的随机变量,简称二项变量.AA1 二项总体及二项分布二项总体及二项分布二项总体(binary population):整个总体可以根据某种性状的出现与否分成两项,即非此即彼的两项,他们所构成的总体称为二项总体 二项分布(binomial distribution): 二项总体中的变量和其概率构成的一个分布,称之为二项概率分布,简称二项分布,是计数资料的一种最主要的理论分布1 二项总体及二项分布二项总体及二项分布 The b

8、inomial setting (assumptions):There are a fixed number n of observationsThe n observations are all independentEach observation falls into one of two categories, which for convenience we call “success” and “failure”The probability of a success, call it p, is the same for each observationPay attention

9、 to the binomial setting, because not all counts have binominal distribution2 二项分布的概率计算二项分布的概率计算!( )()!()!xxn xxn xnnf xP XxC p qp qx nx二项变量取值的概率计算通式(二项分布的概率函数式)二项变量取值的概率计算通式(二项分布的概率函数式)2 二项分布的概率计算二项分布的概率计算例: 红果番茄与黄果番茄杂交,根据孟德尔遗传理论 , F2中红果与黄果的比率为31。求某F2中10株番茄,有7株为红果的概率。v 根据题意,n=10,p=34=0.75,q=14=0.25

10、。设10株番茄中红果为x株,则x为服从二项分布B(10,0.75)的随机变量v F2中10株番茄,有7株为红果的概率为:773731010!(7)0.75 0.250.750.250.25037!3!P xC2 二项分布的概率计算二项分布的概率计算EXCEL函数BINOMDIST (number_s, trials, probability_s, cumulative)3 二项分布的参数和形状二项分布的参数和形状二项分布由n和p两个参数决定。 n称为离散参数, 只能取正整数p 是连续参数,它能取0与1之间的任何数值。当p值较小且n不大时,分布是偏倚的。但随着n的增大 ,分布逐渐趋于对称。当 p

11、 值 趋 于0.5时,分布趋于对称3 二项分布的参数和形状二项分布的参数和形状服从二项分布B(n,p)的随机变量之平均数、标准差与参数n、p有如下关系npqnp3 二项分布的参数和形状二项分布的参数和形状做B(10,0.3)、B(10,0.5)、B(10,0.8)的概率分布图做B(10,0.1)、B(50,0.1)、B(100,0.1)的概率分布图3 二项分布的参数和形状二项分布的参数和形状n10,p不同的二项分布的分布图00.050.10.150.20.250.30.350.40.451234567891011yp0.3p0.5p0.93 二项分布的参数和形状二项分布的参数和形状p0.1,n

12、不同的二项分布00.050.10.150.20.250.30.350.40.451357911 13 15 17 19yPn10n50n1003 二项分布的参数和形状二项分布的参数和形状vp p一定,图形随一定,图形随n n而变化而变化vn n大,图形顶点向中间移大,图形顶点向中间移vn n小,图形偏度大。小,图形偏度大。vnn,不论,不论p p为何值,图形都对称为何值,图形都对称v可证,当可证,当nn,p p不过小,且不过小,且npnp、nqnq5 5,且数值接近时,二项分布且数值接近时,二项分布正态分布。正态分布。4 泊松分布泊松分布 (Poisson distribution)v在二项分

13、布中,当一个概率如p或q相当小(如小如0.1),另一方面n又相当大二项分布的的一种极限分布,称之为泊松分布v泊松分布在生物学的研究中经常遇到!( )!()!r n rnPrpqr n rn0p()!mremP yrr注注 npnpmm4 泊松分布泊松分布 (Poisson distribution)v泊松分布通常是极为偏斜的泊松分布通常是极为偏斜的v泊松泊松分布的主要用途分布的主要用途v在农业上有好多小概率事件,其发生概率在农业上有好多小概率事件,其发生概率p p往往往往0.1,0.1,甚至甚至0.010.01。v二项分布当二项分布当P0.1P0.1和和nP5nP30中心极限定理中心极限定理n

14、1New Populationn21x2xix2yiy1y两个独立样本平均数差数的分布两个独立样本平均数差数的分布12122(,)yyyyNn130New Population1x2xix2yiy1y两个独立样本平均数差数的分布两个独立样本平均数差数的分布n230总体与样本总体与样本TheoreticPopulationSample已知已知抽样分布抽样分布22(,)( ,)yyYNNn 1x2xix4.3 二项总体的抽样分布二项总体的抽样分布二项总体的分布参数 若一个二项总体的变量为:0,1,0,1,10.63/51)/5101(00.24/50.6)(10.6)(10.6)(00.6)(10

15、.6)(02222220.490.24 ppqpp)(12pqpp)(1 4.3 二项总体的抽样分布二项总体的抽样分布从二项总体进行抽样得到的样本,其从二项总体进行抽样得到的样本,其平均数的分平均数的分布布仍为二项分布仍为二项分布 2,yyypqpqpnn4.3 二项总体的抽样分布二项总体的抽样分布样本总和数(次数)的抽样分布的参数:样本总和数(次数)的抽样分布的参数:从二项总体进行抽样得到样本,样本总和数的分布仍从二项总体进行抽样得到样本,样本总和数的分布仍为二项分布。为二项分布。二项分布在二项分布在np及及nq大于大于5时,趋近于正态分布,可利时,趋近于正态分布,可利用正态分布计算概率用正

16、态分布计算概率2,yyynpnpqnpq案例分析案例分析假如你现在获得了一份某大型超市经理助理的兼职工作,经理知道你学过田统之后,决定让你负责采购玉米片(cornflake) ,并希望你能客观而又科学(客观而又科学(objective and scientific)的完成你的工作。你约见了不同玉米片厂家的推销员,最终选择了其中一家,并谈好了价格。案例分析案例分析 货到后,saleswoman 说玉米片重量是10 oz/box 根据你的观察,你认为这个saleswoman属于“外表时尚,内心保守”型 你感觉每盒的重量可能大于你感觉每盒的重量可能大于10 oz 如何去证实你的直觉呢?如何去证实你的

17、直觉呢?An example from An Introduction to Biostatistics 科学研究的基本过程科学研究的基本过程假说假说试验试验结论结论案例分析案例分析人们可以对一批数据形人们可以对一批数据形成不同的观点,但是一成不同的观点,但是一个假设测验提供了一种个假设测验提供了一种始终如一的判断始终如一的判断 依靠某种对所有人依靠某种对所有人都相同的标准去做决定都相同的标准去做决定 -Bernard RosnerFundamentals of Biostatistics案例分析案例分析首先提出假设首先提出假设A pair of hypothesis, actually a

18、pair of predictionsThe pair of hypothesis are mutually exclusive and all-inclusive possibilities.案例分析案例分析提出假设提出假设无效假设(无效假设(null hypothesis):): H0需要测验的假设:需要测验的假设: H010 oz备择假设备择假设 (alternative hypothesis):): HA or H1which is your belief or position: HA10 ozEither H0 or HA will be true, but not both.案例

19、分析案例分析设计实验设计实验随机选取随机选取25个样品进行称重,获得平均重量为个样品进行称重,获得平均重量为10.36oz你知道行业的潜规则,即每盒重量的误差为你知道行业的潜规则,即每盒重量的误差为1.0ozWill H0 or HA be true?分析分析PopulationSample=10=1.022(,)( ,)yyYNNn 1x2xix中心极限定理中心极限定理在在H0 为真的情况下为真的情况下?)10.36(XPn=25案例分析案例分析?)10.36(XP8 . 125/100.1036.10/nXu)8 . 1(1)8 . 1()10.36(uPuPXP0359. 09641.

20、01)8 . 1 (1F案例分析案例分析H0 为真的概率为真的概率P=0.03590.05根据小概率事件实际不可能性原理,如此低概根据小概率事件实际不可能性原理,如此低概率的事件在一次试验中是不可能发生的率的事件在一次试验中是不可能发生的但它却发生了!但它却发生了!因此,因此,H0不成立,应该否定不成立,应该否定H0 ,接受,接受HA案例分析案例分析 HA为真,表明玉米片的重量要为真,表明玉米片的重量要显著显著高于高于10.0ozIn statistics, significantly less or more or different means that the result of the

21、 experiment would be a rare result if the null hypothesis were true.You are right!Chapter 5 统计假设测验统计假设测验田间试验设计与统计分析田间试验设计与统计分析 统计假设测验流程普通番茄普通番茄Vc含量含量6mg/100g转基因番茄转基因番茄Vc含量含量8mg/100gVc含量有无差异?含量有无差异?什么原因造成的?什么原因造成的?误差?误差?基因?基因?Which one is right?提出假设提出假设H0:没有差异:没有差异HA:有差异:有差异设定显著水平设定显著水平计算计算H0为真的概率为真的概率结论:结论:基因基因 or 误差误差小概率原理小概率原理抽样分布抽样分布

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁