《预备知识概率与抽样分布.pptx》由会员分享,可在线阅读,更多相关《预备知识概率与抽样分布.pptx(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。这里的0.05或0.01称为小概率标准,农业试验研究中通常使用这两个小概率标准。小概率原理第1页/共44页2.3 连续型随机变量及其分布连续型随机变量及其分布定义设 X 是一随机变量,若存在一个非负可积函数 f(x),使得其中F(x)是它的分布函数则称 X 是连续型随机变量,f(x)是它的概率密度函数(p.d.f.),简称为密度函数或概率密度。连续型随机变量及常用分布第2页/共44页连续型随机变量及常用分布分布只与自由度,即样本含量有关均匀分布:Unifor
2、m Distribution 指数分布:Exponential Distribution 正态分布:Normal Distribution 分布:Chi Square Distribution t分布:Student t Distribution F 分布:F Distribution 第3页/共44页p当样本统计量被计算出以后可以自由改变的观测值数目。p 举例:3 个数之和是 6X1 =1(或其他数)X2 =2(或其他数)X3 =3(不能改变)自由度df=n1=2p确定一个式子自由度的方法是:若式子包含有 n 个独立的随机变量,和由它们所构成的 k 个样本统计量,则这个表达式的自由度为 n-
3、k。自由度自由度 (Degree of freedom)(Degree of freedom)第4页/共44页(a,b)上的均匀分布,记作1.均匀分布均匀分布若X 的密度函数为 ,则称X服从区间其中X的分布函数为其他第5页/共44页xf(x)abxF(x)ba1.均匀分布均匀分布第6页/共44页即X的取值在(a,b)内任何长为 d c的小区间的概率与小区间的位置无关,只与其长度成正比。这正是几何概型的情形。在进行大量数值计算时,如果在小数点后第 k位进行四舍五入,则产生的误差可以看作服从应用场合应用场合1.均匀分布均匀分布第7页/共44页2.指数分布指数分布若 X 的密度函数为则称 X 服从参
4、数为的指数分布记作:X 的分布函数为:0 为常数,第8页/共44页1xF(x)0 xf(x)02.指数分布指数分布第9页/共44页对于任意的 0 a b,应用场合用指数分布描述的实例有:随机服务系统中的服务时间电话问题中的通话时间无线电元件的寿命动物的寿命指数分布常作为各种“寿命”分布的近似2.指数分布指数分布第10页/共44页3.正态分布正态分布若 X 的密度函数为则称 X 服从参数为,的正态分布记作 X N(,)为常数,第11页/共44页N(-3,1.2)-6-5-4-3-2-10.050.10.150.20.250.33.正态分布正态分布第12页/共44页f(x)的性质的性质图形关于直线
5、x=对称:f(+x)=f(-x)在 x=时,f(x)取得最大值在 x=时,曲线 y=f(x)在对应的点处有拐点。曲线 y=f(x)以x轴为渐近线曲线 y=f(x)的图形呈单峰状q 3.正态分布正态分布第13页/共44页-6-5-4-3-2-10.050.10.150.20.250.33.正态分布正态分布第14页/共44页f(x)的两个参数:位置参数即固定 ,对于不同的 ,对应的 f(x)的形状不变化,只是位置不同。形状参数固定 ,对于不同的,f(x)的形状不同。附近值的概率更大,x=1 所对应的拐点比x=2 所对应的拐点更靠近直线 x=。若 1 2 则前者取 3.正态分布正态分布第15页/共4
6、4页大小3.正态分布正态分布第16页/共44页应用场合 若随机变量 X 受到众多相互独立的随机因素的影响,而每一个别因素的影响都是微小的,且这些影响可以叠加,则 X 服从正态分布.可用正态变量描述的实例非常之多:各种测量的误差;人的生理特征;工厂产品的尺寸;农作物的收获量;海洋波浪的高度;金属线的抗拉强度;热噪声电流强度;学生们的考试成绩;3.正态分布正态分布第17页/共44页正态分布有其特定的数据分布规则:平均值为,标准差为的正态分布68%的观察资料落在m的1之内95%的观察资料落在m的2之内99.7%的观察资料落在m的3之内3s规则:68-95-99规则第18页/共44页0123-1-2-
7、3mm+sm+2sm+3sm-sm-2sm-3s68%的资料95%的资料99%的资料3s规则:68-95-99规则第19页/共44页标准正态分布变量 X 服从平均值为 ,标准差为 的正态分布,简记为 XN(,2。X 经过标准化后为 Z则 Z 也服从正态分布,并且平均值为 0,标准差为 1,即Z N(0,1)。称 Z 服从标准正态(standard normal)。第20页/共44页N(0,1)标准正态分布(x)是偶函数,其图形关于纵轴对称它的分布函数记为(x),其值有专门的表可查。第21页/共44页4.2分布分布第22页/共44页4.2分布分布第23页/共44页3.847.8112.59P P
8、0.050.05的临界值4.2分布分布5.99第24页/共44页4.2分布分布第25页/共44页5.t 分布随机变量随机变量X XN N(m m,s s2 2)标准正态分布标准正态分布N N(0 0,1 12 2)Z变换均数均数标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自由度:n n-1-1Ss s第26页/共44页不同自由度下的t 分布图第27页/共44页t分布的特征 以0为中心,左右对称的单峰分布;t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近Z分布
9、(标准正态分布);当趋于时,t分布即为Z分布。第28页/共44页6.6.F F 分布分布第29页/共44页F 分布曲线第30页/共44页用随机数发生器随机抽样使用Excle可产生服从二项分布、泊松分布、均匀分布、正态分布等的随机数。第31页/共44页用随机数发生器随机抽样假设要从编号为1012500的普通员工中随机抽出50位员工接受问卷调查。第32页/共44页用随机数发生器随机抽样第33页/共44页用随机数发生器随机抽样第34页/共44页利用“抽样”进行系统抽样它是把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。第35页/共44页利用“抽样”进
10、行系统抽样假定在50名随机排序且不连续的员工编号内以系统抽样抽选10位。需要先计算出间隔数:总体数/样本数=50/10=5第36页/共44页利用“抽样”进行系统抽样第37页/共44页利用“抽样”进行系统抽样第38页/共44页利用“抽样”进行系统抽样第39页/共44页利用“抽样”进行系统抽样第40页/共44页参数估计的理论基础参数估计的理论基础大数定理大数定理中心极限定理中心极限定理表明大量随机-现象平均结果具有稳定性的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。如果变量总体存在有
11、限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。第41页/共44页置信度(Confidence Level)也称置信水平,指总体参数值落在样本统计值某一区间内的概率,或指总体参数值落在样本统计值某一区间中的把握性程度。反映的是抽样的可靠性程度(信度)。置信水平=(1,是参数不落在区间内的概率,通常取值 99%,95%,90%,即=0.01,=0.05,=0.10参数估计中的相关概念参数估计中的相关概念第42页/共44页置信区间(Confidence Interval)是指在一定的置信度下,某总体指标所在的区间范围,也称区间估计。反映的是抽样的精确性程度。参数估计中的相关概念参数估计中的相关概念第43页/共44页感谢您的观看!第44页/共44页