统计学知识简介.pptx

上传人:莉*** 文档编号:90164996 上传时间:2023-05-13 格式:PPTX 页数:30 大小:363.04KB
返回 下载 相关 举报
统计学知识简介.pptx_第1页
第1页 / 共30页
统计学知识简介.pptx_第2页
第2页 / 共30页
点击查看更多>>
资源描述

《统计学知识简介.pptx》由会员分享,可在线阅读,更多相关《统计学知识简介.pptx(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、会计学1统计学知识简介统计学知识简介一、总体、样本与随机变量一、总体、样本与随机变量统计学知识简介统计学知识简介总体总体所研究对象的全体。所研究对象的全体。总体中的每个元素称为总体中的每个元素称为个体个体,总体中个体的数目称为,总体中个体的数目称为总体容量总体容量,用,用N表示。表示。分:分:有限总体有限总体N为有限数,为有限数,无限总体无限总体N为无限数。为无限数。样本样本由总体中的若干个体组成的集合由总体中的若干个体组成的集合样本中个体的数目称为样本中个体的数目称为样本容量样本容量,用,用n表示。样本是总体的子集。表示。样本是总体的子集。根据样本的信息来推测总体的情况,并给出这个推断的可靠

2、程度,根据样本的信息来推测总体的情况,并给出这个推断的可靠程度,称为称为统计推断统计推断。统计推断要求从总体中抽取样本须满足。统计推断要求从总体中抽取样本须满足随机原则随机原则,即抽样时总体中的每个个体都有同等的机会成为样本中的元素。即抽样时总体中的每个个体都有同等的机会成为样本中的元素。不重复抽样不重复抽样每次抽取一个每次抽取一个个体不放回去,再抽取第二个个体不放回去,再抽取第二个个体,连续抽取个体,连续抽取n次。次。重复抽样重复抽样每次抽取一个每次抽取一个个体又放回去,再抽取第二个体又放回去,再抽取第二个个体,连续抽取个个体,连续抽取n次。次。对无限总体,不重复抽样等价于重复抽样,当对无限

3、总体,不重复抽样等价于重复抽样,当N很大时,不重复很大时,不重复抽样则近似于重复抽样抽样则近似于重复抽样第1页/共30页一、总体、样本与随机变量一、总体、样本与随机变量统计学知识简介统计学知识简介随机变量随机变量按一定的概率取不同数值的变量,用按一定的概率取不同数值的变量,用、等表示。等表示。一个随机变量的完全信息是包括它的取值范围及取每个数值的一个随机变量的完全信息是包括它的取值范围及取每个数值的概率,称为随机变量的分布。概率,称为随机变量的分布。随机变量按其取值情况分为随机变量按其取值情况分为两大类两大类:离散型随机变量离散型随机变量所有可能值为有限个或至多为无穷可列个。所有可能值为有限个

4、或至多为无穷可列个。连续型随机变量连续型随机变量所有可能取值不能够一一列举出来,其值所有可能取值不能够一一列举出来,其值域为一个或若干个有限或无限区间。域为一个或若干个有限或无限区间。第2页/共30页二、随机变量的分布二、随机变量的分布统计学知识简介统计学知识简介随机变量是用它的随机变量是用它的分布来表示的。分布来表示的。若若为随机变量,为随机变量,x为任意实数,则称为任意实数,则称F(x)=P(x)为为随机变量随机变量的的分布函数分布函数,即,即 x的概率。的概率。分布函数分布函数F(x)满足:满足:0 F(x)1,F(-)=0,F(+)=1,P(x1 x2)=F(x2)-F(x1)对对离散

5、型随机变量离散型随机变量,可以用,可以用概率函数概率函数Pi=P(=xi)表示,即表示,即=xi的概率,其中的概率,其中i=1,2,。P满足:满足:Pi 0,Pi=1对对连续型随机变量连续型随机变量,可以用,可以用密度函数密度函数f(x)表示,近似于表示,近似于 在在x附近单位长区间上取值的概率。附近单位长区间上取值的概率。f(x)满足:满足:f(x)0,对离散对离散变量:变量:对连续对连续变量:变量:第3页/共30页二、随机变量的分布二、随机变量的分布统计学知识简介统计学知识简介分量为随机变量的向量称为分量为随机变量的向量称为多元随机变量多元随机变量,其联合分布,其联合分布函数定义为:函数定

6、义为:F(x1,xn)=P(1 x1,n xn)。若随机变量若随机变量、满足满足F(x,y)=F(x)F(y),即联合分布,即联合分布函数等于各自分布函数的乘积,则称随机变量函数等于各自分布函数的乘积,则称随机变量与与相互相互独立。独立。若若为为随机变量,随机变量,=f()称为随机变量函数,通常也是一称为随机变量函数,通常也是一个随机变量。个随机变量。随机变量是用它的随机变量是用它的分布来表示的。分布来表示的。第4页/共30页三、总体分布的数字特征三、总体分布的数字特征参数参数统计学知识简介统计学知识简介总体分布是由它的某些总体分布是由它的某些数字特征决定的,称之数字特征决定的,称之为参数。常

7、用的参数有为参数。常用的参数有期望、方差、协方差期望、方差、协方差1、数学期望数学期望(Mathematical Expectation)离散型随机变量离散型随机变量的期望值定义为:的期望值定义为:也称均值,表示总体的平均水平,记为也称均值,表示总体的平均水平,记为或或E()连续型随机变量连续型随机变量的期望值定义为:的期望值定义为:期望值满足:期望值满足:(1)若若a为常数,为常数,随机变量,则随机变量,则E(a)=a,E(a)=aE()(2)若若、为随机变量,为随机变量,a、b为常数,则为常数,则E(a+b)=aE()+bE()(3)若若、为相互独立的随机变量,则为相互独立的随机变量,则E

8、()=E()E()第5页/共30页三、总体分布的数字特征三、总体分布的数字特征参数参数统计学知识简介统计学知识简介2、方差方差(Variance)定义为:定义为:表示总体相对均值的离散程度,记为表示总体相对均值的离散程度,记为2或或Var()可简化为:可简化为:方差满足:方差满足:(1)若若a为常数,为常数,随机变量,则随机变量,则Var(a)=0,Var(a)=a2 Var(),Var(a+)=Var()(2)若若、为随机变量,为随机变量,a、b为常数,则为常数,则 Var(a b)=a2 Var()+b2 Var()2abCov(,)为总体标准差,为总体标准差,与总体的数量指与总体的数量指

9、标有相同的量纲。标有相同的量纲。总体分布是由它的某些总体分布是由它的某些数字特征决定的,称之数字特征决定的,称之为参数。常用的参数有为参数。常用的参数有期望值、方差、协方差期望值、方差、协方差(3)若若、相互独立,则相互独立,则 Var(a b)=a2 Var()+b2 Var()显然,参数不是随机变量。显然,参数不是随机变量。第6页/共30页三、总体分布的数字特征三、总体分布的数字特征参数参数统计学知识简介统计学知识简介3、协方差协方差(Covariance)是两个随机变量与各自数学期望离差之积的期望,记为:是两个随机变量与各自数学期望离差之积的期望,记为:可简化为:可简化为:协方差满足:协

10、方差满足:(2)Cov(,)=Var()(1)若若和和独立,则独立,则Cov(,)=0协方差可用于度协方差可用于度量两个随机变量量两个随机变量之间相关关系的之间相关关系的密切程度。密切程度。显然,参数不是随机变量。显然,参数不是随机变量。总体分布是由它的某些总体分布是由它的某些数字特征决定的,称之数字特征决定的,称之为参数。常用的参数有为参数。常用的参数有期望值、方差、协方差期望值、方差、协方差(3)Cov(a+b,c+d)=bdCov(,)(4)Cov(+,)=Cov(,)+Cov(,)第7页/共30页四、样本分布的数字特征四、样本分布的数字特征统计量统计量统计学知识简介统计学知识简介样本分

11、布的数字特征样本分布的数字特征称为统计量。称为统计量。1、样本平均数样本平均数样本平均数表示样本的平均水平。样本平均数表示样本的平均水平。若若 为一个样本,定义为:为一个样本,定义为:样本方差表示样本相对其样本平均数的离散程度,定义为:样本方差表示样本相对其样本平均数的离散程度,定义为:为为样本标准差样本标准差,它与样本观测值的数量指标有相同的量纲。,它与样本观测值的数量指标有相同的量纲。显然,由不同的样本可以得到不同的样本平均数和样本方差,因此统显然,由不同的样本可以得到不同的样本平均数和样本方差,因此统计量是随机变量。可以证明:计量是随机变量。可以证明:2、样本方差样本方差第8页/共30页

12、四、样本分布的数字特征四、样本分布的数字特征统计量统计量统计学知识简介统计学知识简介样本分布的数字特征样本分布的数字特征称为统计量。称为统计量。2、样本方差样本方差3、样本协方差样本协方差第9页/共30页五、几个重要的连续型随机变量的分布五、几个重要的连续型随机变量的分布统计学知识简介统计学知识简介1、正态分布正态分布若随机变量若随机变量的密度函数的密度函数正态分布在统计中具有重要的理论和实践意正态分布在统计中具有重要的理论和实践意义,现实中的许多随机现象都服从或近似服义,现实中的许多随机现象都服从或近似服从正态分布;随着样本容量的增大,很多统从正态分布;随着样本容量的增大,很多统计量近似于正

13、态分布计量近似于正态分布(如如 t分布分布);许多离散型;许多离散型随机变量可用正态分布来近似随机变量可用正态分布来近似(如二项分布如二项分布)正态分布满足正态分布满足:(1)E()=,Var()=2其中其中、为常数,为常数,0,则称,则称服从正态分布,记为服从正态分布,记为 N(,2)当当=0,=1时,称时,称服从服从标准正态分布标准正态分布,记为,记为 N(0,1)(2)若若 N(,2),则,则x xf(xf(x)第10页/共30页五、几个重要的连续型随机变量的分布五、几个重要的连续型随机变量的分布统计学知识简介统计学知识简介2、2分布分布若若1,n 为服从为服从N(0,1)的正态总体的样

14、本,的正态总体的样本,2分布分布满足满足:(1)E()=n,Var()=2n则称则称=12+n2 为为服从服从n个自由度的个自由度的2分布分布,记为,记为 2(n)服从服从2分布的随机变分布的随机变量,可以表示为独立量,可以表示为独立的标准正态随机变量的标准正态随机变量的平方和。正态总体的平方和。正态总体的样本方差服从的样本方差服从2分分布。布。x x0 0f(x)f(x)n=4n=4n=1n=10 0第11页/共30页五、几个重要的连续型随机变量的分布五、几个重要的连续型随机变量的分布统计学知识简介统计学知识简介3、t分布分布若随机变量若随机变量 N(0,1),2(n),与与相互独立,则称相

15、互独立,则称可以可以 证明:证明:(1)E(t)=0,Var(t)=n/(n-2)为服从为服从自由度为自由度为n的的t分布,分布,记为记为t t(n)。(2)Var(t)随着随着n的增加而减少,且的增加而减少,且Var(+)=1(3)当当n30时,时,t(n)近似于近似于N(0,1)。x x0 0f(x)f(x)t分布分布正态分正态分布布第12页/共30页五、几个重要的连续型随机变量的分布五、几个重要的连续型随机变量的分布统计学知识简介统计学知识简介4、F分布分布若随机变量若随机变量 2(n1),2(n2),且,且与与相互独立,则称相互独立,则称为服从为服从第一个自由度为第一个自由度为n1、第

16、二个自由度为第二个自由度为n2的的F分布,分布,记为记为F F(n1,n2)。易知,若易知,若F F(n1,n2),则,则1/F F(n2,n1)。x x0 0f(x)f(x)F F(n(n1 1,n,n2 2)F分布的上侧分位数分布的上侧分位数第13页/共30页六、正态总体的样本平均数和样本方差六、正态总体的样本平均数和样本方差统计学知识简介统计学知识简介(1)若总体服从若总体服从N(,2),x1,xn为一个样本,则为一个样本,则(2)若若x1,xn和和y1,yn是分别取自正态总体是分别取自正态总体N(1,12)、N(2,22)的样本,则的样本,则其中,其中,S12、S22分别为两个样本的样

17、本方差。分别为两个样本的样本方差。第14页/共30页六、正态总体的样本平均数和样本方差六、正态总体的样本平均数和样本方差统计学知识简介统计学知识简介(3)中心极限定理中心极限定理:若随机变量:若随机变量x1,xn相互独立,相互独立,且服从同一分布,则且服从同一分布,则的极限分布的极限分布(n)为标准正态分布,为标准正态分布,其中其中、2分别为分别为xi的均值和方差。的均值和方差。中心极限定理说明,中心极限定理说明,当样本容量当样本容量n充分大时,相互独立充分大时,相互独立随机变量和的分布将是正态的,即:随机变量和的分布将是正态的,即:第15页/共30页七、估计量的评价标准七、估计量的评价标准统

18、计学知识简介统计学知识简介1、无偏性无偏性利用统计量的信息利用统计量的信息可以对未知参数进可以对未知参数进行估计,行估计,作为作为的的估计量,其优劣有估计量,其优劣有一些评价的标准。一些评价的标准。2、有效性有效性3、一致性一致性若若 ,则称,则称 为为的无偏估计量。的无偏估计量。通常称通常称 为为系统误差系统误差,无偏估计意味着无系统误差。,无偏估计意味着无系统误差。若若 为为的所有无偏估计量中方差的所有无偏估计量中方差最小的,则称最小的,则称 为为的有效估计量。的有效估计量。若若 依概率收敛于依概率收敛于,即对任意,即对任意0,则称则称 为为的一致估计量。的一致估计量。通常把样本容量通常把

19、样本容量n30的样本看做大的样本看做大样本,一致性在大样本时才起作用样本,一致性在大样本时才起作用在样本容量相同的情在样本容量相同的情况下,有效估计量的况下,有效估计量的值在值在的附近最为集的附近最为集中中第16页/共30页八、参数估计八、参数估计统计学知识简介统计学知识简介1、参数的点估计参数的点估计统计推断中包括参统计推断中包括参数估计和假设检验。数估计和假设检验。参数估计又分为点参数估计又分为点估计和区间估计。估计和区间估计。(1)矩估计法矩估计法选择一个适当的统计量选择一个适当的统计量 ,把其观测值作为未知参数,把其观测值作为未知参数的估计值,称为点估计。统计量的选取有不同的方法。的估

20、计值,称为点估计。统计量的选取有不同的方法。随机变量随机变量x 的的r阶原点矩定义为阶原点矩定义为E(xr),r阶中心矩定义为阶中心矩定义为E(x-E(x)r。特例:一阶原点矩为数学期望特例:一阶原点矩为数学期望E(x),二阶中心距为方差,二阶中心距为方差Var(x),即,即E(x-E(x)2。矩估计法中,把矩估计法中,把样本矩作为对应总体矩的估计量样本矩作为对应总体矩的估计量,例如:,例如:第17页/共30页八、参数估计八、参数估计统计学知识简介统计学知识简介1、参数的点估计参数的点估计(2)极大似然估计法极大似然估计法选择一个适当的统计量选择一个适当的统计量 ,把其观测值作为未知参数,把其

21、观测值作为未知参数的估计值,称为点估计。统计量的选取有不同的方法。的估计值,称为点估计。统计量的选取有不同的方法。设设x1,xn为由未知参数为由未知参数确定的总体的一个样本,确定的总体的一个样本,对离散型随机变量,定义对离散型随机变量,定义对连续型随机变量,定义对连续型随机变量,定义称称L为似然函数为似然函数。极大似然估计法中,把。极大似然估计法中,把使样本出现概率最大的估计量作为所选使样本出现概率最大的估计量作为所选,即,即关于关于极大化极大化L,得到等价于极大化,得到等价于极大化lnL,通过,通过lnL关于关于的一阶导数为的一阶导数为0来求来求统计推断中包括参统计推断中包括参数估计和假设检

22、验。数估计和假设检验。参数估计又分为点参数估计又分为点估计和区间估计。估计和区间估计。第18页/共30页八、参数估计八、参数估计统计学知识简介统计学知识简介1、参数的点估计参数的点估计(3)最小二乘估计法最小二乘估计法选择一个适当的统计量选择一个适当的统计量 ,把其观测值作为未知参数,把其观测值作为未知参数的估计值,称为点估计。统计量的选取有不同的方法。的估计值,称为点估计。统计量的选取有不同的方法。已知一组样本观测值已知一组样本观测值(Xi,Yi)(i=1,2,n),要求样本回,要求样本回归函数尽可能地拟合这组值,即样本回归线上的点归函数尽可能地拟合这组值,即样本回归线上的点 与真实观测点与

23、真实观测点Yi的的“总体误差总体误差”尽可能地小。尽可能地小。最小二乘法给出的判断标准是:最小二乘法给出的判断标准是:二者之差的平方和最二者之差的平方和最小小,即:,即:在给定样本观测值之下,选出的在给定样本观测值之下,选出的 ,使使Yi与与 之差的平方和最小。之差的平方和最小。统计推断中包括参统计推断中包括参数估计和假设检验。数估计和假设检验。参数估计又分为点参数估计又分为点估计和区间估计。估计和区间估计。第19页/共30页八、参数估计八、参数估计统计学知识简介统计学知识简介2、参数的区间估计参数的区间估计设设x1,xn为由未知参数为由未知参数确定的总体的一个样本,确定的总体的一个样本,对给

24、定的数对给定的数(0,1),确定两个统计量,确定两个统计量1、2,使得,使得P(1 0(右侧检验)(右侧检验)H0:0,H1:/2 z z 0(右侧检验)(右侧检验)H0:0,H1:t/2(n-1)t t(n-1)t 02(右侧检验)(右侧检验)H0:2 02,H1:2 02(左侧检验)(左侧检验)拒绝域为:拒绝域为:检验统计量取为检验统计量取为为为2分布的临界值分布的临界值第28页/共30页九、假设检验九、假设检验统计学知识简介统计学知识简介5、区间估计与假设检验的关系区间估计与假设检验的关系给定显著性水平给定显著性水平,假设检验的拒绝域与,假设检验的拒绝域与1-置信度下的置信度下的置信区间有直接的关系。置信区间有直接的关系。当原假设没有落在置信区间内时,拒绝当原假设没有落在置信区间内时,拒绝H0,发生第一类,发生第一类错误的概率错误的概率正是原假设落在置信区间外部的概率;当正是原假设落在置信区间外部的概率;当原假设落在置信区间内时,不能拒绝原假设落在置信区间内时,不能拒绝H0。在显著性水平在显著性水平下接受下接受H0:=0 XN(,2)0落在落在的的1-置信置信度的置信区间内度的置信区间内 第29页/共30页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁