《数理统计的基本知识概要学习教案.pptx》由会员分享,可在线阅读,更多相关《数理统计的基本知识概要学习教案.pptx(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1数理统计数理统计(sh l tn j)的基本知识概要的基本知识概要第一页,共43页。引言(ynyn)到了十九(sh ji)世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作.但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围(fnwi)之外的推断.第1页/共43页第二页,共43页。数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一
2、定的决策和行动提供依据(yj)和建议.引言(ynyn)第2页/共43页第三页,共43页。数理统计不同于一般的资料统计,它更侧重于应用(yngyng)随机现象本身的规律性进行资料的收集、整理和分析.由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来.但在客观上只允许(ynx)我们对随机现象进行次数不多的观察试验,也就是说,我们获得的只是局部观察资料.引言(ynyn)第3页/共43页第四页,共43页。数理统计方法具有“部分推断(tudun)整体”的特征.引言(ynyn)数理统计(sh l tn j)的基本思想:从所要研
3、究对象的全体中,抽取一小部分进行观测或试验。以取得信息,从而对整体做出推断。每个推断必须伴随一定的概率,以表明推断的可靠性。(数理推断)数理统计的基本任务:以大数定律、中心极限定理为理论基础,根据实际掌握的部分信息对有关主体试验的分布、数字特征做出估计并加以检验的数理推断。第4页/共43页第五页,共43页。一个统计问题(wnt)总有它明确的研究对象.1.总体(zngt)研究对象的全体(qunt)称为总体(母体),总体中所包含的个体的个数称为总体的容量.总体中每个成员称为个体,总体有限总体无限总体一、总体和样本第5页/共43页第六页,共43页。在数理统计研究中,人们往往研究有关(yugun)对象
4、的某一项(或几项)数量指标和.为此,对这一指标进行随机试验,观察试验结果全部观察值,从而考察该数量指标的分布情况.这时,每个具有的数量指标的全体就是总体.每个数量指标就是个体.某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体一、总体(zngt)和样本第6页/共43页第七页,共43页。因此在理论上可以把总体与概率分布等同(dngtng)起来.由于每个个体的出现是随机的,所以(suy)相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量X,因此随机变量X的分布就是该数量指标在总体中的分布.总体就可以用一个随机变量(su j bin
5、 lin)及其分布来描述.一、总体和样本一、总体和样本第7页/共43页第八页,共43页。例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体(zngt)就可以用随机变量X表示,或用其分布函数F(x)表示.某批灯泡的寿命总体 寿命 X 可用一概率(gil)(指数)分布来刻划一、总体(zngt)和样本F(x)第8页/共43页第九页,共43页。类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重(tzhng),我们用X 和Y 分别表示身高和体重(tzhng),那么此总体就可用二维随机变量(X,Y)或其联合分布函数 F(x,y)来表示.统计中,总体这个概念 的要旨是:总体就
6、是(jish)一个随机变量或概率分布.一、总体一、总体(zngt)(zngt)和和样本样本第9页/共43页第十页,共43页。总体分布一般是未知,或只知道是包含未知参数的分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察(gunch)试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.2.样本(yngbn)从国产轿车中抽5辆进行耗油量试验样本容量为5抽到哪5辆是随机(su j)的一、总体和样本一、总体和样本第10页/共43页第十一页,共43页。一旦(ydn)取定一组样本X1,,Xn ,得到n个具体的数(x1,x2
7、,xn),称为样本的一次观察值,简称样本值.n称为这个(zh ge)样本的容量.1.代表性:X1,X2,Xn中每一个与所考察的总体有 相同(xin tn)的分布.2.独立性:X1,X2,Xn是相互独立的随机变量.一、总体和样本第11页/共43页第十二页,共43页。一、总体(zngt)和样本 简单样本(yngbn)是一种理想化的样本(yngbn).如何才能得到简单样本(yngbn)呢?对于有限总体,若采用(ciyng)有放回抽取,则可得到简单样本;若采用(ciyng)无放回抽取,则无法保证每次抽取的独立性,但若有限总体容量较样本容量很大时,无放回抽取与有放回抽取区别很小,亦可采用(ciyng)无
8、放回抽取得到简单样本.对于无限总体,抽取部分个体后放回与否对总体成分影响不大,因此可采用不放回抽取获得简单样本.第12页/共43页第十三页,共43页。简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别(tbi)说明,就指简单随机样本.=F(x1)F(x2)F(xn)若总体(zngt)的分布函数为F(x)、概率密度函数为f(x),则其简单随机样本的联合分布函数为其简单(jindn)随机样本的联合概率密度函数为=f(x1)f(x2)f(xn)一、总体和样本第13页/共43页第十四页,共43页。解:例1一、总体一、总体(zngt)(zngt)和和样本样本
9、第14页/共43页第十五页,共43页。解:例2一、总体(zngt)和样本第15页/共43页第十六页,共43页。一、总体一、总体(zngt)(zngt)和和样本样本第16页/共43页第十七页,共43页。事实上我们抽样后得到的资料都是具体(jt)的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.3.总体、样本(yngbn)、样本(yngbn)值的关系一、总体一、总体(zngt)(zngt)和和样本样本第17页/共43页第十八页,共43页。总体(理论分布)?样本 样本值 统计是从手中已有的资料-样本值,去推
10、断总体的情况(qngkung)-总体分布F(x)的性质.总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以(ky)由样本值去推断总体.样本是联系(linx)二者的桥梁一、总体和样本一、总体和样本第18页/共43页第十九页,共43页。例3 为对某小麦杂交组合F2代的株高X进行研究,抽取容量为100的样本,测试(csh)的原始数据记录如下(单位:厘米),试根据以上数据,画出它的频率直方图,求随机变量X的分布状况.87 88111 91 73 70 92 98105 94 99 91 98110 98 97 90 83 92 88 86 94102 99 89104 94 94
11、92 96 87 94 92 86102 88 75 90 90 80 84 91 82 94 99102 91 96 94 94 85 88 80 83 81 69 95 80 97 92 96109 91 80 80 94102 80 86 91 90 83 84 91 87 95 76 90 91 77103 89 88 85 95 92104 92 95 83 86 81 86 91 89 83 96 86 75 92 二、分布(fnb)密度的近似求法第19页/共43页第二十页,共43页。1.找出数据(shj)中最小值m=69,最大值M=111,极差为 M-m=422.数据(shj)分
12、组,根据样本容量n的大小,决定分组数k。一般(ybn)规律 30n40 5k6 40n60 6k8 60n100 8k10 100n500 10k20二、分布密度的近似求法方法:整理原始数据,加工为分组资料,作出频率分布方法:整理原始数据,加工为分组资料,作出频率分布方法:整理原始数据,加工为分组资料,作出频率分布方法:整理原始数据,加工为分组资料,作出频率分布表,画直方图,提取样本分布特征的信息表,画直方图,提取样本分布特征的信息表,画直方图,提取样本分布特征的信息表,画直方图,提取样本分布特征的信息.步骤如下:步骤如下:步骤如下:步骤如下:第20页/共43页第二十一页,共43页。一般采取(
13、ciq)等距分组(也可以不等距分组),本例取k=9.本例测量(cling)单位为1厘米,组距为 二、分布二、分布(fnb)(fnb)密度的近似求法密度的近似求法组距=极差/组数第21页/共43页第二十二页,共43页。3确定(qudng)组限和组中点值。注意:组的上限与下限(xixin)应比数据多一位小数。当取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比数据多一位小数(xiosh)),分组如下:一般根据:各组中点值 组距=组的上限或下限67.5,72.5)72.5,77.5)77.5,82.5)82.5,87.5)87.5,92.5)92.5,97.5)97.5,102.
14、5)102.5,107.5)107.5,112.5)组中值分别为:70 75 80 85 90 95 100 105 110二、分布密度的近似求法二、分布密度的近似求法第22页/共43页第二十三页,共43页。组序组序区间范围区间范围频数频数fj频率频率Wj=fj/n累计频率累计频率Fj167.5,72.5)20.020.02272.5,77.5)50.050.07377.5,82.5)100.100.17482.5,87.5)180.180.35587.5,92.5)300.30.65692.5,97.5)180.180.83797.5,102.5)100.10.938102.5,107.5)
15、40.040.979107.5,112.5)30.031.004将数据(shj)分组,计算各组频数,作频数、频率分布表第23页/共43页第二十四页,共43页。二、分布(fnb)密度的近似求法5.作出频率(pnl)直方图以样本(yngbn)值为横坐标,频率/组距为纵坐标;以分组区间为底,以 为高 作小矩形.第24页/共43页第二十五页,共43页。作频率(pnl)直方图 二、分布密度二、分布密度(md)(md)的近似求法的近似求法第25页/共43页第二十六页,共43页。从频率直方图可看到:靠近两个(lin)极端的数据出现比较少,而中间附近的数据比较多,即中间大两头小的分布趋势,随机变量分布状况的最
16、粗略的信息.在频率(pnl)直方图中,每个矩形面积恰好等于样本值落在该矩形对应的分组区间内的频率(pnl),即 频率直方图中的小矩形的面积近似地反映了样本数据落在某个区间内的可能性大小,故它可近似描述X的分布(fnb)状况.二、分布密度的近似求法第26页/共43页第二十七页,共43页。三、分布(fnb)函数的近似求法即 不大于x的观察(gunch)值的频率.第27页/共43页第二十八页,共43页。三、分布函数(hnsh)的近似求法第28页/共43页第二十九页,共43页。三、分布(fnb)函数的近似求法例4 抽取了某企业10个月的盈利(yn l)额(单位:万元)3.2 2.5 -4 2.5 0
17、3 2 2.5 4 2设X为月盈利(yn l)额,求X的经验分布函数并画图.解:将样本(yngbn)值由小到大排列为-4 0 2=2 2.5=2.5=2.5 3 3.2 4则其经验分布函数为第29页/共43页第三十页,共43页。三、分布函数三、分布函数(hnsh)(hnsh)的近似求法的近似求法第30页/共43页第三十一页,共43页。三、分布(fnb)函数的近似求法 对于任何实数x,等于在n次重复独立试验中事件 的频率,由频率与概率的关系知,可作为总体X的分布函数F(x)的近似,且当样本容量充分大时,几乎为F(x).若总体X是离散型,图形呈跳跃上升的阶梯曲线(累计频率曲线),若观察值不重复,则
18、每次跳跃高度是1/n,若观察值有重复,则按重复次数的1/n倍跳跃.若总体是连续型,只要大致连接各阶梯中点即可.第31页/共43页第三十二页,共43页。由样本值去推断总体情况,需要(xyo)对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.1.统计(tngj)量 这种不含任何未知参数的样本的函数(hnsh)称为统计量.它是完全由样本决定的量.四、统计量四、统计量第32页/共43页第三十三页,共43页。定义(dngy)例四、统计四、统计(tngj)(tngj)量量未知,为来自X的样本,则是统计(tngj)量,不是统计量.第33页/共43页第三十四页,共43
19、页。注意(zh y):四、统计四、统计(tngj)(tngj)量量1.统计量是关于样本的n元函数(hnsh),且不含未知参数;2.当样本 未取值时,统计量是一函数,当样本 取某组数值时,统计量为一数值.第34页/共43页第三十五页,共43页。2.顺序(shnx)统计量四、统计四、统计(tngj)(tngj)量量第35页/共43页第三十六页,共43页。四、统计(tngj)量例5 设总体(zngt)X的一组观察值为 2 3 2 4 10 13 8 8求极差和中位数.解:将观察(gunch)值由小到大排列R=13-2=112=2 3 4 8=8 10 13 第36页/共43页第三十七页,共43页。样
20、本均值它反映了总体均值(jn zh)的信息样本(yngbn)方差它反映(fnyng)了总体方差的信息样本标准差 3.样本的数字特征四、统计量第37页/共43页第三十八页,共43页。它反映了总体(zngt)k 阶矩的信息样本(yngbn)k阶原点矩样本(yngbn)k阶中心矩 k=1,2,它反映了总体k 阶中心矩的信息四、统计量四、统计量 k=1,2,特别,样本均值样本方差第38页/共43页第三十九页,共43页。四、统计(tngj)量样本(yngbn)修正方差当样本容量n较大(jio d)时,可认为二者无区别.第39页/共43页第四十页,共43页。统计(tngj)量的观察值四、统计四、统计(tngj)(tngj)量量第40页/共43页第四十一页,共43页。四、统计四、统计(tngj)(tngj)量量样本均值和方差(fn ch)具有下列性质:第41页/共43页第四十二页,共43页。四、统计(tngj)量例6 计算下列样本值的均值和修正(xizhng)方差 410 370 420 360 440解:设则从而(cng r)第42页/共43页第四十三页,共43页。