《数理统计抽样分布学习教案.pptx》由会员分享,可在线阅读,更多相关《数理统计抽样分布学习教案.pptx(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、会计学1数理统计数理统计(sh l tn j)抽样分布抽样分布第一页,共38页。试验前试验前 是随机变量是随机变量试验后试验后 是具体的数值是具体的数值设设为来自总体为来自总体的样本的样本,其其中中 均未知,判断下列哪些是统计量:均未知,判断下列哪些是统计量:为什么要求统计量不含任何为什么要求统计量不含任何(rnh)(rnh)未知参数未知参数第1页/共38页第二页,共38页。与均值和方差有什么不同与均值和方差有什么不同?为什么不是为什么不是(下章说明下章说明)与第与第4 4章介绍的矩有什么不同章介绍的矩有什么不同?第2页/共38页第三页,共38页。经验(jngyn)分布函数第3页/共38页第四
2、页,共38页。第4页/共38页第五页,共38页。格里汶科定理(dngl)第5页/共38页第六页,共38页。独立独立,与总体同分布与总体同分布独立独立,与与 同分布同分布由辛钦大数定律知由辛钦大数定律知都存在都存在(cnzi)(cnzi)设设为来自总体为来自总体的样本的样本,总体总体 阶矩阶矩其中其中 为连续函数为连续函数第6页/共38页第七页,共38页。设总体设总体 的均值和方差的均值和方差是来自总体是来自总体 的样本,则的样本,则都存在都存在(cnzi).(cnzi).第7页/共38页第八页,共38页。说明了什么说明了什么?是全体实验数据是全体实验数据的平均值的平均值是是数据数据的中心的中心
3、反映了实验数据反映了实验数据 与数据中心的偏离程度,反映了全体实验数据与数据中心的偏离程度,反映了全体实验数据 的离散程度的离散程度第8页/共38页第九页,共38页。包含了各种包含了各种(zhn)(zhn)有用信息有用信息集中、提炼集中、提炼(tlin)(tlin)数据中包含的有用信息数据中包含的有用信息 它们是随机变量它们是随机变量,必须确定其分布,称为抽样分布必须确定其分布,称为抽样分布来自标准正态总体的抽样分布来自标准正态总体的抽样分布来自一般正态总体的抽样分布来自一般正态总体的抽样分布分布分布 分布分布 分布分布五个抽样分布定理五个抽样分布定理第9页/共38页第十页,共38页。随着随着
4、(su zhe)(su zhe)自由度的增加曲线重心向右下方移动自由度的增加曲线重心向右下方移动是来自总体是来自总体设设的样本的样本,令令 称称 服从服从自由度自由度 为为 的的 分布分布,记为,记为且且 相互独立相互独立,则则设设且且设设相互独立相互独立,则则,于是于是(ysh)(ysh)理解为可独立变化的理解为可独立变化的r.vr.v个数个数则则设设取取 个独立同分布个独立同分布 的的则则 与与同分布同分布第10页/共38页第十一页,共38页。练习练习练习(linx(linx(linx)第11页/共38页第十二页,共38页。随着自由度的增加曲线越来越趋近随着自由度的增加曲线越来越趋近且且设
5、设相互独立相互独立,令令 称称 服从服从自由度自由度 为为 的的 分布分布,记为,记为易知:易知:利用伽马函数利用伽马函数(hnsh)(hnsh)的斯特林公式的斯特林公式即即故当故当 较大时较大时,可认为可认为 英国统计学家兼化学家戈塞特英国统计学家兼化学家戈塞特 (Gosset W S 1876-1937)(Gosset W S 1876-1937)于于19081908年用笔名年用笔名 Student Student 发表发表(fbio)(fbio)了关于了关于 t t 分布的论文分布的论文,这是一篇在统计学发展史上划时代的文章这是一篇在统计学发展史上划时代的文章,它创立了小样本代替大样本的
6、方法,开创了现代统计学的新纪元它创立了小样本代替大样本的方法,开创了现代统计学的新纪元.Gosset,Student Gosset,Student 的最后一个字母都是的最后一个字母都是 t,t,故取名为故取名为“t“t 分布分布”,”,又称为又称为“学生氏分布学生氏分布”.”.第12页/共38页第十三页,共38页。且且设设相互独立相互独立,令令 称称 服从服从自由度自由度 为为 的的 分布分布,记为,记为若若则则分布是为了纪念著名统计学家分布是为了纪念著名统计学家费歇耳费歇耳(R.A.Fisher 1890-1962)(R.A.Fisher 1890-1962)而命名而命名(mng mng)(
7、mng mng)第13页/共38页第十四页,共38页。如何由样本如何由样本 推断推断对对 的推断是通过构造统计量实现的的推断是通过构造统计量实现的如何构造如何构造“好好”的统计量的统计量服从什么分布?服从什么分布?统计推断统计推断(tudun)(tudun)中最重要的结论:中最重要的结论:第14页/共38页第十五页,共38页。仍服从仍服从(fcng)(fcng)正态分布正态分布,且且的样的样设设是来自总体是来自总体本本,则则独立同分布独立同分布由正态分布的性质知,线性组合由正态分布的性质知,线性组合第15页/共38页第十六页,共38页。的样本,的样本,设设是总体是总体分别为样本均值和样本方差,
8、则有分别为样本均值和样本方差,则有相互独立相互独立第16页/共38页第十七页,共38页。的样本,的样本,设设是总体是总体分别为样本均值和样本方差,则有分别为样本均值和样本方差,则有由定理由定理(dngl)(dngl)一、定理一、定理(dngl)(dngl)二有二有且且 与与 独立独立,由,由 分布的定义有分布的定义有即即“平均平均”说来说来 与与 的差别不大的差别不大,故可用故可用 “代替代替”两个未知参数两个未知参数一个未知参数一个未知参数第17页/共38页第十八页,共38页。的样本;的样本;设设是总体是总体的样本的样本,且两样本相互独立且两样本相互独立,是总体是总体两样本均值和样本方差分别
9、为两样本均值和样本方差分别为则则由定理由定理(dngl)(dngl)二,有二,有因两样本独立,故因两样本独立,故 独立独立第18页/共38页第十九页,共38页。的样本;的样本;设设是总体是总体的样本的样本,且两样本相互独立且两样本相互独立,是总体是总体两样本均值和样本方差分别为两样本均值和样本方差分别为则则其中其中(qzhng)(qzhng),且且 相互独立相互独立又又由由 的独立性及的独立性及 分布的可加性有分布的可加性有由两样本的独立性及由两样本的独立性及 分布的定义有分布的定义有第19页/共38页第二十页,共38页。面积为面积为则称则称 为分布密度为分布密度 的的上上 分位点分位点设设若
10、若存在常数存在常数 满足满足的上的上 分位点记为分位点记为第20页/共38页第二十一页,共38页。则称则称 为分布密度为分布密度 的的上上 分位点分位点设设若若存在常数存在常数 满足满足的上的上 分位点记为分位点记为查标准查标准(biozhn)(biozhn)正态分布表正态分布表,可求得可求得第21页/共38页第二十二页,共38页。则称则称 为分布密度为分布密度 的的上上 分位点分位点设设若若存在常数存在常数 满足满足的上的上 分位点记为分位点记为查查 t t 分布分布(fnb)(fnb)表表,可求得可求得第22页/共38页第二十三页,共38页。则称则称 为分布密度为分布密度 的的上上 分位点
11、分位点设设若若存在常数存在常数 满足满足的上的上 分位点记为分位点记为查查 分布表分布表,可求得可求得 Fisher Fisher曾证明曾证明:当当 n n 充分大时有充分大时有第23页/共38页第二十四页,共38页。则称则称 为分布密度为分布密度 的的上上 分位点分位点设设若若存在常数存在常数 满足满足的上的上 分位点记为分位点记为查查 分布表分布表,可求得可求得若若 则则故故第24页/共38页第二十五页,共38页。习题习题(xt)(xt):P126 2P126 2、4 4、9 9作业(zuy)第25页/共38页第二十六页,共38页。27数据整理数据整理(zhngl)与显示与显示(了解了解内
12、容内容)n n117 122 124 129 139 107 117 130 122 125117 122 124 129 139 107 117 130 122 125n n108 131 125 117 122 133 126 122 118 108108 131 125 117 122 133 126 122 118 108n n110 118 123 126 133 134 127 123 118 112110 118 123 126 133 134 127 123 118 112n n112 134 127 123 119 113 120 123 127 135112 134 127
13、 123 119 113 120 123 127 135n n137 114 120 128 124 115 139 128 124 121137 114 120 128 124 115 139 128 124 121例某生产车间50名工人日加工(ji gng)零件数如下(单位:个)。试采用单变量值对数据进行分组。第26页/共38页第二十七页,共38页。28分组数据分组数据(shj)直方图直方图(直方图的制作)(直方图的制作)1.1.用用矩矩形形的的宽宽度度和和高高度度来来表表示示频频数数分分布布的的图图形形,实实际际上上是是用用矩矩形形的的面面积积来来表表示示各各组组的的频频数数分分布布2.
14、2.在在直直角角坐坐标标中中,用用横横轴轴表表示示数数据据分分组组,纵纵轴轴表表示示频频数数或或频频率率,各各组组与与相相应应(xingyng)的的频频数数就就形形成成了了一一个个矩矩形形,即即直直方方图图(Histogram)3.3.直方图下的总面积等于直方图下的总面积等于1第27页/共38页第二十八页,共38页。29直方图的绘制直方图的绘制直方图的绘制直方图的绘制(huzh)(huzh)频频频数数数(人人人)151512129 96 63 310105 511110 0115115 12120 012125 513130 013135 514140 0日加工日加工日加工(ji gng)(j
15、i gng)(ji gng)零零零件数件数件数(个个个)直方图下的面直方图下的面积之和等于积之和等于11图图6-1 6-1 某车间工人日加工某车间工人日加工(ji gng)(ji gng)零件零件数的直方图数的直方图我一眼就看出我一眼就看出来了,大多数来了,大多数人的日加工零人的日加工零件数在件数在120120125125之间之间!第28页/共38页第二十九页,共38页。30分组数据分组数据(shj)折线图折线图(折线图的制作)(折线图的制作)1.1.折线图也称频数多边形图折线图也称频数多边形图折线图也称频数多边形图折线图也称频数多边形图(Frequency polygon)(Frequenc
16、y polygon)2.2.是是是是在在在在直直直直方方方方图图图图的的的的基基基基础础础础上上上上,把把把把直直直直方方方方图图图图顶顶顶顶部部部部的的的的中中中中点点点点(组组组组中中中中值值值值)用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.3.折折折折线线线线图图图图的的的的两两两两个个个个终终终终点点点点要要要要与与与与横横横横轴轴轴轴相相相相交交交交(xingjio)(xingjio),具具具具体的做法是体的做法是体的做法是体的做法是4.4.第第第第一一一一个个个个矩矩矩矩形形形形
17、的的的的顶顶顶顶部部部部中中中中点点点点通通通通过过过过竖竖竖竖边边边边中中中中点点点点(即即即即该该该该组组组组频频频频数数数数一一一一半半半半的的的的位位位位置置置置)连连连连接接接接到到到到横横横横轴轴轴轴,最最最最后后后后一一一一个个个个矩矩矩矩形形形形顶顶顶顶部部部部中点与其竖边中点连接到横轴中点与其竖边中点连接到横轴中点与其竖边中点连接到横轴中点与其竖边中点连接到横轴5.5.折折折折线线线线图图图图下下下下所所所所围围围围成成成成的的的的面面面面积积积积与与与与直直直直方方方方图图图图的的的的面面面面积积积积相相相相等等等等,二二二二者所表示的频数分布是一致的者所表示的频数分布是一
18、致的者所表示的频数分布是一致的者所表示的频数分布是一致的第29页/共38页第三十页,共38页。31151512129 96 63 310510511011011511512120 012512513130 013513514140 0日加工日加工日加工(ji gng)(ji gng)(ji gng)零件数零件数零件数(个个个)频频频数数数(人人人)折线图下的面折线图下的面积与直方图的积与直方图的面积相等!面积相等!分组数据分组数据(shj)折线图折线图(折线图的绘制)(折线图的绘制)图图6-2 6-2 某车间某车间(chjin)(chjin)工人日加工零件数的折线工人日加工零件数的折线图图第3
19、0页/共38页第三十一页,共38页。32未分组数据未分组数据(shj)茎叶图茎叶图(茎叶图的制作)(茎叶图的制作)1.1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.2.由由由由“茎茎茎茎”和和和和“叶叶叶叶”两部分构成,其图形是由数字组成的两部分构成,其图形是由数字组成的两部分构成,其图形是由数字组成的两部分构成,其图形是由数字组成的3.3.以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶4.4
20、.对于对于对于对于n(20n300)n(20n300)个数据,茎叶图最大行数不超过个数据,茎叶图最大行数不超过个数据,茎叶图最大行数不超过个数据,茎叶图最大行数不超过5.5.L=10 log 10 n L=10 log 10 n 6.6.5.5.茎叶图类似茎叶图类似茎叶图类似茎叶图类似(li s)(li s)于横置的直方图,但又有区别于横置的直方图,但又有区别于横置的直方图,但又有区别于横置的直方图,但又有区别7.7.直直直直方方方方图图图图可可可可大大大大体体体体上上上上看看看看出出出出一一一一组组组组数数数数据据据据的的的的分分分分布布布布状状状状况况况况,但但但但没没没没有有有有给给给给
21、出出出出具体的数值具体的数值具体的数值具体的数值8.8.茎茎茎茎叶叶叶叶图图图图既既既既能能能能给给给给出出出出数数数数据据据据的的的的分分分分布布布布状状状状况况况况,又又又又能能能能给给给给出出出出每每每每一一一一个个个个原原原原始始始始数值,保留了原始数据的信息数值,保留了原始数据的信息数值,保留了原始数据的信息数值,保留了原始数据的信息第31页/共38页第三十二页,共38页。33树茎树茎树叶树叶(sh(sh y)y)78878802234777888902234777888900122223333444667778890012222333344466777889013344579901
22、334457991010111112121313数据数据(shj)(shj)个个数数3 3131324241010茎叶图类似横置茎叶图类似横置的直方图的直方图未分组数据未分组数据(shj)茎叶图茎叶图(茎叶图的制作)(茎叶图的制作)图图6-3 6-3 某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图第32页/共38页第三十三页,共38页。34未分组数据未分组数据(shj)茎叶图茎叶图(扩展的茎叶图)(扩展的茎叶图)树茎树茎树茎树叶树叶树叶10s10s10s10.10.10.11*11*11*11t11t11t11f11f11f11s11s11s11.11.11.12*12*12*1
23、2t12t12t12f12f12f12s12s12s12.12.12.13*13*13*12t12t12t13f13f13f13s13s13s13.13.13.7778 88 88 80002 2 32 2 32 2 34 54 54 57 7 77 7 77 7 78 8 8 98 8 8 98 8 8 90 0 10 0 10 0 12 2 2 2 3 3 3 32 2 2 2 3 3 3 32 2 2 2 3 3 3 34 4 4 5 54 4 4 5 54 4 4 5 56 6 7 7 76 6 7 7 76 6 7 7 78 8 98 8 98 8 90 10 10 13 33 33
24、 34 4 54 4 54 4 57779 99 99 9树茎树茎树茎树叶树叶树叶10*10*10*10.10.10.11*11*11*11.11.11.12*12*12*12.12.12.13*13*13*13.13.13.7 8 87 8 87 8 80 2 2 3 40 2 2 3 40 2 2 3 45 7 7 7 8 8 8 95 7 7 7 8 8 8 95 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 9
25、5 5 6 6 7 7 7 8 8 95 5 6 6 7 7 7 8 8 90 1 3 3 4 4 0 1 3 3 4 4 0 1 3 3 4 4 5 7 9 95 7 9 95 7 9 9图图6-4 6-4 图图6.36.3扩展后的茎叶图扩展后的茎叶图第33页/共38页第三十四页,共38页。35未分组数据未分组数据(shj)箱线图箱线图(箱线图的制作)(箱线图的制作)1.1.用于显示未分组的原始数据或分组数据的分布用于显示未分组的原始数据或分组数据的分布用于显示未分组的原始数据或分组数据的分布用于显示未分组的原始数据或分组数据的分布2.2.箱箱箱箱线线线线图图图图由由由由一一一一组组组组数数
26、数数据据据据的的的的5 5个个个个特特特特征征征征值值值值绘绘绘绘制制制制而而而而成成成成,它它它它由由由由一个一个一个一个(y(y )箱子和两条线段组成箱子和两条线段组成箱子和两条线段组成箱子和两条线段组成3.3.其绘制方法是:其绘制方法是:其绘制方法是:其绘制方法是:4.4.首首首首先先先先找找找找出出出出一一一一组组组组数数数数据据据据的的的的5 5个个个个特特特特征征征征值值值值,即即即即最最最最大大大大值值值值、最最最最小小小小值值值值、中中中中位位位位数数数数Me Me 和和和和两两两两个个个个四四四四分分分分位位位位数数数数(下下下下四四四四分分分分位位位位数数数数QLQL和上四
27、分位数和上四分位数和上四分位数和上四分位数QUQU)5.5.连连连连接接接接两两两两个个个个四四四四分分分分(位位位位)数数数数画画画画出出出出箱箱箱箱子子子子,再再再再将将将将两两两两个个个个极极极极值值值值点与箱子相连接点与箱子相连接点与箱子相连接点与箱子相连接 第34页/共38页第三十五页,共38页。36未分组数据未分组数据(shj)单批数据单批数据(shj)箱线图箱线图 (箱线图的构成)(箱线图的构成)中位数中位数中位数4 4 46 6 68 8 8101010121212Q QQU UUQ QQL LLX X X最大值最大值最大值X X X最小值最小值最小值图图6-5 6-5 简单箱
28、线图简单箱线图第35页/共38页第三十六页,共38页。37未分组数据未分组数据(shj)单批数据单批数据(shj)箱线图箱线图 (实例)(实例)最小值最小值最小值107107107最大值最大值最大值139139139中位数中位数中位数123123123下四分位数下四分位数下四分位数117.75117.75117.75上四分位数上四分位数上四分位数128128128105 110 115 120 125 130 135 140105 110 115 120 125 130 135 140105 110 115 120 125 130 135 140图图6-6 506-6 50名工人日加工零件数的箱线图名工人日加工零件数的箱线图第36页/共38页第三十七页,共38页。38分布分布(fnb)的形状与箱线图的形状与箱线图 对称分布对称分布对称分布Q QQLLL中位数中位数中位数 Q QQUUU左偏分布左偏分布左偏分布Q QQLLL中位数中位数中位数 Q QQUUU右偏分布右偏分布右偏分布Q QQLLL 中位数中位数中位数 Q QQUUU图图6-7 6-7 不同不同(b tn)(b tn)分布的箱分布的箱线图线图第37页/共38页第三十八页,共38页。