抽样分布精选PPT.ppt-淘文阁

资源描述

《抽样分布精选PPT.ppt》由会员分享，可在线阅读，更多相关《抽样分布精选PPT.ppt（68页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于抽样分布第1页，讲稿共68张，创作于星期一3.1 模拟抽样过程与抽样分布 3.1.1 3.1.1 抽样与抽样分布抽样与抽样分布 3.1.2 Excel抽取样本常用函数 3.1.3 运用Excel随机抽取样本 3.1.4 使用Excel建立抽样分布上一页下一页返回本章首页第2页，讲稿共68张，创作于星期一3.1.1 抽样与抽样分布抽样抽样是根据随机原则从总体中抽取一部分单位作为样本，并根据样本数量特征对总体数量特征做出具有一定可靠性的估计与推断。将从总体中抽取的部分单位称为样本；将描述样本数量特征的指标称为统计量；描述总体数量特征的指标称为参数。抽样分布从一个总体中随机抽取容量相同的样本

2、，则由这些样本可以计算出某统计量（如样本均值）的取值，这个统计量所有可能取值的概率分布称为该统计量（如均值）的抽样分布。上一页下一页返回本节首页第3页，讲稿共68张，创作于星期一1索引函数INDEX索引函数 INDEX()有两种形式：数组和引用。数组索引函数的语法为：INDEX(array,row_num,column_num)引用索引函数语法：INDEX(reference,row_num,column_num,area_num)3.1.2 Excel抽取样本常用函数上一页下一页返回本节首页第4页，讲稿共68张，创作于星期一2随机数函数RAND()随机数函数RAND()用于生成一个大于等于

3、 0 小于 1 的均匀分布随机数，每次计算时都将返回一个新的数值。其语法结构为：RAND()。3取整函数CEILING取整函数CEILING将参数 Number 沿绝对值增大的方向，舍入为最接近的整数或基数 significance 的最小倍数。其语法结构为：CEILING(number,significance)。其中：Number为待舍入的数值。Significance为基数。上一页下一页返回本节首页第5页，讲稿共68张，创作于星期一3.1.3 运用Excel随机抽取样本打开“第5章抽样分布”工作簿，选择“抽样模拟”工作表。上一页下一页返回本节首页第6页，讲稿共68张，创作于星期一选择

4、G1单元格，在工具栏中单击“函数”快捷按钮，打开“粘贴函数”对话框，在“函数分类”列表中选择 “数学与三角函数”，在“函数名”列表中选择“随机函数RAND”，打开随机函数对话框如下图所示。上一页下一页返回本节首页第7页，讲稿共68张，创作于星期一随机函数对话框中不需要填加任何数据，按住Ctrl+Shift键，单击“确定”按钮，在单元格G1中将显示一组随机数。下面将0和1之间的数转换为整数。将单元格C2中的公式改为“=15*RAND()”，按住Ctrl+Shift键，单击回车键。区域C2：C8中的各数值均扩大15倍。同时工作表重新计算一次，各值均发生改变。上一页下一页返回本节

5、首页第8页，讲稿共68张，创作于星期一选定D2：D8单元格区域，打开“插入”菜单，选择“函数”选项，打开“粘贴函数”对话框。在“函数分类”中选择“数学与三角函数”，在“函数名”列表中选择“取整函数CEILING”，打开取整函数对话框如下图所示。上一页下一页返回本节首页第9页，讲稿共68张，创作于星期一在Number中输入单元格地址C2：C8，在Significance 中输入1，按住Ctrl+Shift键，单击“确定”按钮。重复按F9键，在D2：D8各单元格中将出现介于1和 15之间的随机整数，即将要抽取的样本点。上一页下一页返回本节首页第10页，讲稿共68张，创作于星期一选定单元格区域E2：

6、E8，在“插入”菜单中选择“函数”选项，打开“粘贴函数”对话框。在“函数分类”列表中选择“查找与引用”选项，在“函数名”列表中选择 “索引函数INDEX”，打开选定参数对话框如下图所示。上一页下一页返回本节首页第11页，讲稿共68张，创作于星期一在选定参数窗口中，选择引用(reference)，单击“确定”按钮，进入索引函数INDEX窗口如下图所示上一页下一页返回本节首页第12页，讲稿共68张，创作于星期一在Reference中输入A2：A16，为抽取样本提供区域。在Row-num中输入D2：D8，说明在 Reference区域中要选哪些值。按住Ctrl+Shift组合键，单击“确定

7、”按钮，即得到随机抽取的样本容量为7的样本。每按一次F9键，工作表都将重新抽取一次样本。上一页下一页返回本节首页第13页，讲稿共68张，创作于星期一3.1.4 使用Excel建立抽样分布 1编制频数分布打开“第3章抽样分布.xls”工作簿，选择“总体”工作表，如下图所示。上一页下一页返回本节首页第14页，讲稿共68张，创作于星期一在单元格B1：B10，输入10，20，30，100。用鼠标选定C1：C10区域作为频数接受区域。在“插入”菜单中选择“函数”，打开“粘贴函数”对话框如下图所示。上一页下一页返回本节首页第15页，讲稿共68张，创作于星期一在“函数分类”列表中选择“统计”，在

8、“函数名”列表中选择频数函数FREQUENCY。单击“确定”按钮，打开频数分布函数对话框如下图所示。上一页下一页返回本节首页第16页，讲稿共68张，创作于星期一在Data_array中输入A1：A200，在Bin_array中输入B1:B10。由于这是数组操作，所以按Ctrlshift组合键，同时击回车键。则得到总体数据的频数分布。C1:C10区域中每个单元格都应显示“20”。在单元格C11中单击自动求和钮，在编辑栏中确认显示SUM(C1:C10)后，敲回车键，则自动求和为200。上一页下一页返回本节首页第17页，讲稿共68张，创作于星期一2建立直方图在“插入”菜单中选择“图表”

9、选项，打开“图表向导”对话框如下图所示，进入向导第1步。上一页下一页返回本节首页第18页，讲稿共68张，创作于星期一在“图表类型”列表中选择“柱形图”，在“子图表类型”中选择“簇状柱形图”单击“下一步”按钮，进入第2步。在图表源数据对话框窗口中，在数据区域页面下输入B1：C10。单击“系列”页面，在“系列”选项对话框中删除“系列1”，保留“系列2，则对话框中显示10 个等高柱，但X轴为1、2、3、等如下图所示。上一页下一页返回本节首页第19页，讲稿共68张，创作于星期一上一页下一页返回本节首页第20页，讲稿共68张，创作于星期一在“分类（X）轴标志中输入“B1：B10”，这时对话窗口

10、柱形图的X轴为10、20、30等如图所示。单击“下一步”按钮。上一页下一页返回本节首页第21页，讲稿共68张，创作于星期一在图表选项对话框中，打开“图例”页面，取消图例，单击”完成“按钮”，得柱形图如图所示。上一页下一页返回本节首页第22页，讲稿共68张，创作于星期一3计算均匀分布总体的均值和标准差在单元格B13中输入“均值”，在单元格C13中输入公式“=AVERAGE(A1:A200)”，按回车键显示值为 50.3。在单元格B14中输入“标准差”，在单元格C14中输入公式“=StDEVP(A1:A200)”，按回车键显示数值为28.86715。上一页下一页返回本节首页第23页，讲稿

11、共68张，创作于星期一 4从均匀分布总体中抽样打开“第3章抽样分布.xls”工作簿，选择“样本”工作表。选定A1:AD1区域，从“插入”菜单中选择“函数”选项，打开“粘贴函数”对话框在“函数分类”列表中选择“查找与引用”，在“函数名”列表中选择“索引函数INDEX”，单击“确定”按钮，打开索引函数中“选定参数”对话框。上一页下一页返回本节首页第24页，讲稿共68张，创作于星期一在“选定参数”对话窗口中选择第一行数组引用 (array,row_num,column_num)，单击“确定”按钮，打开索引函数INDEX对话框如下。上一页下一页返回本节首页第25页，讲稿共68张，创作于星期一

12、在“Array”中输入“总体!$A$1:$A$200”。在“Row_num”中输入嵌套公式 “CEILING(200*RAND(),1)”，按住Ctrl+Shift组合键，单击“确定”按钮。在单元格AE1中输入“均值”。选定单元格AF1，输入公式 “=AVERAGE(A1:AD1)”，敲回车键。按F9键。AF1单元格中出现的值应接近50。重复按这个键，数值虽有所变化，但仍接近50。上一页下一页返回本节首页第26页，讲稿共68张，创作于星期一3.2 总体分布与抽样分布3.2.1 3.2.1 总体分布与抽样分布之间的关系总体分布与抽样分布之间的关系3.2.2 3.2.2 检验总体分布与抽样分布

13、的关系检验总体分布与抽样分布的关系上一页下一页返回本章首页第27页，讲稿共68张，创作于星期一3.2.1 总体分布与抽样分布之间的关系样本均值抽样分布的均值等于总体均值：样本均值抽样分布的方差等于总体方差除以样本容量的平方根：nxVx22)(ss=m=)(xE上一页下一页返回本节首页第28页，讲稿共68张，创作于星期一3.2.2 检验总体分布与抽样分布的关系打开“第3章抽样分布.xls”工作簿，选择“样本”工作表。在单元格AG1中输入“抽样分布与总体分布”，单元格AG3中输入“总体分布”，单元格AG4中输入 “抽样分布”，单元格AH2中输入“均值”，单元格 AJ2中输入“标准误差”。上

14、一页下一页返回本节首页第29页，讲稿共68张，创作于星期一在单元格AH3中输入从“总体”工作表中的总体均值，其公式是“总体!C13”。在单元格AJ3输入公式“=总体!C14SQRt(30)”，显示值为5.27039，计算标准误差。在单元格AH4中输入公式 “=AVERAGE(AF1:AF1000)”，以计算AF1:AF1000 范围内随机样本均值的均值。上一页下一页返回本节首页第30页，讲稿共68张，创作于星期一在单元格AJ4中输入公式“=StDEV(AF1:AF1000)”，计算AF1:AF1000范围内样本均值的标准差，结果如图所示：上一页下一页返回本节首页第31页，讲稿共68张，创作于

15、星期一3.3 中心极限定理3.3.1 中心极限定理的内容3.3.2 均匀分布与正态分布3.3.3 非均匀分布与正态分布3.3.4 偏态分布与正态分布上一页下一页返回本章首页第32页，讲稿共68张，创作于星期一3.3.1 中心极限定理的内容中心极限定理是指从总体中抽取样本容量为n的样本，当样本容量足够大时，其统计量的分布可用正态概率分布近似。上一页下一页返回本节首页第33页，讲稿共68张，创作于星期一上一页下一页返回本节首页第34页，讲稿共68张，创作于星期一上图中，在图的上部分中，三个总体分别为均匀分布、U形分布和J形分布，即都是非正态的。随着样本容量的增加，抽样分布开始发生变化。当样本容量

16、为2时，抽样分布开始呈现与总体分布不同的外形；当样本容量为5时，抽样分布开始呈现一个钟形；当样本容量为30时，三个抽样分布近似于同一种分布，即正态分布。因而，当样本容量足够大时，抽样分布可用正态概率分布近似。上一页下一页返回本节首页第35页，讲稿共68张，创作于星期一3.3.2 均匀分布与正态分布1.均匀分布的抽样分布打开“第5章抽样分布.xls”工作簿，选择“样本”工作表，此时工作表中的数据为上面的抽样结果。在单元格AG9中输入“变量值”，在AH9中输入“均匀总体的抽样分布”。在单元格AG10中输入5，敲回车键。上一页下一页返回本节首页第36页，讲稿共68张，创作于星期一选定单元格A

17、G10，在“编辑”菜单中选择“填充”选项中的“序列”，打开“序列”对话框如图所示。上一页下一页返回本节首页第37页，讲稿共68张，创作于星期一在“序列产生在”框中选择“列”，步长值为5，终止值为100，单击“确定”按钮，则在AG10：AG29区域中得到变量值。选定AH10：AH29，在“插入”菜单中选择“函数”选项，打开“粘贴函数”对话框如图5.7所示。上一页下一页返回本节首页第38页，讲稿共68张，创作于星期一在在“函数分类函数分类”列表中选择列表中选择“统计统计”，在，在“函数名函数名”列表列表中选择中选择“频数分布频数分布”函数，单击函数，单击“确定确定”按钮，打开频按钮，打开频数分

18、布函数对话框如下图所示。数分布函数对话框如下图所示。上一页下一页返回本节首页第39页，讲稿共68张，创作于星期一在Data_array中输入“AF1：AF1000”，在Bins_array中输入“AG10:AG29”。按Ctrl+Shift组合键，同时单击“确定”按钮，可得均匀分布的抽样分布如下图所示。上一页下一页返回本节首页第40页，讲稿共68张，创作于星期一2构建正态分布打开“第5章抽样分布.xls”工作簿，选择“样本”工作表，此时工作表中的数据为5.1.4中的抽样结果。在单元格AI9输入“正态分布。选定单元格AI10，输入“1000*”，在“插入”菜单中选择“函数”选项，打开“粘贴函数

19、”对话框在“函数分类”列表中选择“统计”，在“函数名”列表中选择“正态分布NORMDISt”函数。单击“确定”按钮，打开正态分布函数NORMDISt对话框。上一页下一页返回本节首页第41页，讲稿共68张，创作于星期一在“x”中输入AG11，在“Mean”中输入总体均值$AH$3，并绝对引用，在“Standard_dev”中输入均匀总体抽样分布的标准误差$AI$3，并绝对引用。上一页下一页返回本节首页第42页，讲稿共68张，创作于星期一在“Cumulative”中输入1，表示使用累积分布函数。单击“确定”按钮。计算两个累计正态概率的差，其计算公式与AI10相似。选定AI11单元格，输入公式：

20、=1000*NORMDISt(AG11,$AH$3,$AI$3,1)-1000*NORMDISt(AG10,$AH$3,$AI$3,1)敲回车键。把AI11单元格的公式复制到AI12:AI29各单元格中。可以看到变量值3565之间出现的概率比较大。上一页下一页返回本节首页第43页，讲稿共68张，创作于星期一3均匀总体抽样分布与正态分布的比较在“插入”菜单中选择“图表”选项，打开“图表向导”对话框。单击“自定义类型”页面，选择“线-柱”图，单击“下一步”按钮。进入第2步“图表源数据”对话框。在数据区域中输入“=样本!$AG$9:$AI$29”，单击“系列”页面，在“分类X轴标志”中输入“=样本

21、!$AG$9:$AG$29”作为横轴，在“系列”中删除“变量值”系列，保留“均匀分布抽样分布”和“正态分布”。单击“下一步”按钮。上一页下一页返回本节首页第44页，讲稿共68张，创作于星期一上一页下一页返回本节首页第45页，讲稿共68张，创作于星期一在第3步“图表选项”对话框中，单击“图例”页面，将图例置于底部。单击“下一步”，单击“完成”按钮，得到图如下。上一页下一页返回本节首页第46页，讲稿共68张，创作于星期一3.3.3 非均匀分布与正态分布1构建非均匀总体打开“第5章抽样分布.xls”工作簿，选择“非均匀总体”工作表，接5.1.1的数据处理结果。在“工具”菜单中选择“数据分析”

22、选项，打开“数据分析”对话框。单击选择“随机数发生器”，打开对话框如图所示。上一页下一页返回本节首页第47页，讲稿共68张，创作于星期一上一页下一页返回本节首页第48页，讲稿共68张，创作于星期一由于要构造一个非均匀分布，所以要分两次生成随机数。在“变量个数”区域中输入1，在“随机数个数”区域中输入100。在“分布”中选择“均匀”。在参数下输入020，随机数发生器将会产生020之间的数。在输出选项下选择“输出区域”，输入A1作为随机数的起点，单击“确定”按钮，A1：A100将被填满均匀分布的随机数。上一页下一页返回本节首页第49页，讲稿共68张，创作于星期一下面生成非均匀分布的第二部分，即产生

23、一个数值位于80100的均匀分布。在“工具”菜单中选择“数据分析”选项，打开“数据分析”对话框。单击选择“随机数发生器”，打开对话框。在对话框中只需改变2处，一是“参数”改为从80100，二是“输出区域”的起点改为A101，这样所生成的范围在80-100的随机数便会放置在A101以后的单元格中。上一页下一页返回本节首页第50页，讲稿共68张，创作于星期一由于非均匀总体中没有2080的值，所以直方图中只有4个条，左边2条，右边2条上一页下一页返回本节首页第51页，讲稿共68张，创作于星期一2抽样分布与正态分布的比较打开“非均匀样本”工作表，检查样本均值的直方图。重复按F9，可以看到非均匀总体

24、抽样均值的分布和正态分布非常接近，图中表现的集中趋势也和原来的一样，只是这个总体的标准差比原总体的大。上一页下一页返回本节首页第52页，讲稿共68张，创作于星期一3.3.4 偏态分布与正态分布 1构造偏态分布打开“第3章抽样分布.xls”工作簿，选择“偏态总体”工作表，与编制非均匀分布相同，需要分几次运行“随机数发生器”来构建偏态分布。在每次运行“随机数发生器”时，变量个数和均匀分布的选项不变，而随机变量个数、参数和输出地址则要变化。这些变化的选项如下表所示。上一页下一页返回本节首页第53页，讲稿共68张，创作于星期一运行次数随机变量个数参数起点参数终点输出区域120020A12402040

25、A213604060A614806080A121根据上表的各项要求，运行4次“随机数发生器”，便可构建偏态总体。上一页下一页返回本节首页第54页，讲稿共68张，创作于星期一上一页下一页返回本节首页第55页，讲稿共68张，创作于星期一 2偏态总体抽样分布与正态分布比较打开“偏态样本”工作表，检查样本均值的直方图。上一页下一页返回本节首页第56页，讲稿共68张，创作于星期一3.4 t 分布 3.4.1 3.4.1 t t分布与分布与t t分布函数分布函数 3.4.2 3.4.2 t t分布与正态分布之间的关系分布与正态分布之间的关系上一页下一页返回本章首页第57页，讲稿共68张，创作于星期一3.

26、4.1 t分布与t分布函数样本统计量的抽样分布，并不完全服从正态分布，而是服从与正态分布相似的t分布。当样本容量不大于30，而且总体标准差未知时，可以使用t分布。t分布为对称分布。对于不同的样本容量都有一个不同的t分布，随着样本容量增加，t分布的形状由平坦逐渐变得接近正态分布。当样本容量大于30时，t分布就非常接近于正态分布。上一页下一页返回本节首页第58页，讲稿共68张，创作于星期一1t分布函数tDISt t分布分函数用在一定的自由度和显著水平下得出t分布的概率面积。t分布适用于小样本数据的假设检验。t分布的语法结构为：tDISt(x,deg_freedom,tails)其中：X为需要计算

27、分布的数值；Deg_freedom 为自由度；tails 指明分布函数是单侧分布还是双侧分布。上一页下一页返回本节首页第59页，讲稿共68张，创作于星期一2t分布反函数tINV t分布反函数可以根据概率返回某定自由度的 t 分布值。其语法结构为：tINV(probability,deg_freedom)其中：Probability 为对应于双侧 t 分布的概率；Deg_freedom为t分布的自由度。上一页下一页返回本节首页第60页，讲稿共68张，创作于星期一3.4.2 t分布与正态分布之间的关系 1.计算概率打开“第5章抽样分布.xls”工作簿，选择“t 分布”工作表。上一页下一页返回本节

28、首页第61页，讲稿共68张，创作于星期一在单元格E1中输入“10”。在单元格B2中输入标准正态分布函数公式“=NORMSDISt(A2)”，用来确定一个小于A2单元格变量值的标准正态变量的概率，此值为3.17E-0.5。在单元格C2输入t分布函数公式“=tDISt(ABS(A2),$E$1,1)”，这个公式是以单元格A2的绝对值为变量，以单元格E1的数值为自由度的单侧t分布的概率，此值是0.001259166。上一页下一页返回本节首页第62页，讲稿共68张，创作于星期一在单元格B3，输入公式“=NORMSDISt(A3)-NORMSDISt(

29、A2)”，用来计算单元格A3与单元格A2之间的正态分布概率。在单元格C3中输入公式“=tDISt(ABS(A3),$E$1,1)-tDISt(ABS(A2),$E$1,1)”，用来计算单元格A2到单元格A3之间的 t 分布的概率。注意这个公式中的单元格E1是绝对引用，这样便于复制公式。单元格C3中显示为0.000221338。上一页下一页返回本节首页第63页，讲稿共68张，创作于星期一将单元格B3与C3中的公式复制至第82行。找到第38行，单元格A38应显示-0.4，B38应显示0.036041，C38应显示0.034837。如果正确，便可以拟合两种图形了。单击单元格C43，在其公式前面

30、加上绝对值函数，以避免出现负值。其公式为：=ABS(tDISt(ABS(A43),$E$1,1)-tDISt(ABS(A42),$E$1,1)并复制此公式到C44:C82中的各单元格中。上一页下一页返回本节首页第64页，讲稿共68张，创作于星期一2绘制图形打开“第5章抽样分布.xls”工作簿，选择“t 分布”工作表。在“插入”菜单中选择“图表”选项，打开“图表向导”对话框。在第1步的“图表类型”中选择“折线图”，在“子图表类型”中选择“数据点折线图”，单击“下一步”按钮。在第2步“图表源数据”对话框中，在数据区域输入A1:C82。打开“系列”页面，在系列中删除“变量值”，在分类X轴标志中输

31、入“=t分布!$A$2:$A$82”，单击“下一步”按钮。上一页下一页返回本节首页第65页，讲稿共68张，创作于星期一在步骤3的“图表选项”对话框中，不选标题，打开“图例”页面，选择图例在底部上一页下一页返回本节首页第66页，讲稿共68张，创作于星期一在单元格E1中分别输入8，5，2，1，可以看出随着自由度的值变小，两个分布的差异便更加明显。在单元格E1中分别输入20，100，1000，10000和100000，可以看到随着自由度的增加，两个分布的差异逐渐变小，甚至相同。所以，结论是随着自由度增加，t分布将越来越接近于正态分布。上一页下一页返回本节首页第67页，讲稿共68张，创作于星期一12.04.2023感感谢谢大大家家观观看看第68页，讲稿共68张，创作于星期一

展开阅读全文