《统计学区间估计公式汇总表(完整版)实用资料.doc》由会员分享,可在线阅读,更多相关《统计学区间估计公式汇总表(完整版)实用资料.doc(31页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学区间估计公式汇总表(完整版)实用资料(可以直接使用,可编辑 完整版实用资料,欢迎下载)区间估计公式汇总表总体均值的区间估计条件统计量1-置信区间备注1、正态总体,小样本,方差已知2、正态总体,小样本,方差未知3、均值差,大样本,已知4、均值差。大样本, 5、均值差。小样本, 6、成数。总体服从二项分布,大样本;7、两个总体独立,分别服从二项分布,大样本总体方差的区间估计8、总体服从正态分布,S2已知9、两个正态总体方差比的区间估计附件:温州市市政园林企业定期检查结果汇总表报送部门(公章): 报送时间: 年 月 日序号单位名称资质情况定期检查结果备注主项资质核准时间增项资质核准时间结果主要
2、理由市政施工企业1温州市市政工程建设开发公司市政公用工程施工总承包贰级合格2温州市四通建设工程市政贰级(桥梁施工叁级)机电设备安装专业承包叁级合格3温州市速洁二次供水工市政公用工程施工总承包叁级合格4温州保得市政设施工程城市道路照明二级市政公用工程施工总承包叁级2007.6不合格企业净资产不达标5温州市华飞燃气工程安装城市燃气供热工程专业承包叁级合格6温州市实强市政工程市政公用工程施工总承包贰级2005-6-8拆除工程专业承包叁级;建筑装修装饰叁级2007-1-24合格7温州市华昌市政工程市政公用工程施工总承包贰级不合格净资产不达标;中级职称人员数量不达标8温州市城市配套工程建设市政公用工程施
3、工总承包贰级房屋建筑工程施工总承包暂定叁级不合格中级职称人员数量不达标9温州市华宏市政园林工程建设市政公用工程施工总承包贰级2006-6照明叁级 房屋建筑叁级; 园林绿化叁级2006-10; 2004-6不合格近三年最高工程结算收入不达标10温州中城晟泰市政工程 市政公用工程施工总承包 贰级合格11温州市瓯海市政开发市政公用工程施工总承包贰级房屋建筑工程施工总承包叁级不合格近三年最高工程结算收入不达标;二级资质以上项目经理人数不达标。12温州九瑞市政建设市政公用工程施工总承包贰级合格13温州东联市政工程市政公用工程施工总承包贰级混凝土预制构件2006.12不合格净资产不达标;近三年最高工程结算
4、收入不达标。14温州市正龙市政建设市政公用工程施工总承包贰级合格15温州市龙湾区市政工程公司市政公用工程施工总承包贰级合格16浙江华泰市政工程市政公用工程施工总承包贰级合格17浙江顺建市政工程市政公用工程施工总承包贰级机电设备安装专业承包叁级合格18温州市永昌市政建筑工程市政公用工程施工总承包贰级合格近三年最高年工程结算收入不达标。19浙江鳌龙市政建设市政公用工程总承包贰级房屋建筑工程施工总承包叁级不合格中级职称人员数量不达标;近三年最高年工程结算收入不达标;技术负责人工作年限不达标;代表性工程未填写。20浙江天业市政工程市政公用工程施工总承包贰级钢结构工程专业承包叁级合格21温州市明达市政安
5、装工程市政公用工程施工总承包贰级合格22浙江通力市政园林工程市政公用工程施工总承包贰级不合格近三年最高年工程结算收入不达标;23温州通城市政工程市政公用工程施工总承包贰级合格24苍南县龙港市政工程公司市政公用工程施工总承包贰级不合格中级职称人员数量不达标25浙江弘发建设实业市政公用工程施工总承包贰级2002-12-8房屋、矿山总承包贰级、水利水电总承包叁级、装修装饰、隧道、体育场地设施专业承包贰级;土石方、建筑防水、城市及道路照明工程专业承包叁级2004-9-30前合格26温州市顺通建设市政公用工程施工总承包贰级矿山三级,房建建筑三级;装饰三级;合格27浙江天城市政建设工程有限责任公司市政公用
6、工程施工总承包贰级矿建三级;房建三级合格园林绿化施工企业1温州市园林绿化工程公司城市园林绿化贰级合格2温州市保绿景园开发城市园林绿化贰级合格3温州市园林花木城市园林绿化叁级不合格未上报检查表4温州市丰景园林绿化工程城市园林绿化叁级不合格未上报检查表5温州市市政工程建设开发公司城市园林绿化叁级不合格未上报检查表6浙江欣华园艺工程城市园林绿化贰级(试行)2004-1-15合格7浙江治民园林工程城市园林绿化贰级2003-9-29合格8温州市青荷环境艺术城市园林绿化贰级(试行)2006-7-25合格9浙江佳源生态环境建设城市园林绿化贰级2004629合格10温州华美园艺绿化工程城市园林绿化贰级合格11
7、浙江后花园园林工程城市园林绿化贰级不合格未上报检查表12温州市园林景山亚热带园林工程城市园林绿化贰级不合格未上报检查表13温州市龙湾建设园林绿化工程城市园林绿化贰级合格14温州市龙湾大地绿化城市园林绿化贰级合格15温州美景绿化工程城市园林绿化贰级合格16温州市金鼎绿化工程城市园林绿化贰级(试行)不合格未上报检查表17浙江雅林园林城市园林绿化贰级(试行)合格18浙江中瓯园林工艺城市园林绿化贰级不合格未上报检查表19乐清市园林城市园林绿化贰级合格20浙江天一园林城市园林绿化贰级合格21永嘉县原野园林工程城市园林绿化贰级合格23温州景秀园林工程城市园林绿化贰级合格24浙江金桂园林工程城市园林绿化贰级
8、合格监理企业1温州市市政建设监理中心市政乙级合格2温州市景观园林建设工程监理不合格未上报检查表3温州市都市园林绿化建设监理园林丙级不合格未上报检查表项目七 概率论、数据统计与区间估计实验1 概率模型实验目的 通过将随机试验可视化, 直观地理解概率论中的一些基本概念, 从频率与概率的关系来体会概率的统计定义, 并初步体验随机模拟方法. 通过图形直观理解随机变量及其概率分布的特点.基本命令1.调用统计软包的命令进行统计数据的处理, 必须调用相应的软件包, 首先要输入并执行命令statistics以完成数据统计的准备工作.2.调用作图软件包的命令GraphicsGraphics.m用Mathemat
9、ica作直方图, 必须调用相应的作图软件包, 输入并执行Graphics这时可以查询这个软件包中的一些作图命令的用法. 如输入?BarChart则得到命令BarChart的用法说明; 如果没有, 则说明调用软件包不成功, 必须重新启动计算机, 再次调用软件包.实验举例频率与概率例1.1(高尔顿钉板实验)自高尔顿钉板上端放一个小球, 任其自由下落. 在其下落过程中, 当小球碰到钉子时从左边落下的概率为p, 从右边落下的概率为碰到下一排钉子又是如此, 最后落到底板中的某一格子. 因此任意放入一球, 则此球落入哪个格子事先难以确定. 设横排共有排钉子, 下面进行模拟实验:(1) 取自板上端放入一个小
10、球, 观察小球落下的位置; 将该实验重复作5次, 观察5次实验结果的共性及每次实验结果的偶然性;(2) 分别取自板上端放入n个小球, 取 观察n个小球落下后呈现的曲线.作出不同p值下5000个小球落入各个格子的频数的直方图, 输入StatisticsGraphicsGraphicsGaltonn_Integer,m_Integer,p_:=Module,dist=;Forl=1,lRGBColor0,0,1;p=0.15;n=5000;m=20;Galtonn,m,pp=0.5;n=5000;m=20;Galtonn,m,pp=0.85;n=5000;m=20;Galtonn,m,p则输出p=
11、0.15p=0.5p=0.85图1-1 由图1-1可见: 若小球碰钉子后从两边落下的概率发生变化, 则高尔顿钉板实验中小球落入各个格子的频数发生变化, 从而频率也相应地发生变化. 而且, 当曲线峰值的格子位置向右偏; 当曲线峰值的格子位置向左偏.几何概型例1.2 甲、乙二人约定八点到九点在某地会面, 先到者等20分钟离去, 试求两人能会面的概率.由于甲、乙二人在0,60时间区间中任何时刻到达是等可能的, 若以X,Y分别代表甲乙二人到达的时刻, 则每次试验相当于在边长为60的正方形区域中取一点.设到达时刻互不影响, 因此在区域内取点的可能性只与区域的面积大小成正比, 而与其形状、位置无关. 于是
12、, 会面问题可化为向区域随机投点的问题. 所关心的事件“二人能会面”可表示为 (图1-2)于是, 所求概率的理论值为(A的面积)/(的面积)图1-2下面, 我们作如下模拟试验:(1) 模拟向有界区域投点n次的随机试验, 取, 统计每次投点是否落在图1-2所示区域A中, 若是则计数1次.(2) 改变投点数统计落入区域A的次数.输入meetn_Integer:=Modulex,xk_:=xk=AbsRandomInteger,0,60-RandomInteger,0,60;pile=Tablexk,k,1,n;times=Countpile,x_/;0=x=20;Printtimes;freque
13、nce=Ntimes/nn=100;meetnn=1000;meetnn=5000;meetnn=10000;meetn则输出所求结果, 为方便比较, 将输出结果列于表1-1中表1-1约会次数约会成功次数约会成功频率理论约会成功概率100580.5810005570.5570.556500028420.56841000055290.5529 从上表结果可见, 当约会次数越来越大时, 试验约会成功频率与理论约会成功概率越来越接近.离散型随机变量及其概率分布例1.3(二项分布)利用Mathematica绘出二项分布的概率分布与分布函数的图形, 通过观察图形, 进一步理解二项分布的概率分布与分布函数
14、的性质.设, 输入StatisticsAll;g2=PlotEvaluateCDFdist,x,x,0,20,PlotStyle-Thickness0.008,RGBColor0,0,1;t=Tablex,PDFdist,x,x,0,20;gg1=ListPlott,PlotStyle-PointSize0.03,DisplayFunction-Identity;gg2=ListPlott,PlotJoined-True,DisplayFunction-Identity;p1=Showgg1,gg2,g1,DisplayFunction-$DisplayFunction,PlotRange-A
15、ll;则分别输出二项分布概率分布图形(图1-3)与分布函数图形(图1-4).图1-3 图1-4从图1-3可见, 概率随着的增加,先是随之增加, 直到达到最大值, 随后单调减少. 而从图1-4可见, 分布函数的值实际上是的累积概率值.通过改变与的值, 读者可以利用上述程序观察二项分布的概率分布与分布函数随着与而变化的各种情况, 从而进一步加深对二项分布及其性质的理解.连续型随机变量及其概率密度函数例1.4 (正态分布)利用Mathematica绘出正态分布的概率密度曲线以及分布函数曲线, 通过观察图形, 进一步理解正态分布的概率分布与分布函数的性质. (1) 固定 取 观察参数对图形的影响, 输
16、入StatisticsThickness0.008,RGBColor0,0,1,PlotRange-All;PlotCDFdist1,x,CDFdist2,x,CDFdist,x,x,-6,6,PlotStyle-Thickness0.008,RGBColor1,0,0;则分别输出相应参数的正态分布的概率密度曲线(图1-5)及分布函数曲线(图1-6).图1-5 图1-6从图1-5可见:(a) 概率密度曲线是关于对称的钟形曲线, 即呈现“两头小, 中间大, 左右对称”的特点.(b) 当时, 取得最大值, 向左右伸展时, 越来越贴近x轴.(c) 当变化时, 图形沿着水平轴平移, 而不改变形状, 可
17、见正态分布概率密度曲线的位置完全由参数决定, 所以称为位置参数.(2) 固定, 取观察参数对图形的影响, 输入dist=NormalDistribution0,0.52; dist1=NormalDistribution0,1; dist2=NormalDistribution0,1.52; PlotPDFdist1,x,PDFdist2,x,PDFdist,x,x,-6,6, PlotStyle-Thickness0.008,RGBColor0,0,1,PlotRange-All; PlotCDFdist1,x,CDFdist2,x,CDFdist,x,x,-6,6, PlotStyle-T
18、hickness0.008,RGBColor1,0,0,PlotRange-All;则分别输出相应参数的正态分布的概率密度曲线(图1-7)及分布函数曲线(图1-8)图1-7 图1-8 从图1-7与图1-8可见: 固定, 改变时, 越小, 在0附近的概率密度图形就变得越尖, 分布函数在0的附近增值越快; 越大, 概率密度图形就越平坦, 分布函数在0附近的增值也越慢, 故决定了概率密度图形中峰的陡峭程度; 另外, 不管如何变化, 分布函数在0点的值总是0.5, 这是因为概率密度图形关于对称.通过改变与的值, 读者可以利用上述程序观察正态分布的概率分布与分布函数随着与而变化的各种情况, 从而进一步加
19、深对正态分布及其性质的理解.随机变量函数的分布例1.5 设X,Y相互独立, 都服从(0,1)上的均匀分布, 求的概率密度.理论上, 我们可用卷积公式直接求出的密度函数:下面, 我们作如下模拟试验:(1) 产生两组服从(0,1)上均匀分布的相互独立的随机数 取计算(2) 用数据作频率直方图, 并在同一坐标系内画出用卷积公式求得的密度函数图形作比较.输入StatisticsClearg1,t,t1,t2;t=;n=1000;g1x_:=50*Which0=x=1,x,1=xThickness0.01,RGBColor0,0,1;t1=RandomArrayUniformDistribution0,
20、1,n;t2=RandomArrayUniformDistribution0,1,n;Dot=Appendt,t1i+t2i,i,n;p1=Histogramt;Showpic1,p1,DisplayFunction-$DisplayFunction;则在同一坐标系中输出所求频率直方图与密度函数的图形(图1-9). 图1-9中心极限定理的直观演示例1.6 本例旨在直观演示中心极限定理的基本结论: “大量独立同分布随机变量的和的分布近似服从正态分布”. 按以下步骤设计程序:(1) 产生服从二项分布的个随机数, 取, , 计算个随机数之和以及; (2) 将(1)重复组, 并用这组的数据作频率直方图
21、进行观察. 输入statisticsGraphicsGraphicsm=1000;n=50;p=0.2;t=;dist=;Fori=1,iFalse;则输出图1-10. 图1-10从图1-10可见, 当原始分布是二项分布, 比较大时, 个独立同分布的的随机变量之和的分布近似于正态分布.实验习题1. (抛硬币实验) 模拟抛掷一枚均匀硬币的随机实验(可用0-1随机数来模拟实验结果), 取模拟n次掷硬币的随机实验. 记录实验结果, 观察样本空间的确定性及每次实验结果的偶然性, 统计正面出现的次数, 并计算正面出现的频率. 对不同的实验次数n进行实验, 记录下实验结果,通过比较实验的结果, 你能得出什
22、么结论?2. (抽签实验) 有十张外观相同的扑克牌, 其中有一张是大王, 让十人按顺序每人随机抽取一张, 讨论谁先抽出大王.甲方认为: 先抽的人比后抽的人机会大.乙方认为: 不论先后, 他们抽到大王的机会是一样的. 究竟他们谁说的对?3. (泊松分布) 利用Mathematica在同一坐标系下绘出取不同值时泊松分布的概率分布曲线, 通过观察输出的图形, 进一步理解泊松分布的概率分布的性质.4. (二项分布的正态分布逼近) 用正态分布逼近给出二项分布 , 并将得到的近似值与它的精确值比较.实验2 数据统计实验目的 掌握利用Mathematica求来自某个总体的一个样本的样本均值、中位数、样本方差
23、、偏度、峰度、样本分位数和其它数字特征, 并能由样本作出直方图.基本命令1.求样本数字特征的命令(1) 求样本list均值的命令Meanlist;(2) 求样本list的中位数的命令Medianlist;(3) 求样本list的最小值的命令Minlist;(4) 求样本list的最大值的命令Maxlist;(5) 求样本list方差的命令Variance list;(6) 求样本list的标准差的命令StandardDeviationlist;(7) 求样本list的分位数的命令Quantilelist,;(8) 求样本list的阶中心矩的命令CentralMomentlist,n.2.求分组
24、后各组内含有的数据个数的命令BinCounts基本格式为BinCounts数据,最小值,最大值,增量例如,输入BinCounts1,1,2,3,4,4,5,15,6,7,8,8,8,9,10,13,0,15,3则输出4,4,5,1,2它表示落入区间的数据个数分别是4, 4, 5, 1, 2.注: 每个区间是左开右闭的.3.作条形图的命令BarChart基本格式为BarChart数据,选项1,选项2,其中数据是,或的形式.而为条形的高度,为条形的中心.在数据为的形式时默认条形的中心是.常用选项有BarSpacing数值1,BarGroupSpacing数值2.例如, 输入BarChart4,1.
25、5,4,4.5,5,7.5,1.10,5,2,13.5,BarGroupSpacing-0.1则输出如图2-1的条形图. 图2-1实验举例样本的数据统计例2.1 在某工厂生产的某种型号的圆轴中任取20个,测得其直径数据如下:15.28,15.63,15.13,15.46,15.40,15.56,15.35,15.56,15.38,15.21,15.48,15.58,15.57,15.36,15.48,15.46.15.52,15.29,15.42,15.69求上述数据的样本均值,中位数,四分位数;样本方差,极差,变异系数,二阶、三阶和四阶中心矩;求偏度,峰度,并把数据中心化和标准化.输入Sta
26、tisticsdata1=15.28,15.63,15.13,15.46,15.40,15.56,15.35,15.56,15.38,15.21,15.48,15.58,15.57,15.36,15.48,15.46, 15.52,15.29,15.42,15.69; (*数据集记为datal*)Meandata1 (*求样本均值*)Mediandata1 (*求样本中位数*)Quartilesdata1 (*求样本的0.25分位数, 中位数, 0.75分位数*)Quantiledata1,0.05 (*求样本的0.05分位数*)Quantiledata1,0.95 (*求样本的0.95分位数
27、*)则输出15.440515.4615.355,15.46,15.5615.1315.63即样本均值为15.4405,样本中位数为15.46,样本的0.25分位数为15.355,样本的0.75分位数15.56, 样本的0.05分位数是15.13, 样本的0.95分位数是15.63.输入Variancedata1 (*求样本方差*)StandardDeviationdata1 (*求样本标准差*)VarianceMLEdata1 (*求样本方差*)StandardDeviationMLEdata1 (*求样本标准差*)SampleRangedata1 (*求样本极差*)则输出0. 6050.14
28、35440.01957480.139910.56即样本方差为0. 605, 样本标准差为0.143544, 样本方差为0.0195748 样本标准差为0.13991, 极差为0.56.注: Variance给出的是无偏估计时的方差, 其计算公式为, 而VarianceMLE给出的是总体方差的极大似然估计, 其计算公式为,它比前者稍微小些. 输入CoefficientOfVariationdata1(*求变异系数.变异系数的定义是样本标准差与样本均值之比*)则输出0.00929662输入CentralMomentdata1,2(*求样本二阶中心矩*)CentralMomentdata1,3 (*
29、求样本三阶中心矩*)CentralMomentdata1,4 (*求样本四阶中心矩*)输出为0.0195748-0.001000410.000984863 输入Skewnessdata1(*求偏度,偏度的定义是三阶中心矩除以标准差的立方*)Kurtosisdata1(*求峰度,峰度的定义是四阶中心矩除以方差的平方*)则输出-0.3652872.5703上述结果表明:数据(data1)的偏度(Skewness)是-0.365287,负的偏度表明总体分布密度有较长的右尾,即分布向左偏斜.数据(data1)的峰度(Kurtosis)为2.5703. 峰度大于3时表明总体的分布密度比有相同方差的正态分
30、布的密度更尖锐和有更重的尾部. 峰度小于3时表明总体的分布密度比正态分布的密度更平坦或者有更粗的腰部.输入ZeroMeandata1(*把数据中心化,即每个数据减去均值*)则输出-0.1605,0.1895,-0.3105,0.0195,-0.0405,0.1195,-0.0905,0.1195,-0.0605,-0.2305,0.0395,0.1395,0.1295,-0.0805,0.0395,0.0195,0.0795,-0.1505,-0. 5,0.2495输入Standardizedata1(*把数据标准化,即每个数据减去均值,再除以标准差,从而使新的数据的均值为0,方差为1*)则输
31、出-1.11812,1.32021,-2.16309,0.135846,-0.282143,0.832495,-0.630467,0.832495,-0.421472,-1.60577,0.275176, 0.971825,0.90216,-0.560802,0.275176,0.135846, 0.553836,-1.04846,-0.142813,1.73814读者可验算上述新数据的均值为0,标准差为1.作样本的直方图例2.2 从某厂生产的某种零件中随机抽取120个, 测得其质量(单位:g)如表2-1所示.列出分组表, 并作频率直方图. 表2-1 200 202 203 208 216 2
32、06 222 213 209 219 216 203 197 208 206 209 206 208 202 203 206 213 218 207 208 202 194 203 213 211 193 213 208 208 204 206 204 206 208 209213 203 206 207 196 201 208 207 213 208 210 208 211 211 214 220 211 203 216 221 211 209 218 214 219 211 208 221 211 218 218 190 219 211 208 199 214 207 207 214 20
33、6 217 214 201 212 213 211 212 216 206 210 216 204 221 208 209 214 214 199 204 211 201 216 211 209 208 209 202 211 207 220 205 206 216 213 206 206 207 200 198输入StatisticsGraphicsdata2=200, 202, 203, 208, 216, 206, 222, 213, 209, 219, 216, 203, 197, 208, 206, 209, 206, 208, 202, 203, 206, 213, 218, 20
34、7, 208, 202, 194, 203, 213, 211, 193, 213, 208, 208, 204, 206, 204, 206, 208, 209,213, 203, 206, 207, 196, 201, 208, 207, 213, 208, 210, 208, 211, 211, 214, 220, 211, 203, 216, 221, 211, 209, 218, 214, 219, 211, 208, 221, 211, 218, 218, 190, 219, 211, 208, 199, 214, 207, 207, 214, 206, 217, 214, 201
35、, 212, 213, 211, 212, 216, 206, 210, 216, 204, 221, 208, 209, 214, 214, 199, 204, 211, 201, 216, 211, 209, 208, 209, 202, 211, 207,220, 205, 206, 216, 213, 206, 206, 207, 200, 198;先求数据的最小和最大值.输入Mindata2Maxdata2得到最小值190,最大值222.取区间189.5,222.5,它能覆盖所有数据.将189.5,222.5等分为11个小区间,设小区间的长度为3.0.数出落在每个小区内的数据个数,即
36、频数,这可以由BinCount命令来完成. 输入f1=BinCountsdata2,189.5,222.5,3则输出1,2,3,7,14,20,23,22,14,8,6输入gc=Table189.5+j*3-1.5,j,1,11(*产生11个小区间的中心的集合gc*)bc=Transposef1/Lengthdata2,gc(*Lengthdata2为数据data2的总个数即样本的容量n, f1/Lengthdata2为频率fi/n,Transpose是求矩阵转置的命令,这里bc为数据对,第一个数是频率,第二个是组中心*)则输出结果输入作频率对组中心的条形图命令BarChartbc则输出所求条
37、形图(图2-2).图2-2实验习题1.在某省一“夫妻对电视传播媒介观念的研究”项目中,访问了30对夫妻,其中丈夫所受教育(单位:年)的数据如下:18,20,16,6,16,17,12,14,16,18,14,14,16,9,20,18,12,15,13,16,16,21,21,9,16,20,14,14,16,16(1) 求样本均值、中位数、四分位数;样本方差、样本标准差、极差、变异系数,二阶、三阶和四阶中心矩;求偏度、峰度。(2) 将数据分组,使组中值分别为6,9,12,15,18,21作出的频数分布表; 作出频率分布的直方图.2.下面列出84个伊特拉斯坎男子头颅的最大宽度(单位:mm),对数据分组,并作直方图.141 148 132 138 154 142 150 146 155 158 150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140 145 135 147 146 141 136 140 1