《统计学实验(共19页).doc》由会员分享,可在线阅读,更多相关《统计学实验(共19页).doc(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上统计学实验内容一、频数统计1A公司在招聘时采用了综合能力测试(满分为100分),由于应聘的人数较多,现随机抽取了157名应聘者的测试成绩,其测试分数的数据如book1所示。 (1)根据上面的资料,进行分组,并确定组数和组距。 根据资料判断,进行分组,分为六组,组距为10。(2)编制频率分布表 上限成绩频数频率191020160.292030270.393040560.494050390.585060140.68607050.合计157接收频率累积 %191610.19%292727.39%395663.06%493987.90%591496.82%695100.00%
2、其他0100.00%(3)画出直方图。2. 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果见book2。 (1) 指出表中的数据属于什么类型?定序型(2) 制作一张频数分布表; 服务质量等级频数频率1A140.142B210.213C320.324D180.185E150.15合计100(3) 绘制一张条形图,反映服务质量的分布。计数项:服务质量等级服务质量等级汇总A14B21C32D18E15总计100二、参数估计1已知灯管使用寿命服从正态分布,其标准差为50小时。现从一批产品中抽取25个作
3、为样本,测得其平均使用寿命为1600小时,要求在95%的概率保证下估计该批产品平均使用寿命的置信区间。(运用CONFIDENCE函数)标准差50置信度0.95样本容量25平均值1600极限误差19.59964置信区间1580.41619.6抽样平均误差 19.59964,置信区间即(1580.40031619.59964)2在一篇关于“通货紧缩”的文章中,作者考察了各种各样投资的收益情况。这些投资包括股票、债券以及房地产等。这篇文章抽取的是样本容量为200的样本,计算的房地产投资收益(单位:%)如book3所示。同时根据经验假定,房地产投资收益的总体标准差为2.3%。请你用区间估计的方法,采用
4、95%的置信度估计房地产投资的平均收益率。解:用函数AVERAGE求得,样本均值12.08运用CONFIDENCE函数求得,CONFIDENCE(0.05,2.3,200)= 0.,取房地产投资收益的x=0.32房地产投资收益的置信区间为(11.76,12.40)3Metropolitan Research有限公司是一家消费者研究组织,它设计调查,对消费者所使用的大量的产品和服务进行评估。在某一项研究中,Metropolitan调查消费者对底特律某一个主要制造商所生产的汽车的性能的满意程度。分发给该制造商所生产的一种最大型号小汽车用户的调查表表明,许多人抱怨该车刚开始传动系统不佳。为了更好地了
5、解传动系统的问题,Metropolitan采用由底特律地区一个修理企业所提供的实际传动系统的维修记录为样本。Book4数据是50辆汽车传动系统出现故障时所行驶的实际里程的数据。(1)对样本数据进行描述性统计分析。(2)求曾经出现过传动系统问题的汽车总体中在出现传动系统问题时所行驶里程的均值的95%置信区间。运用CONFIDENCE函数求得,CONFIDENCE(0.05,24898.8,50)= 6901.,取房地产投资收益的x=6901.47,房地产投资收益的置信区间为(73342.3-6901.47,73342.3+6901.47)即(66440.83,80243.77)。(3)如果研究公
6、司想在5000英里的允许误差下,估计出现传动系统问题时所行驶里程的均值,则置信度为95%时应选取多大的样本容量?运用公式样本容量,有知z=1.96,24898.8,5000,所以n=95.26故在置信度为95%时应选取样本容量为96。三、方差分析(选做) 1.一家产品制造公司管理者想比较A、B、C三种不同的培训方式对产品组装时间的多少是否有显著影响,将26名新员工随机分配给每种培训方式。在培训结束后,参加培训的员工组装一件产品所花的时间如book5所示(单位:分钟)。取显著性水平a=0.05,确定不同培训方式对产品组装的时间是否有显著影响?2.一家食品制造商推出了一种新的产品,为了使新产品迅速
7、占领市场,公司的市场营销部经理提出了三种营销方式,并且在三个地区分别采用这三种营销方式,然后观察营销方式所产生的产品销售额情况。这三种营销方式在市场上推出之后,公司的统计分析人员随机抽查了20周的销售额数据(单位:千元),如book6所示。试问:市场营销部经理提出的三种营销方式所产生的销售额是否存在显著性差异?(取显著性水平a=0.05)四、相关与回归分析1根据教材第207页表9-4的资料及补充的几个问题,进行相关与回归分析。(1)根据表中数据绘制散点图,观察其相关类型。(2)计算相关系数,判断相关密切程度。计算得到相关系数为0.944。故其相关关系密切程度为高度相关。相关程度是显著的,说明年
8、收入与寿险保额整体呈现正的线性关系。(3)建立寿险保额对人均年收入的回归方程,并解释回归方程的相关含义。(4)计算所建模型拟合优度并解释其意义。R2=0.8917 ,表明总平方和中的89.17%能够被估计的估计的回归方程y=2.2326x-2.8033所解释,换句话说,单位成本差异性的89.17%能够被产量与单位成本之间的线性关系所解释。(5)在显著性水平的情况下,检验总体回归方程和总体回归系数的显著性。SUMMARY OUTPUT回归统计Multiple R0.R Square0.Adjusted R Square0.标准误差4.观测值10方差分析dfSSMSFSignificance F回
9、归分析11435.6851435.68565.851643.94E-05残差8174.414521.80182总计91610.1Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept-2.803324.-0.592110.-13.7218.-13.7218.X Variable 12.0.8.3.94E-051.2.867061.2.86706对总体回归方程显著性检验提出假设:Ho: o=0; H1: 10根据回归分析知:F=65.85164FF(1,n-2),n=10,=0.05查表得临界值F0.05=
10、5.32因为FF0.05,所以拒绝Ho,接受H1。所以总体回归方程存在且有意义。对总体回归系数的显著性检验假设Ho: o=0; H1: 10根据回归分析知t=8.=0.05,t(n-2),t0.05=1.8125因为tt0.05,所以拒绝Ho,接受H1。所以总体回归系数存在显著性。2.金融机构发放房屋抵押贷款必须了解市场上购买房屋的支付能力和支付状况,购房者的支付能力作为因变量y(用家庭平均月收入的百分比代表每月抵押贷款的平均支付能力),抵押贷款的成本费用作为自变量x(用抵押贷款的平均利率代表)。统计分析人员随机收集了如book7所示的样本数据。(1)采用最小二乘法求线性回归直线方程;(2)计
11、算可决系数,并解释其意义;可决系数为0.9801,接近于1,表明估计的回归方程对样本数据的拟合效果较好。(3)显著性水平设为a=0.05,采用t检验统计量进行检验:购房者的支付能力与抵押贷款利率之间是否存在显著性的线性关系?(4)显著性水平设为a=0.05,采用方差分析检验方法进行检验:购房者的支付能力与抵押贷款利率之间是否存在显著性的线性关系?SUMMARY OUTPUT回归统计Multiple R0.R Square0.Adjusted R Square0.标准误差0.观测值10方差分析dfSSMSFSignificance F回归分析119.1019619.10196394.82854.
12、29E-08残差80.0.04838总计919.489观测值预测 Y残差标准残差122.24047-0.24047-1.15961221.118660.1.319.31466-0.01466-0.07067417.874490.1.518.344440.0.618.9205-0.0205-0.09887718.708270.0.818.662790.0.917.78353-0.38353-1.849431018.1322-0.1322-0.63749Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept7
13、.0.11.463333.04E-065.8.5.8.X Variable 11.0.19.870294.29E-081.1.1.1.(3) 假设Ho: o=0; H1: 10根据回归分析知t=19.87029=0.05, n=10,t(n-2),t0.05=1.8125因为tt0.05,所以拒绝Ho,接受H1。所以购房者的支付能力与抵押贷款利率之间存在显著性的线性关系。(4)提出假设:Ho: o=0; H1: 10根据回归分析知:F=394.8285FF(1,n-2),n=10,=0.05查表得临界值F0.05=5.32因为FF0.05,所以拒绝Ho,接受H1。所以购房者的支付能力与抵押贷款
14、利率之间存在显著性的线性关系。五、时间序列分析1.从国家统计局网站上搜集2000-2012年各年按不变价计算的GDP资料。要求:(1)计算这段时间的经济增长率(即按不变价计算的GDP的平均增长速度);(2)用3期移动平均法预测2013年的GDP。预计2013年GDP=.65(3)建立一个趋势直线方程,预测2014年的GDP。年份GDP(亿元)增长速度三期移动平均200099214.552001.20.13672002.70.87332003.80.932004.30.82332005.40.382006.40.03672007.30.05672008.40.51672009.80.682010
15、.80.222011.10.652012.10.2013年预测GDP=.652教材第122页,第5题。年份人口数1999876320008861200189462002902720039100200491722005924320069315根据图表预测可知,2007年人口数为9400万人3某地区1992-2000年自行车的销售量数据见book8。要求:配合二次曲线(试用“回归”分析工具),算出各年的趋势值,画出二次曲线趋势图。年份销售量(万辆)tt*t199234111993422419945839199581416199693525199710563619981097491999988642
16、00096981SUMMARY OUTPUT回归统计Multiple R0.97799R Square0.Adjusted R Square0.标准误差6.观测值9方差分析dfSSMSFSignificance F回归分析25985.7652992.88365.90878.25E-05残差6272.457145.40952总计86258.222Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept-0.095248.-0.011110.-21.07620.88554-21.07620.88554t27.8
17、42863.7.0.18.209337.4764118.209337.47641t*t-1.880950.-4.898690.-2.82049-0.94141-2.82049-0.94141RESIDUAL OUTPUT观测值预测 销售量(万辆)残差125.866678.248.06667-6.06667366.50476-8.50476481.18095-0.18095592.095240.699.247625.7102.63816.8102.2667-4.26667998.13333-2.13333令Y=a+bt+ct*tx1=t,x2=t*t,则由回归分析数据知a=-0.,b=27.,c
18、=-1.Y=-0.+27.t-1.t*t4.某啤酒生产企业2000-2005年各季度销售量如book9所示。要求:(1)运用趋势剔除法测定各季度季节比率;(2)建立恰当的趋势方程;(3)考虑季节影响,预测2006年第一和第二季度的销售量。 某啤酒生产企业2000-2005年各季度的销售量如下:时间时间序号销售量四季度移动平均趋势值TY/T(%)2000.1125223230333731.2530.625118.4442632.753279.2001.15303433.37588.26383534.5108.374234.7534.875120.48303534.87585.2002.19293
19、73678.2103938.2537.625101.3115038.538.375129.4123538.538.590.2003.1133038.7538.62577.2143939.253999.315513939.125130.4163739.7539.37593.2004.1172940.7540.2571.218424140.875102.3195541.541.25132.4203841.7541.62591.2005.1213141.541.62574.2224342.2541.875101.3235442441季度2000年2001年2002年2003年2004年2005年合计
20、同季平均季节比率188.78.77.71.74.389.8974777.78.2108.101.99.102.101.514.10944102.104.3118.4120.129.130.132.632.43279126.127.479.3893185.90.93.91.440.1124188.89.合计-1976.5521395.400平均-#VALUE!98.四个季度比率之和为395.%,调整系数为: 400% / 395.%=1.由上图可知:2006年第一季度为x=25 2006年第二季度为x=26又Y=0.6257x+29.804当x=25时 y=45.4465当x=26时 y=46.0722专心-专注-专业