《统计学贾俊平课后习题答案.doc》由会员分享,可在线阅读,更多相关《统计学贾俊平课后习题答案.doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、附录:教材各章习题答案第1章 统计与统计数据1.1 (1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。1.2 (1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。1.3 (1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。1.4 (1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。1.5 (略)。1.6 (略)。第2章 数据的图表展示2.1 (1) 属于顺序数据。(2)频数分
2、布表如下服务质量等级评价的频数分布服务质量等级家庭数/频率频率/%A1414B2121C3232D1818E1515合计100100 (3)条形图(略) (4)帕累托图(略)。2.2 (1)频数分布表如下40个企业按产品销售收入分组表按销售收入分组/万元企业数/个频率/%向上累积向下累积企业数频率企业数频率100以下100110110120120130130140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0 (2
3、)某管理局下属40个企分组表按销售收入分组/万元企业数/个频率/%先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.02.3 频数分布表如下某百货公司日商品销售额分组表按销售额分组/万元频数/天频率/%2530303535404045455046159610.015.037.522.515.0合计40100.0 直方图(略)。2.4 茎叶图如下茎叶数据个数18893201133688899912313569541236676501274 箱线图(略)。2.5 (1)排序略。(2)频数分布表如下 100只灯泡使用寿命非频数分布按使用寿命分组/小时灯泡个数
4、/只频率/%650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计100100 (3)直方图(略)。 (4)茎叶图如下茎叶6518661456867134679681123334555889969001111222334455666778888997000112234566677888971002233567788972012256789973356741472.6 (1)频数分布表如下按重量分组频率/包4042242443444674648164850175252
5、10525420545685658105860460623合计100(2)直方图(略)。(3)食品重量的分布基本上是对称的。2.7 (1)频数分布表如下按重量误差分组频数/个10200203053040740508506013607097080680902合计50 (2)直方图(略)。2.8 (1)属于数值型数据。(2)分组结果如下分组天数/天-25-206-20-158-15-1010-10-513-50120545107合计60 (3)直方图(略)。2.9 (1)直方图(略)。(2)自学考试人员年龄的分布为右偏。2.10 (1)茎叶图如下A班树茎B班数据个数树 叶树叶数据个数0359214
6、40448429759121169230787866960100003(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。2.11 (略)。2.12 (略)。2.13 (略)。2.14 (略)。2.15 箱线图如下:(特征请读者自己分析)第3章 数据的概括性度量3.1 (1);。(2);。(3)。(4)左偏分布。3.2 (1);。(2);。(3);。(4);。(5)略。3.3 (1)略。(2);。(3);。(4)选方法一,因为离散程度小。3.4 (1)=274.1(万元);Me=272.5 。(2)QL=260.25;QU=291.25。(3)(
7、万元)。3.5 甲企业平均成本19.41(元),乙企业平均成本18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。3.6 (1)=426.67(万元);(万元)。(2);。3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。 (2) 男生:=27.27(磅),(磅);
8、女生:=22.73(磅),(磅); (3)68%;(4)95%。3.9 通过计算标准化值来判断,说明在项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数0.5个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。3.10 通过标准化值来判断,各天的标准化值如下表日期周一周二周三周四周五周六周日标准化值Z3-0.6-0.20.4-1.8-2.20周一和周六两天失去了控制。3.11 (1)离散系数,因为它消除了不同组数据水平高地的影响。 (2)成年组身高的离散系数:; 幼儿组身高的离散系数:; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散
9、程度相对较大。3.12 下表给出了一些主要描述统计量,请读者自己分析。方法A方法B方法C平均165.6平均128.73平均125.53中位数165中位数129中位数126众数164众数128众数126标准偏差2.13标准偏差1.75标准偏差2.77极差8极差7极差12最小值162最小值125最小值116最大值170最大值132最大值1283.13 (1)方差或标准差;(2)商业类股票;(3)(略)。第4章 抽样与参数估计4.1 (1)200。(2)5。(3)正态分布。(4)。4.2 (1)32。(2)0.91。4.3 0.79。4.4 (1)。(2)。4.5 (1)1.41。(2)1.41,1
10、.41,1.34。4.6 (1)0.4。(2)0.024 。(3)正态分布。4.7 (1)0.050,0.035,0.022,016。(2)当样本量增大时,样本比例的标准差越来越小。4.8 (1);(2)E=4.2;(3)(115.8,124.2)。4.9 (87819,)。4.10 (1)811.97;(2)812.35;(3)813.10。4.11 (1)(24.11,25.89);(2)(113.17,126.03);(3)(3.136,3.702)4.12 (1)(8687,9113);(2)(8734,9066);(3)(8761,9039);(4)(8682,9118)。4.13
11、(2.88,3.76);(2.80,3.84);(2.63,4.01)。 4.14 (7.1,12.9)。4.15 (7.18,11.57)。4.16 (1)(148.9,150.1);(2)中心极限定理。4.17 (1)(100.9,123.7);(2)(0.017,0.183)。4.18 (15.63,16.55)。4.19 (10.36,16.76)。4.20 (1)(0.316,0.704);(2)(0.777,0.863);(3)(0.456,0.504)。4.21 (18.11%,27.89%);(17.17%,22.835)。4.22 167。4.23 (1)2522;(2)60
12、1;(3)268。4.24 (1)(51.37%,76.63%);(2)36。4.25 (1)(2.13,2.97);(2)(0.015,0.029);(3)(25.3,42.5)。4.26 (1)(0.33,0.87);(2)(1.25,3.33);(3)第一种排队方式更好。4.27 48。4.28 139。第5章 假设检验5.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为:,。5.2 “某一品种的小鸡因为同类相残而导致的死亡率”,。5.3 ,。5.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验
13、结果却提供证据支持店方倾向于认为其重量少于60克;(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。5.5 (1)检验统计量,在大样本情形下近似服从标准正态分布;(2)如果,就拒绝;(3)检验统计量2.941.645,所以应该拒绝。5.6 3.11,拒绝。5.7 ,不拒绝。5.8 ,拒绝。5.9 ,不拒绝5.10 ,拒绝。5.11 1.93,不拒绝。5.12 7.48,拒绝。5.13 206.22,拒绝。5.14 ,拒绝。第6章 方差分析6.
14、1 (或),不能拒绝原假设。6.2 (或),拒绝原假设。6.3 (或),拒绝原假设。6.4 (或),拒绝原假设。6.5 (或),拒绝原假设。,拒绝原假设;,不能拒绝原假设;,拒绝原假设。6.6 方差分析表中所缺的数值如下表:差异源SSdfMSFP-valueF crit组间42022101.4780.3.组内383627142.07总计425629(或),不能拒绝原假设。第7章 相关与回归分析7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。(2)。(3)检验统计量,拒绝原假设,相关系数显著。7.2 (1)散点图(略)。(2)。7.3 (1)表示当时的期望值。(2)表示每变动一个
15、单位平均下降0.5个单位。(3)。7.4 (1)。(2)。7.5 (1)散点图(略)。(2)。(3)。回归系数表示运送距离每增加1公里,运送时间平均增加0.00358天。7.6 (1) 散点图(略)。二者之间为高度的正线性相关关系。(2),二者之间为高度的正线性相关关系。(3)估计的回归方程为:。回归系数表示人均GDP每增加1元,人均消费水平平均增加0.元。(4)判定系数。表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。(5)检验统计量,拒绝原假设,线性关系显著。(6)(元)。(7)置信区间:1990.749,2565.464;预测区间:1580.463,2975.750。
16、7.7 (1) 散点图(略),二者之间为负的线性相关关系。(2)估计的回归方程为:。回归系数表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。(3)检验统计量(P-Value=0.),拒绝原假设,回归系数显著。(4)(次)。(5)置信区间:(37.660,70.619);预测区间:(7.572,100.707)。7.8 Excel输出的结果如下(解释与分析请读者自己完成)Multiple R0.7951R Square0.6322Adjusted R Square0.6117标准误差2.6858观测值20方差分析dfSSMSFSignificance F回归分析1223.1403223.
17、140330.93322.79889E-05残差18129.84527.2136总计19352.9855Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept49.31773.805012.96120.000041.323657.3117X Variable 10.24920.04485.56180.00000.15510.34347.9 (1)方差分析表中所缺的数值如下 方差分析表变差来源dfSSMSFSignificance F回归1.6.6354.2772.17E-09残差1040158.074015.807总计11.67(2)。
18、表明汽车销售量的变差中有86.60%是由于广告费用的变动引起的。(3)。(4)。回归系数表示广告费用每增加一个单位,销售量平均增加1.个单位。(5)Significance F2.17E-09,线性关系显著。7.10 ;。7.11 (1)27。(2)4.41。(3)拒绝。(4)。(5)拒绝。7.12 (1)。(2)。7.13 ;。7.14 ;预测28.586。7.15 (略)。7.16 (1)显著。 (2)显著。 (3)显著。7.17 (1)。(2)。(3)不相同。方程(1)中的回归系数表示电视广告费用每增加1万元,月销售额平均增加1.6039万元;方程(1)中的回归系数表示在报纸广告费用不变
19、的条件下,电视广告费用每增加1万元,月销售额平均增加2.2902万元。(4);。(5)的P-Value=0.0007,的P-Value=0.0098,均小于,两个回归系数均显著。7.18 (1)(2)回归系数表示降雨量每增加1毫mm,小麦收获量平均增加22.3865kg/hm2;回归系数表示温度每增加1,小麦收获量平均增加327.6717kg/mh2。(3)可能存在。7.19 (1)。(2);。(3)Significance F3.88E-08,不显著;的P-Value=0.0013,不显著。第8章 时间序列分析和预测8.1 (1)时间序列图(略)。(2)13.55%。(3)1232.90(亿
20、元)。8.2 (1)时间序列图(略)。(2)1421.2(公斤/公顷)。(3)时的预测值:,误差均方; 时的预测值:,误差均方。更合适。8.3 (1)3期移动平均预测值630.33(万元)。 (2)时的预测值:,误差均方87514.7; 时的预测值:,误差均方62662.5;时的预测值:,误差均方50236。更合适 (3)趋势方程。估计标准误差。8.4 (1)趋势图(略)。(2)趋势方程。2001年预测值3336.89(亿元)。8.5 (1)趋势图(略)。 (2)线性趋势方程,2000年预测值=585.65(万吨)。8.6 线性趋势:;二次曲线:;三次曲线:。8.7 (1)原煤产量趋势图(略)
21、。(2)趋势方程,预测值(亿吨)。8.8 (1)图形(略)。(2)移动平均法或指数平滑法。(3)移动平均预测=72.49(万元);指数平滑法预测72.5(万元)( )。8.9 (1)略。 (2)结果如下2001年/月时间编号季节指数回归预测值最终预测值1971.04393056.303190.482980.99393077.503058.873990.95933098.712972.4841000.93983119.922931.9951010.94393141.132964.8861020.95893162.333032.3071030.92873183.542956.4381040.926
22、13204.752967.8691050.98143225.963166.05101061.00753247.163271.51111071.04723268.373422.77121081.26943289.584175.958.10 各季节指数如下1季度2季度3季度4季度季节指数0.75170.85131.23431.1627季节变动图(略)。计算趋势:分离季节因素后的趋势方程为:。图形(略)周期波动图(略)。8.11 各月季节指数如下1月2月3月4月5月6月0.67440.66990.74320.79030.80610.85107月8月9月10月11月12月0.75520.34490.9
23、6191.19921.86622.3377季节变动图(略)。计算趋势:分离季节因素后的趋势方程为:。图形(略)。周期波动图(略)。随机波动图(略)。第9章 指数9.1 (1)。(2)。(3)。(4)13920元26190元-12270元。9.2 (1)111.72%。(2)111.60%。(3)100.10%。(4)15.3万元15.1532万元+0.1468万元。9.3 (1)2.62%;8016元。(2)28.42%;元。(3)143.37%;元。9.4 (1)单位成本增长11.11%。(2);。9.5 结果如下表:年份缩减后的人均GDP19901584.919911817.219922149.419932562.319943161.219954145.219965148.719975889.119986357.919996640.020007049.89.6 ,下跌1.48%。