《统计学原理与实务徐静霞.pdf》由会员分享,可在线阅读,更多相关《统计学原理与实务徐静霞.pdf(37页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、思考与练习一、思考题1、 分类数据的图示方法,其中包括条形图、Pareto 图、对比条形图和饼图等。顺序数据除了上文提到的条形图、pareto 图、对比条形图、饼图之外还可以借助累积频数分布图和环形图来进行描述。2、 条形图、饼图、环形图、累积分布图、直方图、茎叶图、箱形图、散点图、线图、三维散点图、气泡图、雷达图等。3、 数据分组按照分组标志的不同可以分为单变量值分组和组距分组两种。根据组距不同还可以分为等距分组和不等距分组。4、 分组和编制频数分布表的具体步骤如下:第 1 步:排序。将变量按照一定的大小顺序进行排序,通常是由小至大的递增顺序,使用计算机软件进行整理时此步可以忽略。第 2 步
2、:确定组数。 一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少, 数据的分布就会过于集中,组数太多, 数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数K 不应少于 5 组且不多于15 组, 即 5 K15。 在实际分组时, 也可以借助经验公式来确定组数K,2lglg1nK其中 n 为数据的个数,对结果四舍五入取整数即为组数。第 3 步:确定各组的组距。在组距分组中,一个组的最小值称为下限(low limit ) ;一个组的最大值称为上限(
3、upper limit ) ,组距( class width)是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数来确定,即,组距 =(最大值最小值)组数。5、 饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。环形图中间有一个“空洞” ,样本或总体中的每一部分数据用环中的一段表示。饼图只能显示一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体或样本的数据系列,每一个总体或样本的数据系列为一个环。因此环形图可显示多个总体或样本各部分所占的相应比例,从而有利于进行比较研
4、究。6、 直方图与条形图是不同的,首先,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。7、 茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值, 即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于
5、大批量数据,茎叶图通常适用于小批量数据。8、 统计图一般由下面几个部分构成:(1)标题,即图的名称,简明扼要说明资料的中心内容,必要时注明时间和地点,一般写在图的正下方位置,同时将图形的编号写在标题的前面。 (2)标目,分为纵标目与横标目,分别表示纵轴与横轴数字刻度的意义,一般注明度量衡单位。 (3)点线条面,借以用来显示数据的元素,这是图形的主体部分,用于显示数据和展示数据的规律和关系。(4)刻度,指在纵轴或横轴上的坐标。(5)图例,其目的是为了使读者能区分统计图中各种图形的意义。9、 一般用“图优性(Graphical excellency) ”来描述一个好的统计图。“图优性”是指图形能够
6、在最短的时间内,用最少的笔墨,在最小的空间里,给观众最多的思想。一张好的图形应包括如下基本特性:显示数据,集中反映图形的内容,避免歪曲,数据之间可进行有效比较,目的明确且唯一,统计描述和文字说明清晰。10、常见的统计表一般由4 个主要部分组成,即表头、行标题、列标题和数据,此外,必要时可以在统计表的下方加上表外附加说明。11、在具体编制统计表时,应当遵循以下几点规则:(1)统计表的结构要合理,内容要简练,形式要美观。比如行标题、列标题、数字资料的位置应安排合理。如果有合计一项,一般放在最后一行或最后一列。有时,由于强调的问题不同, 行标题和列标题可以互换,但应使统计表的横竖长度比例适当,避免出
7、现过高或过长的表格形式。(2)统计表一般使用“三线表”的形式,如表324 所示,表的上下两端横线一般用粗线条绘制, 用细线把行标题和数字资料进行分离,统计表的左右两端不封口。这样使人看起来清楚、醒目、美观。如果数据关系复杂,单靠三条线是不够的,在这种情况下,数据资料也可用横线或竖线对数据资料进行分开,以表明数据的隶属关系,但必须用细线, 总之表中尽量少用横竖线。(3)表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出统计表的内容, 一般需要表明统计数据的时间(When) 、 地点 (Where) 以及何种数据 (What) ,即标题内容应满足3W 要求。如果表中的全部数
8、据都是同一计量单位,可放在表的右上角标明,若各变量的计量单位不同,则应放在每个变量后或单列出一列标明。(4)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。当数字因小可略而不计时,可写上“0” ;当缺某项数字资料时,可用符号“”表示;不应有数字时用符号“一”表示,一张填好的统计表不应出现空白单元格。(5)在绘制统计表时,为保证统计资料的科学性与严肃性,在统计表下, 应注明资料来源,以表明表中数据的可靠性,或是方便读者查阅使用。必要时,也可在统计表下添加注解,以对变量或数据进行必要的解释和文字说明。二、单项选择题1-5 C A C C D6-10 C B B B C11
9、-15C D D B C 16-20C D D B B 21-25BB B C B 26-30A C A B D 三、练习题1、 (1)属于顺序数据(2)计数项 : 成绩成绩汇总A B C D E 8 25 26 15 6 总计80 (3)成绩人数累计频率A 8 8 0.1 B 25 33 0.4125 C 26 59 0.7375 D 15 74 0.925 E 6 80 1 总计80 80 1 (4)汇总ABCDE051015202530ABCDE汇总汇总2、( 1)(2)正态分布3、(1)接收频率累积 % 接收频率累积 % 49 5 10.00 79 15 30.00 59 5 20.0
10、0 89 11 52.00 69 10 40.00 69 10 72.00 79 15 70.00 49 5 82.00 89 11 92.00 59 5 92.00 99 4 100.00 99 4 100.00 合计0 - 合计0 - (2)(3)VAR00001 Stem-and-Leaf Plot Frequency Stem & Leaf 02468101214161820优良中及格不及格甲班乙班 2.00 4 . 13 3.00 4 . 667 3.00 5 . 003 2.00 5 . 89 5.00 6 . 01144 5.00 6 . 57799 7.00 7 . 00013
11、44 8.00 7 . 55666788 6.00 8 . 011344 5.00 8 . 57789 3.00 9 . 022 1.00 9 . 7 Stem width: 10.00 Each leaf: 1 case(s) 4、 (2)(3)接收频率% 累积 % 接收频率累积 % 69 4 4.00 99 11 22.00% 79 12 16.00 109 9 40.00% 89 16 32.00 89 8 56.00% 99 18 54.00 119 7 70.00% 109 16 72.00 79 6 82.00% 119 14 86.00 129 4 90.00% 129 8 94
12、.00 69 2 94.00% 139 4 98.00 139 2 98.00% 149 2 100.00 其他1 100.00% 100 VAR00004 Stem-and-Leaf Plot Frequency Stem & Leaf 2.00 6 . 89 6.00 7 . 233566 8.00 8 . 01123456 11.00 9 . 12224556788 9.00 10 . 002466678 7.00 11 . 2355899 4.00 12 . 4678 2.00 13 . 24 1.00 14 . 1 Stem width: 10.00 Each leaf: 1 cas
13、e(s) 5、(1)VAR00003 Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 11 . 6 2.00 12 . 02 1.00 12 . 8 2.00 13 . 04 2.00 13 . 56 2.00 14 . 22 2.00 14 . 78 .00 15 . 1.00 15 . 5 2.00 16 . 02 1.00 16 . 8 4.00 17 . 0233 Stem width: 100.00 Each leaf: 1 case(s) 6、(1)计数项 : 时间时间汇总7:00 3 7:30 4 8:00 4 8:30 7 9:00
14、2 总计20 (2)0123456787:007:308:008:309:00汇总汇总7、(1) 、(2)050010001500200025003000350040004500台式机笔记本联想戴尔惠普华硕苹果索尼宏基海尔三星神州联想戴尔惠普华硕苹果索尼宏基海尔汇总7:007:308:008:309:008、(1)(2)(3)050000100000150000200000250000300000050000100000 150000 200000全社会固定资产投资全社会固定资产投资01000002000003000004000005000002006 2007 2008 2009 2010国
15、内生产总值全社会固定资产投资社会零售品消费总额01000002000003000000100000200000全社会固定资产投资全社会固定资产投资9、(1)接收频率% 累积 % 接收频率% 累积 % 29 10 10.00 20-30 5 10.00 39 16 26.00 30-40 8 26.00 49 12 38.00 40-50 6 38.00 59 16 64.00 50-60 13 64.00 69 20 84.00 60-70 10 84.00 79 12 96.00 70-80 6 96.00 89 4 100.00 80-90 2 100.00 合计100 - 合计100 -
16、 (2)(3)010000020000030000040000020062007200820092010国内生产总值全社会固定资产投资社会零售品消费总额10、(1)(2)0100020003000400050006000700080009000050100150降雨量( mm)降雨量( mm)11、(1)(2)(3)第四章二、单项选择题1-5CADBD 6-10BCBDD 11-15BACCC 16-20BBBCD 21-25CDACC 26-28DAA 三、计算分析题4.1(1)首先将数据由小到大进行排列,中位数的位置为7211321n,即排在第7位的数值为中位数,即民生银行的营业收入为中位
17、数,eM350.17 亿元。平均数亿元809.14621384.10604.12337.402904.49001nxxnii(2)25.34134nQL的位置即LQ在第 3 个数值( 145.13)和第 4 个数值( 176.11)之间 0.25 的位置上,因此875.15225. 0)13.14511.176(13.145LQ(亿元)5.79413343nQU的位置即UQ在第 9 个数值( 1295.31)和第 10 个数值( 3340.37)之间 0.75 的位置上,因此105.282975.0)31.129537.3340(31.1295UQ(亿元)(3)百分位数的位置9.3131003
18、013100Pi由于i不是整数,百分位数的位置就是第1i个位置的数据的整数部分,则第30 个百分位数是第4 个数,即华夏银行的营业收入176.11 亿元为第30 个百分数。(4)112nxxsnii=1786.559(亿元),亿元809.1462x65.0-599.1786809.1462-15.297sxxzii4.2 通常情况下,这种比赛对选手的打分是计算切尾均值,即同时集中平均数和中位数两种统计量的优点,且考虑到歌手B的得分中存在极端高分,故用切尾均值比较合适。首先将歌手A 的分数按升序整理为顺序统计量,得到1x,2x,3x,4x,5x,6x,7x,8x,9x7.9, 8.1, 8.2,
19、 8.3, 8.5, 8.6, 8.6, 8.7, 8.9 因为极端高分只有一个,因此去掉一个最高分,去掉一个最低分,取91。则歌手 A的最后得分为:43.877.82 .81.8299192983291992919191991xxxxxxx歌手 B的最后得分为:37.877.82.81 .8299192983291992919191991xxxxxxx由以上计算结果,可知歌手A 的分数略高于歌手B。4.3 若按单利计算: 设本金为V,则该笔本金12 年应得的利息总和=V (0.033+0.051+0.082+0.13+0.151)=0.75V则平均年利率%5. 71075.0VVfxfx若按
20、复利计算:则平均年利率%43.7115.011. 0108.0105. 0103.0110323x4.4 已知20000M(元) ,1850eM(元),则17752200018503230MMxe(元)因为0MMxe,因此该公司职工月工资收入呈左偏分布。4.5(1)众数0M72 和 74.3 中位数的位置为5 .15213021n则中位数为排序后处于15 位和 16 位的两个数值的平均数,即7425 .745 .73eM平均数为82.7330687.698.783.741nxxnii(2)5.74304nQL的位置即LQ在第 7 个数值( 71.2)和第 8 个数值( 71.2)之间 0.5
21、的位置上,因此2.715 .0)2 .712.71(2.71LQ(g/L)5.22430343nQU的位置即UQ在第 22 个数值( 75.8)和第 23 个数值( 75.9)之间 0.5 的位置上,因此85.755 .0)8 .759.75(8.75UQ(g/L)(3)众数 72 和 74.3 的频数均为4,故两种情况下异众比率均为%67.8630411imimirfffffV极差为5.15655.80minmaxiixxR标准差91.313082.736882.733 .7412212nxxsnii(4)用 Excel 求得偏态系数为-0.013,峰态系数为 -0.446。(5)由于众数与
22、平均数非常接近,可知数据分布应较为对称,又由于标准差数值较小,可知数据离散程度应不大。这一点同时可由偏态系数-0.013 和峰态系数 -0.446 得到印证,即女大学生血清总蛋白含量数据属轻微的左偏分布,同时略有扁平。4.6 已知29x,4s,根据经验法则, 有 95.45%的年份里二氧化硫超标的天数在21 37天之间,有 2.275%的年份里超标天数大于37 天, 有 0.00135%的年份里超标天数大于41 天,有 15.865%的年份里超标天数少于25 天。4.7 22.1623267433400fxfxA(元 / 人)25.52626796.74056237)(2ffxxsA(元 /
23、人)%42.3222.162325.526AAAxsv1664ffxxB( 元/ 人) 17.546298304)(2ffxxsB(元 / 人)%82.32166417.546BBBxsv由以上计算可得: (1)B企业的平均工资高于A企业的平均工资。 (2)由于ABvv,所以 A企业的平均工资更具有代表性。4.8(1) 2008 年粗钢产量的平均数37.901nxxnii(百万吨)2008年 粗 钢 产 量 的 中 位 数 的 位 置 为5 .6211221n, 故 中 位 数7.4926.538.45eM(百万吨)(2)2009 年粗钢产量的四分位数为34124nQL的位置即LQ为第 3 个
24、数值,即3.25LQ(百万吨)9412343nQU的位置即UQ为第 9 个数值,即60UQ(百万吨)则 2009 年粗钢产量的四分位差为7 .343.2560LUdQQQ(百万吨)2009 年粗钢产量的平均数25.861nxxnii(百万吨)因此 2009 年粗钢产量的标准差为16.15311225.869 .1525.868.56712212nxxsnii(百万吨)(3)2008 年粗钢产量的标准差为23.13211237.909.1937.903.50012212nxxsnii(百万吨)因此 2008 年中国、印度、俄罗斯和巴西的z值分别为:1 .323.13237.90-3.500sxx
25、z中国中国25.023.13237.90-8 .57sxxz印度印度17.023.13237.90-5.68sxxz俄罗斯俄罗斯43.023.13237.90-7.33sxxz巴西巴西2009 年中国、印度、俄罗斯和巴西的z值分别为:14.316.15325.86-8.567sxxz中国中国15.0-16.15325.86-8.62sxxz印度印度-0.1716.15325.86-60sxxz俄罗斯俄罗斯-0.3916.15325.86-5.26sxxz巴西巴西由以上计算结果可知,中国、俄罗斯、巴西三国的标准分数变数不大,而印度则有明显提高,因此印度粗钢产量的排名也由2008 年的第 5 位上
26、升到2009 年的第 3 位。4.9(1)由 20-30 岁年龄组的分数计算离散系数为%73.2211025111xsv由 60-64 岁年龄组的分数计算离散系数为%78.279025222xsv因此, 60-64 岁年龄组的分数差异较大。(2)由于20-30 岁年龄组的WAIS分数大致是正态分布,根据经验法则,可知20-30岁年龄组中有68.27%的人分数在85135 之间。(3)由于60-64 岁年龄组的WAIS分数大致是正态分布,根据经验法则,可知60-64岁年龄组中有68.27%的人分数在65115 之间。(4)莎拉的标准分为125110-13511sxxz母亲的标准分为2.12590
27、-12022sxxz由计算结果可知,莎拉的母亲在60-64 年龄组中分数比较高。4.10064.05.19043027744.1216550028.10815067.6803513313iiikiiifMnsfxMSK748.0328.1081501464325660034414nsfxMKkiii4.11(1)茎叶图如下:数茎树叶数据个数6 389 3 7 01267899999 11 8 000112 6 (2)最省油自动挡SUV耗油量的平均数和标准差分别为32.8201.109 .95 .53.51nxxnii自59. 1112nxxsnii自(3)最省油手动挡SUV耗油量的平均数和标准
28、差分别为615.7202 .81.88.63.61nxxnii手53.0112nxxsnii手因此%11.1932.859.1自自自xsv%96.6615.753.0手手手xsv由以上结果可知,自动挡SUV耗油量的离散程度较大。(4)平均来看,自动挡SUV的耗油量要高于手动挡,且离散程度较大,如果购买一款SUV,从经济省油的角度考虑,选择手动挡较合适。第五章二单项选择题 :1-5 BCDAA 6-10 DDBBD 11-15 BBDBD 16-20 AABAC 21-25 DBCAB 26-30 ACDBA 三计算分析题1、解: (1)根据原始数据,计算可得:4340fxfx(小时);112n
29、xxsnii=735(小时);则其 68.27%的置信区间为:5 .44135.426610735143402nszx(2)%9810098? p, n=100, 12z, 则其 68.27%的置信区间为:994.0966.0100)98.01(98.0198.0)?1 (?2nppzp2、解: (1)24. 5x,71.22s,n=100, 22z57.591.410071.2224.52nszx(2) 已知:%70? p,n=100, 22z, 则其 95.45%的置信区间为:61.0,79.0100)7.01 (7.027 .0)?1 (?2nppzp3、解: (1)已知: n=20,
30、1500 x,150s,142.2)19(2t由方差未知时,小样本的区间估计公式得:85.157115.142820150142.215002nstx(2)已知:1800 x,100s,22z,则其置信区间为:52.183648.176330100218002nszx4、解:已知:35x,4s,96.12z,则其置信区间为:64.32,36.37110010100101696. 1351100101001022szx5、解:已知:5.501x,8s,32z,则其置信区间为:9.5031.499100835.5012nszx6、解:已知%,2%,95E22z47502.005.095.02)1
31、()(22222Ezn(件)7、解:已知%,4%,98E96.12z480596.47)04.0(02.098.096.1)1()(22222Ezn(个)8、解:已知:%85.94136129? p,n=136, 96.1025.0z, 则其 95% 的置信区间为:9856.09114.0136)9485.01(9485.096.19485.0)?1 (?025.0nppzp9、解: (1)已知: n=16, 75. 6x,25.2s,131.2)15(2t由方差未知时,小样本的区间估计公式得:95.755.51625.2131.275.62nstx即该单位平均每个家庭每天看电视的95% 的置
32、信区间为5.55 小时到 7.95 小时。(2)若已知总体标准差5. 2,且要求区间估计的边际误差与上一题的相同, 即取边际误差20.11625.2131.22nstE。当05.0时,96.12z,估计总体均值时样本容量的确定公式为:1720.15 .296.1)(2222222Ezn只需增加一个样本就能满足精度需要。10、解:已知:2.10 x,4.2s,96.1025. 0z,则其置信区间为:04.1136.9314.296.12 .10025.0nszx第六章二 单选1-5ABABC 6-10 ACDAB 11-15 BABBD 16-20 DBDAD 21-25CCCAA 26-30
33、BABAD 31-35 CBADA 36-40DADAC 三 计算分析6.1解:建立原假设与备择假设为:5:0H,5:1H(1)检验统计量18.350/2 .0591.4z58.2005.02zz,所以拒绝原假设,认为该批元件的厚度不符合规定的要求。(2)利用 P值决策。 用【NORMSDIST 】计算出18. 3z的 P值为 0.00146=0.01,所以拒绝原假设,认为该批元件的厚度不符合规定的要求,与统计量决策结果一致。6.2 解: (1)70:0H,70:1H。(2)样本数据表明应该拒绝原假设时,意味着该生产线生产的玻璃纸平均横向延伸率不符合规格,必须对生产线进行调整。(3)样本数据无
34、法支持拒绝原假设时意味着质量控制监督人员没有充分的理由认为该生产线所处状态不正常,无需停产调整。6.3 解: (1)发生第一类错误指的是实际上奖励计划并未提高销售人员的平均销售额,而公司董事长却认为它提高了销售人员的平均销售额,这将导致公司错误的推行新的奖励计划,却无法获得更高的销售额。(2)发生第二类错误指的是实际上奖励计划提高了销售人员的平均销售额,公司董事长却没有意识到, 这将使公司错过推行新的奖励计划的机会,也就无法进一步提高销售额。6.4 解:建立原假设与备择假设为:12:0H,12:1H;(1)检验统计量83.1253 .01289.11z65.105. 0zz,在 5%的显著性水
35、平下,拒绝原假设,既有足够的证据认为新的教学方法使100 米成绩有所提高。(2)利用 P值决策。用【NORMSDIST 】计算出83.1z的 P值为 0. 0337=0.05,拒绝原假设, 有足够的证据认为新的教学方法使100 米成绩有所提高, 与统计量决策结果一致。6.5解:建立原假设与备择假设为:400:0H;400:1H(1)检验的临界值是645.105.0z,检验统计量645.133.325/130400420z,所以拒绝原假设,即在5%的显著性水平下,认为该化肥能够使小麦增产。(2)利用 P值决策。用【 NORMSDIST 】计算出33. 3z的 P值为 0.0004=0.05,所以
36、拒绝原假设, 即在 5%的显著性水平下, 认为该化肥能够使小麦增产,与统计量决策结果一致。6.6 建立原假设与备择假设为:400:0H;400:1H33.325/30400420)24(t,由 Excel中的【 TINV】函数得71.1)24()1(05. 0tnt因为71.1)24(33.305. 0tt,所以拒绝原假设,即在5%的显著性水平下,认为该化肥能够使小麦增产。(2)利用 P值决策。用【 TDIST 】计算出33.3T的 P值为 0.0014=0.05,所以拒绝原假设,即在5%的显著性水平下,认为该化肥能够使小麦增产,与统计量决策结果一致。6.7 建立原假设与备择假设为:8 .3:
37、0H,8 .3:1H(1)检验统计量645.196.3400/01.18 .36 .305.0zz,所以拒绝原假设,认为该城市平均人口有所下降。(2)利用 P值决策。 用【NORMSDIST 】计算出33.3Z的 P值为 0.0000374749=0.05,所以拒绝原假设,即在5%的显著性水平下,认为该城市平均人口有所下降,与统计量决策结果一致。6.8 建立原假设与备择假设为:100:0H,100:1H(1)检验统计量32.239/251007501.0zz,所以拒绝原假设,认为该厂的平均成本有所下降。(2)利用 P值决策。用【 NORMSDIST 】计算出3Z的 P值为 0.001=0.01
38、,所以拒绝原假设, 即在 5%的显著性水平下, 认为该厂的平均成本有所下降,与统计量决策结果一致。6.9 建立原假设与备择假设为:%96:0H;%96:1H(1)检验统计量444.045)96.01 (96.096.04543z65.105.0z,不能拒绝原假设,因此没有充分的理由认为该批皮鞋优质率达到96%,所以不接受该批订货。(2)利用 P值决策。用【NORMSDIST 】计算出444. 0Z的 P值为 0.671=0.05,所以不能拒绝原假设, 没有充分的理由认为该批皮鞋优质率达到96%, 不接受该批订货,与统计量决策结果一致。6.10 建立原假设与备择假设为:%80:0H;%80:1H
39、(1) 检验统计量2475.0200)8.01 (8.08.073.0z=0.05或=0.01,所以不拒绝原假设,没有充分的理由认为超过80%的行人有违章行为,与统计量决策结果一致。第 7 章相关与回归分析二 单项选择题1-5 BCBAC 6-10 CCABA 11-15 BCCAA 16-20 CCBDB 21-25 CBBAA 26_30 BCBBA 31_35 CBABA 36_40 BAAAA 三计算分析题7.1(1)散点图如下:从散点图可以看出,销售收入与广告费用之间为正的线性相关关系。(2)利用 Excel的“CORREL”函数计算的相关系数为947663. 0r。(3)首先提出如
40、下假设:0:0H,0:1H。计算检验的统计量272.7947663.0128947663.01222rnrt当05.0时,9687.2)28(205. 0t。由于检验统计量9687.2272.72tt,拒绝原假设。表明产量与生产费用之间的线性关系显著。7.2 (1)散点图如下:从散点图可以看出,复习时间与考试分数之间为正的线性相关关系。(2) 利用 Excel的“CORREL”函数计算的相关系数为8621. 0r。 相关系数8.0r,表明复习时间与考试分数之间有较强的正线性相关关系。7.3 (1)散点图如下:7.3 利用 Excel的“CORREL”函数计算的相关系数为9489.0r。由 Ex
41、cel输出的回归结果如下表:020406080100010203040复习时间考试分数得到的回归方程为:xy003585. 0118129.0?回归系数003585.0?1表示运送距离每增加1 公里, 运送时间平均增加0.003585天。7.4(1) 散点图如下:从散点图可以看出,航班正点率与被投诉次数之间为负的线性相关关系。(2)由 Excel输出的回归结果如下表:回归统计Multiple R 0.868643 R Square 0.75454 Adjusted R Square 0.723858 标准误差18.88722 观测值10 0204060801001201400204060801
42、00航班正点率投诉次数方差分析df SS MS F Significance F 回归分析1 8772.584 8772.584 24.59187 0.001108 残差8 2853.816 356.727 总计9 11626.4 Coefficients 标准误差t Stat P-value Intercept 430.1892 72.15483 5.962029 0.000337 X Variable 1 -4.70062 0.947894 -4.95902 0.001108 得到的回归方程为:xy7. 41892.430?。回归系数7 .4?1表示航班正点率每增加 1%,顾客投诉次数平均
43、下降4.7 次。(3) 回归系数检验的 P-Value=0.00110805.0) , 拒绝原假设,回归系数显著。(4)1892.54807 .41892.430?80y(次) 。(5)当05.0时,306.2)210(205. 0t,18.88722es。置信区间为:48.161892.54397.024)75.8680(10118.88722306.21892.54)()(1?2122020niiexxxxnsty即(37.7,70.7) 。预测区间为:57.461892.54397.024)75.8680(101118.88722306. 21892.54)()(11?2122020ni
44、iexxxxnsty即(7.6,100.8) 。7.5 Excel输出的回归结果如下:回归统计Multiple R 0.968167 R Square 0.937348 Adjusted R Square 0.916463 标准误差3.809241 观测值5 方差分析df SS MS F Significance F 回归分析1 651.2691 651.2691 44.88318 0.006785 残差3 43.53094 14.51031 总计4 694.8 Coefficients 标准误差t Stat P-value Intercept 13.62541 4.399428 3.0970
45、86 0.053417 X Variable 1 2.302932 0.343747 6.699491 0.006785 由上述结果可知:回归方程为xy3029.26254.13?,回归系数表明,x每增加一个单位y平均增加 2.3029个单位;判定系数%74.932R,表明回归方程的拟合程度较高;估计标准误差8092.3es,表明用x来预测y时平均的预测误差为3.8092。7.5(1)方差分析表中所缺的数值如下:变差来源df SS MS F Significance F 回归1 1622708.6 1622708.6 359.19 2.17E-09 残差10 40158.07 4015.807
46、 总计11 1642866.67 (2)根据方差分析表计算的判定系数%76.989876.067.164286660.16227082SSTSSRR。表明汽车销售量的变差中有98.7%是由于广告费用的变动引起的。(3)相关系数可由判定系数的平方根求得:9935.02Rr。(4)回归方程为:xy420211.16891.363?。回归系数420211.1?1表示广告费用每增加一个单位,销售量平均增加1.420211个单位。(5)由于 Significance F2.17E-0905.0,表明广告费用与销售量之间的线性关系显著。7.6当100 x时,96.2100037895.08295.0?4y
47、。当05.0,3979.2)225()2(205.02tnt。y的平均值的 95% 的置信区间为 :即(1.98 ,3.94 ) 。(2)当95x时,77.295037895.08295.0?4y。当05.0,3979.2)225()2(205. 02tnt。y的平均值的 95% 的预测区间为:85. 477.2154399.6)3 .12095(25119799.13979.277.2)()(11?2122020niiexxxxnsty(-2.08 ,7.62 )第八章第 8 章时间序列分析和预测8.1(1) 时间序列图如下:98.096.2154399.6)3 .120100(251979
48、9.13979.296.2)()(1?2122020niiexxxxnsty从时间序列图可以看出,国家财政用于国防的支出额大体上呈指数上升趋势。(2)年平均增长率为:%1.161%1.116131.2901.49511190nnYYG。(3)2271.5748%)1.161 (1 .4951?2010Y。8.2(1) 时间序列图如下:(2)2010 年的预测值为:8.6945347457 .6372.7494 .7623.7534.5712010F(3)由 Excel输出的指数平滑预测值如下表:2010 年3 . 0时的预测值为:24.6679.679)3.01(7.6373.0)1 (201
49、0ttFYF5. 0时的预测值为:85.683730)5 .01(7 .6375 .0)1(2010ttFYF比较误差平方可知,5 .0更合适。8.3(1)第 19 个月的 3 期移动平均预测值为:33.63031891366064458719F(2)由 Excel输出的指数平滑预测值如下表:月份营业额预测0.3 误差平方预测0.4 误差平方预测0.5 误差平方1 295 2 283 295.0 144.0 295.0 144.0 295.0 144.0 3 322 291.4 936.4 290.2 1011.2 289.0 1089.0 4 355 300.6 2961.5 302.9 2
50、712.3 305.5 2450.3 5 286 316.9 955.2 323.8 1425.2 330.3 1958.1 6 379 307.6 5093.1 308.7 4949.0 308.1 5023.3 7 381 329.0 2699.4 336.8 1954.5 343.6 1401.6 8 431 344.6 7459.6 354.5 5856.2 362.3 4722.3 9 424 370.5 2857.8 385.1 1514.4 396.6 748.5 10 473 386.6 7468.6 400.7 5234.4 410.3 3928.7 11 470 412.5