《《统计学》答案-第三版.doc》由会员分享,可在线阅读,更多相关《《统计学》答案-第三版.doc(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学复习资料第2章 统计数据的描述练习题2. 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为15287=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到
2、各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100110110120120130130140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.013. 解:(1)由于两
3、组的平均体重不相等,应通过比较离散系数确定体重差异较大的组:因为女生的离散系数为V=0.1男生体重的离散系数为V=0.08对比可知女生的体重差异较大。 (2) 男生:=27.27(磅),s =2.27(磅); 女生:=22.73(磅),s =2.27(磅); (3)68%; (4)95%。14 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。(2)利用Excel进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得:成年组身高的离散系数:;又得幼儿组身高的平均数为71.3,标准
4、差为2.497,从而得: 幼儿组身高的离散系数:; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。第四章参数估计(1) 1. 解:已知总体标准差=5,样本容量n=40,为大样本,样本均值=25,(1)样本均值的抽样标准差=0.7906(2)已知置信水平1=95%,得 =1.96,于是,允许误差是E =1.960.7906=1.5496。2. 解:(1)已假定总体标准差为=15元, 则样本均值的抽样标准误差为 =2.1429(2)已知置信水平1=95%,得 =1.96,于是,允许误差是E =1.962.1429=4.2000。(3)已知样本均值为=120元,
5、置信水平1=95%,得 =1.96, 这时总体均值的置信区间为 =1204.2=可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。3. 解:计算样本均值:将上表数据复制到Excel表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到=3.316667,计算样本方差s:删除Excel表中的平均值,点击自动求值其它函数STDEV选定计算数据列确定确定,得到s=1.6093 也可以利用Excel进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“(a7-3.316667)2”,回车,即得到各数据的离差平方,在最下行求总和,得到: =90
6、.65再对总和除以n-1=35后,求平方根,即为样本方差的值s=1.6093。计算样本均值的抽样标准误差: 已知样本容量 n=36,为大样本,得样本均值的抽样标准误差为 =0.2682分别按三个置信水平计算总体均值的置信区间: 置信水平为90%时:由双侧正态分布的置信水平1=90%,通过21=0.9换算为单侧正态分布的置信水平=0.95,查单侧正态分布表得 =1.64, 计算得此时总体均值的置信区间为=3.31671.640.2682= 可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)小时; 置信水平为95%时:由双侧正态分布的置信水平1=95%,得 =1.
7、96, 计算得此时总体均值的置信区间为=3.31671.960.2682= 可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)小时; 置信水平为99%时:若双侧正态分布的置信水平1=99%,通过21=0.99换算为单侧正态分布的置信水平=0.995,查单侧正态分布表得 =2.58, 计算得此时总体均值的置信区间为=3.31672.580.2682=6. 解:已知样本容量n =200,为大样本,拥有该品牌电视机的家庭比率p =23%,拥有该品牌电视机的家庭比率的抽样标准误差为 =2.98%双侧置信水平为90%时,通过21=0.90换算为单侧正态分布的置信水平=0
8、.95,查单侧正态分布表得 =1.64, 此时的置信区间为 =23%1.642.98%=可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%,27.89%)。双侧置信水平为95%时,得 =1.96, 此时的置信区间为 =23%1.962.98%=可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为;(17.16%,28.84%)。7. 解: 已知总体单位数N=500,重复抽样,样本容量n =50,为大样本,样本中,赞成的人数为n1=32,得到赞成的比率为 p = =64%(1)赞成比率的抽样标准误差为 =6.788%由双侧正态分布的置信水平1=
9、95%,得 =1.96, 计算得此时总体户数中赞成该项改革的户数比率的置信区间为 = 64%1.966.788%=可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为(50.70%,77.30%)。(2)如预计赞成的比率能达到80%,即 p=80%, 由 =6.788%,即=6.788% 得样本容量为 n = 34.72 取整为35,即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。13. 解:已知总体比率=2%=0.02,由置信水平1-=95%,得置信度=1.96,允许误差E 4%即由允许误差公式 E=整理得到样本容量n的计算公式:n=47.0596 由于
10、计算结果大于47,故为保证使“”成立,至少应取48个单位的样本。14. ?解:已知总体标准差=120,由置信水平1-=95%,得置信度=1.96,允许误差E 20即由允许误差公式 E=整理得到样本容量n的计算公式: n=138.2976由于计算结果大于47,故为保证使“”成立,至少应取139个顾客作为样本。第6章 假设检验练习题(全免)6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设应为:,。6.2 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;(2)第
11、二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。第七章4. 解:(1)利用EXCEL制作数据散点图: 将已知表格的后两列复制到Excel中,选择该表格后,点击:图表向导XY 散点图确定,即得散点图如下:(2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,说明航班整点率与投诉率两者之间,存在着一定的负相关关系。利用Excel的统计函数“CORREL”计算得到相关系数r= 0.88261,属于高度负相关(3)求投诉率依赖航班正点率的
12、估计的回归方程设投诉率为Y,航班正点率为X 建立回归方程 解法一:应用Excel函数计算:应用统计函数“SLOPE”计算直线斜率为:=0.07041应用统计函数“INTERCEPT”计算直线与y轴的截距为:= 6.017832解法二:应用Excel列表计算:作出Excel运算表格如下:航空公司名称航班正点率(%)投诉率(次/10万名乘客)x2xyxy西南(Southwest)航空公司81.80.216691.2417.178大陆(Continental)航空公司76.60.585867.5644.428西北(Northwest)航空公司76.60.855867.5665.11美国(US Air
13、ways)航空公司75.70.685730.4951.476联合(United)航空公司73.80.745446.4454.612美洲(American)航空公司72.20.935212.8467.146德尔塔(Delta)航空公司71.20.725069.4451.264美国西部(Americawest)航空公司70.81.225012.6486.376环球(TWA)航空公司68.51.254692.2585.625合 计667.27.1849590.46523.215得回归系数为: = = 0.0704144 初始值 = = =6.01783于是得回归方程为 (4)参数的经济意义是:航班正
14、点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。(5)航班按时到达的正点率为80%时,估计每10万名乘客投诉的次数可能为: (次/10万) 第八章 时间序列分析练习题1. 解:设i年的环比发展水平为x i,则由已知得:x200330,(1)又知:,求x2008 由上得 即为 ,从而2008年该厂汽车产量将达到得 x200830 = 301.3131 = 39.393(万辆)从而按假定计算,2008年该厂汽车产量将达到39.393万辆以上。(2)规定,求由上得 可知,2004年以后9年应以7.11的速度增长,才能达到2013年汽车产量在2003年的基础上翻一番的目标。(3)设
15、:按每年7.4%的增长速度n年可翻一番, 则有 所以 (年)可知,按每年保持7.4%的增长速度,约9.71年汽车产量可达到在2003年基础上翻一番的预定目标。原规定翻一番的时间从2003年到2013年为10年,故按每年保持7.4%的增长速度,能提前0.29年即3个月另14天达到翻一番的预定目标。3. 解:设i年的环比发展水平为x i,则已知的三段年均增长率表示为: ,即 ,即 ,即(1) 该地区国内生产总值在这10年间的发展总速度为 =则平均增长速度为:(2) 若x2000=500亿元,以后平均每年增长6,即由 得到 x2002=(亿元),可知,若2000年的国内生产总值为500亿元,以后平均
16、每年增长6,到2002年可达561.80亿元。(3) 若2002年的国内生产总值的计划任务为570亿元,一季度的季节比率为105,则2002年各季度的平均计划任务是5704亿元,于是,2002年一季度的计划任务为:(亿元)。4. 解: (1) *用移动平均法预测该公司下一年的收益: 在Excel中作出10年间股票的每股收益表,添加“五项平均”计算列,选定“五项平均”列中的第三行单元格,点击菜单栏中“”符号右边的小三角“”,选择点击:自动求和平均值,用鼠标选定前五个数据(b2:b6),回车,即得到第一个五项平均值“0.96”。选择第一个五项平均“0.96”所在的单元格,并将鼠标移动到该单元格的右
17、下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列倒数第三行的单元格处放开,即得到用五项移动平均法计算的趋势值,如下表:年序每股收益五项平均10.64 20.73 30.94 0.9641.14 1.1351.33 1.3261.53 1.4771.67 1.6681.68 1.9092.10 102.50 再利用上表的计算结果预测第11年的每股收益: 选定上Excel表中的全部预测值,并将鼠标移动到该选定区域的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列第11年对应的单元格处放开,即获得911年的预测值(见下表蓝色数字),即得第11年的每股收益额为“2.30”。如下表: 年序每股
18、收益五项平均10.64 20.73 30.94 0.9641.14 1.1351.33 1.3261.53 1.4771.67 1.6681.68 1.9092.10 1.99102.50 2.092.30 *用趋势方程法预测该公司下一年的收益: 先求出10年间股票每股收益的趋势(回归)方程。 设时间为t,每股收益为y,趋势方程为 y=1+2 t 解法一:应用Excel统计函数进行计算:应用统计函数“SLOPE”计算直线斜率:在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“”,选择“统计
19、”,再在“选择函数(N)”中选择函数“SLOPE”,然后点击“确定”;在“函数参数”窗口中,点击“Known_ys”输入栏后,在Excel表中刷取y列数据,再点击“Known_xs”输入栏后,在Excel表中刷取t列数据,然后点击“确定”。这时即在选定的单元格中出现直线斜率的计算结果0.192848 应用统计函数“INTERCEPT”计算直线与y轴的截距直线起点值:在表格外选定某单元格,作为直线斜率的放置位置,点击:菜单栏中“”右边的“”后,选择“其它函数”,在“插入函数”窗口中,点击“或选择类别(C)”输入栏右边的“”,选择“统计”,再在“选择函数(N)”中选择函数“INTERCEPT”,然
20、后点击“确定”;在“函数参数”窗口中,点击“Known_ys”输入栏后,在Excel表中刷取y列数据,再点击“Known_xs”输入栏后,在Excel表中刷取x列数据,然后点击“确定”。这时即在选定的单元格中出现直线斜率的计算结果 0.365333 解法二:应用最小二乘法,用Excel列表计算趋势方程的公式元素: 年序每股收益t2tyty10.64 10.6420.73 41.4630.94 92.8241.14 164.5651.33 256.6561.53 369.1871.67 4911.6981.68 6413.4492.10 8118.9102.50 10025合计55 14.26
21、38594.34 可得:回归系数 初始值 = = =0.365336 于是,得每股收益倚年份序号的趋势方程为:对趋势方程代入 t=11,可预测下一年(第11年)的每股收益为:元(2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193元。是一个较为适合的投资方向第10章 统计指数练习题1. 解:设销售量为q,价格为p,则价值量指标、数量指标、质量指标三者关系为: 销售额=销售量价格 qp = q p 于是,对已知表格标注符号,并利用Excel计算各综合指数的构成元素如下:品种销售量(公斤)销售价格q0p0q0p1q1p0q1p1(元/公斤)基期计算期基期计算期q0q1p
22、0p1白菜5505601.61.88809908961008黄瓜22425021.9448425.6500475萝卜30832010.9308277.2320288西红柿1681702.43403.2504408510合 计125013002039.22196.821242281于是代入相应公式计算得:用拉氏公式编制总指数为:四种蔬菜的销售量总指数 四种蔬菜的价格总指数 用帕氏公式编制总指数:四种蔬菜的销售量总指数为 四种蔬菜的价格总指数为 比较两种公式编制出来的销售量总指数和价格总指数,可见:拉氏指数帕氏指数 在经济意义上,拉氏指数将同度量因素固定在基期。销售量总指数说明消费者为保持与基期相
23、同的消费价格,因调整增减的实际购买量而导致实际开支增减的百分比;价格总指数说明消费者为购买与基期相同数量的四种蔬菜,因价格的变化而导致实际开支增减的百分比。帕氏指数将同度量因素固定在计算期。销售量总指数说明消费者在计算期购买的四种蔬菜,因销售量的变化而导致实际开支增减的百分比;价格总指数说明消费者在计算期实际购买的四种蔬菜,因价格的变化而导致实际开支增减的百分比。3. 解:设产量为q,单位成本为p,销售价格为r,则价值量指标、数量指标、质量指标三者关系为: 产值=产量价格 , 总成本=产量单位成本 qr = q r , qp = q p*以单位产品成本p为同度量因素,编制该企业的帕氏产量指数P
24、q: 选择已知表格中的单位产品成本和产量数据,标注符号,并利用Excel计算帕氏产量指数的构成元素如下:产品计量单位产 量计算期单位成本q0p1q1p1基期计算期q0q1p1A 件270340501350017000B 台32358002560028000C 吨1901503306270049500合计10180094500于是,以单位产品成本为同度量因素,编制该企业的帕氏产量指数为*以销售价格r为同度量因素,编制该企业的帕氏产量指数Pq再选择已知表格中的价格和产量数据,标注符号,并利用Excel计算帕氏产量指数的构成元素如下:产品计量单位产 量计算期销售价格q0r1q1r1基期计算期q0q1
25、r1A件270340651755022100B台323510003200035000C吨1901504007600060000合计125550117100于是,以价格为同度量因素,编制该企业的帕氏产量指数为 比较说明两种产量指数不同的经济分析意义:以单位产品成本为同度量因素编制的该企业的帕氏产量指数说明,按计算期计算的三种产品,因产量的变化而导致总成本增减的百分比。 以销售价格为同度量因素编制的该企业的帕氏产量指数说明,按计算期计算的三种产品,因产量的变化而导致总产值增减的百分比。4. 解:设销售量为q,价格为p,则个体价格指数为ip,销售额指标、销售量指标、价格指标三者关系为: 销售额=销售
26、量价格 qp = q p 求用基期加权的算术平均指数公式编制四种蔬菜的价格总指数:用基期加权的算术平均价格指数为 作Excel表格计算公式元素:品 种基期销售额(元)个体价格指数(%)ipq0p0q0p0ip白 菜880112.5990黄 瓜44895425.6萝 卜30890277.2西红柿403.2125504合 计2039.22196.8用基期加权的算术平均价格指数为: ; 用计算期加权的调和平均指数公式编制四种蔬菜的价格总指数用计算期加权的调和平均价格指数公式为 作Excel表格计算公式元素:品 种计算期销售额(元)个体价格指数(%)q1p1/ipq1p1ip白 菜1008112.5896黄 瓜47595500萝 卜28890320西红柿510125408合 计22812124即得用计算期加权的调和平均价格指数为: 用基期加权的几何平均指数公式编制四种蔬菜的价格总指数(课本无此内容)页脚内容29