《2022年统计学离线作业 .pdf》由会员分享,可在线阅读,更多相关《2022年统计学离线作业 .pdf(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一次作业二、主观题 (共 4 道小题 ) 6.指出下面的数据类型:1 年龄数值型数据2 性别分类型数据3 汽车产量数值型数据4 职工对企业某项改革措施的态度赞成、中立、反对顺序数据5 购买商品时的支付方式现金、信用卡、支票分类数据7.某研究部门准备抽取2000 个职工家庭推断该城市所有职工家庭的年人均收入。要求:(1) 描述总体和样本。总体是“该城市所以的职工家庭”样本是“抽取的2000个职工家庭”(2) 指出参数和统计量。参数是“城市所有职工家庭的年人均收入”统计量是“抽取的2000个职工家庭”计算出的年人均收入8.一家研究机构从IT 从业者中随机抽取1 000 人作为样本进行调查,其中
2、60答复他们的月收入在5 000 元以上, 50的人答复他们的消费支付方式是用信用卡。要求:(1) 这一研究的总体是什么 ? 总体是所有的 IT 从业者(2) 月收入是分类变量、顺序变量还是数值型变量? 顺序变量(3) 消费支付方式是分类变量、顺序变量还是数值型变量? 分类变量(4) 这一研究涉及截面数据还是时间序列数据? 截面数据9.一项调查说明,消费者每月在网上购物的平均花费是200 元,他们选择在网上购物的主要原因是“ 价格廉价 ” 。要求:(1) 这一研究的总体是什么 ? 总体是所有网上购物者(2) “消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量? 分类变量(3) 研究者
3、所关心的参数是什么? 所有网上购物者的月平均花费(4) “消费者每月在网上购物的平均花费是200 元”是参数还是统计量 ? 统计量(5) 研究者所使用的主要是描述统计方法还是推断统计方法? 推断统计法第二次作业二、主观题 (共 1 道小题 ) 31.自填式、面访式、式各有什么长处和弱点? 自填式;优点: 1 调查组织者管理容易, 2 成本低,可进行大规模调查,3 对被调查者,可选择方便时间答卷,减少答复敏感问题压力。缺点:1 返回率低, 2 不适合结构复杂的问精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 20 页卷,调查内容有限, 3
4、 调查周期长, 4 在数据搜集过程中遇见问题不能及时调整。面访式;优点: 1 答复率高, 2 数据质量高, 3 在调查过程中遇见问题可以及时调整。缺点:1 成本比较高, 2 搜集数据的方式对调查过程的质量控制有一定难度,3 对于敏感问题,被访者会有压力。式;优点: 1 速度快, 2 对调查员比较安全, 3 对访问过程的控制比较容易。缺点:1实施地区有限, 2 调查时间不能过长, 3 使用的问卷要简单, 4 被访者不愿答复时, 不易劝服。第三次作业二、主观题 (共 5 道小题 ) 16.为评价家电行业售后服务的质量,随机抽取了由100 个家庭构成的一个样本。服务质量的等级分别表示为:A好;B较好
5、; C 一般; D较差; E.差。调查结果如下:B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求:(1) 指出上面的数据属于什么类型。顺序类型(2) 用 Excel 制作一张频数分布表。接收频数E 15 D 18 C 32 B 21 A 14
6、(3) 绘制一张条形图,反映评价等级的分布。(4) 绘制评价等级的帕累托图。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 20 页17.某行业管理局所属40 个企业 2002 年的产品销售收入数据如下:152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1) 根据上面的数据
7、进行适当的分组,编制频数分布表,并计算出累积频数和累积频率按销售收入分组频数向下累计频数向下累计频率向上累计频数向上累计频率8595 3 3 7.50% 0 100.00% 95105 6 9 22.50% 37 92.50% 105115 9 18 45.00% 31 77.50% 115125 11 29 72.50% 22 55.00% 125135 4 33 82.50% 11 27.50% 135145 5 38 95.00% 7 17.50% 145155 2 40 100.00% 2 5.00% (2) 按规定,销售收入在125 万元以上为先进企业, 115125 万元为良好企业
8、, 105115 万元为一般企业, 105 万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。按销售收入分组万元企业数个频率 % 先进企业11 27.50% 良好企业11 27.50% 一般企业9 22.50% 落后企业9 22.50% 18. 一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的 100 袋食品,测得的重量数据如下:单位: g 57 46 49 54 55 58 49 61 51 49 51 60 52 54 51 55 60 56 47 47 53 51 48 53 50 52 40 45 57
9、53 52 51 46 48 47 53 47 53 44 47 50 52 53 47 45 48 54 52 48 46 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 20 页49 52 59 53 50 43 53 46 57 49 49 44 57 52 42 49 43 47 46 48 51 59 45 45 46 52 55 47 49 50 54 47 48 44 57 47 53 58 52 48 55 53 57 49 56 56 57 53 41 48 要求:(1) 构建这些数据的频数分布表。重量 g) 频率比率
10、 % 向上累计40-45 8 8 8 45-50 37 37 45 50-55 34 34 79 55-60 18 18 97 60-65 3 3 100 合计100 100 100 (2) 绘制频数分布的直方图。(3) 说明数据分布的特征。答:由图表可知食品重量主要是分布在45-55 之间,它的分布呈现两头小中间大的钟形分布中的偏态分布,符合正常的分布规律。19. 甲乙两个班各有40 名学生,期末统计学考试成绩的分布如下:考试成绩人数甲班乙班优良中及格不及格3 6 18 9 4 6 15 9 8 2 要求:(1) 根据上面的数据,画出两个班考试成绩的比照条形图和环形图。精选学习资料 - -
11、- - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 20 页(2) 比较两个班考试成绩分布的特点。从上面的图形可以看出,甲班同学的成绩主要分布在中,乙班同学的成绩主要分布在良;甲班的不及格人数比乙班不及格人数多。(3) 画出雷达图,比较两个班考试成绩的分布是否相似。从上图可知,甲乙班的考试成绩是不相似的。20.已知 19952004 年我国的国内生产总值数据如下(按当年价格计算):单位:亿元年份国内生产总值第一产业第二产业第三产业精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 20 页1995 1996
12、1997 1998 1999 2000 2001 2002 2003 2004 678846 744626 783452 820675 894681 973148 1173902 1368759 11993 142112 145524 1447196 146282 154118 161173 169281 2076807 28538 33613 37223 38619 40558 44935 48750 52980 61274 72387 17947 20428 23029 25174 27038 29905 33153 36075 39188 43721 要求:(1) 用 Excel 绘制国
13、内生产总值的线图。(2) 绘制第一、二、三产业国内生产总值的线图。(3) 根据 2004年的国内生产总值及其构成数据绘制饼图。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 20 页第四次作业二、主观题 (共 7 道小题 ) 18.随机抽取 25 个网络用户,得到他们的年龄数据如下:单位:周岁19152925242321382218302019191623272234244120311723要求;(1) 计算众数、中位数:o=19和 23;Me=23 (2) 根据定义公式计算四分位数。QL=19,QU=26.5 (3) 计算平均数和标准
14、差;(4) 计算偏态系数和峰态系数:(5) 对网民年龄的分布特征进行综合分析:样本数据的均值是24 岁,单标准差较大,说明网民年龄之间差异较大;从偏值和峰度系数来看,网民年龄呈现右偏尖峰分布。19. 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另 种是顾客在三千业务窗口处列队3 排等待。为比较哪种排队方式使顾客等待的时间更短两种排队方式各随机抽取 9 名顾客。得到第一种排队方式的平均等待时间为72 分钟,标准差为197 分钟。第二种排队方式的等待时间(单位:分钟 )如下:55 66 67 68 71 73 74 7 8 78 要求:
15、(1) 画出第二种排队方式等待时间的茎叶图。树茎树叶频数5 5 1 6 678 3 7 13488 5 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 20 页(2) 计算第二种排队时间的平均数和标准差。(3) 比较两种排队方式等待时间的离散程度。因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,得第一种排队方式的离散系数为0.274;第二种排队方式的离散系数为0.102,所以第一种排队方式等待的离散程度大于第二种排队方式。(4) 如果让你选择一种排队方式,你会选择哪种?试说明理由。选择第二种,因为平均等待时
16、间短,而且离散程度小。20. 在某地区抽取120 家企业,按利润额进行分组,结果如下:按利润额分组 ( 万元) 企业数 ( 个) 200300 300400 400500 500600 600 以上19 30 42 18 11 合计120 要求:(1) 计算 120家企业利润额的平均数和标准差。平均数是,标准差是116.48。(2) 计算分布的偏态系数和峰态系数。21. 一项关于大学生体重状况的研究发现男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为 5kg。请答复下面的问题:(1) 是男生的体重差异大还是女生的体重差异大?为什么 ? 女生的体重差异大,因为,男生体
17、重的离散系数为0.08. (2) 以磅为单位 (1ks 22lb) ,求体重的平均数和标准差。(3) 粗略地估计一下,男生中有百分之几的人体重在55kg 一 65kg 之间? 男生中有 68% 的人体重在 55kg 一 65kg 之间(4)粗略地估计一下,女生中有百分之几的人体重在40kg60kg 之间? 女生中有 95% 的人体重在 40kg 一 60kg 之间精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 20 页22. 一条产品生产线平均每天的产量为3 700 件,标准差为50 件。如果某一天的产量低于或高于平均产量,并落人士2
18、个标准差的范围之外,就认为该生产线“ 失去控制 ” 。下面是一周各天的产量,该生产线哪几天失去了控制? 时间周一周二周三周四周五周六周日产量( 件) 3 850 3 670 3 690 3 720 3 610 3 590 3 700 用标准分数判断:时间周一周二周三周四周五周六周日标准化值3 0 周一和周六失去控制23.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15 个工人,让他们分别用三种方法组装。下面是15 个工人分别用三种方法在相同的时间内组装的产品数量:单位:个方法 A 方法 B 方法 C 164 167 168 165 170 165 164 16
19、8 164 162 163 166 167 166 165 129 130 129 130 131 30 129 127 128 128 127 128 128 125 132 125 126 126 127 126 128 127 126 127 127 125 126 116 126 125 要求:(1) 你准备采用什么方法来评价组装方法的优劣? 方法 A组装优先理由是平均数较大,离散数较小,分布较为紧密,分析较方便,具有代表性。(2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。我选第一种,单位时间的产量是后面第二种的130% ,最小值也比后面的最大值高出很多,很明显生产效率很
20、高,作为老板必须选这个的,前提是产品质量必须一样。24.在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200 种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。(1) 你认为该用什么样的统计量来反映投资的风险? 方差或标准差(3) 如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? 商业类股票(4) 如果进行股票投资,你会选择商业类股票还是高科技类股票? 高科技类股票精
21、选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 20 页第五次作业二、主观题 (共 3 道小题 ) 12. 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。 随机抽取由这台机器灌装的9 个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3 盎司的概率。13., ,表示从标准正态总体中随机抽取的容量,n=6 的一个样本,试确定常数b,使得精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页,共 20
22、页14. 在习题 6.1 中,假定装瓶机对瓶子的灌装量服从方差的标准正态分布。假定我们计划随机抽取10 个瓶子组成样本,观测每个瓶子的灌装量,得到10 个观测值,用这10 个观测值我们可以求出样本方差,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得第六次作业二、主观题 (共 13 道小题 ) 24. 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3 周的时间里选取49 名顾客组成了一个简单随机样本。(1) 假定总体标准差为15元,求样本均值的抽样标准误差。2在 95的置信水平下,求边际误差。精选学习资料 - - - - - - - - - 名师归纳总结 -
23、 - - - - - -第 11 页,共 20 页(3)如果样本均值为120元,求总体均值的95的置信区间。25. 某大学为了解学生每天上网的时间,在全校7 500 名学生中采取重复抽样方法随机抽取36 人,调查他们每天上网的时间,得到下面的数据 (单位:小时 ):求该校大学生平均上网时间的置信区间,置信水平分别为90,95和 99。26. 某居民小区为研究职工上班从家里到单位的距离,抽取了由16 个人组成的一个随机样本,他们到单位的距离(单位: km)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 假定总体服从正态分布,求职工上班从家里到单位平均距离
24、的95的置信区间。27.一家研究机设想估计在网络公司工作的职工每周加班的平均时间,为此随机抽取了18 个职工。得到他们每周加班的时间数据如下 (单位:小时 ):6 3 21 8 17 12 20 11 7 9 0 21 8 25 16 15 29 16 假定职工每周加班的时间服从正态分布。估计网络公司职工平均每周加班时间的90% 的置信区间。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 12 页,共 20 页28. 在一项家电市场调查中随机抽取了200 个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占 23。求总体比例的置
25、信区间,置信水平分别为90%和 95%。29. 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比方,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟 )如下:方式 1 方式 2 10 要求:(1) 构建第一种排队方式等待时间标准差的95的置信区间。(2) 构建第二种排队方式等待时间标准差的95的置信区间。精选学习资料 - -
26、 - - - - - - - 名师归纳总结 - - - - - - -第 13 页,共 20 页(3) 根据(1)和(2)的结果,你认为哪种排队方式更好? 第一种排队方式好,标准差小。30. 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表所示:来自总体 1 的样本来自总体 2 的样本=25 =16 =23 =20 差如下表所示:(1) 设100,求的 95的置信区间。(2) 设10, =,求的 95的置信区间。(3) 设10,求的95的置信区间。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 14 页,共 20 页(4) 设
27、n110,n220。=,求的 95的置信区间。(5) 设 n110,n220。, 求的 95的置信区间。31. 下表是由 4 对观察值组成的随机样本。配对号来自总体 A的样本来自总体 B的样本1 2 3 4 2 5 10 8 0 7 6 5 (1) 计算 A与 B各对观察值之差,再利用得出的差值计算和。(2) 设分别为总体A和总体B的均值,构造的95的置信区间。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 15 页,共 20 页32. 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改良以减小方差。下面是两部机器生产的袋茶重量
28、(单位: g)的数据:机器 1 机器 2 要求:构造两个总体方差比/的 95的置信区间。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 16 页,共 20 页33.根据以往的生产数据,某种产品的废品率为2。如果要求95的置信区间,假设要求边际误差不超过4,应抽取多大的样本 ? 34. 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验, 标准差大约为120 元,现要求以 95的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20 元,应抽取多少个顾客作为样本? 35. 假定两个总体的标准差分别为:,假设要求误差范围不超过5
29、, 相应的置信水平为95,假定,估计两个总体均值之差时所需的样本量为多大? 36. 假定,边际误差E005,相应的置信水平为95,估计两个总体比例之差时所需的样本量为多大? 第七次作业二、主观题 (共 8 道小题 ) 42. 糖厂用自动打包机打包,每包标准重量是100 千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9 包重量 (单位:千克 )如下: 993 98 7 100 5 101 2 98 3 99 7 99 5 102 1 100 5 已知包重服从正态分布,试检验该日打包机工作是否正常(a005)? 精选学习资料 - - - - - - - - - 名师归纳总结 - -
30、 - - - - -第 17 页,共 20 页43. 某种大量生产的袋装食品,按规定不得少于250 克。今从一批该食品中任意抽取50 袋,发现有6 袋低于 250 克。假设规定不符合标准的比例超过5就不得出厂,问该批食品能否出厂(a005)? 44. 某种电子元件的寿命x(单位:小时 )服从正态分布。现测得16 只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命显著地大于225 小时(a005)? 45. 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效
31、率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12 件产品,记录各自的装配时间(单位:分钟 )如下:甲方法: 31 34 29 32 35 38 34 30 29 32 31 26 乙方法: 26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同 (a 005)? 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 18 页,共 20 页46. 调查了 339 名 50 岁以上的人,其中205名吸烟者中有43 个患慢性气管炎,在134 名不吸烟者中有13
32、 人患慢性气管炎。调查数据能否支持“ 吸烟者容易患慢性气管炎” 这种观点 (a005)? 47. 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过60 万元。随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款的平均规模是否明显地超过60 万元,故一个n=144 的随机样本被抽出,测得=681 万元, s=45。用 a001 的显著性水平,采用p 值进行检验。48. 有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员把自愿参与实验的22 000 人随机平均分成两组,一组人员每星期服用三次阿司匹林(样本 1),另一组人员在相同的时间服
33、用抚慰剂(样本 2)持续 3 年之后进行检测,样本 1 中有 104 人患心脏病,样本2 中有 189人患心脏病。以a005 的显著性水平检验服用阿司匹林是否可以降低心脏病发生率。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 19 页,共 20 页49. 有人说在大学中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了25 名男生和16 名女生,对他们进行了同样题目的测试。测试结果说明,男生的平均成绩为82 分,方差为56 分,女生的平均成绩为78 分,方差为49 分。假设显著性水平=0 02,从上述数据中能得到什么结论? 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 20 页,共 20 页