《统计学练习及参考答案.doc》由会员分享,可在线阅读,更多相关《统计学练习及参考答案.doc(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流统计学练习及参考答案.精品文档.第一章参考答案一、填空1、统计一词的含义是 统计工作 、 统计数据(统计资料) 、 统计学 。2、标志是说明 总体单位 的特征的,分为 品质 标志和 数量 标志。3、要研究工业企业生产经营状况时,全部工业企业构成 总体 ,每一个工业企业是 总体单位 。4、工人的年龄、工资、工龄属于 数量 标志,工人的性别、民族、工种属于 品质 标志。5、设备台数、工人人数属于 离散 变量,身高、体重、年龄属于 连续 变量。6、研究某市居民生活状况,该市全部居民构成了 总体 ,居民家庭的收入是 数量标志 。7、某市职工人数普查中
2、,该市全部职工人数是 指标 ,每一个职工是 总体单位 。8、从个人奖金最高额、最低额,企业奖金总额和人均奖金总额等方面研究某企业奖金的分配情况,该项研究中统计指标是 企业奖金总额、人均奖金总额 ,变量值是 奖金最高额、最低额 。二、单选1、构成统计总体的个别事物称为( D )。A 调查单位B 标志值C 品质标志D 总体单位2、对某城市工业企业未安装设备进行普查,总体单位是(B)。A 工业企业全部未安装的设备B 工业企业每一台未安装设备C 每个工业企业的未安装设备D 每一个工业企业3、下面属于统计总体的是( B )。A 某地区的粮食总产量B 某地区的全部企业C 某商场全年商品销售额D 某地区全部
3、职工人数4、在全国人口普查中( B )。A 男性是品质标志B 人的年龄是变量C 人口的平均寿命是数量标志D 全国人口是统计指标5、下列指标中属于质量指标的是( B )。A 社会总产值B 产品合格率C 产品总成本D 人口总数6、指标是说明总体特征的,标志是说明总体单位特征的( B )。A 标志和指标之间的关系是固定不变的B 标志和指标之间的关系是可以变化的C 标志和指标都是可以用数值表示的D 只有指标才可以用数值表示7、某工人月工资1500元,工资是( A )。A 数量标志B 品质标志C 质量指标D 数量指标8、下列属于数量标志的是(A)。A 职工的年龄B 职工的性别C 政治面貌D 籍贯9、研究
4、某市工业企业生产设备使用状况,统计总体为( D )。A 该市全部工业企业B 该市每一个工业企业C 该市全部工业企业每一台设备D 该市工业企业全部生产设备10、要了解某班40个学生的学习情况,总体单位是(B)。A 40个学生B 每一个学生C 每一个学生的成绩D 40个学生的成绩11、某学生某门课程考试成绩为90分,则成绩是( C )。A 品质标志B 变量值 C 变量D 标志值12、为了估计全国高中学生的平均身高,从20个城市抽取了100所中学进行调查。在该项调查中,研究者感兴趣的总体是(C )。A)100所中学B)20个城市C)全国的高中学生D)100所中学的高中学生第二章参考答案1、某班40名
5、学生统计学考试成绩分别为:68 89 88 84 86 87 75 73 72 6875 82 97 58 81 54 79 76 95 7671 60 90 65 76 72 76 85 89 9264 57 83 81 78 77 72 61 70 81学校规定:60分以下为不及格,6070分为及格,7080分为中,8090分为良,90100分为优。要求:(1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表。(2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况。(略)2、 参考答案月工资/元人数/人频率/%组中值800以下201060080012005226100
6、0120016009648140016002000241218002000以上842200合计2001003、某工业集团公司工人工资情况按月工资(元)分组企业个数各组工人所占比重(%)400500500600600700700800800以上364452025301510合 计22100计算该集团工人的平均工资。参考答案:4、1990年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:品种价格(元/斤)甲市场成交额(万元)乙市场成交量(万斤)甲乙丙1.11.41.51.22.81.5211合计5.54试问哪一个市场农产品的平均价格较高?并说明原因。 解:对于甲市场: 对于乙市场:5、
7、某厂甲、乙两个工人班组,每班组有8名工人,每个班组每个工人的月生产量记录如下:甲班组:20、40、60、70、80、100、120、70乙班组:67、68、69、70、71、72、73、70计算甲、乙两组工人平均每人产量;计算全距,平均差、标准差,标准差系数;比较甲、乙两组的平均每人产量的代表性。解:甲乙平均值7070全距离1006平均差22.51.5标准差29.58041.870829标准差系数0.4225770.026726乙组平均数代表性好。6、某乡农民家庭人均年收入情况汇总表如下,根据资料计算该乡农民家庭年人均收入的众数、中位数、四分位数、方差。农民家庭人均纯收入分组/元农民家庭数/户
8、10000120002401200014000480140001600010501600018000600180002000027020000220002102200024000120240002600030合计3000解:Mo=Me=Q1在14000-16000分组内,Q1=Q3在16000-18000分组内,Q3=组中值x频数fxf110002402640000-4960246016005904384000130004806240000-29608761600420556800015000105015750000-96092160096768000017000600102000001040
9、10816006489600001900027051300003040924160024952320002100021044100005040254016005334336000230001202760000704049561600594739200025000307500009040817216002451648000合计30004788000027955200000平均值15960方差93184007、甲乙两个生产小组各有5名工人,他们的日产量分别为:甲组35、38、40、45、52件;乙组28、34、42、48、58件,计算每组平均差,并说明甲乙两组平均数的代表性高低。甲离差离差绝对值乙
10、离差离差绝对值35-5528-141438-2234-88400042004555486642225816161444平均值4042平均差2.88.88、投资银行某笔投资的年利率按复利计算,25年的年利率分配是有1年3%,有4年5%,有8年8%,有10年10%,有2年15%,求年平均年利率。解:-19、对于右偏分布,均值、中位数和众数之间的关系是(A)。A)均值中位数众数B)中位数均值众数C)众数中位数均值D)众数均值中位数10、变异系数为0.4,均值为20,则标准差为(D)。A)80B)0.02C)4D)811、在数据集中趋势的测量中,不受极端值影响的测度指标是(D)。A)均值B)几何平均数
11、C)调和平均数D)众数12、两组数据的均值不等,但标准差相等,则(A)。A)均值小,差异程度大B)均值大,差异程度大C)两组数据的差异程度相同D)无法判断13、在数据出现0时,不宜计算(A)平均数。A)几何 B)调和C)算术D)加权14、各变量值与其(C )的离差之和等于零。A)中位数B)众数C)均值D)标准差15、数据的离散程度越大,集中趋势的测度值对该组数据的代表性(A)。A)越差B)越好C)不变D)无法确定第三章参考答案1、某产品出厂检验规定,次品率p不超过4%才能出厂,现从一批产品中抽取12件进行检查,假设取值为1代表次品,取值为0代表合格品,则数值总体是( D )。A0B.1C.0和
12、1D.许多取值为0和1的数的全体2、某厂生产的螺丝钉,其标准长度为6.8mm,而其真是的长度XN(u,0.36),从上述叙述中,假设总体均值就是标准长度,从生产的螺丝钉中抽取了1个螺丝钉作为样本,其长度为6.7mm,则该样本X1的分布是( B )。AP(X1=6.7)=1B. N(6.8,0.36)C.N(6.7,0.36)D.U(6.7,6.8)3、样本和样本观测值的关系是( C )。A两者都是随机变量,分布相同B.两者都是随机变量,但分布不同C.样本观测值是样本的一次实现D.样本只能取样本观测值4、以下不是统计量的是( D )。A样本均值B.样本方差C.样本极差D.样本量5、若随机变量X服
13、从标准正态分布,则其方差为( B )。A0B.1C.P(1-P)D.np(1-p)6、随机变量,则其概率分布曲线是(A )。A在处达到最大值B是一个非对称曲线C以为中心的对称曲线D以为中心的对称曲线第四章1、 为了确定大学生配戴眼镜的比率,调查人员欲对该大学的学生进行抽样调查。根据以往调查结果表明,该大学有75%的学生佩戴眼镜,则对于极限误差E分别为5%,10%,15%时,显著性水平为95%,抽取的样本量各位多少比较合适。参考答案:由,本抽样中,所以E=5%时,n=288.12,应取289个;E=10%时,n=72.03,应取73个;E=15%时,n=32.0133,应取33个。2、 为调查某
14、单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,的样本均值为6.75小时,原本标准差为2.25小时。(假设看电视时间服从正态分布) 试对家庭每天平均看电视时间进行置信水平为95%区间估计。参考答案:(1)在该抽样中,n=16,总体是正态分布,所以其置信区间为:(2)由得=9200.167,应取9201。3、 据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房者中本地人购房比率p的区间估计,在置信水平为90%时,其极限误差(边际误差)E=0.08。则:(1) 这80名受访者样本中为本地购房者的比率是多少?(2) 若显著性水平为5%,则要保持同样的精度进行区间估计
15、,需要调查多少购房者。参考答案:(1)该抽样中,n=80,由,得p=0.75或p=0.25。P的取值范围为(67%,83%)或(17%,33%)。(2)由得11254.69,应取11255人调查。4、 某大学生记录了一个月31天所花的伙食费,经计算得出了这个月平均每天花费10.2元,标准差为2.4元。若显著性水平为95%,估计该学生每天平均伙食费的置信区间。参考答案:在该抽样中,n=31,属于大样本,总体方差未知的情况,所以其置信区间为=(9.355,11.045)该学生每天平均伙食费在(9.355,11.045)之间。5、 为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅办
16、理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为12分钟,标准差为4.1分钟。假设办理时间成正态分布。则:(1) 其95%的置信区间是多少。(2) 若样本容量为40,观察的数据不变,则95%的置信区间为多少。参考答案:(1)在该抽样中,n=15,属于正态分布小样本,总体方差未知的情况,所以其置信区间为=(9.355,11.045)该学生每天平均伙食费在(9.355,11.045)之间。(2)在该抽样中,n=40,属于大样本,总体方差未知的情况,所以其置信区间为=(9.355,11.045)该学生每天平均伙食费在(9.355,11.045)之间。6、假设一
17、个汽车防冻液的容器里可装3785毫升液体,随机抽取n=18的一个随机样本,得到了平均值为3787毫升,标准差为55.4毫升。若显著性水平为99%,则总体标准差的置信区间是多少。参考答案:在该问题中,n=18,总体方差的估计区间为()=(1460.768,9158.455),所以总体标准差的置信区间为(38.22,95.70)。第五章1、 由于时间和成本对产量变动的影响很大,所以在一种新的生产方式投入使用之前,生产厂家必须确信其所推荐的新生产方式能降低成本。目前生产中所用的生产方式成本均值为每小时200元。对某种新的生产方式,测量其一段样本生产期的成本。(1) 该项研究中,建立适当的原假设和备择
18、假设。(2) 当不能拒绝原假设时,试对所做的结论进行评述。(3) 当可以拒绝原假设时,试对所做的结论进行评述。【参考答案】(1)(厂家支持能降低成本,至少和原来持平,按照规范,等号一般放在备择假设中)(2)当不能拒绝原假设时,说明这种新的生产方式不能带来成本降低(3)可以拒绝原假设,说明该种新的生产方式能够降低生产成本。2、 某洗涤剂厂有一台装瓶洗洁精的灌装机,在生产正常时,每瓶洗洁精的净重服从正态分布,均值为454克,标准差为12克。为检验近期机器是否正常,从中抽取16瓶,称得其净重的平均值为456.64克。(1) 试对该机器正常有否做出判断(取显著性水平为0.01,假定总体方差不变)(2)
19、 若标准差未知,但测得16瓶洗洁精的样本标准差为12克,试对机器是否正常做出判断。【参考答案】(1)假设: 计算统计量,该问题是总体为正态分布,总体方差已知的小样本,统计量为z= 查表得临界值2.576 因为2.5760.88,所以接受原假设,即机器正常。(2)假设: 计算统计量,该问题是总体为正态分布,总体方差未知的小样本,统计量为t= 查表得临界值3.286因为3.2860.88,所以接受原假设,即机器正常。3、 某厂产品的优质率一直保持在40%,近期质监部门进行抽查,共抽查了15件产品,其中优质品为15件,在显著性水平为0.05水平上是否能够认为其优质品率仍保持在40%。【参考答案】假设
20、:计算统计量,该问题统计量为z= 查表得临界值1.96 因为1.964.74,所以拒绝原假设,即不能认为继续保持在40%。4、 过去大量资料表明,某酒厂生产的一种瓶装酒的容量服从标准差为5的正态分布,企业标示的产品平均容量为250毫升。监督机构从市场上随机抽取了该产品12瓶进行检测,测得平均容量为246毫升。试在0.05的显著性水平下,检验该酒厂生产的这种瓶装酒是否存在容量不足的问题。【参考答案】假设:计算统计量,该问题是总体为正态分布,总体方差已知的小样本,统计量为z= 查表得临界值-1.64因为-2.77-6.8,所以拒绝原假设,即这批产品重量不符合要求。6、 在上题中如果按要求产品重量的
21、标准差不超过5克。试在0.05的显著性水平下检验这批产品重量的波动是否符合要求。【参考答案】假设:计算统计量 查表得临界值因为2.76.173.88529,拒绝原假设 三个厂商生产的电池平均寿命有差异。(3) 如果有差异,到底哪些厂商之间有差异(取显著性水平0.05)。假设1:假设2:假设3:计算统计量:14.4 计算LSD: 因为14.46.74,12.66.74,所以A和B有差异,B和C有差异,A和C没有差异。2、5种不同品牌的鲜牛奶在不同的超市出售。为研究不同品牌的牛奶销售量是否存在差异,随机抽取了8家超市,记录了一周内各品牌牛奶的销售量数据(单位:箱。每箱30袋,每袋500克),结果如
22、下表:量 商场品牌12345678A7173666958607061B7178818978859084C7378768674808176D7375738075717372E6266698160646157显著性水平为0.05,用Excel分析表如下:差异源SSDfMS FP-value F Crit行(品牌)1760444022.320.00002.7141列(商场)520774.293.770.00532.3593误差5522819.71总计283239(1) 在方差分析表中将所缺数值填写完整(如表所示);(2) 分析品牌和商场对牛奶销售量是否有影响。对于品牌,假设: 对于商场,假设当显著性
23、水平为0.05时,统计量品牌和商场分别为22.32,3.77因为对品牌来说,22.322.7141,拒绝原假设,品牌有差异对于商场来说,3.772.3593,拒绝原假设,商场有差异。第七章参考答案1、 下面不属于相关关系的现象是(C)。A利息与利率B.居民收入和储蓄存款C电视机产量和鸡蛋产量D.某种商品的销售额与销售价格2、当r=0.8时,下面说法正确的是(D)。A80%的点都密集在一条直线的周围B. 80%的点高度相关C其线性程度是r=0.4的两倍D两变量高度正线性相关3、在直线回归方程y=a+bx中,回归系数b表示( D )。A当x=0时y的平均值B.x变动一个单位时y的变动总量Cy变动一
24、个单位时x的平均变动量D.x变动一个单位时y的平均变动量4、可决系数越大,则回归方程(B)。A拟合程度越低B拟合程度越高C拟合程度有可能高,有可能低D用回归方程进行预测越不准确5、具有因果关系的现象(B)。A必然具有函数关系B必然具有相关关系C必然具有线性相关关系D必然具有非线性相关关系6、对于有线性相关关系的两变量建立的有意义的直线回归方程y=a+bx中,回归系数b(A)。A 可能小于0B只能是正数C只能为0D只能是负数7、在计算一元线性回归方程时,已得到以下结果:F=483.808,=99.11,n-k=22。试根据此结果,完成下表。来源平方和自由度方差来自回归2179.5612179.5
25、6来自残差99.11224.51总离差平方和2278.67238、若X表示在一家分店工作的销售人员数量,Y表示这家分店的年销售额(千元),已经求出Y对X的回归方差的估计结果如下表所示。预测量系数标准差t值常数8011.3337.06X505.4829.12方差分析来源平方和自由度方差来自回归6828.616828.6来自残差2298.82882.1总离差平方和9127.429(1) 写出估计的回归方程;(2) 在研究中涉及多少家分店;(3) 对斜率系数做显著性检验;(4) 预测有12名销售员的该分店年销售收入。参考答案:(1)回归方程为y=80+50x(2)研究中涉及分店数量为29+1=30(
26、3) 统计量t=9.12临界值查表=2.3685 因为9.122.3685,拒绝原假设,即存在线性关系。(4)y=80+50*12=6809、某商业企业2007-2011年五年内商品销售额的平均数为421万元,标准差为30.07万元;商业利润的平均数为113万元,标准差为15.41万元;五年内销售额与商业利润的乘积和为240170万元,各年销售额的平方和为890725万元,各年商业利润的平方和为65033万元。试就以上资料计算。(1)商业销售额与商业利润的样本相关系数并解释其含义。(2)其他条件不变时,估计当商品销售额为600万元时,商业利润可能为多少万元。参考答案:(1)设销售额为x,利润为
27、y,由已知条件得所以相关系数 =0.9947(2)首先计算回归系数:=0.51所以回归方程为y=-101.71+0.51x当x=600时,y=-101.71+0.51*600=204.29万元10、测得某地区10名3岁儿童的体重与体表面积的资料如表所示,试计算相关系数,并以0.05的显著性水平检验相关系数的显著性。体重1111.81212.313.113.714.414.915.216体表面积5.35.35.45.645.365.86.16.16.4参考答案:体重x体表面积yx平方y平方xy1115.312128.0958.3211.85.3139.2428.0962.543125.41442
28、9.1664.8412.35.64151.2931.809669.372513.15.3171.6128.0969.43613.76187.693682.2714.45.8207.3633.6483.52814.96.1222.0137.2190.89915.26.1231.0437.2192.7210166.425640.96102.4合计134.457.341831.24330.2596776.172 =0.9121检验:假设; 计算统计量 计算临界值 因为6.29272.75,拒绝原假设,说明体表面积和体重有显著的线性相关关系。11、用Excel建立的建筑面积X与建造总成本Y的回归结果如
29、下表所示:Summary output回归统计Multiple R0.973051R Square0.946829Adjusted R Square0.941512标准误差31.736观测值12方差分析DfSSMSF回归分析1179348.9179348.9178.0715残差1010071.741007.174总计11189420.7Coefficients标准误差t StatP-valueIntercept1845.47519.2644695.796883.76E-16X Variable 1-64.1844.809828-13.34431.07E-07根据上述分析表:(1) 确定建筑面积
30、和建造总成本之间的相关系数;(2) 建立建筑总成本和建筑面积之间的线性回归方程;(3) 解释回归系数的经济意义;(4) 预测当建筑面积为10000时建筑总成本;(5) 对回归系数进行显著性检验;(6) 对回归拟合程度加以判断。参考答案:(1) R=0.973051(2) 截距表示固定成本为1845.475,斜率表示可变成本为64.184。(3) 当面积为10000时,总成本为(5), 统计量 查表得临界值为和-2.2281 因为-2.2281-13.3443,拒绝原假设,说明线性显著相关。 (6)因为,所以拟合度很好。12、设销售收入x为自变量,销售成本y为因变量。现已知根据某百货公司某年12
31、个月的有关资料计算出以下数据(单位:万元):(1) 拟合简单线性回归方程,并对方程中回归系数的经济意义做出解释;(2) 计算可决系数;(3) 计算回归标准误差;(4) 对斜率进行显著性水平5%的显著性检验;(5) 假定下年1月销售收入为800万元,预测其销售成本。参考答案:(1)线性回归方程为:,表示销售固定成本为4.566万元,销售可变成本为0.786万元 (2)(3) ,代入数据得(4), 统计量 查表得临界值为和-2.2281 因为223.482.2281,拒绝原假设,说明线性显著相关。 (5)由回归方程得万元。第八章参考答案1、我国人口自然增长情况如下:年 份1986198719881
32、9891990比上年增加人口16561793172616781629试计算我国在“七五”时期年平均增加人口数量。【答案】该问题是时期数列,序时平均数为简单算术平均,即=1696.42、某商店1990年各月末商品库存额资料如下:月份12345681112库存额605548434050456068又知1月1日商品库存额为63万元。试计算上半年、下半年和全年的平均商品库存额。【答案】该问题是属于时点数列问题,上半年是间断相等,下半年间断不相等,应该采用简单算术平均和加权平均分别计算。(1)上半年的平均值采用首末折半法:(2)下半年采用加权平均法计算: 52.75(3)全年的可以采用加权法计算,也可以
33、采用简便的综合计算:3、某工厂的工业总产值1988年比1987年增长7%,1989年比1988年增长10.5%,1990年比1989年增长7.8%,1991年比1990年增长14.6%;要求以1987年为基期计算1988年至1991年该厂工业总产值增长速度和平均增长速度。【答案】环比环比发展速度定基发展速度定基增长速度1987-19887%107.00%107.00%7.00%198910.50%110.50%118.24%18.24%19907.80%107.80%127.46%27.46%199114.60%114.60%146.07%46.07%平均增长速度=4、某地区1990年底人口数
34、为3000万人,假定以后每年以9的增长率增长;又假定该地区1990年粮食产量为220亿斤,要求到1995年平均每人粮食达到850斤,试计算1995年的粮食产量应该达到多少斤?粮食产量每年平均增长速度如何?【答案】(1)1995年人口数量为万人(2)1995年粮食产量为3137.452850=2666834万斤266.6834亿斤(3)每年增长速度5、某地区粮食产量19851987年平均发展速度是1.03,19881989年平均发展速度是1.05,1999年比1989年增长6%,试求19851990年的平均发展速度。【答案】首先计算1990年发展速度 1985-1990年平均发展速度为6、某地商
35、品出口额2009年比2000年增长10%,2010年比2000增长25%,求该地商品出口额2010年比2009年环比增长速度。【答案】环比增长速度为7、投资银行某笔投资的年利率按复利计算,25年的年利率分配是有1年3%,有4年5%,有8年8%,有10年10%,有2年15%,求平均年利率。【答案】年平均利率为8、某化工厂企业近年的化肥产量见下表,试利用指标间关系将表中所缺数字填充完整。某化工厂企业近年的化肥产量资料年份20052006200720082009化肥产量400420445.2484544.5环比增长速度%568.7212.5定基发展速度%105111.3121136.139、某企业2
36、004-2010年间某产品产量资料如表所示。年份2004200520062007200820092010产量3146607592107122要求:(1)该动态数列的变动趋势是否符合直线趋势;(2)如果符合,请利用上述资料拟合直线趋势方程;(3)试预测该企业2011年该产品产量是多少。【答案】(1)由散点图符合直线趋势(2)计算过程如表所示年份年份变量t产量yt平方y平方ty2004-53125961-1552005-34692116-1382006-16013600-6020070750562502008192184649220093107911449321201051222514884610
37、合计05337047099670所以回归系数所以y=76.14+9.57t(3)2011年根据时间变化规律t=7,y=76.14+9.577=143.1310、下面是某企业2013年各月总产量根据移动平均计算值,根据移动平均法将下表完成(在?处填上恰当数字)。月份总产值三项移动平均四项移动平均四项移动平均修正1月712月6068.469.83月74.269.471.372.84月747776.279.55月82.881.280.8882.256月86.88584.185.957月85.48787.5889.28月88.89089.8290.439月95.892.191.1991.9510月91.79393.294.4511月91.59412月98.811、根据动态指标的相互关系,确定某企业隔年的产量水平及相关动态指标,完成下面表格。年份产值(万元)与上年相比增长量发展速度%增长速度%增长1%绝对值2009120-20101288106.676.671.22011138.2410.2410881.282012146.538.2910661.382013151.535