《2014年应用统计学期考复习资料-答案(共10页).docx》由会员分享,可在线阅读,更多相关《2014年应用统计学期考复习资料-答案(共10页).docx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上一、填空题1、为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,样本是(100所中学的高中学生)。2、某连续变量数列,其首组为开口组,上限为80,又知其邻组的组中值为95,则首组的组中值为( 65 )。3、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为 ( 88,88)。4、对连续大量生产的某种小件产品进行质量检验,最恰当的调查方式是( 抽样调查 )。5、按连续变量分为4组,各组为55-65,65-75,75-85,85以上,则数据65、85分别在( 2,4 )组。6、评价估计量
2、优劣的标准有无偏性、(一致性或相合性、有效性)。7、根据季节时间数列资料计算的各季节比率之和应等于(4)。8、已知一个总体均值95%的置信区间为(122,130),如果样本均值和标准差分别为126和16.07,则研究时应抽取的样本容量为( 64)。9、有两个变量数列,甲数列均值为100,标准差为12.8,乙数列均值为14.5, 标准差为3.7,比较两数列均值的代表性,结果是(甲好于乙)。10、已知总体标志值的平均数为13,各标志值平方和的平均数为174,则标准差系数为( 17.2 )。11、用水平法求平均发展速度本质上是求( 序时)平均数。12、某企业某年各月月末库存额资料如下(单位:万元):
3、48,44,36,32,30,40,36,34,42,46,50,56;又知上年年末库存额为52。则全年平均库存额为( 41 )。14、构成时间数列的两个基本要素是(所属时间、指标数值)。15、在假设检验中,如果检验统计量的P值大于给定的显著性水平a,则在做决策时,需要在显著性水平a的情况下,(不能拒绝)原假设。16、一组数据的最大值是85,最小值是33,中位数是55,众数是42,则该组数据的极差是( 52 )。17、样本统计量的概率分布称为( 抽样分布 )。18、利用样本统计量的值来估计总体参数的过程称为(参数估计 )。19、统计分组中,同一组的上组限与下组限之差称为(组距)。20、两个变量
4、之间的简单线性相关系数的取值范围为( -1,1 )。21、样本或总体中各不同类别数值之间的比值称为 ( 比率 )。22、在互联网上主动参与某项调查的网民所构成的样本,称为(自愿样本)。23、一元线性回归中,使得残差平方和最小的估计回归系数的方法称为(最小二乘法)。二、不定项选择题1、统计学的核心内容是( C )。 A数据的收集 B数据的整理 C数据的分析 D数据的分组 E以上都不对2、下列变量中属于连续变量的有( ABD )。 A 职工人数 B机器设备台数 C人的身高与体重 D 汽车、船舶数 E工业增加值3、在下列叙述中,正确的是(ABCD)。A 如果抽样分布的均值不等于总体参数时,则该统计量
5、被称为参数的有偏估计。B 样本方差可以估计总体方差 C 样本均值可以估计总体均值 D 样本比率可以估计总体比率 E 以上都不正确4、一元线形回归方程中的回归系数( AC )。A 能说明两变量间的变动方向 B不能说明两变量间的变动方向 C 能表明两变量间的变动程度 D不能表明两变量间的变动程度 E 其数值大小受计量单位的影响5、随机抽取400人的一个样本,发现有26%的上网者为女性。则女性上网者比率95%的置信区间为( A )。A (0.217,0.303) B (0.117,0.403) C(0.217,0.403) D (0.117,0.503) 6、从一个总体中抽取16个样本,其标准差为6
6、.2022,则总体方差的置信度为95%的置信区间为( A )。A (4.58,9.60) B (5.20,9.78) C (4.72,9.20) D (4.90,9.77) (请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)7、某公司1,2,3,4月职工平均人数分别为190人,215人,220人和230人,该公司一季 度月职工平均人数为( C )A 208 B
7、215 C 214 D 222 E 2128、某企业1996年产量为125,1997年比上年增长20%,1998年比1997年增长20%,则1998年比1996年增长( D )A 20% B 40% C 60% D 44% E 40%9、应用移动平均法分析长期趋势,采用多少项计算移动平均数,一般考虑下列问题( ABC )A 现象的变化是否有周期性 B 原数列的项数 C 原数列波动大小 D 是否需要移动平均数列的首尾数值 E是时期数列还是时点数列10、抽样调查遵循随机原则的原因是(BE )A 样本容量有限 B 保证总体中每个单位有同等机会被抽中 C 能确定抽样方法 D 能确定推断的可靠程度 E
8、能计算抽样误差三、简答题1、什么叫统计分组?简述对数据进行组距分组的步骤。是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数,其中N为数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。2、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。 二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型
9、来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于: (1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,
10、它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量3、概率抽样与非概率抽样有何关系?联系:二者都属抽样调查、非全面调查。区别:概率抽样是按照随机原则抽取样本,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,可以计算和控制抽样误差,能说明估计结果的可靠程度。非概率抽样是从研究目的出发,根据调查者的经验和判断,从
11、总体中有意识地抽取若干单位构成样本。在及时了解总体大致情况、总结经验教训、进行大规模调查前的试点等方面,非概率抽样具有概率抽样无法取代的优越性。4、标志与指标的区别与联系?区别:标志说明总体单位的特征,指标是说明总体的特征;指标都能用数值表示,而标志中的品质标志不能;指标数值是经过一定汇总得来的,而标志中的数量标志不一定经过汇总;标志一般不具备时间、地点等条件,但作为一个完整的指标,一定要受到时间、地点、范围等条件的限制。联系:许多统计指标的数值都是由总体各单位的数量标志汇总得来的;指标与数量标志在一定条件下可以转化。6、什么是均值、众数、中位数?三者的关系是什么?均值即算术平均数;众数是一组
12、数据中出现次数最多的变量值;中位数是一组数据按从小到大排列后,处于正中间位置上的变量值。三者的关系是:对于同一组数据资料计算众数、中位数和均值,如果数据具有单一众数,且分布是对称的,则三者相等。若数据为左偏分布,则有,若数据右偏分布,则有。从数值关系上看,三者的关系可表述为。7、什么是估计量?评价估计量的标准有哪些? (1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。 (2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。 (3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。8、简述测定季节变动的原始资料平均法的基本步骤和原理。又称
13、按月(或季)平均法,这种方法不考虑长期趋势影响,根据原始数据直接计算季节指数,测定季节变动。(1)计算各年同月(季)的平均数 (i=112月或i=14季),目的消除各年同一季度(月份)数据上的不规则变动;(2)计算全部数据的总平均数 ,找出整个数列的水平趋势;(3)计算季节指数S i,即 (i=112月或i=14季)10、何谓第II类错误与第类错误? 第II类错误也称为取伪错误,指在假设检验操作过程中,当原假设实际上为假,但由于随机性,从总体中抽得的样本所构建的检验统计量值却落在了接受域之内,以致做出不能推翻(可以认为接受)原假设的判断,这样就称为犯了第II类错误;(2.5分)第类错误是指原假
14、设实际上为真,但作出了拒绝原假设的判断,这样就称为犯了第类错误。(2.5分)11、请解释总体和样本。总体就是所研究的全部元素的集合 (2.5分) 样本就是从总体中抽取的一部分元素的集合 (2.5分)四、计算题1、若已知甲、乙两个企业1980年的产值分别为300万元和500万元,1994年的产值分别为800万元和1500万元。要求:(1)分别计算甲、乙两个企业产值的平均发展速度;(2)若按各自的速度发展,甲企业从现在起还需几年才能达到乙企业1994年的产值水平?(3)若要求甲企业在五年内达到乙企业1994年的产值水平,则每年应递增多少?解:(1)甲企业 =107.26乙企业 =108.16(2)
15、8.97(年)(3)113.40-1=13.4应递增13.42、有两个工厂生产三种产品的成本资料如下表,要求比较两个厂的总平均成本的高低并说明原因。(5分)品种单位成本(元)总成本(元)A厂B厂甲乙丙152030210030001500322515001500解:HA= 19.41,HB=18.31 A高于B,A厂价低的产品比重小,B市场价低的产品比重大。3、某公司下属三个部门报告期的流通费用率(=流通费/销售额)分别为12%、8%、10%,流通费用额分别为96万元、120万元、100万元。试计算三个部门的平均流通费用率。(分)解:H= =9.58%4、已知某袋装糖果的重量近似服从正态分布,现
16、从一批糖果中随机抽取16袋,检测结果,样本平均重量为503.75克,标准差为6.022克。试求这批袋装糖果的平均重量的置信度为95%的置信区间。(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、 t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)解:样本平均重量为, 样本标准差,则允许误差为即这批袋装糖果平均重量的置信度为95%的置信区间为:503.753.305克,即在(500.45,507.06)之间。5、某
17、地区8个同类企业的月产量与生产费用的资料如下:企业编号月产量(千吨)生产费用(万元)11.26222.08633.18043.811055.011566.113277.213588.0160要求:(1)计算相关系数,并说明相关程度。(2)并拟合一元线性回归方程,并对方程中回归系数的经济意义做出解释。(10)解: ,计算结果表明X与Y为高度相关。(2)设一元线性回归模型为:则所以回归方程为: ,结果表明,月产量每增加1000吨,生产费用平均增加12.896万元。6、为研究某一化学反应过程中,温度X对产品得率Y的影响,测的数据如下:温度X100110120130140150160170180190
18、得率Y45515461667074788589要求:(1)计算相关系数,并说明相关程度。(2)并拟合一元线性回归方程。解:(1)编号XYXYX2Y21100454500100002025211051561012100260131205464801440029164130617930169003721514066924019600435661507010500225004900716074118402560054768170781326028900608491808515300324007225101908916910361007921合计145067347225,计算结果表明X与Y为高度相关。
19、(2)设一元线性回归模型为:则所以回归方程为:7、为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取16户,得样本均值为 6.75小时,样本标准差为2.25小时。()以95的置信水平估计家庭每天平均看电视的时间;()若已知总体标准差为2.5,允许误差和置信水平不变,求适合的样本容量。(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.131、 t0.05(15)=1.753)(10分)解:(1)n=16, 样本均值=6.75,样本标准差=2.25查该单位平均每个家庭每天看电视的95%的置信区间是6.75 =6. 751.20即(5.5
20、5,7.95)(2)据(1)知允许误差E=1.20,又有总体标准差为2.5,95%置信度下,则即只需多增加一个样本就能满足要求。(0分)8、某工厂生产某种零件,按照规格该种零件的直径应该为4.5cm,长期积累的数据资料表明,零件的直径服从正态分布,现在从一批零件中抽得容量为5的样本,测得其直径(单位:cm)分别为4,4.5,5,5.5,6,试根据抽样结果判断零件的平均直径是否符合规定要求,显著性水平a取值为0.05。注:可能需要使用的值Z0.05=1.645, Z0.025=1.96,,t0.025(4)=2.776, t0.05(4)=2.132, t0.025(5) =2.571,t0.0
21、5(5)=2.015解:首先根据题意建立假设: 样本容量为n=5,通过样本数据计算得到样本均值为: 样本方差: 此时总体为正态分布,且不知道总体方差,样本为小样本,因此需要构建t检验统计量。 由于,检验值落在非拒绝域内,因此根据样本数据信息,在0.05的显著性水平下无法拒绝原假设,可以认为该批零件的平均直径符合规定要求。9、某连锁大型超市2000年到2005年的年销售额(单位:亿元)资料如下表所示,年份200020012002200320042005销售额1.1801.1691.3001.3311.5401.620试根据上表资料计算:(1)该超市2000年至2005年的平均销售额(2分);(2)以2000年为基期,计算该超市2005年销售额的定基增长速度、环比增长速度(4分);(3)以2000年为基期,计算该超市2001年至2005年间销售额的平均增长速度(3分)。(4)根据2001年至2005年间销售额的平均增长速度预测2007年的销售额(3分)解: (1)该超市6年平均销售额是 (2)2005年该超市的销售额与2000年相比,其定基增长速度为 2分环比增长速度为: (3)该超市销售额5年的平均增长速度是 3分 (4)2007年的销售额为: 专心-专注-专业