《2022年统计学名词解释及简答题 .pdf》由会员分享,可在线阅读,更多相关《2022年统计学名词解释及简答题 .pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学习必备欢迎下载名词解释一、分类数据(categorical data)是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。二、顺序数据(ran k data)是只能归于某一有序类别的非数字型数据。三、数值型数据 ( metric data)是按数字尺度测量的观察值,其结果表现为具体的数值。四、系统抽样(systematic sampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。五、非概率抽样(non-probability sa
2、mpling)是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。六、抽样误差 (sampling error )是由于抽样的随机性引起的样本结果与总体真值之间的误差。七、 四分位数 (quartile) 也称四分位点, 他是一组数据排序后处于25%和 75%位置上的值。四分位数是通过3 个点将全部数据等分为4 部分,其中每部分包括25%的数据。八、离散系数 也成为 变异系数 (coefficient of variation ),它是一组数据的标准差与其相应的平均数之比。其计算公式为:ssvx离散系数是测度数据离散
3、程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。九、泊松分布 (Poisson distribution )是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。十、中心极限定理(central limit theorem ):设从均值、2( 有限 ) 的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值X的抽样分布近似服从均值为、方差2/n 的正态分布。十一、置信区间( confidence interval )在区间估计中,有样本统计量所构造的总体参数的估计区间称为置信区间,
4、其中区间的最小值称为置信上限。十二、显著性水平(significant level) 是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01,这表明,当做出接受原假设的决定时,其正确的概率为95%或 99%。十三、方差分析( analysis of variance, ANOV A)就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。十四、相关系数( correlation coefficient )是根据样本数据计算的度量两个变量之间线性
5、关系强度的统计量。十五、回归模型( regression model)对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系。描述因变量y 如何依赖于自变量x 和误差项的方程称为回归模型。十六、点估计利用估计的回归方程,对于x 的一个特定值0 x,求出 y 的一个估计值就是点估计。点估计可分为两种:一是平均值的点估计;二是个别值的点估计。十七、时间序列 (time series) 是同一现象在不同时间上的相继观察值排列而成的序列。十八、指数平滑法(exponential smoothing)是通过对过去的观察值加权平均进行预测的一种方法, 该方法使t+1 期的预测值等于t 期的实际
6、观察值与t 期的预测值的加权平均值。十九、指数 ,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。指数是测定多项内容数量综合变动的相对数。这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容;指数概念的第二个要点是其表现形式为动态相对数,既然是动态相对精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 4 页学习必备欢迎下载数,就涉及指标的基期对比,不同要素基期的选择就成为指数方法需要讨论的问题。二十、居民消费价格指数(consumer price index , CPI)是度量居民消费品和服务项目价格水平随时间变动的相
7、对数,反映居民家庭购买的消费品和服务价格水平的变动情况。简答题一、概率抽样的定义及特点概率抽样 (probability sampling )也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,抽样时是按一定的概率以随机原则抽取样本。其次,每个单位被抽中的概率是已知的,或是可以计算出来的。最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。二、简述直方图与条形图的不同点直方图与条形图不同。首先,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度
8、表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。三、简述一张好的图形应具有以下基本特征:(1) 显示数据(2) 让读者把注意力集中在图形的内容上,而不是制作图形的程序上。(3) 避免歪曲。(4) 强调数据之间的比较。(5) 服务于一个明确的目的。(6) 有对图形的统计描述和文字说明。四、简述制作统计表应注意的几个问题首先,要合理安排统计表的结构,比如行标题、列标题、数字资料的位置应合理安排。其次,表头一般应包括表号、总标题
9、和表中数据的单位等内容。再次,表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目。最后, 在使用统计表时,必要时可在表的下方加上注释,特别要注明数据来源,以表示对他人劳动成果的尊重,以备读者查阅使用。五、简述众数、中位数和平均数的关系从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置的值,而平均数则是全部数据算术平均。因此,对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:如果数据的分布式对称的,众数(0M)、中位数(eM)和平均数(x)必定相等,即0M=eM=x;如果数据是左偏分布,说明数据存在极小值, 必然拉动平均
10、数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:xeM0M;如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则0MeMx。六、简述一组数据的分布特征可以从哪几方面进行测设数据分布的特征可以从三方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。七、简述古典概型的特征( 1)结果有上限。( 2)各个结果出现的可能行被认为是相同的。八、简述评价估计量好坏的标准1 无偏性2 有效性精选学习资料 - - - - - -
11、- - - 名师归纳总结 - - - - - - -第 2 页,共 4 页学习必备欢迎下载3 一致性九、简述假设检验的流程首先提出原假设和备择假设。原假设和备择假设分别为:0:3190H(克) 0:3190H(克)接下来,需要确定适当的检验统计量,并计算其数值。最后可以进行统计决策。十、什么是假设检验中的两类错误?一类错误是原假设0H为真却被我们拒绝了,犯这种错误的概率用表示,所以也称错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用表示,所以也称错误或取伪错误。十一、说明计算2统计量的步骤步骤一:用观察值0f减去期望值ef;步骤二:将0()eff之差平方;步骤三:将20
12、()eff的结果除以;步骤四 ;将步骤三的结果加总。十二、方差分析包括哪些类型?它们有何区别?根据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。 当方差分析中只涉及一个分类型自变量时称为单因素方差分析。在对实际问题的研究中,有时需要考虑对试验结果的影响。当方差分析中涉及两个分类型自变量时,称为双因素方差分析。十三、解释2R的含义和作用怎样度量它们之间的关系强度呢?可以用组间平方和(SSA)占总平方和(SST)的比例大小来反映,这一比例记为2R,即2()()SSASSRSSTSS组间总其平方根 R 就可以用来测量两个变量之间的关系强度。2R的平方根 (类似于第11 章
13、中介绍的相关系数r)可以用来测量自变量与因变量之间的关系强度。根据上面的结果可以计算出R=0.591404,这表明行业与投诉次数之间有中等以上的关系。十四、简述方差分析的基本步骤1 提出假设2 构造检验的统计量3 统计决策4 方差分析表十五、简述判定系数的含义及作用判定系数是对估计的回归方程拟合优度的度量。判定系数2R测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方和 SSE=0, 2R=1,拟合是完全的;如果y 的变化与x 无关, x 完全无助于解释y 的变差,此时? yy,则2R=0.可见2R的取值范围是 0,1 。2R越接近于1,表明回归平方和占总平方和的比例越大,
14、 回归直线与各观察点越接近,用 x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之,2R越接近于0,回归直线的拟合程度就越差。十六、在多元线性回归中,选择自变量的方法有哪些?变量选择的方法主要有:向前选择、向后剔除、逐步回归、最优子集等。十七、简述时间序列的构成要求时间序列的成分可以分为四种,即趋势(T) 、季节性或季节变动(S) 、周期性或循环精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 4 页学习必备欢迎下载波动( C) 、随机性或不规则波动(I) 。十八、简述时间序列的预测程序第一步:确定时间序列所包含的成分,也就是确定时间序列的类型。第二步:找出适合此类时间序列的预测方法。第三步:对可能的预测方法进行评估,以确定最佳预测方案。第四步:利用最佳预测方案进行预测。十九、简述构建综合评价指数的步骤(1)建立综合评价指标体系。(2)评价指标的无量纲化处理。(3)确定各项评价指标的权重。(4)计算综合评价指数。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 4 页