2022年统计学名词解释汇总袁卫版 .pdf

上传人:H****o 文档编号:33397863 上传时间:2022-08-10 格式:PDF 页数:8 大小:81.03KB
返回 下载 相关 举报
2022年统计学名词解释汇总袁卫版 .pdf_第1页
第1页 / 共8页
2022年统计学名词解释汇总袁卫版 .pdf_第2页
第2页 / 共8页
点击查看更多>>
资源描述

《2022年统计学名词解释汇总袁卫版 .pdf》由会员分享,可在线阅读,更多相关《2022年统计学名词解释汇总袁卫版 .pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、统计学名词解释统计学 : 是收集、处理、分析、解释数据并从数据中得出结论的科学。统计学方法 : 描述统计和推断统计;理论统计和应用统计。统计数据的来源: 第一手数据 ( 直接数据 ) ;第二手数据(间接数据)。基本概念:总体( 人们研究的所有基本单位总和) 变量(总体中个体单位所具有的特征)样本(总体的一部分)统计数据类型 : 按采取 计量尺度 ,分类数据(定性)、顺序数据(定性)、数值型数据(定量);按统计 数据收集方法 ,观测数据、实验数据;按被描述对象与时间关系 ,截面数据、时间序列数据(动态数据)变量分类:分类变量,顺序变量,数值型变量;随机变量(某次试验结果的数值性描述),非随机变量

2、;经验变量,理论变量。离散型变量和连续型变量离散型变量,只能取有限个数值;连续型变量,取一个或多个区间中任何值;均值: 亦数学期望,是随机变量所有可能取值的一个加权平均参数估计: 用样本统计量去估计总体的参数估计量: 用来估计总体参数的统计量的名称点估计: 用样本估计量的值作为总体参数的估计值区间估计: 在点估计的基础上,给出总体参数估计的一个范围置信区间: 在区间估计中,由样本统计量所构造的总体参数的估计区间;置信系数: 置信区间中包含总体参数真值的次数所占的比率评价估计量的标准: 无偏性、有效性、一致性;假设: 对总体参数的具体数值所作的陈述;名师资料总结 - - -精品资料欢迎下载 -

3、- - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 8 页 - - - - - - - - - 假设检验:先对总体参数提出某种假设, 然后利用样本信息判断假设假设是否成立的过程。方差分析: 检验多个总体均值是否相等的统计方法数据的预处理包括哪些内容?数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。直方图和条形图有什么区别? 条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距, 直方图各矩形连续排列,条形图分开排列, 条形图主要展示

4、分类数据,直方图主要展示数值型数据。 茎叶图和直方图相比有什么优点?茎叶图既能给出数据的分布情况,又能给出每一个原始数据, 即保留了原始数据的信息。在应用方面,直方图通常适用于大批量数据, 茎叶图适用于小批量数据。一组数据的分布特征可以从哪几方面进行测度:一是分布的集中趋势,反映数据向其中心靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。简述众数、中位数、平均数的特点和应用场合。众数是一组数据分布的峰值, 不受极端值的影响, 缺点是具有不唯一性。 众数主要作为分类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值,不受数据极

5、端值的影响。 中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。均值是就数值型数据计算的, 具有优良的数学性质, 缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。为什么要计算离散系数。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 8 页 - - - - - - - - - 第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。第二,它们与原变量值的计量单位相同,采用不同计量单位计

6、量的变量值,其离散程度的测度值也就不同。 因此,为消除变量值水平高低和计量单位不同对离散程度的测度值的影响,需要计算离散系数。简述异众比率、四分位差、方差或标准差的适用场合对于顺序数据, 但主要使用四分位差来测量其离散程度;对于数值型数据, 虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。标准分数有哪些用途?标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。1. 抽样推断的含义 : 是在根据随机原则从总体中抽取部分实际数据的基础上,运用数理统计方法,对总体某一现象的数量性

7、作出具有一定可靠程度的估计判断。2. 简单随机抽样:含义:从含有N个元素的总体中,抽取n 个元素作为样本,使得每一个容量为n 的样本都有相同的机会被抽中, 这样的方式称为简单随机抽样。特点:简单随机抽样是其他抽样方法的基础。有两种抽取元素的方式:重复臭氧和不重复抽样。3. 分层抽样:含义:在抽样之前先将总体的元素划分为若干层,然后从各个层中抽取一定数量的元素组成一个样本,这样的样本抽样方式称为分层抽样,也成分类抽样。 特点:除了可以对总体进行评估外,还可以对各层的子总体进行评估。 可以按自然区域或行政区域进行分层,使抽样的组织和实施都比较方便。分层抽样的样本分布在各个层内,从而使样本在总体中的

8、分布比较均匀。可以提高估计的精度。4. 系统抽样:含义:先将总体个元素按照某种顺序排列,并按某种规则确定一个随机起点, 然后,每隔一定的间隔抽取一个元素,直至抽取 n 个元素形成一个名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 8 页 - - - - - - - - - 样本。特点:简单易行在总体中的分布一般也比较均匀,由此估计的误差通常要小于简单随机抽样。5. 整群抽样 : 含义:先将总体划分成若干群, 然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所

9、有元素进行观察。特点:不需要有总体元素的具体名单而只要有群的名单就可以进行抽样。整群抽样时群内各元素比较集中,对样本进行调查比较方便,节约费用。在群内各元素存在差异时,整群抽样可以提供较好的结果,理想的情况是每一群都是整个总体的一个缩影。3. 重复抽样:从总体中抽取一个元素后, 把这个元素放回到总体中再抽取第二个元素,直至抽取 n 个元素为止。不重复抽样: 一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取n 个元素为止。4. 抽样分布:重复选取容量为 n 的样本时,由每一个样本算出的统计量数值的相对频数分布或概率分布,称为样本统计量的抽样分布。5. 样本统计量的分布

10、与总体分布的关系?由于现实中我们不可能将所有的样本都抽出来,因此,统计量的抽样分布实际上是一种理论分布,但它与总体分布存在着密切的关系, 以均值 x 的抽样分布为例,其抽样分布与原有总体的分布有关,如果原有总体是正态分布, 那么,无论样本容量的大小, 样本均值也服从正态分布。 其分布的数学期望为总体均值,方差为总体方差的 1/n ,即 00。如果原有总体的分布不是正态分布,就要看样本容量的大小了,当 n 为大样本时 (n30),根据统计上的中心极限定理可知,当样本容量 n 增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。其分布的数学期望为总体均值,方差为总体方差

11、的1/n 。6. Z /2n的含义:是估计误差。 Z/2 的值和样本量 n 共同确定了估计误差的大小,一旦确定了置信水平1-,Z/2 的值就确定了。对于给定的Z/2的值和总体标准差。可以确定任一允许的估计误差所需要的样本量。7. 样本均值抽样分布的两个主要特征值:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 8 页 - - - - - - - - - 与总体参数的关系:1. 理解原假设与备择假设的含义: 原假设:通常将研究者想收集证据予以反对的假设称为原假设或零假设,用

12、H0表示;备择假设:通常将研究者想收集证据予以支持的假设称为备择假设或研究假设,用H1表示。2. 统计检验量:根据样本观测结果计算得到的, 并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。标准化检验统计量: 是将统计检验量标准化, 标准化的统计检验量 =(点估计量 -假设值) / 点估计量的抽样标准差。3. 第类错误: 当原假设为真时拒绝原假设,所犯的错误称为类错误。 犯第类错误的概率通常记为。第类错误: 当原假设为假时没有拒绝原假设,所犯的错误称为第类错误,又称取伪错误。犯第类错误的概率通常记为。它们发生概率之间的关系: 在样本量不变的情况下, 要减小就会使增大, 而要增大

13、就会使减小,这两类错误此消彼长。4. 显著性水平:假设检验中犯的第类错误的概率,称为显著性水平,记为。它对于假设检验决策的意义: 显著性水平是人们事先制定的犯第类错误的概率的最大允许值,在实际应用中,显著性水平往往是人们事先给出的一个值。5.P 值:在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,称为 P值,也称为观察到的显著性水平。利用 P值决策的准则:如果P值,拒绝 H0 ;如果 P值,不拒绝H0. 6. 单侧检验与双侧检验的区别:单侧检验中,P值位于抽样分布的一侧,而双侧检验 P值位于分布的两侧,每一侧的P值为 1/2. 7. 大样本情形下总体均值左侧检验的拒绝域:ZZ

14、;右侧检验的拒绝域:ZZ;双侧检验的拒绝域: |Z| Z/2 。8. 小样本情形下总体均值检验应该构造的检验统计量t 应用前提:服从正态分布9. 小样本情形下总体均值左侧检验拒绝域:t t (n-1) ; 右侧检验拒绝域: tt (n-1);双侧检验的拒绝域: |t|t /2 (n-1)10. 假设检验的一般步骤:依照题意建立原假设H0与备择假设 H1判断样本大小并计算检验统计量根据显著水平进行判断原假设是否成立。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 8 页 -

15、 - - - - - - - - 1、相关关系:变量之间存在的不确定的数量关系。相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量 x 取某个值时, 变量 y 的取值可能有几个2、相关系数的取值和意义:取值范围:1r1。若 0r1,x、y 之间存在正线性相关关系; 1r0, 负线性相关关系;若r=+1,x 、y 之间为完全正相关关系; r= 1,为完全负线性相关关系。当|r|=1时,y 的取值完全依赖于x,二者之间即为函数关系; 当 r=0 时,说明 y 的取值和 x 无关,即二者之间不存在线性关系(并不说明变量之间没有任何关系)。若|r| 1,说明变量之间线性关系越密切, |r|

16、 0,越不密切。 |r| 0.8, 高度相关; 0.5 |r|0.8,中度相关;0.3 |r|0.5,低度相关; |r|F, 拒绝 H0,表明两个变量之间的线性关系是显著的;若 Ft/2, 拒绝 H0, 回归系数等于 0 的可能性小于,表明自变量 x 对因变量 y 的影响是显著的(两个变量之间存在着显著的线性关系);若 |t|t/2, 则不能拒绝 H0 ,表明 x 对 y 的影响是不显著的,二者之间不存在线性关系。10. 置信区间估计:对x 的一个给定值 x0,求出 y 的平均值的区间估计。预测区间估计:对x 的一个给定值 x0,求出 y 的一个个别值的区间估计。区别:1 简述时间序列的各构成

17、要素构成要素分为四种,即趋势(T)、季节性 or 季节变动( S)、周期性或循环波动(C)、随机性或不规则波动(I ). 趋势是指时间序列在长时期内呈现出来的某种持续向上或持续下降的变动。它是由某种固定性的因素作用于序列而形成的。可以是线性, 也可以是非线性。 季节变动是指时间序列在一年内重复出现的周期性波动。循环波动或周期性波动是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。 不同于趋势变动, 季节变动有比较固定的规律,周期为一年,而循环波动则无固定的规律, 变动周期多为一年以上, 且周期长短不一。周期性通常是由于经济环境的变化而引起的。随机性或不规则波动是由于一些偶然性的因素

18、产生的。2 利用增长率分析时间序列时应注意哪些问题(1) 当时间序列中的观察值出现0 或负数时,不宜计算增长率;(2) 不能单纯就增长率论增长率,要注意增长率与绝对水平的综合分析;大的增长率背后,其隐含的绝对值可能很小, 小的增长率背后其隐含的绝对值可能很大。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 8 页 - - - - - - - - - 3 简述平稳序列和非平稳序列的含义平稳序列:基本上不存在趋势的序列。 各观察值基本上在某个固定的水平上波动,虽然在不同的时间

19、段波动的程度不同,但并不存在某种规律, 而其波动可以看成是随机的。非平稳序列: 包含趋势性、 季节性或周期性的序列。 它可能只含有其中的一种成分,也可能是几种成分的组合。4 指数平滑法的基本含义 : 是加权平均的一种特殊形式对过去的观察值加权平均进行预测的一种方法观察值时间越远,其权数也跟着呈现指数的下降, 因而称为指数平滑有一次指数平滑、二次指数平滑、三次指数平滑等该方法使用第 T+1期的预测值等于 T期的实际观测值与第T期预测值的加权平均值一次指数平滑法也可用于对时间序列进行修匀,以消除随机波动, 找出序列的变化趋势5 分解预测的基本步骤 : 确定并分离季节成分。计算季节指数,以确定时间序列中的季节成分。 然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数, 以消除季节成分建立预测模型并进行预测。对消除季节成分的时间序列建立线性预测模型,并根据这一模型进行预测计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的观测值。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 8 页 - - - - - - - - -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁