《word庄欣-中级经济师-经济基础-教材精讲班-第24章.docx》由会员分享,可在线阅读,更多相关《word庄欣-中级经济师-经济基础-教材精讲班-第24章.docx(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、中级经济师经济基础知识教材精讲班授课教师:庄欣第二十四章描述统计【本章考情分析】年份单选题多选题合计2017 年3题3分1题2分5分2016 年2题2分2题4分6分2015 年4题4分2题4分8分【本章教材结构】描述离散程度的测度统计描述离散程度的测度统计分布形态的测度集中趋势的测度W方差 标准差 离散系数值位数均中众中位数和众数的匕喉及适用范围偏态系数标准分数变量间的相互关系 变量间的相关分析散点图相关系数网校解析:考查数据集中趋势的测度。中位数主要用于顺序数据,也适用于数值型数据,但 不适用于分类数据,中位数不受极端值的影响,抗干扰性强。尤其适用于收入这类偏斜分布 的数值型数据。三、离散系
2、数1、定义:离散系数,也称为变异系数或标准差系数,即标准差与均值的比值,主要用于不同类别数据离散程度的比较,记为cvo离散系数计算公式为:cv =2、要点:离散系数消除了测度单位和观测值水平不同的影响,可以直接用来比较变量的离散程 度。标准差的大小不仅与数据的测度单位有关,也与观测值的均值大小有关,不能直接用标 准差比较不同变量的离散程度。【例题:计算】某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480 元、750元和500元,求该日平均销售额、方差、标准差和离散系数 网校答案:(1)日平均销售额:-520 + 600 + 480 + 750 + 500x -5= 570
3、 (元)(2)日销售额的样本方差:厂万23 一,=1 O - 一12 _ (520 - 570)2 + (600 - 570)2 + (480 - 570)2 + (750 - 570)2 + (500 -570)251= 12200 (元)570【例题:多选】下列统计量中,容易受极端值影响的有(1A ,均值B .方差C .标准差D .众数E.中位数网校答案:ABC【例题:单选】下列统计量中,适用于描述分类数据集中趋势的是(IA .均值B .中位数C.变异系数D.众数网校答案:D网校解析:(1)均值是集中趋势最主要的测度值,主要适用于数值型数据,不适用于分类 和顺序数据。(2)中位数是一个位置
4、代表值,主要用于顺序数据和数值型数据,但不适用于分类数 据。(3)众数不适用于定量变量,主要适用于分类和顺序变量。(4)离散系数,也称为变异系数或标准差系数,即标准差与均值的比值,主要用于不同类别数据离散程度的比较。考点3分布形态的测度一、偏态系数1、偏度是指数据分布的偏斜方向和程度,描述的是数据分布对称程度。测度数据分布 偏度的统计量称为偏态系数,其计算公式为:偏态系数取决于离差三次方的平均数与标准差三次方的比值。2、种类:(1)如果偏态系数等于0,说明数据的分布是对称的;(2 )如果偏态系数为正值,说明数据的分布为右偏的,取值在0和0.5之间说明轻度 右偏,取值在0.5和1之间说明中度右偏
5、,取值大于1说明严重右偏;(3 )如果偏态系数为负值,说明数据的分布为左偏,取值在0和-0.5之间说明轻度左偏,取值在-0.5和-1之间说明中度左偏,取值小于-1说明严重左偏。偏态系数的绝对值越大,说明数据分布的偏斜程度越大。【例题:多选】在某电商网站上,商品甲得到6个评价得分,分别是1、4、4、5、5、5 ;商品乙得到五个评分,分别是3、3、3、4、4。关于这两组数据的说法,正确的有(XA.商品甲的评分中位数高于商品乙B.商品甲的评分均值低于商品乙C.商品甲的评分众数局于商品乙D.商品甲的评分分布离散程度大于商品乙E.商品甲的评分分布是左偏的网校答案:ACDE网校解析:本题考查描述统计。【例
6、题多选】某企业员工年收入数据分布的偏态系数3.0则该组数据的分布形态为IA .右偏B .左偏C.轻度偏斜D.严重偏斜E.中度偏斜网校答案:AD二、标准分数1、标准分数可以给出数值距离均值的相对位置,计算方法是用数值减去均值所得的差 除以标准差,计算公式为:在统计上,均值和标准差不同时,不同变量的数值是不能比较的。【例题:单选】在考核A中,员工得分的均值为80分,标准差为20分;在考核B中,员 工得分的均值为60分,标准差为5分。在考核A中80分转化后的标准分数为(),考核B中70分转化后的标准分数为(),说明70分在考核B中的相对排名比80分在考核A中的相对排名(1A . 0,2 ,高 B .
7、 80,60 ,低C . 20 , 5 ,高 D . 0,10,低网校答案:A2、标准分数的平均数为0,标准差为L标准分数也称为Z分数,是统计上常用的一种标准化方法,转变后的标准分数并没有 改变数值在原分布中的位置,也没有改变数据原分布的偏度。3、在实际应用中,当数据服从对称的钟形分布时,可以运用经验法则来判断与均值的 距离在特定倍数标准差之内的数据项所占比例。经验法则表明:(1)约有68%的数据与平均数的距离在1个标准差之内;(2 )约有95%的数据与平均数的距离在2个标准差之内;(3 )约有99%的数据与平均数的距离在3个标准差之内。因此,对手服从对称的钟形分布的标准分数,68%的标准分数
8、在-1 , +1范围内,约 有95%的标准分数在-2 , +2范围之内,约有99%的标准分数在-3 , +3范围之内。因此 根据经验法则,如果上面的考核B中的得分服从对称钟形分布,则95%的得分都在50分 和 70 分之间(60-2*5 , 60+2*5、【例题单选】根据经验法则服从对称钟形分布的标准分数在卜2 ,+2范围内的约有:XA . 50%B . 95%C . 68%D . 99%网校答案:B网校解析:对手服从对称的钟形分布的标准分数,68%的标准分数在-1 , +1范围内,约有95%的标准分数在-2 , +2范围之内,约有99%的标准分数在卜3 , +3范围之内。【例题:多选】某企业
9、客户满意度数据服从对称的钟形分布,均值为75,标准差为5。根据经验法则,关于该企业客户满意度的说法,正确的有(1A .约有68%的客户满意度在70 , 80范围内B .约有68%的客户满意度在75 , 85范围内C .约有95%的客户满意度在75 , 95范围内D .约有95%的客户满意度在65 , 85范围内E .约有99%的客户满意度在60 , 90范围内网校答案:ADE网校解析:本题考查标准分数的计算。在实际应用中,当数据服从对称的钟形分布时,经验法则表明:(1)约有68%的数据与平均数的距离在1个标准差之内;(2 )约有95%的数据与平均数的距离在2个标准差之内;(3 )约有99%的数
10、据与平均数的距离在3个标准差之内。约有68%的客户满意度在70 , 80范围内,计算方法是( 75-1*5,75 + 1*5 考点4变量间的相关分析一、变量间的相关关系客观现象的相关关系可以按不同的标准进行分类:按相关的程度分完全相关当一个变量的取值变化完全 由另一个变量的取值变化所 确定时称这两个变量间的关 系为完全相关。不相关当两个变量的取值变化彼此互不影响时,称为不相关。不完全相关当两个变量之间的关系介于完全相关和不相关之间称为不完全相关。垓相关的方向分正相关当一个变量的取值由小变大, 另一个变量的取值也相应由 小变大,这种相关称为正相 关。负相关当一个变量的取值由小变大, 而另一个变量
11、的取值相反地 由大变小这种相关称为负相 关。按相关的形式分线性相关当两个相关变量之间的关系大致呈现为线性关系时称之为线性相关。非线性相关如果两个相关变量之间并不 表现为直线的关系而是近似 十某种曲线方程的关系则这 种相关关系称为非线性相关。注意:相关关系并不等同于因果关系。【例题:多选】客观现象的相关关系按相关方向划分为(A .正相关B.线性相关C .负相关D .不相关E.非线性相关网校答案:AC9OO o A O 。嗓。 oO砂库。 o 7。工。 o O %9O O7 o薪:。为。C05X (a)(d)二、散点图两个变量间的关系 可以用散点图来展示。 在散点图中,每个点代 表一个观测值,横纵
12、坐 标值分别代表两个变量 相应的观测值。图241不同形态的散点图图a的点几乎无规律而言,表示这两个变量不相关。图b和图c中,观测点密集在一 条直线周围,表现为较强的线性相关,但相关的方向不同。图b中的两个变量为正相关关 系,图C的两个变量为负相关关系。图d中的观测点呈现出曲线模式,这表示两个变量为 非线性相关。【例题多选】根据变量X和变量Y的散点图,可以看出这两个变量间的相关关系为(12040608()100120XA.正相关B.不相关 C.负相关D.线性相关 E.完全相关网校答案:AD网校解析:2015年考了单选。当一个变量的取值变化完全由另一个变量的取值变化所确定时,称这两个变量间的关系为
13、完全相关。所以,选项E不合适。三、相关系数相关系数是度量两个变量之间相关关系的统计量。最常用的相关系数是Pearson相关系数,它度量的是两个变量之间的线性相关关系。【例题:单选】下列统计量中,适用于分析两个定量变量间相互关系的是(XA.离散系数考点1集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势的测度也就是寻找数据水平的代表值或中心值。一、均值1、定义和计算公式均值也叫平均数,就是数据组中所有数值的总和除以该组数值的个数。设一组数据为Xi , X2,,Xn ,平均数的计算公式为:nnn【例题:单选】在某城市2014年4月空气质量检测结果中
14、,随机抽取6天的质量指数进行分阮 样本数据分别是:30、40、50、60、80和100 ,这组数据的平均数是(A . 50B . 55C . 60D . 70网校答案:C网校解析:均值=(30+40+50+60+100) /6=602、均值的几个要点:(1)均值是集中趋势最主要的测度值,均值是一组数据的重心所在,解释了一组数据的平均水平。D.偏态系数网校答案:C网校解析:本题考查相关系数。相关系数是度量两个变量相关关系的统计量。1、假设分别可得到两个变量X和Y的n组观测值,即Xi, yi , i=1,2,n ,其中的两组观 测值之间是一一对应的,那么Pearson相关系数r的计算公式为:记忆公
15、式:“一/二(七一初乂一刃i=lIXu-x)2x(z-)2LxxLyy= Z(x-矶y-yLxx = X(X-X/=12、Pearson相关系数的取值范围在+1和-1之间,即-1WY1。若0 ” 1,表明变量X和丫之间存在正线性相关关系;若-lwr0,表明变量X和丫之间存在负线性相关关系;若r=l ,表明变量X和丫之间为完全正线性相关;若r=-L表明变量X和丫之间为完全负相关;可见当M=1时,变量丫的取值完全依赖于X ;当r=0时,说明丫和X之间不存在线性相关关系。并不说明变量之间没有任何关系。注意:Pearson相关系数只适用于线性相关关系的判断。因此r=0只表示两个变量之 间不存在线性相关
16、关系,并不说明变量之间没有任何关系。变量之间的非线性相关程度较大时,就可能会导致r=0o因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关 关系的结论,而应结合散点图做出合理的解释。【例题:单选】根据下面的变量X和变量Y的散点图,可以看出这两个变量的Pearson相关系数r的取值范围是(A. r-1B. 0r1D. -1 r0o -50-ior15G20I X6080100网校答案:D 网校解析:本题考查散点图与相关系数。若变量X和Y之间存在负线性相关关系,则相关 系数【例题:单选】变量和变量的Pearson相关系数r=l ,这说明变量和变量间的相关关系是( IA.完全负线性相关B.低
17、度线性相关C.完全正线性相关D.不存在线性相关网校答案:C【例题:单选】在相关分析中,如果两个变量间Pearson相关系数r=0 ,这表示( XA.两个变量间不存在线性相关关系B.两个变量间没有任何相关关系C.两个变量间存在中度相关关系D.两个变量间存在非线性相关关系网校答案:A【例题:单选】相关系数的取值范围为(1A . 0rlB.0rlC . -lrlD . -lr0.8时,可视为两个变量之间高度相关0.54卜|0.8时,可视为中度相关0.34r|0.5时,视为低度相关|r|0.3时,说明两个变量之间的相关程度极弱,可视为无线性相关关系【例题:单选】下列变量间,相关的密切程度最高的是(A
18、.某城市居民人均收入与私人汽车拥有量之间的相关系数为0.78B .某产品单位成本与利润之间的相关系数为-0.98C .某城市景点游客数量与票价的相关系数为-0.58D .某城市居民收入水平与食品支出之间的相关系数为0.94网校答案:B【例题:单选】根据2014年某城市金融业和制造业各1000人的年薪样本数据来比较这两个行业,从业人员年薪的离散程度,应采用的统计量是()。A.标准分数B.变异系数C.相关系数D.偏态系数网校答案:B【本章主要考点总结】1、均值、中位数和众数2、方差、标准差和离散系数3、偏态系数和标准分数4、变量间的相关关系的分类5、散点图6、相关系数的计算和取值范围(2)均值主要
19、适用于数值型数据,不适用于分类和顺序数据。(3)均值容易受到极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。【例题:单选】以下关于均值的说法错误的是(A.均值是集中趋势最主要的测度值B.它主要适用于数值型数据C.均值容易受到极端值的影响D.均值也适用于分类和顺序数据网校答案:D二、中位数一先排序,再找中间位置1、定义和计算公式把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数,用Me表示。中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。设一组数据为Xi , X2,Xn ,按从小到大的顺序为X( 1), X( 2
20、),X(n),则中位数 为:当n为奇数时Me=(y+1)(y+1)当n为偶数时【例题:单选】在某企业中随机抽取7名员工来了解该企业2013年上半年职工请假情况,这7名员工2013年上半年请假天数分别为:15310072这组数据的中位数是(A . 3B . 10C .4D . 0网校答案:A网校解析:考查中位数的计算。本题一定要先排序,由小到大排序后的数据是0,1,2, 3,5,7, 10,中位数直观观察即可知为3。【例题:单选】某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、36人、36人、37人、37人,其中位数为(A . 34B . 35C . 36C.37网校答
21、案:B网校解析:n为偶数,中位数=( 34+36 )/2=35o2、中位数的几个要点:中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。中 位数的优点是不受极端值的影响,抗干扰性强,尤其适于收入这类偏斜分布的数值型数据。三、众数1、定义众数是指一组数据中出现次数(频数)最多的变量值。【例题:单选】2010年某省8个地市的财政支出(单位:万元)分别为:59000 5000265602 66450 78000 78000 78000 132100这组数据的中位数和众数分别是()万元。A . 78000,78000B . 72225,78000C . 66450,132100
22、D . 75894,25132100网校答案:B网校解析:本题先选择众数,可以排除CDO再确定中位数,由于所给数据是8个,所以中位数的位置是第4个和第5个数据的平均数,(66450+78000 )/2=722252、众数的几个要点众数适用于描述分类数据和顺序数据的集中趋势,而在定量数据中,可能出现多众数或 无众数的情况,因此众数不适于描述定量数据的集中位置。四、均值、中位数和众数的比较及适用范围(1)均值适于定量变量。优点是能够充分利用数据的全部信息,均值大小受每个观测值的影响,匕戢稳定;缺点是易受极端值的影响,如果观测值中有明显的极端值,则均值的代表性较差。(2)中位数不适于分类变量,适于顺
23、序变量和定量变量,特别是分布不对称的数据。优点是不受极端值的影响;缺点是没有充分利用数据的全部信息,稳定性差于均值,优于众数。(3)众数不适用于定量变量,主要适用于分类和顺序变量。优点是不受极端值的影响,尤其是分布明显呈偏态时,众数的代表性更好。缺点是没有充分利用数据的全部信息,缺乏稳定性,而且可能不唯一。总结:均值、中位数和众数的比较及适用范围指标含义或计算适用范围是否受极端值影响均值集中趋势最主要的测度值。数值型数据受中位数先排序,再找中间位 置,位置居中的两个 数的平均数,或者是 一个数。顺序数据、数值型数据不受众数一组数据中出现次数 (频数)最多的变量 值。分类数据、顺序数据不受【例题
24、:多选】下列关于均值、中位数和众数的股交及适用范围的说法正确的有(A,均值适于定量变量B.众数不适用于定量变量,主要适用于分类和顺序变量C.中位数不适于分类变量,适于顺序变量和定量变量D.众数和中位数的优点是不受极端值的影响,尤其是分布明显呈偏态时,代表性更好E.众数、中位数和均值的缺点是没有充分利用数据的全部信息,缺乏稳定性网校答案:ABCD考点2离散程度的测度离散程度反映的是数据之间的差异程度。集中趋势的测度值是对数据水平的一个概括 性的度量,它对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大, 集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好。【例
25、题:单选】集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。数 据的离散程度越大,集中趋势的测度值对该组数据的代表性(A .越好B .越差C.始终不变D.在一定区间内反复变化网校答案:B方差是数据组中各数值与其均值离差平方的平均数,它能较好地反映出数据的离散程 度,是实际中应用最广泛的离散程度测度值。方差越小,说明数据值与均值的平均距离越小, 均值的代表性越好。对于总体数据,常用的方差计算公式有两种:n灭)2i=lN有放回的简单随机抽样不放回的简单随机抽样Nl对于样本数据,常用的方差计算公式为:E (XT)?s2 =-n-1样本方差s2的分母是样本规模n减1。在有放回的简单 随机
26、抽样中,样本方差s2是总体方差/的无偏估计量;而 在不放回的简单随机抽样中,样本方差S2是总体方差S2的 无偏估计量。二、标准差(即方差的平方根)对于样本数据,常用的标准差计算公式为:标准差不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位。标准差与方差计算I:匕较简便,又具有比较好的数学性质,是应用最广泛的统计离散程度 的测度方法。但是标准差与方差只适用于数值型数据。与均值一样,它们对极端值也很敏感。【例题:多选】下列指标中用于测度数据离散趋势的有(XA .均值B .中位数C .方差D .平均数E .标准差网校答案:CE【例题:单选】下列数据特征测度中,是用于反映偏斜分布数值型数据集中趋势的是(1A.离散系数B .方差C .标准差D .中位数网校答案:D