社会统计学卢淑华x.pptx

上传人:一*** 文档编号:82660772 上传时间:2023-03-26 格式:PPTX 页数:77 大小:910.29KB
返回 下载 相关 举报
社会统计学卢淑华x.pptx_第1页
第1页 / 共77页
社会统计学卢淑华x.pptx_第2页
第2页 / 共77页
点击查看更多>>
资源描述

《社会统计学卢淑华x.pptx》由会员分享,可在线阅读,更多相关《社会统计学卢淑华x.pptx(77页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、会计学1社会统计学卢淑华社会统计学卢淑华x第一页,编辑于星期二:五点 三十五分。一、分布一、分布(distribution)n n变量各种可能取值及其出现的次数或频次,又称频次分布。变量各种可能取值及其出现的次数或频次,又称频次分布。频数、频次、次数(频数、频次、次数(frequencyfrequency)第1页/共77页第二页,编辑于星期二:五点 三十五分。二、统计表二、统计表表2.5 家庭结构的频次分布家庭结构频次百分比(%)核心家庭105049.30 直系家庭72033.80 联合家庭1105.16 其他25011.74 总数2130100.00 第2页/共77页第三页,编辑于星期二:五

2、点 三十五分。多选项二分法多选项二分法abcde样本1 样本2样本3 样本4 样本5 第3页/共77页第四页,编辑于星期二:五点 三十五分。多选项二分法多选项二分法abcde样本111101样本200111样本310011样本411001样本511001合计 43225第4页/共77页第五页,编辑于星期二:五点 三十五分。多选项分类法多选项分类法n nP26 例2n nP27 例3第5页/共77页第六页,编辑于星期二:五点 三十五分。3、加权平均法、加权平均法P28 例4第6页/共77页第七页,编辑于星期二:五点 三十五分。(二)定序变量(二)定序变量 表2-7 单位对武打片的反映统计喜爱程度

3、频次百分比(%)很反感37.69 不爱看1025.64 一般1025.64 爱看923.08 非常爱看717.95 总数39100.00 第7页/共77页第八页,编辑于星期二:五点 三十五分。(三三)定距变量定距变量统计分组的步骤(等距、重合、组距式分组)第一:确定组数。经验公式 k=1+lgn/lg2k=1+lg100/lg2=7.64第二:确定组距。组距=(最大值-最小值)/组数 =(1.56-1.27)/10=0.029原则:以5或10的倍数作为组距。本例选择:0.03第三:确定组限。要求:第一组下限要小于所有数据的最小值,最后一组上限要大于所有数据的最大值原则:以5或10的倍数作为组限

4、。第8页/共77页第九页,编辑于星期二:五点 三十五分。(三三)定距变量定距变量统计分组的步骤(等距、重合、组距式分组)第四:计数。以0.03作为组距的分组情况。1.265-1.295;1.295-1.325,1.255-1.285;1.285-1.315,1.245-1.275;1.275-1.305,第9页/共77页第十页,编辑于星期二:五点 三十五分。(三三)定距变量定距变量身高组中值人数频率向上累计向下累计人数频率人数频率1.2651.2951.2811111001001.2951.3251.31445599991.3251.3551.3477121295951.3551.3851.3

5、72222343488881.3851.4151.402424585866661.4151.4451.432424828242421.4451.4751.461010929218181.4751.5051.49669898881.5051.5351.52119999221.5351.5651.551110010011合计100100表2.11 100名儿童身高统计分组表第10页/共77页第十一页,编辑于星期二:五点 三十五分。向上累计:由低到高,上限以下向下累计:由高到低,下限以上思考:360体您本次开机共用时1分10秒,击败了全国12%的电脑第11页/共77页第十二页,编辑于星期二:五点 三

6、十五分。关于统计分组的个人认识关于统计分组的个人认识原则:统计分组没有对错,只有好坏。开口组实际中应用更广。极端值,extreme value判断依据:发生概率非常小,后果很严重911事件2004印度洋海啸飞机失事、英法核潜艇相撞、美、俄卫星相撞,股灾,亚洲金融危机第12页/共77页第十三页,编辑于星期二:五点 三十五分。图2.1 家庭结构分布图饼图(Pie)第13页/共77页第十四页,编辑于星期二:五点 三十五分。条形图 bar 按年龄和分人口数(2012年,0.83%人口抽样调查)第14页/共77页第十五页,编辑于星期二:五点 三十五分。100100名儿童身高向上累计直方图名儿童身高向上累

7、计直方图名儿童身高向上累计直方图名儿童身高向上累计直方图第15页/共77页第十六页,编辑于星期二:五点 三十五分。100100名儿童身高向下累计直方图名儿童身高向下累计直方图第16页/共77页第十七页,编辑于星期二:五点 三十五分。父亲身高(父亲身高(800800名)名)第17页/共77页第十八页,编辑于星期二:五点 三十五分。母亲身高(800名)第18页/共77页第十九页,编辑于星期二:五点 三十五分。父亲体重(800名)第19页/共77页第二十页,编辑于星期二:五点 三十五分。母亲体重(800名)第20页/共77页第二十一页,编辑于星期二:五点 三十五分。分年龄别的死亡率第21页/共77页

8、第二十二页,编辑于星期二:五点 三十五分。三次产业构成比第22页/共77页第二十三页,编辑于星期二:五点 三十五分。第23页/共77页第二十四页,编辑于星期二:五点 三十五分。数据描述的数值方法数据描述的数值方法数据描述的数值方法分布的形状集中趋势离散程度众 数中位数均 值离散系数方差和标准差峰 度四分位距极差偏 态第2节第3节第24页/共77页第二十五页,编辑于星期二:五点 三十五分。一、众数(Mode)概念:出现次数最多的标志值计算(一)定类数据 表2.5 P24 第二节:集中趋势的测量第25页/共77页第二十六页,编辑于星期二:五点 三十五分。表2.5 家庭结构的频次分布家庭结构频次百分

9、比(%)核心家庭105049.30 直系家庭72033.80 联合家庭1105.16 其他25011.74 总数2130100.00 Mo=“核心家庭核心家庭”第26页/共77页第二十七页,编辑于星期二:五点 三十五分。(二)定序(二)定序 表表2.7 P29 表2-7 单位对武打片的反映统计喜爱程度频次百分比很反感37.69 不爱看1025.64 一般1025.64 爱看923.08 非常爱看717.95 总数39100.00 Mo=“不爱看”Mo=“一般”第27页/共77页第二十八页,编辑于星期二:五点 三十五分。(三)定距(三)定距1.未分组资料 表2.102.单项式 表2.143.组距

10、式 表2.11Mo=1.38,1.39,1.40,1.41,1.42,1.43,1.44Mo=1,2Mo=1.40,1.43第28页/共77页第二十九页,编辑于星期二:五点 三十五分。二、中位数二、中位数Median(一)定序 表2.7 找中位数组:向上累计次数首次超过N/2的组即为中位数组;该组的标志值即为中位数值Me=“一般”第29页/共77页第三十页,编辑于星期二:五点 三十五分。(二)定距(二)定距1.未分组资料 表2.10方法:中位数位置=(N+1)/2第30页/共77页第三十一页,编辑于星期二:五点 三十五分。概念解释:次序统计量概念解释:次序统计量 (order statisti

11、csorder statistics)x1x2x3x4x59.229.659.209.259.309.209.229.259.309.65第31页/共77页第三十二页,编辑于星期二:五点 三十五分。表表2.10第32页/共77页第三十三页,编辑于星期二:五点 三十五分。2.分组资料分组资料(1)单项式分组 表2.18向上累计次数首次超过N/2的组即为中位数组;该组的标志值即为中位数Me=“乙”第33页/共77页第三十四页,编辑于星期二:五点 三十五分。(三)组距式分组(三)组距式分组n n首先确定中位数组;首先确定中位数组;使用公式使用公式n n下限公式:下限公式:n n上限公式:上限公式:第

12、34页/共77页第三十五页,编辑于星期二:五点 三十五分。公式中各字母含义公式中各字母含义n nU:中位数组的上限;n nL:中位数组的下限;n nfm:中位数组的频数;n nSm-1:向上累计时中位数组前一组的累计频数,即中位数前一组所对应的向上累计频数;n nSm+1:向下累计时中位数组后一组的累计频数 即中位数后一组所对应的向下累计频数;n ni:中位数组的组距。第35页/共77页第三十六页,编辑于星期二:五点 三十五分。f2x向上累计Sm-1SmLUMeAb中位数组前一组中位数组BCaED下限公式Me=L+a上限公式Me=U-b下限公式推导第36页/共77页第三十七页,编辑于星期二:五

13、点 三十五分。身高组中值人数频率向上累计人数频率1.2651.2951.2811111.2951.3251.3144551.3251.3551.347712121.3551.3851.37222234341.3851.4151.40242458581.4151.4451.43242482821.4451.4751.46101092921.4751.5051.496698981.5051.5351.521199991.5351.5651.5511100100合计100100表2.11 100名儿童身高统计分组表f中位数组次数中位数组上限首次大于50%首次大于50中位数组前一组所对应向上累计次数中

14、位数组中位数组下限第37页/共77页第三十八页,编辑于星期二:五点 三十五分。L=1.385U=1.415fm=24Sm-1=34i=0.03第38页/共77页第三十九页,编辑于星期二:五点 三十五分。西藏辽宁天津上海图1 我国分地区人口年龄中位数(2000年)北京河南第39页/共77页第四十页,编辑于星期二:五点 三十五分。三、四分位数三、四分位数(quartile)概念:数据排序后处在25%,50%和75%位置上的数。25%25%25%25%Q1Q2Q3Q2=Me第40页/共77页第四十一页,编辑于星期二:五点 三十五分。(一)定序 表2.7 找Q1、Q2、Q3所在组 Q1所在组:向上累计

15、次数首次超过f/4的组;Q2所在组:向上累计次数首次超过f/2的组;Q3所在组:向上累计次数首次超过3f/4的组;Q1=Q1所在组标志值;Q2=Q2所在组标志值;Q 3=Q3所在组标志值;第41页/共77页第四十二页,编辑于星期二:五点 三十五分。喜爱程度频次百分比向上累计很反感37.69 3不爱看1025.64 13一般1025.64 23爱看923.08 32非常爱看717.95 39总数39100.00 19.59.75Q1所在组Q1=“Q1=“不爱看不爱看不爱看不爱看”Q2所在组Q2=“一般一般”29.25Q3所在组Q3=“爱看看”第42页/共77页第四十三页,编辑于星期二:五点 三十

16、五分。(二)定距数据(二)定距数据1、未分组资料(spss版本)Q1位置=(n+1)/4;Q2位置=(n+1)/2;Q3位置=3(n+1)/4表2.10Q1位置=(n+1)/4=25.25;Q2位置=(n+1)/2=50.5;Q3位置=3(n+1)/4=75.75Q1=x(25)+0.25 x(26)-x(25)=1.37+0.25 1.37-1.37=1.37Q2=x(50)+0.5 x(51)-x(50)=1.4+0.5 1.41-1.4=1.405Q3=x(75)+0.75 x(76)-x(75)=1.44+0.75 1.44-1.44=1.44第43页/共77页第四十四页,编辑于星期二

17、:五点 三十五分。(二)定距数据(二)定距数据1、未分组资料(excel版本)Q1位置=(n+3)/4;Q2位置=(n+1)/2;Q3位置=(3n+1)/4表2.10Q1位置=(n+3)/4=25.75;Q2位置=(n+1)/2=50.5;Q3位置=(3n+1)/4=75.25Q1=x(25)+0.75 x(26)-x(25)=1.37+0.75 1.37-1.37=1.37Q2=x(50)+0.5 x(51)-x(50)=1.4+0.5 1.41-1.4=1.405Q3=x(75)+0.25 x(76)-x(75)=1.44+0.25 1.44-1.44=1.44第44页/共77页第四十五页

18、,编辑于星期二:五点 三十五分。Excel 操作操作:quartile第45页/共77页第四十六页,编辑于星期二:五点 三十五分。2.2.分组资料分组资料(1 1)单项式分组)单项式分组 找找QQ1 1、QQ2 2、QQ3 3所在组所在组 Q Q1 1所在组:向上累计次数首次超过所在组:向上累计次数首次超过 f f/4/4的组;的组;QQ2 2所在组:向上累计次数首次超过所在组:向上累计次数首次超过 f f/2/2的组;的组;Q Q3 3所在组:向上累计次数首次超过所在组:向上累计次数首次超过33f f/4/4的组;的组;Q1=Q1所在组标志值;Q2=Q2所在组标志值;Q 3=Q3所在组标志值

19、;第46页/共77页第四十七页,编辑于星期二:五点 三十五分。(2)组距式分组)组距式分组使用公式 找Q1、Q2、Q3所在组 Q1所在组:向上累计次数首次超过f/4的组;Q2所在组:向上累计次数首次超过f/2的组;Q3所在组:向上累计次数首次超过3f/4的组;第47页/共77页第四十八页,编辑于星期二:五点 三十五分。第48页/共77页第四十九页,编辑于星期二:五点 三十五分。第49页/共77页第五十页,编辑于星期二:五点 三十五分。身高组中值人数频率向上累计人数频率1.2651.2951.2811111.2951.3251.3144551.3251.3551.347712121.3551.3

20、851.37222234341.3851.4151.40242458581.4151.4451.43242482821.4451.4751.46101092921.4751.5051.496698981.5051.5351.521199991.5351.5651.5511100100合计100100表2.11 100名儿童身高统计分组表f首次大于50首次大于25Q3所在组首次大于75Q1所在组Q2所在组L1=1.355U1=1.385第50页/共77页第五十一页,编辑于星期二:五点 三十五分。身高人数向上累计人数频率1.2651.2951111.2951.3254551.3251.355712

21、121.3551.3852234341.3851.4152458581.4151.4452482821.4451.4751092921.4751.505698981.5051.535199991.5351.5651100100合计100表2.11 100名儿童身高统计分组表L1=1.355U1=1.385Sm1-1=12f1=22L2=1.385U2=1.415Sm2-1=34f2=24L3=1.415U3=1.445Sm3-1=58f3=24第51页/共77页第五十二页,编辑于星期二:五点 三十五分。第52页/共77页第五十三页,编辑于星期二:五点 三十五分。三、均值三、均值(一)未分组资料

22、(简单算术平均数)(二)分组资料(加权算术平均数)第53页/共77页第五十四页,编辑于星期二:五点 三十五分。三、均值三、均值(一)未分组资料(简单算术平均数)(二)分组资料(加权算术平均数)第54页/共77页第五十五页,编辑于星期二:五点 三十五分。例例 2.10Excel 内置函数 =average()第55页/共77页第五十六页,编辑于星期二:五点 三十五分。例例 2.11Excel 内置函数 sumproduct(),sum()第56页/共77页第五十七页,编辑于星期二:五点 三十五分。众数、中位数和算术平均数的关系众数、中位数和算术平均数的关系对称分布 均值=中位数=众数分配为钟形、

23、轻微不对称的经验公式:左偏分布均值 中位数 众数右偏分布众数 中位数均值第57页/共77页第五十八页,编辑于星期二:五点 三十五分。第三节:离散趋势测量法第三节:离散趋势测量法n n数据集中趋势的测度指标确实能反映某种事物的一般水平,在比较不同空间和时间上数据集中趋势的测度指标确实能反映某种事物的一般水平,在比较不同空间和时间上的情况是能消除规模大小的影响,是衡量其差距的重要指标。但只依据平均指标来评的情况是能消除规模大小的影响,是衡量其差距的重要指标。但只依据平均指标来评价事物的优劣远远不够。因为总体内部各单位标志值具有差异,有高低、大小、多少价事物的优劣远远不够。因为总体内部各单位标志值具

24、有差异,有高低、大小、多少之别。就总体而言,平均数背后隐藏最大值与最小值之间的差距,有的差距不大,有之别。就总体而言,平均数背后隐藏最大值与最小值之间的差距,有的差距不大,有的则非常悬殊。总体内部各单位标志值差距悬殊的平均数就掩盖着尖锐的矛盾,让人的则非常悬殊。总体内部各单位标志值差距悬殊的平均数就掩盖着尖锐的矛盾,让人们感到不真实。所以,在反映具体问题时,除了从集中趋势角度分析外,还应把总体们感到不真实。所以,在反映具体问题时,除了从集中趋势角度分析外,还应把总体内部各单位标志值中最大值、最小值及其差距摆出来,要列出平均差异大小和差异的内部各单位标志值中最大值、最小值及其差距摆出来,要列出平

25、均差异大小和差异的相对程度,即要对待研究现象进行离散程度的测度。相对程度,即要对待研究现象进行离散程度的测度。第58页/共77页第五十九页,编辑于星期二:五点 三十五分。一、异众比率一、异众比率第59页/共77页第六十页,编辑于星期二:五点 三十五分。表2.5 家庭结构的频次分布家庭结构频次百分比(%)核心家庭105049.30 直系家庭72033.80 联合家庭1105.16 其他25011.74 总数2130100.00 异众比率异众比率=1-1050/2130=50.70%一、异众比率(定类数据)第60页/共77页第六十一页,编辑于星期二:五点 三十五分。2.全距(全距(Range)n

26、n全距也称极差,是一组数据的最大值与最小值之差。n nR=最大值-最小值n n组距分组数据可根据最高组上限-最低组下限计算。n n受极端值的影响。第61页/共77页第六十二页,编辑于星期二:五点 三十五分。1.未分组资料未分组资料 表表2.10R=1.56-1.27=0.29Excel操作最大值=max(),=large(data,1)最大值=min(),=large(data,1)第62页/共77页第六十三页,编辑于星期二:五点 三十五分。2.分组资料分组资料 表表2.11R=1.565-1.265=0.3第63页/共77页第六十四页,编辑于星期二:五点 三十五分。n n等于上四分位数与下四

27、分位数之差n n反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。n n不受极端值的影响。n n可以用于衡量中位数的代表性。2 2 四分位距四分位距四分位距四分位距(Inter-Quartile Range,IQR)(Inter-Quartile Range,IQR)2,2,3,4,4,4,5,5,6,6,7Q1=3,Q2=6,Q3=6第64页/共77页第六十五页,编辑于星期二:五点 三十五分。n n方差方差是一组数据中各数值与其算术平均数是一组数据中各数值与其算术平均数离差平方的平均数,离差平方的平均数,标准差标准差是方差正的平是方差正的平方根。方根。n n总体方差和样本方差的符

28、号不同,计算公式也不一样。总体方差和样本方差的符号不同,计算公式也不一样。n n是反映定量数据离散程度的最常用的指标。是反映定量数据离散程度的最常用的指标。3 方差和标准差方差和标准差第65页/共77页第六十六页,编辑于星期二:五点 三十五分。方差的计算公式方差的计算公式总体方差 样本方差 未分组数据分组数据 样本方差用(n-1)去除,从数学角度看是因为它是总体方差2的无偏估计量。第66页/共77页第六十七页,编辑于星期二:五点 三十五分。P56.表2-26(一)未分组资料(一)未分组资料Excel操作总体方差=varp(data)总体标准差=stdevp(data)样本方差=var(data

29、)样本标准差=stdev(data)(二)分组资料表2.11第67页/共77页第六十八页,编辑于星期二:五点 三十五分。4 4 离散系数(离散系数(离散系数(离散系数(Coefficient of Variation)Coefficient of Variation)n n标准差与其相应的均值之比,表示为百分数。n n特点:特点:n n反映了相对于均值的反映了相对于均值的相对离散程度相对离散程度;n n可用于比较计量单位不同的数据的离散程度;可用于比较计量单位不同的数据的离散程度;n n计量单位相同时,如果两组数据的均值相差悬殊,离计量单位相同时,如果两组数据的均值相差悬殊,离散系数可能比标准

30、差等绝对指标更有意义。散系数可能比标准差等绝对指标更有意义。第68页/共77页第六十九页,编辑于星期二:五点 三十五分。离散系数:例子离散系数:例子对30名经理人员的调查表明年平均收入=$500,000,标准差=$50,000。对30名工人的调查表明平均收入=$32,000,标准差=$5,000。离散系数:经理人员:工人:虽然经理人员收入的绝对离散程度远远大于工人,但经理人员收入的相对离散程度小于工人。第69页/共77页第七十页,编辑于星期二:五点 三十五分。1 1 偏态及其测定(偏态及其测定(偏态及其测定(偏态及其测定(Skewness)n n 数据分布的不对称性称作偏态。n n偏态系数就是

31、对数据分布的不对称性(即偏斜程度)的测度。n n偏态系数有多种计算方法,在统计软件中(如Excel等)通常采用以下公式:Excel操作:=skew(data)第70页/共77页第七十一页,编辑于星期二:五点 三十五分。偏态系数的含义偏态系数的含义左偏分布(也称负偏分布):偏态系数 SK 0;偏态系数的绝对值越大,偏斜越严重。数据向右边延伸得更多对称分布:偏态系数=0。第71页/共77页第七十二页,编辑于星期二:五点 三十五分。2 峰度及峰度系数峰度及峰度系数(Kurtosis)n n峰度:数据分布的扁平或尖峰程度。n n峰度系数:数据分布峰度的度量值,对数据分布尖峰或扁平程度的测度,一般用K表

32、示。n n统计软件(如Excel等)中常用以下公式计算:Excel操作:=kurt(data)第72页/共77页第七十三页,编辑于星期二:五点 三十五分。峰度系数的含义峰度系数的含义扁平分布尖峰分布峰度系数K0,与正态分布相比该分布一般为尖峰、肥尾,肩部较瘦。均值和方差相同的正态分布第73页/共77页第七十四页,编辑于星期二:五点 三十五分。Excel Excel 描述描述描述描述统计分析结统计分析结统计分析结统计分析结果果果果第74页/共77页第七十五页,编辑于星期二:五点 三十五分。SPSS描述统计结果描述统计结果全距最小值最大值求和均值统计量标准误差第75页/共77页第七十六页,编辑于星期二:五点 三十五分。SPSS描述统计结果描述统计结果(样本)标准差(样本)方差偏度系数峰度系数第76页/共77页第七十七页,编辑于星期二:五点 三十五分。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁