《统计学学习ppt课件-第三章-统计数据的整理.ppt》由会员分享,可在线阅读,更多相关《统计学学习ppt课件-第三章-统计数据的整理.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第三章第三章 统计数据的整理与显示统计数据的整理与显示主要内容主要内容设计整理方案设计整理方案原始资料审核原始资料审核统计分组统计分组统计汇总统计汇总审核审核制表、制图等制表、制图等积累与保管积累与保管统计分组统计分组次数分布次数分布统计表统计表基本步骤基本步骤一、统计分组一、统计分组分组前分组前分组前分组前分组后分组后分组后分组后252533334242(1)划分现象类型)划分现象类型1、作用、作用 例:按所有制性质划分,我国现有例:按所有制性质划分,我国现有8种经济类型:种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;
2、外商投资经济;港澳台投资经济股份制经济;外商投资经济;港澳台投资经济 对所研究的社会经济现象,按照对所研究的社会经济现象,按照对所研究的社会经济现象,按照对所研究的社会经济现象,按照一定的标志,将总体划分为若干性质一定的标志,将总体划分为若干性质一定的标志,将总体划分为若干性质一定的标志,将总体划分为若干性质不同的组成部分不同的组成部分不同的组成部分不同的组成部分(2)研究总体结构)研究总体结构例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年 1990年年 2000年年 2006年年 GDP100 100 100 100 第一产业第一产业 3.2 4.3
3、1.6 0.9 第二产业第二产业75.7 63.8 46.3 48.5 第三产业第三产业21.1 31.9 52.1 50.6(3)研究现象之间的依存关系)研究现象之间的依存关系例:中国城镇居民历年的恩格尔系数例:中国城镇居民历年的恩格尔系数 年份年份 1980 1990 2000 2005恩格尔系数(恩格尔系数(%)56.9 54.2 39.4 36.7 2、统计分组的目的、统计分组的目的将性质相同的分到同一组将性质相同的分到同一组将性质不同的从组中分开将性质不同的从组中分开组内差异小组内差异小组间差异大组间差异大总体:分总体:分总体单位总体单位:合合(1)分组标志的选择原则)分组标志的选择
4、原则a a 满足统计研究的目的满足统计研究的目的同一总体研究目的不同同一总体研究目的不同,其分组标志亦不同其分组标志亦不同b b 满足一定的时间、地点等具体情况满足一定的时间、地点等具体情况研究目的不变,但分组标志并不是永远固定不变的研究目的不变,但分组标志并不是永远固定不变的分组标志都是可变标志分组标志都是可变标志3、统计分组的方法、统计分组的方法关键:选择分组标志关键:选择分组标志分组三要素分组三要素:对象:总体对象:总体依据:分组标志依据:分组标志结果:组结果:组(1)种类种类品质标志品质标志数量标志数量标志组与组之间的界限明晰组与组之间的界限明晰量变到质变量变到质变二、次数分布(分布数
5、列)二、次数分布(分布数列)构成要素:构成要素:总体分组情况总体分组情况和和落在各组的单位数落在各组的单位数(也称次数或频数)(也称次数或频数)基本形式:基本形式:分组分组次数(频数)次数(频数)频率(频率(%)合计合计100.0频数分布频数分布频率分布频率分布分类分类品质数列品质数列变量数列变量数列单项数列单项数列组距数列组距数列等距数列等距数列异距数列异距数列例例例例例例例例例例例例A 单项数列单项数列适用于变动范围较小的离散型变量适用于变动范围较小的离散型变量组与组之间的界限明晰组与组之间的界限明晰B B 组距数列组距数列适用于变动范围较大的离散型变量和连续型变量适用于变动范围较大的离散
6、型变量和连续型变量1、变量数列、变量数列(1)种类)种类组距式分组所含要素组距式分组所含要素组数组数 k k的值取决于现象类型的值取决于现象类型 组距组距 i 反映了区间的距离反映了区间的距离 i=U-L 各区间距离相等为各区间距离相等为等距分组等距分组,反之为,反之为异距分组异距分组组限组限 即区间两端的数值即区间两端的数值下限下限L:区间起点的数值区间起点的数值上限上限U:区间终点的数值区间终点的数值根据研究变量性质不同,组限表示方法亦不同根据研究变量性质不同,组限表示方法亦不同 对于对于离散型变量离散型变量,可采用,可采用非同限法非同限法非同限法非同限法,此时,此时组与组之间界限明晰。组
7、与组之间界限明晰。对于对于连续型变量连续型变量,只能采用,只能采用同限法同限法同限法同限法,此时,此时组与组之间的界限不明晰。组与组之间的界限不明晰。所谓同限法,即将上一组的上限作为下一所谓同限法,即将上一组的上限作为下一组的下限,在具体统计汇总时,对于临界值的组的下限,在具体统计汇总时,对于临界值的归属,要遵循归属,要遵循上组限不在内上组限不在内上组限不在内上组限不在内原则。原则。组中值组中值 即组距中点的数值即组距中点的数值一般计算公式:一般计算公式:对于开口组:对于开口组:通常假设开口组组距等于邻组组距通常假设开口组组距等于邻组组距缺少下限缺少下限缺少下限缺少下限:组中值组中值组中值组中
8、值=该组上限该组上限该组上限该组上限-1/2-1/2邻组组距邻组组距邻组组距邻组组距缺少上限缺少上限缺少上限缺少上限:组中值组中值组中值组中值=该组下限该组下限该组下限该组下限+1/2+1/2邻组组距邻组组距邻组组距邻组组距成绩成绩组中值组中值学生数学生数60以下以下55360-7065570-8075880-90851090以上以上958合计合计-34若开口组组距按邻组组距计算超过了取值范围若开口组组距按邻组组距计算超过了取值范围若开口组组距按邻组组距计算超过了取值范围若开口组组距按邻组组距计算超过了取值范围,则按其最大值则按其最大值则按其最大值则按其最大值(最小值最小值最小值最小值)作为开
9、口组的假设上限作为开口组的假设上限作为开口组的假设上限作为开口组的假设上限(下下下下限限限限)计算组中值计算组中值计算组中值计算组中值重量重量(斤斤)组中值组中值个数个数(个个)2以下以下26610101414以上以上1481216合计合计-例例例例:一批西瓜按重量分组一批西瓜按重量分组一批西瓜按重量分组一批西瓜按重量分组应用组中值的假设条件应用组中值的假设条件:例例例例:某考试某考试某考试某考试80-9080-9080-9080-90分有四名学生分有四名学生分有四名学生分有四名学生,成绩分别是成绩分别是成绩分别是成绩分别是81,82,88,89,81,82,88,89,81,82,88,89
10、,81,82,88,89,要求计算该分数段的总分。要求计算该分数段的总分。要求计算该分数段的总分。要求计算该分数段的总分。变量值在该组呈均匀分布或对称分布变量值在该组呈均匀分布或对称分布根据组中值计算:根据组中值计算:根据原始数据计算根据原始数据计算:*按组中值计算的结果是按组中值计算的结果是近似值近似值(2)编制数列)编制数列l排序排序l决定数列的形式决定数列的形式 单项数列单项数列变异程度较小变异程度较小变异程度较大变异程度较大组距数列组距数列离散变量离散变量连续变量连续变量l决定组距和组数决定组距和组数 组距尽量保持整数组距尽量保持整数组距尽量保持整数组距尽量保持整数等距数列等距数列异距
11、数列异距数列标志值变动较均匀标志值变动较均匀标志值变动不均匀标志值变动不均匀开口组开口组闭口组闭口组两端标志值变动不均匀且对应单位数较少两端标志值变动不均匀且对应单位数较少两端标志值变动较均匀两端标志值变动较均匀2、次数分布的表示方法、次数分布的表示方法(1)列表法(表示法)列表法(表示法)用统计表来反映次数分布用统计表来反映次数分布向上累计次数向上累计次数:说明各组上限以下的累计单位数说明各组上限以下的累计单位数向下累计次数向下累计次数:说明各组下限以上的累计单位数说明各组下限以上的累计单位数 成成 绩绩(分分)组中组中值值(分分)学生学生数数(人人)频频率率(%)累计次数累计次数(人人)累
12、计频率累计频率(%)向上向上累计累计向下向下累计累计向上向上累计累计向下向下累计累计50-605525.060-7065717.570-80751127.580-90851230.090以上以上95820.0合计合计-40100.0-9 920203232404040403838313120208 85.05.022.522.550.050.080.080.0100.0100.0100.0100.095.095.077.577.550.050.020.020.02 22.图示法图示法直方图直方图等距数列等距数列等距数列等距数列:(变量,频数)(变量,频数)异距数列:异距数列:异距数列:异距数列
13、:(变量,频数密度变量,频数密度=频数频数/组距组距)折线图折线图曲线图曲线图等距数列等距数列等距数列等距数列:(组中值,频数):(组中值,频数)异距数列异距数列异距数列异距数列:(组中值,频数密度):(组中值,频数密度)用统计图来反映次数分布用统计图来反映次数分布在折线图的基础上演变而来,日常生活中在折线图的基础上演变而来,日常生活中在折线图的基础上演变而来,日常生活中在折线图的基础上演变而来,日常生活中主要根据曲线图来研究主要根据曲线图来研究主要根据曲线图来研究主要根据曲线图来研究圆饼图圆饼图 以扇形面积表示次数分布以扇形面积表示次数分布以扇形面积表示次数分布以扇形面积表示次数分布各组比率
14、各组比率各组比率各组比率 3603600 0为扇形的圆心角为扇形的圆心角为扇形的圆心角为扇形的圆心角次数分布的主要类型次数分布的主要类型(按曲线图形状划分)(按曲线图形状划分)1、钟型分布、钟型分布 (最为常见)(最为常见)中间多,两头少中间多,两头少 分为正态分布和偏态分布分为正态分布和偏态分布工人人数工人人数日产量日产量左偏分布左偏分布右偏分布右偏分布2、U型分布型分布 中间少,两头多中间少,两头多3、J型分布型分布 分正分正J型与反型与反J型型年龄年龄死亡率死亡率()投资额投资额利润率利润率人口数人口数年龄年龄三、统计表三、统计表构成构成构成构成总标题(编号)总标题(编号)横行标题:统横
15、行标题:统计研究的对象,计研究的对象,也称也称主词主词主词主词纵栏标题:说纵栏标题:说明主词的指标明主词的指标名,也称名,也称宾词宾词宾词宾词数字资料数字资料填表说明填表说明代代码码合合计计外外部部支支出出内部内部支出支出其中其中:1.经经常费常费支出支出2.科科研研基建基建支出支出其中其中:固固定资定资产购产购建建人员人员劳务劳务费费设备设备购置购置甲甲乙乙12345678总总 计计一、按隶属关一、按隶属关系分组系分组二、按地区分二、按地区分组组单位负责人:单位负责人:单位负责人:单位负责人:填表人:填表人:填表人:填表人:报出日期:报出日期:报出日期:报出日期:年年年年 月月月月 日日日日
16、说明:说明:说明:说明:1.1.本表由科学技术委员会、教育委员会、国防科学技术工业委员会和本局社科处报本表由科学技术委员会、教育委员会、国防科学技术工业委员会和本局社科处报本表由科学技术委员会、教育委员会、国防科学技术工业委员会和本局社科处报本表由科学技术委员会、教育委员会、国防科学技术工业委员会和本局社科处报送。送。送。送。2.2.统计范围是各级各部门统计范围是各级各部门统计范围是各级各部门统计范围是各级各部门(县及县以上县及县以上县及县以上县及县以上)所属国有独立核算的科学研究与技术开发机构;科所属国有独立核算的科学研究与技术开发机构;科所属国有独立核算的科学研究与技术开发机构;科所属国有
17、独立核算的科学研究与技术开发机构;科技信息与文献机构;全日制普通高校;国防科技工业系统的科学研究与技术开发机构及科技信技信息与文献机构;全日制普通高校;国防科技工业系统的科学研究与技术开发机构及科技信技信息与文献机构;全日制普通高校;国防科技工业系统的科学研究与技术开发机构及科技信技信息与文献机构;全日制普通高校;国防科技工业系统的科学研究与技术开发机构及科技信息与文献机构;大中型工业企业和建筑企业。小型工业企业、交通运输仓储及邮电通信企业、息与文献机构;大中型工业企业和建筑企业。小型工业企业、交通运输仓储及邮电通信企业、息与文献机构;大中型工业企业和建筑企业。小型工业企业、交通运输仓储及邮电
18、通信企业、息与文献机构;大中型工业企业和建筑企业。小型工业企业、交通运输仓储及邮电通信企业、农业及地质水利企事业单位、医疗卫生机构、综合技术服务机构等企事业单位可用最近的调查农业及地质水利企事业单位、医疗卫生机构、综合技术服务机构等企事业单位可用最近的调查农业及地质水利企事业单位、医疗卫生机构、综合技术服务机构等企事业单位可用最近的调查农业及地质水利企事业单位、医疗卫生机构、综合技术服务机构等企事业单位可用最近的调查数据替代。数据替代。数据替代。数据替代。3.3.报送时间为报送时间为报送时间为报送时间为20062006年年年年4 4月月月月3030日前。报送方式为报盘。日前。报送方式为报盘。日
19、前。报送方式为报盘。日前。报送方式为报盘。科技活动经费支出情况科技活动经费支出情况科技活动经费支出情况科技活动经费支出情况 表表表表 号:号:号:号:L L 表表表表制表机关:国制表机关:国制表机关:国制表机关:国 家家家家 统统统统 计计计计 局局局局文文文文 号:国统字号:国统字号:国统字号:国统字(2005)85(2005)85号号号号综合机关名称:综合机关名称:综合机关名称:综合机关名称:年年年年 计量单位:万计量单位:万计量单位:万计量单位:万 元元元元编制规则编制规则l长宽比例适当长宽比例适当l标题简练准确标题简练准确l主词、宾词相互对应,合理安排顺序主词、宾词相互对应,合理安排顺
20、序l书写工整、字迹清晰、数字对齐书写工整、字迹清晰、数字对齐l数字部分不应留下空白数字部分不应留下空白l计量单位书写规范计量单位书写规范某厂职工人数统计表某厂职工人数统计表按性别分组按性别分组男男 职职 工工女女 职职 工工合合 计计人数(人)人数(人)(频数)(频数)比率()比率()(频率)(频率)25311536868.7531.25100.00返回返回某厂职工家庭人口分组统计某厂职工家庭人口分组统计按家庭人口按家庭人口分组分组1合合 计计职工户数职工户数(频数)(频数)比率()比率()(频率)(频率)7返回返回23456381055431202.915.241.320.512.18.0255100.0