《课件第2章 统计基础.pptx》由会员分享,可在线阅读,更多相关《课件第2章 统计基础.pptx(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2.1统计学基本概念2.2数据收集处理与数据描述2.3数据描述性统计分析 第第2 2章章 统计基础统计基础2.1 统计学基本概念统计学基本概念 统计学是研究不确定性现象数量规律性的方法论科学,也是对客观现象进行定量分析的 重要工具。统计学可以分为理论统计学和应用统计学两类,前者侧重于统计方法的数学理论,后者侧重于统计方法在各个领域的应用。2.1.1 统计学及统计工作过程2.1.2 总体和样本2.1.3 标志与变量2.1.4 统计指标和指标体系2.112.11统计学及统计工作过程统计学及统计工作过程1.统计学含统计学含义义 统计学是一门收集、整理、描述、显示和分析统计数据的科学,是一套由数据到结
2、论的科学理论、方法和技术统计有其自己的特点,主要表现在以下几个方面。1)数量性2)总体性3)差异性2 2统计工作过统计工作过程程 统计工作是对社会调查研究以认识其本质和规律性的一种工作,这种调查研究是我们对客观事物的一种认识1)统计调查 统计调查是根据一定的目的,通过科学调查方法,收集社会经济现象实际资料的活动,主要有统计调查方案的设计及数据收集等2)统计整理获得原始数据资源从原始数据资源创建数据库编辑数据库修正和调整原始数据资源数据库的最终确定从数据库创建数据文件3)统计分析统计分析所运用的方法包括两大类:描述统计和推断统计。4) 结果显示统计分析结果的报告形式包括口头和书面两种2.12 2
3、.12 总体和样本总体和样本1.总体与总体单总体与总体单位位 什么是总体,简而言之,总体就是统计所研究 对象的全体,即由具有某一共同属性的许多个别事物所组成的集合,也可以说是样本收集人员感兴趣的所有观测信息的集合; 构成总体的每一个别事物称为总体单位,也叫个体。 总体中总体单位的数量称为总体容量。最常见的总体是由自然物体所组成的总体。2样样本本 样本来自总体,总体是抽取样本的依据。从理论上看,样本可以大到与总体容量相同,也可以小到只包含一个总体单位2.13 2.13 标志与变量标志与变量1.标标志志 总体中各单位普遍具有的属性或特征称为标志,每个总体单位从不同方面考察都具有许多属性和特征标志分
4、为品质标志和数量标志;品质标志表明个体属性方面的特征,品质标志的表现只能用文字、语言来描述数量标志表明个体数量方面的特征,可以用数值来表现2 2变变量量 在统计中,狭义的变量是指说明现象某一数量特征的概念,即可变的数量标志称为变量。但是从广义上看,变量不仅指可变的数 量标志,也包括可变的品质标志。通常将可以取不同数量值的变量称为数量变量或定量变量(Quantitative Variable),将取非数量值的变量称为属性变量或定性变量或分类变量(QualitativeVariable,Categorical Variable),前者是可变的数量标志的抽象化,后者是可变的品质标志的抽象化。3 3计
5、量尺计量尺度度不同的标志使用不同的计量尺度,采用不同的计量尺度可以得到不同类型的统计数据。1)定类尺度2)定序尺度3)定距尺度4)定比尺度2.14 2.14 统计指标和指标体系统计指标和指标体系1.统计指统计指标标 统计指标简称指标,是反映统计总体数量特征的概念和数值。 统计指标按其所反映总体的内容和数量性质不同,分为数量指标和质量指标。 统计指标按其计量单位不同,可分为实物指标和价值指标。 统计指标按其反映现象的时间状态不同,可分为静态指标和动态指标。 统计指标按其计算的范围不同,可分为总体指标和样本指标2 2指标体指标体系系 统计指标体系是由一系列相互联系的统计指标所组成的有机整体,用以反
6、映所研究现象总体各方面相互依存、相互制约的关系。 例如,为了反映工业企业生产经营的全貌,需要设立产量、产值、品种、质量、职工人数、 工资、劳动生产率、原材料、设备、能源消耗、财务成本等多项指标,组成工业企业统计指标体系。2.2 数据收集处理与数据描述数据收集处理与数据描述 掌握统计数据是进行分析的前提,没有统计数据,统计方法就失去了用武之地。因此,如何取得准确可靠的统计数据是统计研究的重要内容。2.2.1 数据来源2.2.2 数据质量2.2.3 数据预处理2.2.4 数据分组2.2.5 频数分布2.2.6 数据显示2.212.21数据来源数据来源 从调查主体角度看,数据主要来源于两种渠道:一种
7、是通过直接的统计调查或传感器获 得的原始数据,一般称之为第一手或直接的统计数据,该数据是尚未经过整理的数据;另一 种是通过他人获得的数据,这些数据一般都是进行加工汇总后公布的数据,通常称之为第二 手或间接的统计数据。2.222.22数据质量数据质量1.数据的误差种数据的误差种类类1)登记性误差2)代表性误差(1)随机性误差。(2)系统性误差。2 2数据的质量标数据的质量标准准1)数据的时效性3)数据的准确性3)数据的适用性4)数据的一致性2.232.23数据预处理数据预处理1.数据审数据审核核 1) 准确性审核 1.逻辑性审查2.比较审查3.设置疑问框审查2) 适用性审查 数据的适用性审查主要
8、是根据数据的用途,检查数据解释说明问题的程度。具体审查数据与调查主题、目标总体的界定、调查项目的解释等是否匹配。3) 及时性审查 数据的及时性审查主要检查数据是否按规定时间报送,如未按规定时间报送,就需要检查未按时报送的原因。4) 一致性审查 数据的一致性审查主要检查数据在不同地区或国家、在不同的时间段是否具有可比性及时性审查2 2数据排数据排序序 数据排序是按一定规则,如大小、高低、优劣等次序将数据排列,以便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。2.2.42.2.4数据分组数据分组1.数据分组的意数据分组的意义义 所谓分组,就是按照分组标志将研究的问题分成若干个组
9、成部分 在社会经济统计研究中,数据分组具有划分现象的类型、研究总体的结构和现象之间的依存关系的作用。2.数据分组标数据分组标志志1)按品质标志分组 按品质标志分组就是按事物的品质特征进行分组。2)按数量标志分组 按数量标志分组就是按事物的数量特征进行分组3 3数据分组体系数据分组体系1)平行分组体系:将同一总体的几个简单分组按某一规则排列起来就构成一个平行分组体系2)复合分组体系:将数据同时按两个或两个以上的标志层叠起来分组,称为复合分组。由复合分组形成的分组系列就构成复合分组体系2.2.5 2.2.5 频数分布频数分布1属性分布数属性分布数列列1)定类尺度的分布数列定类尺度的分布数列其分组标
10、志 各分组名称是反映类别的定类数据。2)定序尺度的分布数列定序尺度的分布数列其分组标志是定序数据。该频数分布的构造方法与定类尺度相同。2 2变量分布数列变量分布数列1) 变量分布数列的种类 1.单项式变量数列 2.组距式变量数列两种。2) 组距式变量数列的编制 组距式数列编制的具体步骤如下:确定组数;确定组距;确定组限(各组间的界限);计算组中值;频数计量及分布。2.262.26数据显示数据显示1.统计统计表表 统计表一般由 4 个主要部分构成,即表头、行标题、列标题和数值资料。此外,必要时可以在统计表的下方加入表外附加2.统计统计图图1) 非数值型数据的统计图 作为定类尺度与定序尺度这两类非
11、数值型数据通常使用的统计图有条形图和饼图。2) 数值型数据的统计图 前面介绍的非数值型数据的图示方法同样适宜数值型数据,除条形图、饼图以外,数值型数据较常采用的还有直方图、折线图、曲线图和茎叶图2.3 数据描述性统计分析数据描述性统计分析2.3.1 数据对比分析2.3.2 集中趋势测量2.3.3 离散趋势测量2.312.31数据对比分析数据对比分析 数据对比分析是利用相对数反映研究问题数量特征及数量关系的一种统计方法。相对数 是指两个有联系的数据的比值1.计划完成相对数2.结构相对数3.比例相对数4.比较相对数5.动态相对数6.强度相对数2.3.2集中趋势测量集中趋势测量1 1非数值型数据集中
12、趋势测量非数值型数据集中趋势测量 定类尺度测量 定序尺度测量2 2数值型数据集中趋势测量数值型数据集中趋势测量 1.平均数法(1) 简单平均数(2) 加权平均数(3) 加权平均数变形 2.几何平均数法(1) 简单几何平均数(2) 加权几何平均数 3.众数法(1) 单项变量数列(2) 组距变量数列 4.中位数法(1) 由未分组资料确定中位数(2) 由分组资料确定中位数 2.332.33离散趋势测量离散趋势测量 离散趋势有多种测量方法,可根据数据类型及集中趋势测度值的不同来决定使用哪种方法。1.非数值型数据离散趋势测量非数值型数据离散趋势测量1) 定类尺度离散趋势测量 计 算 异 众 比 率2) 定序尺度离散趋势测量 计算四分位差和计算异众比率2 2数值型数据离散趋势测数值型数据离散趋势测量量1)全距2)平均差3) 方差与标准差4) 离散系数