社会调查教程第13章.pptx

上传人:知****量 文档编号:76416636 上传时间:2023-03-10 格式:PPTX 页数:43 大小:3.47MB
返回 下载 相关 举报
社会调查教程第13章.pptx_第1页
第1页 / 共43页
社会调查教程第13章.pptx_第2页
第2页 / 共43页
点击查看更多>>
资源描述

《社会调查教程第13章.pptx》由会员分享,可在线阅读,更多相关《社会调查教程第13章.pptx(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、社会调查教程精编本社会调查教程精编本(第二版)(第二版)江立华 水延凯 主编 国家级精品课程教材 新编21世纪社会学系列教材 第十三章 统计分析第十三章 统计分析第一节 统计分析概述第二节 调查报告的结构和体制第三节 调查报告的写作步骤与撰写要则第一节 统计分析概述统计分析的目的一一二二第一节 统计分析概述统计分析的过程三三统计分析的层次统计分析就是运用统计学原理和方法处理通过调查所获得的数据资料,简化和描述数据资料,揭示变量之间的统计关系,并进而推断总体的一整套程序和方法。四四推断统计的基本原理统计分析的目的简化和描述数据简化和描述数据。在社会调查中,搜集的数据多种多样,数量庞大。在撰写调查

2、报告时,没有必要也没有可能罗列每个数据,而是运用统计分析方法将调查数据简化后再描述出来。用样本推断总体用样本推断总体。在随机抽样调查中,对样本的调查只是手段而不是目的,真正的目的在于通过对样本进行分析所获得的统计量,来推断总体参数。u样本统计量u总体参数发现变量之间的统计关系发现变量之间的统计关系。一一统计分析的过程在数据录入和清理之后,数据的统计分析,大致要经过两个过程:数据预处理数据预处理,就是在统计分析之前对清理后的数据做预备性处理。预处理,一般包括缺损值处理、加权处理、变量重新编码、数据重新排序,以及创造新变量等。数据统计分析数据统计分析,就是调用统计软件中的各种统计程序对数据进行分析

3、,包括单变量、双变量、多变量统计分析,以及制作统计图、统计表等一系列 工作。二二统计分析的层次按照统计分析的性质,可分为:描述统计描述统计u描述统计是运用数字(如频数、百分比、平均值)和图、表等形式汇总所收集来的数据信息。u目的:在不歪曲或丢失大量信息的情况下,将 数据信息简化为更易理解的形式。推断统计。推断统计。u是运用概率分布知识,通过样本统计量预测总体参数的分析方法。u目的:通过对样本的调查来了解总体。当数据描述结果仅适用于一个样本,而我们希望了解总体的特征时,可以使用推断统计。三三统计分析的层次按照统计分析涉及变量的多少,可分为:单变量统计分析单变量统计分析只涉及一个变量,它用平均数、

4、百分比等来描述单个变量的 特征,也可以进行区间估计、显著性检验等推断统计分析。只能进行描述性研究。双变量统计分析方法双变量统计分析方法,包括列联表分析与 检验、秩相关检验、单因 素方差分析、简单线性回归分析等。当一项统计分析涉及三个或三个以上变量(其中至少有一个因变量)时,则被称为多变量或多元统计分析多变量或多元统计分析。双因素方差分析、多元线性回归分析、因子分析、Logistic回归分析等。如果要进行解释性研究,就必须进行双变量统计分析或多变量统计分析。三三推断统计的基本原理推断统计的必备前提是,样本数据必须来自随机抽样调查。只有用随机方法 抽取的样本,其样本统计量才具备推断总体的资格。推断

5、统计与抽样分布推断统计与抽样分布u样本的抽样分布的目的就是运用它来由样本统计量推断总体参数值。因此,抽样分布是推断统计的依据或工具。u抽样分布,是指在一个总体中重复抽取许多大小一样的样本的统计量而 形成的分布。u抽样分布的一个重要作用在于预测统计量的落点及其与所估计参数的接近程 度。抽样分布的建立与作用并非只是人们的一种设想,它有其实际的数理基础或 理论依据,这就是中心极限定理。四四推断统计的基本原理参数估计参数估计u把通过样本计算出来的统计值称为样本统计量,简称统计量,而把总体统计值称为参数。u参数估计就是运用样本统计量对总体参数进行推断或估计的统计过程与统计方法。参数估计包括:p点值估计点

6、值估计是选择一个适当的样本统计量直接代表总体的参数值。优点:无偏性、一致性、有效性缺点:无法知道估计的误差到底有多大u区间估计区间估计是用一个数值区间表示未知总体参数落入该区间的概率或可能性有多大的一种统计方法。置信区间是指在进行区间估计时,在某一概率水平下总体参数所处的数值区间。四四推断统计的基本原理u区间估计p理论基:抽样分布。p核心问题:把样本统计量与总体参数之间的关系转换成抽样分布来处理。p布具有的特性是:总体平均数或抽样分布平均数处于样本平均数1.96个抽样分布标准差范围内的概率为95%,处于样本平均数2.58个抽样分布标准差范围内的概率为99%。假设检验假设检验u假设检验是以抽样分

7、布原理为基础,检验调查样本中的统计特性是否在总体 中同样存在的一种统计方法。它是推断统计中最重要也是最常用的方法。u参数估计是用具体的样本统计量(如平均数、标准差、百分比等)来推断总体参数,而假设检验则是检验样本中的事实、关系在总体中是否也存在。u属于推断统计范畴,随机抽样是其前提或必备条件。进行假设检验,必须首先建立两个假设:四四推断统计的基本原理四四第二节 单变量统计分析集中量数分析一一二二第二节 单变量统计分析离散量数分析三三单变量推断统计集中量数分析一一离散量数分析二二离散量数分析二二离散量数分析二二离散量数分析二二单变量推断统计参数估计(主要是区间估计参数估计(主要是区间估计)是用样

8、本统计量来估计总体参数,它通常只涉及一个变量,也有涉及两个变量的,如相关系数的区间估计等,只是较少用到。在单变量分析中,可分为三种情况或类型:总体平均数的参数估计、总体比率的参数估计和总体方差的参数估计。假设检验假设检验:在单变量分析范围内,分为三大基本类型,即总体平均数的假设检验、总体比率的假设检验、总体方差的假设检验。每一类型又可分为两种小类型:单样本总体假设检验:对单个样本的统计量(如平均数、比率、方差)可否推断总体的检验;双样本差异的总体假设检验:对两样本统计量的差异(如平均数之差、比率之差、方差之差)是否在总体中也存在的检验,亦即要证明两样本的差异是否由来自两个不同的总体造成。三三第

9、三节 双变量统计分析双变量统计分析的内容一一二二第三节 双变量统计分析双变量统计分析的方法双变量统计分析的内容双变量统计分析分为相关关系和因果关系两种形式:两变量间的相关关系两变量间的相关关系:当一个变量X发生变化时,另一个变量Y也随之发生变化,相反,当X发生变化时,Y也发生变化。社会现象之间的相关关系,从不同角度可区分为不同类型:按照相关方向的不同:可分为正相关和负相关按照相关强度的不同:可分为完全相关、不相关和不完全相关按照相关形式的不同:可分为线性相关和非线性相关两变量间的因果关系两变量间的因果关系:一变量的变化可以确定为另一变量变化的原因的关系。要确定两个变量之间的因果关 系,必须同时

10、满足三个条件:两变量间必须存在相关关系先有原因,后有结果。必须确定变量X与Y之间的关系,不是由于第三个变量的存在而呈现出的一种虚假关系。一一双变量统计分析的方法在双变量统计分析中,由于变量的测量层次不同,因而计算两变量相关系数 的方法和假设检验的方法也不相同。变量的测量层次,可分为定类、定序、定距、定比四种类型,这样就形成了多种不同测量层次变量的两两组合。二二双变量统计分析的方法二二双变量统计分析的方法n定类定类-定类(或定序)变量分析定类(或定序)变量分析PRE(proportion reduction in error)叫作消减误差比例。PRE表示的就是当我们用一个变量X来解释另一个变量Y

11、时,能够减少多少比例的误差,能够消减误差的比例越大,表明两个变量的关系越密切,亦即相互影响的作用力越大,反之则越小。PRE取值区间为 0,1。消减误差比例的计算公式为二二双变量统计分析的方法二二双变量统计分析的方法二二双变量统计分析的方法n定距定距-定距变量分析定距变量分析两个定距变量的相关分析:两个定距变量的相关系数,通常使用皮尔逊积差相关(或积矩相关)公式计算。由于原始公式计算时略为复杂,为了能直接运用X和Y的原始数据计算相关系数,可以将皮尔逊积差相关公式转化成如下公式:二二其中,r表示皮尔逊积差相关系数,X表示变量Y的取值,Y表示变量Y的取值,n表示个案数或样本容量。在处理分组数据时,则

12、采用如下计算公式:双变量统计分析的方法n一元线性回归分析对两个定距变量进行回归分析,被称为一元线性回归分析,即只有一个自变量X,且两变量间存在线性相关关系。一元线性回归分析,实质上就是要在变量X和变量 Y之间建立一个线性回归方程,从而用X去预测Y。一元线性回归方程的标准形式为:建立回归方程的主要问题是求出方程中回归系数b(回归线的斜率)和回归线在轴上的截距a,这一过程被称为配制回归线或拟合回归线。确定回归系数b的原则是使散点图(根据X和Y一一对应的值绘制而成的分布图)上各点距回 归线上的相应点的垂直距离平方和为最小,这种求回归系数b的方法被称为最小 二乘方法。求回归系数b的公式为:二二这个公式

13、可以说是回归系数b的定义公式,为计算方便,可将其转化为能直接用原始数据计算b的公式:双变量统计分析的方法二二第四节 多变量统计分析简介第四节多变量统计分析简介1 1、多变量相关分析、多变量相关分析是相对于双变量相关分析而言的。在双变量相关分析中,是用一个统计量(如相关系数、G、r等)反映两个变量间的相关关系。当变量达到三个或三个以上时,相关关系的分析就属于多变量相关分析或多元相关分析了。与多变量相关分析直接有关的方法,有偏相关分析复相关分析典型相关分析第四节多变量统计分析简介第四节多变量统计分析简介5 5、对数线性模型分析:、对数线性模型分析:是在自变量和因变量都是定类或定序变量时,用以分析

14、它们之间的相互关系的多变量统计分析方法,它处理的是以交互分类表形式出现 的定类或定序数据。6、结构方程模型分析结构方程模型分析:是一种用于建立、估计、检验因果关系模型的功能强大 的多变量统计分析方法。它把因子分析、回归分析、路径分析、方差分析等多种 多变量统计分析方法有机地整合在一起。7、多层线性模型分析:多层线性模型分析:是专门用于对具有层次结构特性的数据进行多变量统计 分析的统计方法。本章要点1、统计分析就是运用统计学原理和方法处理通过调查所获得的数据资料,简化和描述数据资料,揭示变量之间的统计关系,并进而推断总体的一整套程序 和方法。2、统计分析可按不同标准划分层次。按照统计分析的性质,

15、可分为描述统 计和推断统计;按照统计分析涉及变量的多少,可分为单变量统计分析、双变量 统计分析和多变量统计分析。3、描述统计是关于样本的统计方法,其分析结果是样本统计量;推断统计 是通过样本推断总体的统计方法,包括参数估计与假设检验。4、单变量统计分析,可分为集中量数分析和离散量数分析两大部分;单变 量统计分析不仅可做描述统计,而且可做推断统计。5、双变量统计分析,主要分析两个变量之间的关系,包括相关关系与因果 关系。6、相关关系可分为不同类型:按照相关方向的不同,可分为正相关和负相 关;按照相关强度的不同,可分为完全相关、不相关和不完全相关;按照相关形 式的不同,可分为线性相关和非线性相关。

16、本章要点7、要确定两个变量之间的因果关系,必须同时满足三个条件:两变量 间必须存在相关关系。必须确定自变量变化在前,因变量变化在后。必须确定变量X与Y之间的关系,不是由于第三个变量的存在而呈现出的一种虚假关系。8、双变量统计分析有各种各样的方法,选择双变量统计分析方法的基础是变量的测量层次。双变量统计分析同样可进行描述统计与推断统计。9、在社会统计中,消减误差比例(PRE)是一个重要范畴,也是一种重要 的统计方法。10、多变量统计分析是指涉及三个及三个以上变量(其中至少一个因变量)的统计分析方法。它是当代统计学中发展最迅速、最活跃的领域。本章中的基本概念统计分析描述统计推断统计参数估计点值估计区间估计假设检 验虚无假设备择假设置信水平置信区间集中量数离散量数相关关系因果关系抽样分布统计量参数消减误差比例()方差与标 准差思考与练习思考与练习思考与练习推荐阅读书目

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作计划

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁