李沛良《社会研究的统计应用》笔记和典型题(含考研真题)详解.docx

上传人:无*** 文档编号:68345513 上传时间:2022-12-27 格式:DOCX 页数:152 大小:480.28KB
返回 下载 相关 举报
李沛良《社会研究的统计应用》笔记和典型题(含考研真题)详解.docx_第1页
第1页 / 共152页
李沛良《社会研究的统计应用》笔记和典型题(含考研真题)详解.docx_第2页
第2页 / 共152页
点击查看更多>>
资源描述

《李沛良《社会研究的统计应用》笔记和典型题(含考研真题)详解.docx》由会员分享,可在线阅读,更多相关《李沛良《社会研究的统计应用》笔记和典型题(含考研真题)详解.docx(152页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、目录内容简介目录第一部分复习笔记第一篇导论第一章科学方法与社会研究历程第二篇统计叙述:单变项与双变项第二章简化一个变项之分布第三章简化两个变项之分布第四章相关测量法与测量层次第三篇统计推论:单变项与双变项第五章抽样与统计推论第六章参数值的估计第七章假设检定:均值与百分率第八章假设的检定:两个变项之相关第四篇多变项分析第九章详析模式与统计控制第十章多因分析第十一章因径分析第十二章定类或定序依变项回归分析第十三章多项互关分析第五篇社会变迁分析第卜四章趋势资料分析法第十五章同组分析第二部分典型题(含考研真题)详解一、名词解释二、简答题三、论述题第一部分复习笔记第一篇导论第一章科学方法与社会研究历程社

2、会学三先的受念/社会学航允历程的来龙去肱1等划社会学研究的步骤执行 I息结(选定所允题目初步探索成立假设理论貂茗与澄涌蜕念科学方法与社会研究方程号划(研究设计-定类层次定字层次定及百次一定比廛次界定母体和决定抽样的步零【统计分忻f访问法 f抽取样本.收兵交。(观察法执行档累资料至理资料J校对I魂明统计分析.将众多的资料作海合运算总结J敏恭用先绝果说明用咒玲果的贡蛾受柒若干新的斫克题目【知识框架】【重点难点归纳】一、社会学研究历程的来龙去脉社会学研究的概念社会学研究,是指运用科学的方法来搜集和分析社会事实,以理解社会现象之间的关系,尤其是因果关系。社会学研究采用科学方法来叙述和解释社会现象间的关

3、系。2.社会学研究的步骤采用科学方法的社会学研究的整个历程,大致上可分为三个阶段:(1)筹划:研究题目初步探索、成立假设、理论解释与澄清概念及研究策略。(2)执行:试点研究、抽取样本、收集资料及整理资料。(3)总结:统计分析、解释研究结果及理论与实际贡献。二、筹划在规划一项研究时,大致上可以分为下面的五个步骤:1 .选定研究题目开始一项研究时,选定研究题目是非常重要的。2 .初步探索(1)收集有关的文献;(2)咨询对研究的题目有经验、有知识的人,进行了解;(3)观察个案,即挑选一些较为典型的个案,亲自观察所要研究的现象。3 .成立假设(1)变项是指社会学研究的社会现象。假设是指根据研究者对问题

4、的了解,假定现象与现象之间的关系。假设的形式包括函数式和差异式。(2)在成立假设时,必须尽可能说清楚变项与变项之间的关系。研究假设,一般是说明两个变项的关系,但也可以只假定一个变项的情况或假定多个变项的相关情况。(3)不是所有的社会学研究都成立假设。但当前的社会学研究,大部分是争取先成立假设,再搜集事实来加以验证,并且重复测验。4 .理论解释与澄清概念在成立假设以后,便要予以解释。另外,对假设中的变项所包含的概念,要清楚界定它们的意义,以免发生误解。5 .研究策略要证明假设,必须首先设计研究方式,然后确定每个变项的测量方法及其测量层次,最后计划抽取样本和选择统计方法。(1)研究设计较为常用的研

5、究方式有实验法和社会调查法,二者皆可验证假设。实验法实验法的基本逻辑,是有意地改变A变项,然后看看B变项是否随着变化;如果B变项显然是随着A变项的变化而变化,即说明A变项对B变项有影响。实验法的逻辑很严密,其操作程序为:a.将研究对象分为实验组和控制组。两组的成员在实验前的情况要基本相同,尤其是那些会影响实验效果的情况。使两组情况相同有两种方法:随机法和配对法。b.为证明假设:A-B,要改变实验组的A变项,但不改变控制组的A变项,然后比较两组的B变项在实验前、后的变化。如果变化的程度不同,表示A对B有影响;如果相同,则表示无影响。社会调查法社会调查法的特点,是在研究过程中不改变社会现状,只求就

6、地取材,然后以统计方法推算变项与变项之间的关系。社会调查法可以分为叙述性调查和解释性调查两大类。a.一般的社区调查或民意调查属于叙述性调查。当代的社会学研究,偏重因果关系,较常进行解释性调查。b.解释性的社会调查研究,目的是要证明不同的变项之间是否有因果关系。实验法与社会调查法的比较a.如果证明因果关系,社会调查法在逻辑上不及实验法严谨。严格来说,调查法只能确定变项之间是否相关。b.进行社会调查时,可作全体调查,也可作抽样调查。在某一个时期进行的社会调查是横剖调查;在不同的时期重复的社会调查是纵贯调查。纵贯调查又分趋势研究和同组研究。个案研究个案研究是指选择一个或几个个案,作深入的接触和观察,

7、目的是对所研究的问题作深入的了解。个案研究不适宜用作证明假设。(2)测量变项选择指标确定如何测量变项,是指采用哪些事实作为变项的指标。每个社会现象都有许多不同的数值或属性,这些不同的值便构成了一个变项。任何一个变项都可能有许多不同的指标,因此选择指标的标准必须符合变项的含义,同时又易于搜集所需的事实。指标的合并对于简单的变项,用一个指标便足够。对于较复杂的变项,可能要用上多个指标,为便于分析,有时需要将各项指标合并起来。合并的方法,主要有类型法、指数构成法和尺度法二坐一类型法是将各指标交互分类。型-类法数成指拗法指数构成法是用简明而合理的公式,来综合各指标。度尺法尺度法是根据各指标之间的关系来

8、计算总值,使研究对象高低有序。总和尺度法最为简单易行,也最常用,计算总值的方法是将各指标的数值相加起来。研究单位在测量变项时,要注意研究单位的性质。以个人为研究单位的变项,称为个人变项;以地区或群体为研究单位的,称为群体变项。在测量变项时,要清楚说明研究单位是个人还是群体。推论的两种错误:将以群体研究单位研究得出的结论推论到以个人为研究单位时的情况。区群谬误微体谬误将以个人为研究单位的研究结论推论及于群体或整个地区。(3)测量层次变项在测量以后,会有不同的数值或属性。根据这些值的数学特质,可以将它们由低至高分为四个层次:定类、定序、定距和定比。定类层次,是指变项的值只能把研究对象分类,即只能决

9、定研究对象是同类抑或不同类,具有=与#的数学特质。分类时,要注意互斥性和无遗性两个原则。定序层次,是能确定值的次序,即变项的值能把研究对象排列高低或大小,具有,与V 的数学特质。定序层次包括了定类层次的特质。定距层次,是指能确定值与值之间的距离,即变项之值与值间的距离是可以知道的,因而具有加与减的数学特质。定距层次包括了定序和定类层次的特质。定比层次,是最高的测量层次,其数值中的零值是绝对的、固定的,除了定类、定序和定距层次的特质以外,也具有乘与除(X、+)的数学特质。(4)界定母体和决定抽样的步骤界定母体,是指清楚说明研究对象的范围,即所研究的人物、时间和地点。母体的定义愈清楚愈好。如果所界

10、定的母体范围过大,不容易全部研究,就需要采取抽样的方法。(5)统计分析统计方法分两大类:叙述统计法和推论统计法。叙述统计法就是帮助简化资料的方法。推论统计法是根据抽样取出的资料推论出母体的情况。三、执行为保证研究质量,应该首先做小规模的试点研究,即抽取若干研究对象来试验整套计划是否可行。根据试点研究的结果和经验修改原来的计划以后,就可以进行大规模的研究工作。1 .抽取样本,收集资料依据抽样的计划,从全部研究对象中抽取样本。抽取样本以后,向每一个样本单位收集所需的资料。搜集资料的方法,可以归为三大类:访问、观察和档案资料。(1)访问法访问法在社会学研究中最常用,它可以在较短时间内获取大量资料。访

11、问之前,一般是预先设计好一组问题,称为问卷。答案的方式主要有固定答题和自由答题两种:a.固定答题,由研究员预先设计了若干可能的答案,由答者选择。固定答题便于统计分析,但所提供的答案不一定适当。b.自由答题,让答者随着自己的意思回答,研究员不提供可能的答案。自由答题能够让答者充分表达他的意思,较为准确,但答者可能哆嗦和花样众多,访问费时且分析起来也不容易。用问卷收集资料的方式可以分为两类:自填和对答。自填是指把问卷交给答者,由他自己填写答案。这种方式又分为邮寄和当面填写两类:a.邮寄方式的好处是节省人力,但问题是寄回来的问卷可能很少。b.当面填写是指把研究对象集合起来,在研究员面前自己填写问卷。

12、自填的方式要求答者懂得文字和J解问题的意思,难以在教育落后的地区应用。对答是指由研究员询问,答者作口头答复,然后研究员作记录。这种方式又分为电话访问与面对面访问两类:a.电话访问是指研究员用电话询问研究对象,可以节省交通费用和时问,但只能提出少量问题,而且在电话普遍地区才可进行,否则样本的代表性有疑问。b.面对面访问是指登门拜访,直接访问研究对象,此方法耗费人力和时间多,但可以避免自填方式以及电话访问的短处,而且有较长的访问时间,搜集大量资料。设计问卷时,切忌太长,要尽可能精简,要经过反复考虑,力求去芜存菁。同时,每个问题所用的词语,要具体和明确,不能模棱两可或有双重含义。所用的词语,也不可影

13、响答者的意见。(2)观察法观察法即是以耳闻目睹的方式,实地了解研究对象的行为。观察法分为参与观察法和非参与观察法两种。参与观察法是指研究员要参加所研究的活动,从而获取资料。非参与观察法是指研究员的身份是旁观者。(3)档案资料档案资料,包括报纸、杂志、机关文件与书信等。这是现有的资料,所以一般来说,花的时间最少,代价最小。2 .整理资料整理资料一般分为校对和编码两步。(1)校对是指查看所收集的资料有没有错,有没有错漏和是否清楚。有错漏或不清楚的,就要马上补上或更正。(2)编码是指把资料作简明的记录和分类。记录资料时,可用简单的数码表示。四、总结统计分析,将众多的资料作综合运算(1)运用适当的叙述

14、统计方法,把所得到的资料简化,使之易于理解。如果所研究的是一个样本,要运用适当的推论统计方法,用样本的研究结果来推论总体的情况。(2) 一个严谨的研究,在未分析变项与变项之间的关系之前,应该先检验每个变项的测量信度和测量效度,再开始运用统计方法分析资料以求验证假设。测量信度是指用相同的方法重复测量变项时所得的资料与原有资料的吻合程度。测量效度是指所得资料与测量的目标的吻合程度。2 .解释研究结果研究者提出更精确和更周详的解释。如果研究结果是否定原来的假设,须解释其原因。3 .说明研究结果的贡献研究结果的贡献包括理论的贡献和实际的贡献。4 .提供若干新的研究题目提供若干新的研究题目,即使自己未能

15、解答,也要提议别人去寻求答案。第二篇统计叙述:单变项与双变项第二章简化一个变项之分布,次致分布比例/定类层次比室至示【对比值C累加次效/基本技术,定字星决累tn百分率f次数的计算矩形田,定距县次为示法I多鱼浅虱优化一个变项之分布形宸浅1一些的我的嗝念J c形腔浅峰状曲畿I对称与不对称曲线定类变项:众值勇士趋势更量法1定字变项:中也值定距至项:均值定类变项:禀异比军或灵异指欤要歌迨势出量法,定字变项:四分也差I定域变项:标准差正态曲线及正态分布1正态分布与标准值I标鹿正态分布【知识框架】【重点难点归纳】一、基本技术定类层次适用于简化一个定类变项资料的方法,有次数分布、比例、比率、对比值和图示法等

16、。次数分布次数分布法是指统计变项内每一个值的原资料出现多少次。次数分布可以把原资料作初步的简化,但不能用来比较不同的样本。如要比较,可以计算比例或比率。比例比例是指将每类的次数(/)除以总数(.V)。比例是使两个样本的总数变成同一个基数,即都是以1为基数,就可以进行比较。公式:比率比率是把计算比例时所用的基数变大,使之容易领会。比率的公式是:. Z.X100一ZxlOOO _, q Z-X10000a.百分率:.V b.千分率:.VC.万分率:.V社会学研究最常用的是百分率()。一般来说,要求精确程度愈高或样本愈大,可以保留的小数愈多。社会学研究通常是保留小数点以后的一位或两位数字。对数值中的

17、小数作取舍,通俗的做法是“四舍五入”。近代统计学有一项新原则,就是“前单五人”,即“五”前面是单数就进位,若是双数就舍掉(0也算双数)。如果百分率的数值也太小,可以用千分率、万分率等。如犯罪研究的统计,通常是用十万为基数;人口学的研究则较常用千分率。1r分析定类层次资料时,也可以计算两数值的对比值。A数值与B数值的对比值,即 A除以B。图示法图示法是以图形来简化资料。在社会学研究中比较多用的有长条图和圆瓣图。长条图是以长方形的长度(宽度相同)来表示次数或百分率的多少;圆瓣图是把一个圆形平面按数值的比例分割。2.定序层次累加次数和累加百分率适用于定序层次而不可用于定类层次。(1)累加次数(简写c

18、f)累加次数是把次数逐级相加起来。分为向上累加和向下累加两种。它们的作用是使研究者容易知道某值以下或以上之次数总和。(2)累加百分率(简写c%)累加百分率是将各级的百分率数值逐级相加。3.定距层次累加次数或累加百分率的方法,即可以分析定序资料,也可以用于分析定距资料。(1)次数的计算一般是先将各值分成若干组,然后计算每组的次数。分组时,要留意每组的界限、宽度和断点。组限,即每组的范围,包括上限和下限。每个组的宽度,简称组距,即组的真实上限与真实下限之差。组中点即真实上限与真实下限的平均数。(2)图示法较常用于社会学研究的有矩形图和多角线图。矩形图以一个矩形的面积(长X宽)表示每组数值之次数或百

19、分率的多少。绘制矩形图时,通常是以一个坐标的横轴的宽度表示组距,以纵轴的长度表示次数或百分率,二者的乘积就是该组之次数或百分率。矩形图与长条图的区别包括:a.长条图只讲长度,宽度则固定;矩形图则是计算面积,长度与宽度均有意义。b.长条图可以分开;而矩形图由于数值有连续性,各个矩形要相连排列,不可以分开。多角线图多角线图是把各个矩形顶端的中点用直线连结起来。其作用是使各组的次数(或百分率)的分布情况更显而易见。(3)一些曲线的概念整理定距资料时,可将资料分组,然后用多角线显示分布情况。但各组距的大小,会影响线条的平滑程度。一般是组距愈小,线条就愈平滑。社会学研究常用平滑曲线来表示定距变项的资料分

20、布,如下列一些曲线:J形曲线下降时先急后缓或上升时先缓后急,如图2-1所示。图2-1 J型曲线U形曲线先降后升或先升后降,如图2-2所示。f图2-2 U型曲线如图2-3所示。峰状曲线图2-3峰状曲线对称与不对称曲线如果把曲线从中央分割,两边的资料分布完全相同,且图形对称就是对称曲线,否则就称为不对称曲线。不对称曲线显示资料作偏态分布,分为正向(即向右)偏态和负向(即向图2-4对称与不对称曲线二、集中趋势测量法集中趋势测量法是指找出一个数值来代表变项的资料分布,以反映资料的集结情况。1 .定类变项:众值众值(简写。)即次数最多之值。因为众值最有代表性,因此具有估计或预测的意义,长远来说,以众值作

21、预测所犯的错误总数是最小的。众值适合于分析定类变项,当然也可用来分析定序或定距变项的资料。2 .定序变项:中位值中位值(简写以,)为一个序列的中央位置之值,即高于此值的有50%的研究个案,低于此值的也有50% o计算中位值有用原资料和用分组资料计算两种情况。(1)根据原资料求出中位值计算方法是将各个个案由低至高排列起来,居序列中央位置的个案的值就是中位值。其公式为:M位置=亍,其中”是个案数目。如果”是偶数时,通常的做法,是将位于最中央的两个数值的平均值作为中位值。(2)用分组资料来求出中位值首先将分组资料中各组的次数(,)向上累加起来(/、宁日M = z +-: h-T),再求出中位值的位置

22、。公式如下:其中,工=中位值组之真实下限;/=中位值组之次数;“=中位值组之组距;可=低于中位值组真实下限之累加次数;”全部个案数目。中位值具有估计或预测的意义。长远来说,以中位值去估计定序变项的数值,所犯的错误总数是最小的。3 .定距变项:均值定距资料可以作加减运算,故可以将变项的各个数值相加起来,求取一个平均的数值,即均值(简写了)。计算的方法,也分为两种情况,即用原资料和用分组资料。(1)根据原资料求出均值Yx公式:其中,E表示各个个案数值之和,”表示全部个案数目。均值表明了资料的集中趋势,可作估计或预测之用。长远来说,以均值估计定距变项的资料,错误最小。如果某个变项值重复出现许多次,可

23、以先统计每个值(X)之次数(/),再求取次数与相应变项值之间的乘积(户),然后利用各个乘积之总和求出均值。(2)根据分组资料求出均值_工一公式:”其中,/表示每组的次数,X.表示组中点,表示个案数目。总的来说,如要测量集中趋势,即找出一个最有代表性之值,定类变项的资料可用众值(乂。);定序变项可用众值(M。),但以中位值(乂,)较适宜。定距变项可用众值(乂。),也可用中位值(,),但以均值(了)最适宜。然而,有两种情况下不宜用均值:在分组资料中的极端组没有组限时,不能求出均值,只能用中位值;在变项中有个别的数值非常特殊(过高或过低),则均值的代表性就有疑问,用中位值较为适合。三、离散趋势测量法

24、离散趋势测量法,是要求出一个值来表示个案与个案之间的差异情况。1 .定类变项:离异比率或质异指数(1)离异比率离异比率(简写V)是指非众值的次数与全部个案数目的比率。公式如下:其中“是全部个案数目,加。是众值的次数,二者之差(n一九)就是非众值的次数。 V愈大,就表示众值的代表性愈小,以之作估计或预测时所犯的错误也就愈大。(2)质异指数由于离异比率的方法过于粗略,另一个较为精确和常用的方法是质异指数(简写IQV),其作用是求出各个类别之间在理论上最多的可能差异中(以M代表)实际上出现了多少差异(以A代表)。公式如下:命-jZOF-. Jn4(k-l)其中,=全部个案数目,k=变项的类别数目,/

25、=每个类别的实际次数2 .定序变项:四分位差四分位差的计算方法,是将个案由低至高排列,然后分为四个等分(即每个等分包括25%的个案),则第一个四分位置的值(2)与第三个四分位置的值(2)的差异,即四分位差(简写。),公式为:Q = QQ计算四分位差时,先要求出。的位置和2的位置,然后计算在这两个位置上的值的差异。实际做法,分为原资料与分组资料两种情况。(1)根据原资料求出9与Q的位置公式为:W +19位置=丁3(+1)位置=1其中“是全部个案数目。(2)根据分组资料来计算四分位差步骤计算向上累加次数。求出白和乌的位置,公式如下:9位置=3n口位置=丁其中”是全部个案数目。参考累加次数分布,决定

26、乌和。的位置应属于哪一组。从所属的组中,计算a位置和a位置的数值。公式如下:其中属组之真实下限;4=0属组之真实下限;工=9属组之次数;工=乌属组之次数;%=低于a属组下限之累加次数;%=低于2属组下限之累加次数;丐属组之组距;%=乌属组之组距;”全部个案数目。3.定距变项:标准差全距即最大数值与最小数值之差,精确性甚有疑问。分析定距变项的离散情况,最常用的方法是标准差(简写S),即将各数值(X)与其均值(工)之差的平方和除以全部个案数目(),然后取其平方根。公式如下:公式中X与jf的相差,即表示以均值作为代表值时会引起的偏差或错误。如果各个实际数值与均值之相差的总和很大,就表示变项数值的离势

27、度很大,即均值的代表性很小。公式以为分母,是要求出各个个案的数值与均值之间的差异平均有多少,反映均值的代表性。计算标准差,可以根据原资料,也可以根据分组资料。(1)原资料公式:V 标准差的数值在相互比较时更能突出其意义。标准差也有另一种意义,即表示用均值作估计或预测变项值时所犯错误的大小。同理,可以计算次数资料的标准差。(2)分组资料公式:,=感亘尸其中。是每组的组中点,/是该组的次数。表示定距资料的离散程度,另一种常用的方法是方差。方差(简写S:)即标准差的平方值,其意义与标准差相同。总体来说,质异指数(或离异比率)最适合于分析定类变项,也可用于分析定序或定距变项。四分位差(或十分位差)最适

28、合用来分析定序变项,也可分析定距变项。标准差(或方差)则只能用于分析定距变项。这些离势测量法与集中趋势测量法作用互补。测量方法与测量层次的关系可以综合如表2-1所示:表2-1测量方法与测量层次的关系定类变项定序变项定距.变项集中趋势余值中位值均值离散趋势质异指数四分位差新准姜四、正态分布与标准值正态曲线及正态分布定距资料可用一条平滑的曲线表示,如正态曲线。此曲线呈钟形,如图2-5所示:图2-5正态曲线(1)正态分布的公式其中x=变项的数值;/=该变项值的次数;$=标准差;爪=3.1416;3=2.7183;=均值。(2)正态分布的特点正态分布的众值、中位值和均值相同。正态分布的x值与均值三差异

29、愈大,其次数会愈少,但不会等于零。在正态曲线下每一部分的面积(即次数总和)都可以计算出来。2.标准正态分布将正态分布的数值改用标准差为单位,可以将不同形态的正态分布归纳为一种分布。这个以标准差为单位的正态分布,一般称为标准正态分布,其每个变项值(x)变为:x-x上式的z称为“标准值”,代表每个X值在标准正态分布上的数值。标准正态分布的均值是0,标准差是1。例如,Z=2.4,就表示该值与均值(等于0)的距离是2.4个标准差。每个标准值所表示的面积,可用下图的斜线部分来表示,如图2-6所示。由于正态分布是对称的,因此标准值其实是绝对值,只要是数值相同,则无论是正值或负值,所表示的面积大小都相同。标

30、准值是正数时,所表示的面积是在均值右边;Z| 1.65|,Z| 1.96|,Z|2.33|,Z|2.40|,Z|2.58|,Z| 3.09|,Z|3.30|,标准值是负数,则在左边。图2-6标准正态分布既然可以知道每个标准值所表示的面积,那么也可以求得任何两个标准值之间所包括的面积,或是超越这个标准值的面积。因此可以算得如下的数值(在社会学研究中常用):比例是0.05;比例是0.025;比例是0.01;比例是0.0082;比例是0.005:比例是0.001;比例是0.0005。第三章简化两个变项之分布统计相关的概念简化两个变项之分布(统计相关的性质相关程度与相关方向I相关程度与方向的测量列联表

31、及其相关概念1交互分类与百分表列联表的计算I条件百分表及其制定准则r相关测量法I筒化相关与消减误差t消减误差比例【知识框架】【重点难点归纳】一、统计相关的性质统计相关的概念相关,是指一个变项的值与另一个变项的值有连带性。即如果一个变项的值发生变化,另一个变项的值也有变化,则两个变项就是相关了。2 .相关程度与相关方向(1)变项与变项之间的相关程度,可用统计法予以测量。大多数的统计法是以0代表无相关,以1代表全相关。介于0与1之间的数值如果愈大,就表示相关的程度愈强。(2)相关方向,也可用统计方法予以测量。变项与变项之间的关系,可以分为正与负两个方向,即正相关(又称正比)与负相关(又称反比)。正

32、相关是指一个变项的值增加时,另一变项的值也增加。负相关是指一个变项的值增加时,另一变项的值却减少。相关方向的分析只限于定序或定距变项。3 .相关程度与方向的测量尤拉Q系数,特别适合于分析两个二分变项的关系。表3-1变量示例1ac2bdT adbc如表3-1所示,X与丫都是二分变项,可计算Q系数如下:Q值是0则表示两个变项没有关系,愈大则表示关系愈强,但不会大于1。Q值可以是正数或负数,前者表示正相关,后者表示负相关。此外,分析两个变项的关系时,还需注意两个变项是否有因果关系。许多社会学研究在成立假设时,会假定某变项是因,称为自变项;另一变项是果,后者称为依变项。自变项( X)与依变项(Y)的关

33、系,可表示为:X-Y。相关的两个变项,不一定有因果之分,可能是共同变化。不对称关系是指X影响Y,而丫不会影响X;对称关系是指不确定或不区分影响的方向。二、交互分类与百分表列联表及其相关概念交互分类,是指同时依据两个变项的值,将所研究的个案分类。综合了两个变项的共同分布的统计表,通常称为列联表,又称条件次数表。在表的最下端是对应变项各级水平的总次数,称为边缘次数,它们的分布情况称为边缘分布。表中的其他次数,称为条件次数,表示在自变项的每个值(条件)的情况下依变项的各个值的个案数目(次数)。2 .列联表的计算列联表有大小之分。计算的方法,通常是将依变项值的数目乘上自变项值的数目。如果将依变项放于表

34、的旁边,将自变项放于表的上端,则表的大小=rxc (r为横行数目,c为纵列数目)。先后次序表示前者(依变项)受后者(自变项)的影响。rxc表与cxr表是不同的 o因为前后两个数值代表不同的变项,包含不同类别数。3 .条件百分表及其制定准则为求相互比较从而知道两个变项间的关系,需将各个基数标准化。最常用的标准化方法,是将所有基数都变成100,各个条件次数变为百分率。这样制成的表,称为条件百分表。制定条件百分表的依据准则:(1)每个表的顶端要有表号和标题。(2)绘表时所用的线条,要尽可能简洁。(3)在表上层的自变项每个值下的号,表示下列的数值都是百分率。(4)表下层括弧内的数值,表示在计算百分率时

35、所根据的个案总数。在研究报告中,如果有条件百分表,便不需要有条件次数表。(5)表内百分率数值的小数位要保留多少,视乎研究的需要,但最好是有一致性。在绘制条件百分表时,通常是根据自变项的方向来计算百分率;但如果依变项在样本内的分布不能代表其在总体内的分布,则百分率的计算要根据依变项的方向。三、简化相关与消减误差相关测量法相关测量法,是指以一个统计值表示变项与变项之间的关系。这个值,通常称为相关系数。选择相关测量法时,应注意以下三点:(1)变项的测量层次:定类、定序和定距。(2)两个变项间之关系是否对称。(3)统计值的意义:最好选用统计值有意义的相关测量法,如PRE测量法,其统计值具有消减误差比例

36、的意义,因此常用于社会学研究中。2.消减误差比例现假定X的值未知,预测丫值时所产生的全部误差是身;若X的值已知,则可根据X的每个值来预测丫值,假定误差的总数是J 则以X值来预测丫值时所减少的误差为:鸟一层。这个数值(玛一44)与原来的全部误差(耳)相比,即为消减误差比例。公式如下:PRE的数值愈大,表示以X值预测丫值时能够减少的误差所占的比例愈大,即X与丫的关系愈强。PRE的数值在。与1之间,如果冬=0,则PRE=1,反映X与丫是全相关;如果玛=玛,则PRE=O,反映X与丫是无相关。第四章相关测量法与测量层次r Lambda相关测量法C 系数,两个定类变项:Lambda, Tau-y &一系数

37、、Tau-y相关测量法z Gamma相关测量法相关测量法与测量层次两个定序变项:Gainna. d. ci,相关沌量法Gamma或系数值在次数表中的求辞(tau系数和rho系数简单线性回归分析两个定距变项:演单线性七积矩相关测量法定类变项与定距变项:相关比率与非线性相关定类变项与定序变项:Lambda, Tau-y系数定序变项与定距变项:相关比率I综合【知识框架】【重点难点归纳】一、两个定类变项:Lambda, Tau-y如果两个变项都属于定类测量层次,可用Lambda相关测量法,也可用古德曼和古鲁斯卡的Tau-y相关测量法。其统计值都具有PRE意义。1) Lambda相关测量法(1)Lamb

38、da相关测量法的含义Lambda相关测量法,又称格特曼的可预测度系数,其基本逻辑是计算以一个定类变项的值来预测另一个定类变项的值时,如果以众值作为预测的准则,可以减除多少误差。消减的误差在全部误差中所占的比例愈大,就表示这两个变项的相关愈强。2) ) Lambda相关测量法的两种形式对称形式,简写入系数,其特点是假定两个变项间的关系是对称的,即不分自变项或依变项。不对称形式,简写系数,即要求一个是自变项(X)而另一个是依变项(Y)。公式如下:(对称)2 AM+ MJ(不对称)T其中,以,=丫变项的众值次数,m.=x变项的众值次数,w,=x变项的每个值(类别)之下丫变项的众值次数,也=丫变项的每

39、个值(类别)之下X变项的众值次数,n=全部个案数目。入系数与4系数的统计值均介于o与1之间,且都具有消减误差比例的意义。3) ) Lambda相关测量法的特点Lambda相关测量法的特点是以众值作为预测的准则,因此,如果全部众值集中在条件次数表的同一列或同一行中,则Lambda系数便会等于0。2. Tau-y相关测量法Tau-y系数属于不对称相关测量法,要求两个定类变项中有一个是自变项(X),另一个是依变项(Y)。其系数值介于0与1之间,具有消减误差比例的意义。公式如下:)4其中乙,即不知X而预测丫时的全部误差;F.,即知道X预测丫时所犯的错误;”=全部个案数目;/=某条件次数;尸,7变项的某

40、个边缘次数;月=工变项的某个边缘次数。由于Tau-y测量法是考虑全部的次数,故其敏感度高于Lambda测量法。二、两个定序变项:Gamma,如要以一个统计值来简化一个定序变项与另一个定序变项的关系,可应用古德曼和古鲁斯卡的Gamma系数,适用于分析对称的关系;也可应用萨默斯的4系数,适用于不对称的关系。两者的系数值都是由-1至+1,既表示相关的程度,也表示相关的方向,而且都有消减误差比例的意义。由于Gamma系数与4系数的目标都是分析两列等级的关系,故可统称为级序相关法。级序相关法是以每对个案之间的相对等级作为预测的准则。假如样本的全部个案数目是“,则会组成5献“一对个案。同序对是指某对个案在

41、两个变项上的相对等级是相同的;异序对是指某对个案在两个变项上的相对等级是不同的。通常以N代表同序对总数,以区代表异序对总数,Gamma系数与4系数就是根据这两个数值来计算两个定序变项的相关程度和相关方向。1. Gamma相关测量法计算Gamma系数(简写G)的公式如下:其中M是同序对数,也是异序对数。Gamma系数值具有消减误差比例的意义。G是负值,即表示从样本中任意取出两个个案时,如果知道他们在某个变项上的相对等级,就应该估计他们在另一变项上的相对等级是相反的,而G的绝对值愈大,就表示估计时所犯的错误可能性愈小。另外,Q系数是Gamma系数的一种特殊方式,倘若两个定序变项都是二分的,则、=6

42、。2. 4相关测量法公式:- N + M+芍其中叱是同序对数,M是异序对数,4是只在依变项(Y)上同分的对数。的系数值通常小于Gamma系数值,因为在4公式中分母的数值较大。3. Gamma或4系数值在次数表中的求解在次数表中计算Gamma或4系数值的程序如下:(1)在次数表中,X的值(i)分为1与2两个等级,丫的值(J)也一样。交互分类后的次数(人)分布如表4-1所示:表4-12x2表示例I LY12fll(2)上表中的左上角次数乘上其右下角的次数,就是同序对数。即:乂=正(左)上表中的右上角次数乘上其左下角的次数,就是异序对数。即:N-f6上表中同一纵列的次数的乘积,就是只在X变项上同分的

43、对数。即:工=为左)上表中同一横行的次数的乘积,就是只在丫变项上同分的对数。即:W =65AMM 至于在两个变项上都是同分的对数,先要计算每个方格内的个案所组成对数,然后将各方T 一工15-1),工:(,:-,(t 左(左一。壬2222格的对数相加起来。即:(3)根据公式计算Gamma或4系数值。同理,可以从任何的rxc表中求出Gamma或4的系数值。4. tau系数和rho系数级序相关测量法,除了Gamma系数与4系数,还有肯德尔的tau系数和斯皮尔曼的rho系数。(1)肯德尔的tau系数的三种形式肯德尔的tau系数有三种形式,分别称为tau-a、tau-b和tau-c,都是适宜于分析对称的

44、关系。tau系数的基本逻辑,是计算同序对数与异序对数之差在全部的可能对数中所占的比例。公式如下:tau系数计算公式区别tau-av-乂tau-a -2,如果在两个变项上都没有同分对,则tau- a的统计值是由-1至+1。tau-bhNf_如有同分对,可用laub,只有在交互分类表行数与列数相同(即r=c)的情况下,tau-b系数值才由-1至+1 otau-c2m(N -N八tau-c ;一i-无论有无同分对和无论行数与列数是多少,tau- c系数值都是由-1至+1。tau系数中以tau- c最常适合社会学研究,但tau-c没有消减误差比例的含义。其中凡是同序对数,M是异序对数,”是全部个案数目

45、,m 是交互分类表的行数(r)与列数(c)中的较小者。(2)斯皮尔曼rho系数斯皮尔曼rho系数的特点是在计算每个个案在两个变项上的等级时,不仅要区别二者的高低差异,而且还要计算二者差异的确切数值。这个公式的基本逻辑,是求出在最大可能的=-等级差异总值中,实际的等级差异所占的比例是多少。公式如下:其中D表示每个个案在两列级序上的差异值,”表示全部个案数目。D-可以避免正负值相抵消。rho是对称相关测量法。其统计值是由-1至+1,表示相关的程度和方向,其平方值可以有消减误差比例的意义。三、两个定距变项:简单线性如果所研究的变项都是属于定距测量层次,可以用简单线性回归分析法来以自变项的数值预测或估计依变项的数值,而用积矩相关系数来测量两个变项的相关程度和方向。1 .简单线性回归分析(1)简单线性回归分析法是指根据一个直线方程式,以一个自变项(X)的数值来预测Y= bX+a一个依变项(丫)的数值。方程式为:其中X是自变项数值;方是回归系数,表示回归线的斜率;4是截距,即回归线与y轴的交点;尸是根据回归方程式所预测的y变项值。(2)回归法在绘制回归线时所根据的准则是最小平方,依此推算出回归直线的位置。其斜率(b)与截距(a)的数值如下:

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁