《心理与教育统计学04.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学04.ppt(35页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、任何事物都没有真正正确的解释,解释是为人们理解而服务的一种媒介。解释的价值是使得他人可以更富有成果地思考。Andreas Buja1第四章第四章 数据离散程度的测度数据离散程度的测度(measures of dispersion)1.数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征2.反映各变量值远离其中心值的程度(离中趋势)反映各变量值远离其中心值的程度(离中趋势)反映各变量值远离其中心值的程度(离中趋势)反映各变量值远离其中心值的程度(离中趋势)3.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧
2、面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度4.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值2 2 4.1 4.1 全距、四分位距与百分位距全距、四分位距与百分位距(顺序数据顺序数据)4.24.2 平均差平均差4.3 4.3 方差与标准差方差与标准差(定量数据定量数据)4.44.4 相对差异量相对差异量4.54.5 偏态量及峰态量偏态量及峰态量内容梗概内容梗概3 3数据分布的特征和测度数据分布的特征和测度数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集
3、中趋势离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值平均差平均差平均差平均差平均差平均差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度百分位距百分位距百分位距百分位距百分位距百分位距四分位距四分位距四分位距四分位距四分位距四分位距偏偏偏偏偏偏 态态态态态态4 44.1 全距与百分位差全距与百分位差5 5全距、极差全距、极差 (range)1.1.一组数据的最大值与最小值之差一组数据的最大值与最小值之差一组数据的最大值与最小值之差一组数据的最大值与最小值之差2.2.离散程度的最简单测度值
4、离散程度的最简单测度值离散程度的最简单测度值离散程度的最简单测度值3.3.易受极端值影响易受极端值影响易受极端值影响易受极端值影响4.4.未考虑数据的分布未考虑数据的分布未考虑数据的分布未考虑数据的分布7 7 8 8 9 910107 7 8 8 9 9 1010 R=max(xi)-min(xi)5.5.计算公式为计算公式为计算公式为计算公式为6 6四分位距的概念四分位距的概念 1.1.依一定顺序排列的一组数据中间部位依一定顺序排列的一组数据中间部位50%个频数距离的一半作为差异量指个频数距离的一半作为差异量指标标2.2.也称为内距或四分间距也称为内距或四分间距3、反映了中间、反映了中间50
5、%数据的离散程度数据的离散程度4.4.不受极端值的影响不受极端值的影响5.5.用于衡量中位数的代表性用于衡量中位数的代表性7 7四分位距的计算方法四分位距的计算方法n n1、原始数据计算方法:、原始数据计算方法:n n例如,例如,25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,求,求四分位距。四分位距。四分位距。四分位距。n n1212、1414、1515、1717、1919、2020、2222、2525、2929、3030、3131、3333、3535、3737、3939、40408 8n n2、频数分布表计算法:、频数分布表计算法:n n用内
6、插法求出第一个四分位数及第三个四用内插法求出第一个四分位数及第三个四分位数,然后带入公式。分位数,然后带入公式。9 9四分位距的应用及其优缺点四分位距的应用及其优缺点n n优点:四分位距简明易懂,计算简便,较少手两优点:四分位距简明易懂,计算简便,较少手两优点:四分位距简明易懂,计算简便,较少手两优点:四分位距简明易懂,计算简便,较少手两极端数值的影响,比全距可靠。极端数值的影响,比全距可靠。极端数值的影响,比全距可靠。极端数值的影响,比全距可靠。n n缺点:忽略了左右共缺点:忽略了左右共缺点:忽略了左右共缺点:忽略了左右共50%50%数据的差异,不适合代数据的差异,不适合代数据的差异,不适合
7、代数据的差异,不适合代数运算。数运算。数运算。数运算。1010三、百分位距三、百分位距n n百分位距是指两个百分位数之差。百分位距是指两个百分位数之差。n n计算方法计算方法:11114.2 平均差、平均差、1212一、平均差的概念一、平均差的概念 1.1.各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数2.2.能全面反映一组数据的离散程度能全面反映一组数据的离散程度能全面反映一组数据的离散程度能全面反映一组数据的离散程度3.3.数学性质较差,实际中应用较少数学性质较差,实际中应用较少数学性质较差,实际中应
8、用较少数学性质较差,实际中应用较少4 4.计算公式为计算公式为计算公式为计算公式为未分组数据未分组数据未分组数据未分组数据组距分组数据组距分组数据组距分组数据组距分组数据1313二、平均差的计算方法二、平均差的计算方法n n1、原始数据计算法:、原始数据计算法:n n例如,求原始数据例如,求原始数据78、83、69、75、97、88、86 的的平均差。平均差。n n2、频数分布表计算法;、频数分布表计算法;1414平均差平均差(例题分析)例例例例4.3 4.3 某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销
9、售量分组按销售量分组组中值组中值(Mi)频数频数(fi)140 150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合计合计12020401515平均差平均差(例题分析)含义:含义:每一天的销售量平均数相比,每一天的销售量平均数相比,平均相差平均相差17台台1616三、三、平均差的优缺点平均差的优缺点17174.2 方差
10、和标准差方差和标准差 1818方差和标准差方差和标准差(variance and standard deviation)1.1.数据离散程度的最常用测度值数据离散程度的最常用测度值2.2.方差是指离差平方的算术平均数方差是指离差平方的算术平均数3.3.反映了各变量值与均值的平均差异反映了各变量值与均值的平均差异4.4.根据总体数据计算的,称为总体方差(根据总体数据计算的,称为总体方差(2 2)或标准差()或标准差();根据样本数据计算的,);根据样本数据计算的,称为样本方差(称为样本方差(s2 2)或标准差()或标准差(s)4 6 8 10 124 6 8 10 12 x x=8.38.319
11、19方差和标准差的计算方法方差和标准差的计算方法n n1、原始数据计算法、原始数据计算法n n2、频数分布表计算法、频数分布表计算法2020样本方差和标准差样本方差和标准差(simple(simple variancevariance and and standard deviationstandard deviation)未分组数据未分组数据未分组数据未分组数据:分组数据:分组数据:分组数据:分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式2121样本标准差样本标准差 (例题分析)例例例例4.4 4.4 某电脑
12、公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)140150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 540302010 01020304050160270320270 0170200240160250合计合计120554002222样本标准差样本标准差 (例题分析)含义:含义:每
13、一天的销售量与平均数相比,每一天的销售量与平均数相比,平均相差平均相差21.49台台2323方差和标准差的性质和意义方差和标准差的性质和意义1.1.一一组组数数据据中中每每个个数数据据都都加加或或减减去去同同一一个个数数后,得到的方差等于原方差。后,得到的方差等于原方差。2.2.一一组组数数据据中中每每个个数数据据都都乘乘以以一一个个数数后后,得得到的方差等于原方差乘以这个数的平方。到的方差等于原方差乘以这个数的平方。3.3.方方差差与与标标准准差差是是表表示示一一组组数数据据离离散散程程度度的的最最好好指指标标。其其值值越越大大,说说明明频频数数分分布布的的离离散散程程度度越越大大,该该组组
14、数数据据较较分分散散;其其值值越越小小,说明频数分布比较集中,离散程度小。说明频数分布比较集中,离散程度小。2424各种差异量的数值关系n nR=6QX=7.5MD=9QD25254.4 相对差异量相对差异量 2626差异系数差异系数(coefficient of variation)1.1.标准差与其相应的均值的百分比标准差与其相应的均值的百分比 CV,也,也称为变异系数。称为变异系数。2.2.对数据相对离散程度的测度。对数据相对离散程度的测度。3.3.消除了数据水平高低和计量单位的影响。消除了数据水平高低和计量单位的影响。4.4.用于对不同组别数据离散程度的比较。用于对不同组别数据离散程度
15、的比较。5.5.计算公式为:计算公式为:2727差异系数的用途差异系数的用途 n n1、比较不同单位资料的差异程度、比较不同单位资料的差异程度n n2、比较单位相同而平均数相差较大的两组、比较单位相同而平均数相差较大的两组资料的差异程度资料的差异程度n n3、可判断特殊差异情况、可判断特殊差异情况2828差异系数差异系数(例题分析)某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)x1销售利润(万元)销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540
16、.064.069.0【例例例例4.5 4.5】某某某某管管管管理理理理局局局局抽抽抽抽查查查查了了了了所所所所属属属属的的的的8 8家家家家企企企企业业业业,其其其其产产产产品品品品销销销销售售售售数据如表。试比较产品销售额与销售利润的离散程度数据如表。试比较产品销售额与销售利润的离散程度数据如表。试比较产品销售额与销售利润的离散程度数据如表。试比较产品销售额与销售利润的离散程度2929差异系数差异系数(例题分析)结结论论:计计算算结结果果表表明明,说说明明产产品品销销售售额额的的离离散散程度小于销售利润的离散程度。程度小于销售利润的离散程度。v v1 1=536.25536.25309.19
17、309.19=0.5770.577v v2 2=32.521532.521523.0923.09=0.7100.7103030经验法则与异常值的取舍经验法则与异常值的取舍n n经验法则表明:当一组数据对称分布时经验法则表明:当一组数据对称分布时经验法则表明:当一组数据对称分布时经验法则表明:当一组数据对称分布时n n约有约有约有约有68%68%的数据在平均数加减的数据在平均数加减的数据在平均数加减的数据在平均数加减1 1个标准差的范围个标准差的范围个标准差的范围个标准差的范围之内之内之内之内n n约有约有约有约有95%95%的数据在平均数加减的数据在平均数加减的数据在平均数加减的数据在平均数加
18、减2 2个标准差的范围个标准差的范围个标准差的范围个标准差的范围之内之内之内之内n n约有约有约有约有99%99%的数据在平均数加减的数据在平均数加减的数据在平均数加减的数据在平均数加减3 3个标准差的范围个标准差的范围个标准差的范围个标准差的范围之内之内之内之内 n n如果数据落在平均数如果数据落在平均数加减加减加减加减3 3个标准差的范围之外,个标准差的范围之外,个标准差的范围之外,个标准差的范围之外,则在整理数据时,可将此数据作为异常值舍弃。则在整理数据时,可将此数据作为异常值舍弃。则在整理数据时,可将此数据作为异常值舍弃。则在整理数据时,可将此数据作为异常值舍弃。3131 不同测度的选
19、用不同测度的选用n n不同类型的数据可供选用的测度不同。不同类型的数据可供选用的测度不同。不同类型的数据可供选用的测度不同。不同类型的数据可供选用的测度不同。n n各种测度都有优缺点各种测度都有优缺点各种测度都有优缺点各种测度都有优缺点。n n集中趋势的测度和离散程度的测度联合使用。集中趋势的测度和离散程度的测度联合使用。集中趋势的测度和离散程度的测度联合使用。集中趋势的测度和离散程度的测度联合使用。n n集中趋势的测度描述的频数分布的典型性,指的是集中趋势的测度描述的频数分布的典型性,指的是集中趋势的测度描述的频数分布的典型性,指的是集中趋势的测度描述的频数分布的典型性,指的是一个点值,离散
20、程度的测度反应频数分布的变异性,一个点值,离散程度的测度反应频数分布的变异性,一个点值,离散程度的测度反应频数分布的变异性,一个点值,离散程度的测度反应频数分布的变异性,是一段距离。前者的代表性如何,可用后者的大小是一段距离。前者的代表性如何,可用后者的大小是一段距离。前者的代表性如何,可用后者的大小是一段距离。前者的代表性如何,可用后者的大小来说明。后者越小说明前者越有代表性。来说明。后者越小说明前者越有代表性。来说明。后者越小说明前者越有代表性。来说明。后者越小说明前者越有代表性。32324.5 偏态量及峰态量偏态量及峰态量n n一、偏态量偏态量n n1、利用算术平均数与众数或中位数的、利用算术平均数与众数或中位数的距离来计算距离来计算n n2、利用动差来计算:、利用动差来计算:3333n n二、峰态量二、峰态量n n1、用两个百分位距来计算:、用两个百分位距来计算:n n2、利用动差来计算:、利用动差来计算:3434结结 束束3535