《社会学研究方法分析和综合之定量(统计)分析课件.ppt》由会员分享,可在线阅读,更多相关《社会学研究方法分析和综合之定量(统计)分析课件.ppt(79页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、社会学社会学-研究方法研究方法分析和综合之定量(统计)分析和综合之定量(统计)分析分析n所谓所谓定量(统计)分析定量(统计)分析,就是对社会研究收,就是对社会研究收集来的数据资料进行计算、统计检验、分析集来的数据资料进行计算、统计检验、分析解释,并以此为依据,做出科学推断,揭示解释,并以此为依据,做出科学推断,揭示社会现象中所蕴涵的规律的一种方法。社会现象中所蕴涵的规律的一种方法。n统计分析包括统计分析包括描述统计描述统计和和推断统计推断统计两种类型。两种类型。n统计分析方法的内容还可以根据变量的多少统计分析方法的内容还可以根据变量的多少划分为划分为单变量分析单变量分析、双变量分析双变量分析和
2、和多变量分多变量分析析,前两者可称为,前两者可称为初等统计初等统计,后者可称为,后者可称为高高等统计等统计。1.描述统计描述统计描述统计描述统计描述统计描述统计主要是对所收集的资料进行整理、分主要是对所收集的资料进行整理、分主要是对所收集的资料进行整理、分主要是对所收集的资料进行整理、分类和简化,描述数据的全貌以表明研究对象的类和简化,描述数据的全貌以表明研究对象的类和简化,描述数据的全貌以表明研究对象的类和简化,描述数据的全貌以表明研究对象的某些特性。某些特性。某些特性。某些特性。描述统计包括数据的初步整理,数据集中趋势描述统计包括数据的初步整理,数据集中趋势描述统计包括数据的初步整理,数据
3、集中趋势描述统计包括数据的初步整理,数据集中趋势和离散趋势以及相关系数的度量等方面。和离散趋势以及相关系数的度量等方面。和离散趋势以及相关系数的度量等方面。和离散趋势以及相关系数的度量等方面。描述统计的目的在于使杂乱无章的数据更清晰描述统计的目的在于使杂乱无章的数据更清晰描述统计的目的在于使杂乱无章的数据更清晰描述统计的目的在于使杂乱无章的数据更清晰直观地显示研究对象的特征,以利于进一步分直观地显示研究对象的特征,以利于进一步分直观地显示研究对象的特征,以利于进一步分直观地显示研究对象的特征,以利于进一步分析。析。析。析。1.描述统计描述统计(1)描述统计的基本技术)描述统计的基本技术(2)集
4、中趋势测量)集中趋势测量(3)离散趋势测量)离散趋势测量(1)描述统计的基本技术)描述统计的基本技术频数频数频数频数(FrequencyFrequency):也称为次数,它是指分布:也称为次数,它是指分布:也称为次数,它是指分布:也称为次数,它是指分布在各类别中的数据个数。在各类别中的数据个数。在各类别中的数据个数。在各类别中的数据个数。频数分布频数分布频数分布频数分布(Frequency DistributionFrequency Distribution):是指一组:是指一组:是指一组:是指一组数据中取不同值的个案的次数分布情况,它一数据中取不同值的个案的次数分布情况,它一数据中取不同值的
5、个案的次数分布情况,它一数据中取不同值的个案的次数分布情况,它一般是以般是以般是以般是以频数分布表频数分布表频数分布表频数分布表的形式表达。的形式表达。的形式表达。的形式表达。频数分布表的作用频数分布表的作用频数分布表的作用频数分布表的作用:简化资料。将调查得到的杂乱的原始数据简化资料。将调查得到的杂乱的原始数据简化资料。将调查得到的杂乱的原始数据简化资料。将调查得到的杂乱的原始数据,以十以十以十以十分简洁的统计表反映出来分简洁的统计表反映出来分简洁的统计表反映出来分简洁的统计表反映出来.清楚地了解调查数据的众多信息。清楚地了解调查数据的众多信息。清楚地了解调查数据的众多信息。清楚地了解调查数
6、据的众多信息。(1)描述统计的基本技术)描述统计的基本技术频率分布频率分布频率分布频率分布(P(P(P(Percentages Distributionercentages Distribution):是一组:是一组:是一组:是一组数据中不同取值的频数相对于总数的比率分布数据中不同取值的频数相对于总数的比率分布数据中不同取值的频数相对于总数的比率分布数据中不同取值的频数相对于总数的比率分布情况。这种比率在社会调查中经常是以百分比情况。这种比率在社会调查中经常是以百分比情况。这种比率在社会调查中经常是以百分比情况。这种比率在社会调查中经常是以百分比的形式来表达。的形式来表达。的形式来表达。的形式
7、来表达。频率分布表频率分布表频率分布表频率分布表:是不同类别在总体中的相对数量:是不同类别在总体中的相对数量:是不同类别在总体中的相对数量:是不同类别在总体中的相对数量分布。它十分便于不同总体和不同类别之间的分布。它十分便于不同总体和不同类别之间的分布。它十分便于不同总体和不同类别之间的分布。它十分便于不同总体和不同类别之间的比较。比较。比较。比较。(1)描述统计的基本技术)描述统计的基本技术统计表统计表统计表统计表:表示被说明的事物及其统计指标和数:表示被说明的事物及其统计指标和数:表示被说明的事物及其统计指标和数:表示被说明的事物及其统计指标和数值的表格。值的表格。值的表格。值的表格。统计
8、表的种类统计表的种类统计表的种类统计表的种类 按总体分组的情况分:按总体分组的情况分:按总体分组的情况分:按总体分组的情况分:简单表(简单表(简单表(简单表(P272P272表表表表11-1011-10)分组表分组表分组表分组表 单项分组表(单项分组表(单项分组表(单项分组表(P269P269表表表表11-611-6)组距分组表(组距分组表(组距分组表(组距分组表(P269P269表表表表11-711-7)复合表(又称交互分类表)复合表(又称交互分类表)复合表(又称交互分类表)复合表(又称交互分类表)P271P271表表表表11-911-9(1)描述统计的基本技术)描述统计的基本技术统计表的结
9、构统计表的结构统计表的结构统计表的结构 从外表形式上看,统计表由从外表形式上看,统计表由从外表形式上看,统计表由从外表形式上看,统计表由表号表号表号表号、总标题总标题总标题总标题(上(上(上(上端中部)、端中部)、端中部)、端中部)、横行标题横行标题横行标题横行标题(左端)、(左端)、(左端)、(左端)、纵栏标题纵栏标题纵栏标题纵栏标题(表(表(表(表上方)、上方)、上方)、上方)、指标数值指标数值指标数值指标数值、注释注释注释注释和和和和资料来源资料来源资料来源资料来源等要素组等要素组等要素组等要素组成。成。成。成。从内容上看,统计表由从内容上看,统计表由从内容上看,统计表由从内容上看,统计
10、表由主词主词主词主词和和和和宾词宾词宾词宾词两部分构成。两部分构成。两部分构成。两部分构成。P271P271表表表表11-811-8(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图 统计图是利用统计资料绘制成的几何图形或具统计图是利用统计资料绘制成的几何图形或具统计图是利用统计资料绘制成的几何图形或具统计图是利用统计资料绘制成的几何图形或具体形象,它可以从数量方面显示出研究对象的体形象,它可以从数量方面显示出研究对象的体形象,它可以从数量方面显示出研究对象的体形象,它可以从数量方面显示出研究对象的规模、水平、结构、发展趋势和比例关系,是规模、水平、结构、发展趋势和比例关系,
11、是规模、水平、结构、发展趋势和比例关系,是规模、水平、结构、发展趋势和比例关系,是表现统计资料的一种重要形式。表现统计资料的一种重要形式。表现统计资料的一种重要形式。表现统计资料的一种重要形式。(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图条形图条形图条形图条形图 条形图条形图条形图条形图是用宽度相同的直条的高低或长短来表是用宽度相同的直条的高低或长短来表是用宽度相同的直条的高低或长短来表是用宽度相同的直条的高低或长短来表示各项统计指标数值大小的图形。示各项统计指标数值大小的图形。示各项统计指标数值大小的图形。示各项统计指标数值大小的图形。根据条形图表现统计资料内容的不同
12、,条形图根据条形图表现统计资料内容的不同,条形图根据条形图表现统计资料内容的不同,条形图根据条形图表现统计资料内容的不同,条形图又分为又分为又分为又分为单式条形图单式条形图单式条形图单式条形图、复式条形图复式条形图复式条形图复式条形图和和和和结构条形图结构条形图结构条形图结构条形图。(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图饼形图饼形图饼形图饼形图 饼形图饼形图饼形图饼形图通常是以圆形面积或以圆内各扇形面积通常是以圆形面积或以圆内各扇形面积通常是以圆形面积或以圆内各扇形面积通常是以圆形面积或以圆内各扇形面积的大小来表示统计指标数值大小的图形。的大小来表示统计指标数值大
13、小的图形。的大小来表示统计指标数值大小的图形。的大小来表示统计指标数值大小的图形。(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图直方图直方图直方图直方图 直方图直方图直方图直方图是由紧挨着的长条构成的,与条形图不是由紧挨着的长条构成的,与条形图不是由紧挨着的长条构成的,与条形图不是由紧挨着的长条构成的,与条形图不同的是,它的条的宽度是有意义的,实际上它同的是,它的条的宽度是有意义的,实际上它同的是,它的条的宽度是有意义的,实际上它同的是,它的条的宽度是有意义的,实际上它不是用长条的高度而是用长条的面积表示频率不是用长条的高度而是用长条的面积表示频率不是用长条的高度而是用长
14、条的面积表示频率不是用长条的高度而是用长条的面积表示频率的大小,长条的纵轴高度表示频率密度(频率的大小,长条的纵轴高度表示频率密度(频率的大小,长条的纵轴高度表示频率密度(频率的大小,长条的纵轴高度表示频率密度(频率密度密度密度密度=频率频率频率频率/组距),长条的宽度表示组距。组距),长条的宽度表示组距。组距),长条的宽度表示组距。组距),长条的宽度表示组距。某班统计学考试成绩分布图2101518505101520 成绩(分)60708090100人数(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图折线图折线图折线图折线图 折线图折线图折线图折线图是用直线连接直方图中条形
15、顶端的中点是用直线连接直方图中条形顶端的中点是用直线连接直方图中条形顶端的中点是用直线连接直方图中条形顶端的中点而成的。当组距逐渐减小时,折线将逐渐变为而成的。当组距逐渐减小时,折线将逐渐变为而成的。当组距逐渐减小时,折线将逐渐变为而成的。当组距逐渐减小时,折线将逐渐变为平滑,趋向为曲线。平滑,趋向为曲线。平滑,趋向为曲线。平滑,趋向为曲线。(某班统计学考试成绩折线图210151850510152095 成绩(分)人数060708090100(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图线性图线性图线性图线性图 线性图线性图线性图线性图:表示两个变量之间的函数关系的曲线:
16、表示两个变量之间的函数关系的曲线:表示两个变量之间的函数关系的曲线:表示两个变量之间的函数关系的曲线图,可以表明事物的发展规律、总体单位的分图,可以表明事物的发展规律、总体单位的分图,可以表明事物的发展规律、总体单位的分图,可以表明事物的发展规律、总体单位的分配情况、揭示事物间的依存关系或表明计划执配情况、揭示事物间的依存关系或表明计划执配情况、揭示事物间的依存关系或表明计划执配情况、揭示事物间的依存关系或表明计划执行的进度。行的进度。行的进度。行的进度。1.描述统计描述统计(1)描述统计的基本技术)描述统计的基本技术(2)集中趋势测量)集中趋势测量(3)离散趋势测量)离散趋势测量(2)集中趋
17、势测量)集中趋势测量集中趋势分析集中趋势分析集中趋势分析集中趋势分析:是从一组数据中抽象出一个代:是从一组数据中抽象出一个代:是从一组数据中抽象出一个代:是从一组数据中抽象出一个代表值,以代表现象的共性和一般水平。表值,以代表现象的共性和一般水平。表值,以代表现象的共性和一般水平。表值,以代表现象的共性和一般水平。除可以说明某一社会现象在一定条件下数量的除可以说明某一社会现象在一定条件下数量的除可以说明某一社会现象在一定条件下数量的除可以说明某一社会现象在一定条件下数量的一般水平外;集中趋势还可以对不同空间的同一般水平外;集中趋势还可以对不同空间的同一般水平外;集中趋势还可以对不同空间的同一般
18、水平外;集中趋势还可以对不同空间的同类现象或同一现象在不同时间的状态进行比较;类现象或同一现象在不同时间的状态进行比较;类现象或同一现象在不同时间的状态进行比较;类现象或同一现象在不同时间的状态进行比较;以及分析某些社会现象之间的依存关系。以及分析某些社会现象之间的依存关系。以及分析某些社会现象之间的依存关系。以及分析某些社会现象之间的依存关系。最常见的集中量数有最常见的集中量数有最常见的集中量数有最常见的集中量数有算术平均数算术平均数算术平均数算术平均数(简称平均数,(简称平均数,(简称平均数,(简称平均数,也称为均值)、也称为均值)、也称为均值)、也称为均值)、众数众数众数众数和和和和中位
19、数中位数中位数中位数三种。三种。三种。三种。(2)集中趋势测量)集中趋势测量众数众数众数众数 众数众数众数众数是一组数据中出现次数最多是一组数据中出现次数最多是一组数据中出现次数最多是一组数据中出现次数最多(即频数最高即频数最高即频数最高即频数最高)的那个数值的那个数值的那个数值的那个数值,用,用,用,用 MoMo 表示。表示。表示。表示。适用条件:只有集中趋势明显时,才能用众数适用条件:只有集中趋势明显时,才能用众数适用条件:只有集中趋势明显时,才能用众数适用条件:只有集中趋势明显时,才能用众数作为总体的代表值。作为总体的代表值。作为总体的代表值。作为总体的代表值。例:有例:有例:有例:有1
20、616例高血压病人的发病年龄例高血压病人的发病年龄例高血压病人的发病年龄例高血压病人的发病年龄(岁岁岁岁)为:为:为:为:42,45,48,51,52,54,55,55,61,61,62,6242,45,48,51,52,54,55,55,61,61,62,62,试求众数。,试求众数。,试求众数。,试求众数。58,58,58,58(2)集中趋势测量)集中趋势测量众数众数众数众数 需要注意的几个问题:需要注意的几个问题:需要注意的几个问题:需要注意的几个问题:定性数据可以存在众数。定性数据可以存在众数。定性数据可以存在众数。定性数据可以存在众数。众数是一组数据中出现次数最多的数据,是一众数是一组
21、数据中出现次数最多的数据,是一众数是一组数据中出现次数最多的数据,是一众数是一组数据中出现次数最多的数据,是一组数据中的原数据,而不是相应的次数。组数据中的原数据,而不是相应的次数。组数据中的原数据,而不是相应的次数。组数据中的原数据,而不是相应的次数。例例例例 对于某些数据而言,例如均匀分布,并不存在对于某些数据而言,例如均匀分布,并不存在对于某些数据而言,例如均匀分布,并不存在对于某些数据而言,例如均匀分布,并不存在众数。众数。众数。众数。如,原始数据如,原始数据如,原始数据如,原始数据:10 5 9 12 6 8:10 5 9 12 6 8 对于某些数据存在两个或多于两个的众数。对于某些
22、数据存在两个或多于两个的众数。对于某些数据存在两个或多于两个的众数。对于某些数据存在两个或多于两个的众数。如,如,如,如,原始数据原始数据原始数据原始数据:25 :25 28 2828 28 36 36 42 4242 42(2)集中趋势测量)集中趋势测量众数众数众数众数 众数的计算方法众数的计算方法众数的计算方法众数的计算方法(1 1)单项数列确定众数,即出现次数最多(频率)单项数列确定众数,即出现次数最多(频率)单项数列确定众数,即出现次数最多(频率)单项数列确定众数,即出现次数最多(频率最大)的标志值就是众数。最大)的标志值就是众数。最大)的标志值就是众数。最大)的标志值就是众数。(2
23、2)组距数列确定众数:在等距数列条件下,先)组距数列确定众数:在等距数列条件下,先)组距数列确定众数:在等距数列条件下,先)组距数列确定众数:在等距数列条件下,先确定众数组,然后再通过公式进行具体计算,确定众数组,然后再通过公式进行具体计算,确定众数组,然后再通过公式进行具体计算,确定众数组,然后再通过公式进行具体计算,找出众数点的标志值。找出众数点的标志值。找出众数点的标志值。找出众数点的标志值。(2)集中趋势测量)集中趋势测量众数众数众数众数 计算公式:计算公式:计算公式:计算公式:是众数所在组的下限;是众数所在组的下限;是众数所在组前一组的次数;是众数所在组前一组的次数;是众数所在组后一
24、组的次数;是众数所在组后一组的次数;是众数所在组的次数;是众数所在组的次数;是众数组的组距。是众数组的组距。按成绩分按成绩分组(分)组(分)学生人数学生人数(人)(人)6060以下以下6069606970797079808980899090以上以上 2 2151519191515 3 3合计合计5454(2)集中趋势测量)集中趋势测量中位数中位数中位数中位数 中位数中位数中位数中位数:将总体单位的某一数量标志的各个数:将总体单位的某一数量标志的各个数:将总体单位的某一数量标志的各个数:将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的那个数值按照大小顺序排列,居于中间位置的那个
25、数值按照大小顺序排列,居于中间位置的那个数值按照大小顺序排列,居于中间位置的那个数值就是中位数。值就是中位数。值就是中位数。值就是中位数。它的含义是全部数据中有一半数值在它之上它的含义是全部数据中有一半数值在它之上它的含义是全部数据中有一半数值在它之上它的含义是全部数据中有一半数值在它之上,另另另另一半数值在它之下。一半数值在它之下。一半数值在它之下。一半数值在它之下。MMd d50%50%50%(2)集中趋势测量)集中趋势测量中位数中位数中位数中位数 计算方法计算方法计算方法计算方法由未分组资料确定中位数由未分组资料确定中位数由未分组资料确定中位数由未分组资料确定中位数 排序:确定中位数位置
26、排序:确定中位数位置排序:确定中位数位置排序:确定中位数位置 奇数:中间位置的标志值为中位数。奇数:中间位置的标志值为中位数。奇数:中间位置的标志值为中位数。奇数:中间位置的标志值为中位数。偶数:中间位置相邻两个变量值的简单平均数偶数:中间位置相邻两个变量值的简单平均数偶数:中间位置相邻两个变量值的简单平均数偶数:中间位置相邻两个变量值的简单平均数是中位数。是中位数。是中位数。是中位数。原始数据原始数据:24 22 21 26 20排排 序序:20 21 22 24 26位位 置置:1 2 3 4 5位置位置位置位置=n+n+1 12 25+15+12 23 3中位数中位数中位数中位数2222
27、原始数据原始数据:10 5 9 12 6 8排排 序序:5 6 8 9 10 12位位 置置:1 2 3 4 5 6位置位置位置位置 n+n+1 12 26+16+12 23.53.5中位数中位数中位数中位数 8+98+92 28.58.5(2)集中趋势测量)集中趋势测量中位数中位数中位数中位数由定序分组资料求中位数由定序分组资料求中位数由定序分组资料求中位数由定序分组资料求中位数中位数的位置为:中位数的位置为:中位数的位置为:中位数的位置为:(300+1)/2(300+1)/2(300+1)/2(300+1)/2150.5150.5150.5150.5从从从从累累累累计计计计频频频频数数数数
28、看看看看,中中中中位位位位数数数数的的的的在在在在“一一一一般般般般”这这这这一一一一组组组组别别别别中。因此中。因此中。因此中。因此 MMd d一般一般一般一般某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 (户户户户)累计频数累计频数累计频数累计频数 非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意24241081089393454530302
29、424132132225225270270300300合计合计合计合计300300(2)集中趋势测量)集中趋势测量中位数中位数中位数中位数由单值分组资料求中位数由单值分组资料求中位数由单值分组资料求中位数由单值分组资料求中位数l先计算中间位置先计算中间位置:(n+1)2=(150+1)2=75.5l再找出其对应值再找出其对应值由组距分组资料求中位数由组距分组资料求中位数由组距分组资料求中位数由组距分组资料求中位数第一步:确定中位数所处位置,按第一步:确定中位数所处位置,按 确定(确定(f f为次数)。为次数)。第二步:采用公式计算第二步:采用公式计算n n上限法:用上限法:用“以上累计以上累计
30、”法确定中位数。法确定中位数。n n下限法:用下限法:用“以下累计以下累计”法确定中位数。法确定中位数。n n其中:其中:U U是中位数所在组的上限,是中位数所在组的上限,L L是中位数所在组的下限,是中位数所在组的下限,f fmm是中位是中位数所在组的次数,数所在组的次数,S Sm+1m+1是中位数所在组后面各组累计数,是中位数所在组后面各组累计数,S Sm-1m-1是中位是中位数所在组前面各组累计数,数所在组前面各组累计数,i i是中位数所在组的组距。是中位数所在组的组距。(2)集中趋势测量)集中趋势测量算术平均数(算术平均数(算术平均数(算术平均数(The Arithmetic Mean
31、The Arithmetic Mean)简称简称简称简称均数均数均数均数(MeanMean)或)或)或)或均值均值均值均值,定义为所有测量值,定义为所有测量值,定义为所有测量值,定义为所有测量值之和除以变量值个数(即,样本含量之和除以变量值个数(即,样本含量之和除以变量值个数(即,样本含量之和除以变量值个数(即,样本含量Sample Sample SizeSize)。反映一组呈对称分布的变量值在数量)。反映一组呈对称分布的变量值在数量)。反映一组呈对称分布的变量值在数量)。反映一组呈对称分布的变量值在数量上的平均水平。上的平均水平。上的平均水平。上的平均水平。(2)集中趋势测量)集中趋势测量算
32、术平均数(算术平均数(算术平均数(算术平均数(The Arithmetic MeanThe Arithmetic Mean)直接计算法直接计算法直接计算法直接计算法计算公式计算公式 :例:试计算例:试计算1,3,7,9的均数?的均数?(2)集中趋势测量)集中趋势测量算术平均数(算术平均数(算术平均数(算术平均数(The Arithmetic MeanThe Arithmetic Mean)加权算术平均法加权算术平均法加权算术平均法加权算术平均法当数据已分当数据已分当数据已分当数据已分组组组组,形成了,形成了,形成了,形成了变变变变量数列:量数列:量数列:量数列:成绩成绩成绩成绩 x x人数人数
33、人数人数 f f 7070808085851 12 22 2合计合计合计合计5 5平均成绩(70+80+85)/3?平均成绩所有人的成绩总和/总人数 (70+80*2+85*2)/580(2)集中趋势测量)集中趋势测量算术平均数(算术平均数(算术平均数(算术平均数(The Arithmetic MeanThe Arithmetic Mean)加权算术平均法加权算术平均法加权算术平均法加权算术平均法 计算公式计算公式计算公式计算公式n例:由单值分组求算术平均值例:由单值分组求算术平均值工人日产量(件)工人日产量(件)工人日产量(件)工人日产量(件)工人人数(人)工人人数(人)工人人数(人)工人人
34、数(人)工人人数比重(工人人数比重(工人人数比重(工人人数比重(%)10 10 11 11 12 12 13 13 14 14 70 70150150380380150150100100 8.75 8.75 12.50 12.50 47.50 47.50 18725 18725 12.50 12.50合合合合 计计计计800800100.00100.00n平均指标的种类平均指标的种类平平平平均均均均指指指指标标标标静态平均数静态平均数动态平均数动态平均数位置平均数位置平均数数值平均数数值平均数几何平均数几何平均数调和平均数调和平均数算术平均数算术平均数中位数中位数众数众数n集中趋势集中趋势(C
35、entral tendency)平均指标平均指标一组数据向其中心值靠拢的倾向和程度;一组数据向其中心值靠拢的倾向和程度;一组数据向其中心值靠拢的倾向和程度;一组数据向其中心值靠拢的倾向和程度;测度集中趋势就是寻找数据一般水平的代表值测度集中趋势就是寻找数据一般水平的代表值测度集中趋势就是寻找数据一般水平的代表值测度集中趋势就是寻找数据一般水平的代表值或中心值;或中心值;或中心值;或中心值;不同类型的数据用不同的集中趋势测度值;不同类型的数据用不同的集中趋势测度值;不同类型的数据用不同的集中趋势测度值;不同类型的数据用不同的集中趋势测度值;选用哪一个测度值来反映数据的集中趋势,要选用哪一个测度值
36、来反映数据的集中趋势,要选用哪一个测度值来反映数据的集中趋势,要选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定。根据所掌握的数据的类型来确定。根据所掌握的数据的类型来确定。根据所掌握的数据的类型来确定。n众数、中位数、平均数的特点和应用众数、中位数、平均数的特点和应用 众数众数众数众数 不受极端值影响不受极端值影响不受极端值影响不受极端值影响 具有不惟一性具有不惟一性具有不惟一性具有不惟一性 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 中位数中位数中位数中位数 不受极端值影响不受极端值影响不受极端值影响不受极端
37、值影响 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 平均数平均数平均数平均数 易受极端值影响易受极端值影响易受极端值影响易受极端值影响 数学性质优良数学性质优良数学性质优良数学性质优良 数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用左偏分布左偏分布左偏分布左偏分布均值均值均值均值 中位数中位数中位数中位数 众数众数众数众数对称分布对称分布对称分布对称分布 均值均值均值均值=中位数中位数中位数中位数=众数众数众数众数右偏分布右偏分布右偏分布右偏分布众数众
38、数众数众数 中位数中位数中位数中位数 均值均值均值均值众数、中位数和平均数的关系图示众数、中位数和平均数的关系图示众数、中位数和平均数的关系图示众数、中位数和平均数的关系图示中位数、众数和平均数之间的数量关系决定中位数、众数和平均数之间的数量关系决定中位数、众数和平均数之间的数量关系决定中位数、众数和平均数之间的数量关系决定于总体内次数分配的状况。于总体内次数分配的状况。于总体内次数分配的状况。于总体内次数分配的状况。1.描述统计描述统计(1)描述统计的基本技术)描述统计的基本技术(2)集中趋势测量)集中趋势测量(3)离散趋势测量)离散趋势测量(3)离散趋势测量)离散趋势测量所谓所谓所谓所谓离
39、散趋势(又称离中趋势)离散趋势(又称离中趋势)离散趋势(又称离中趋势)离散趋势(又称离中趋势),是指数列中,是指数列中,是指数列中,是指数列中各变量值之间的差距和离散程度。各变量值之间的差距和离散程度。各变量值之间的差距和离散程度。各变量值之间的差距和离散程度。离势小,平均数的代表性高;离势大,平均数离势小,平均数的代表性高;离势大,平均数离势小,平均数的代表性高;离势大,平均数离势小,平均数的代表性高;离势大,平均数代表性低。代表性低。代表性低。代表性低。离中趋势(差异程度)离中趋势(差异程度)离中趋势(差异程度)离中趋势(差异程度)变异指标变异指标变异指标变异指标变异指标变异指标变异指标变
40、异指标用以反映总体各单位标志值的变动范用以反映总体各单位标志值的变动范用以反映总体各单位标志值的变动范用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个围或参差程度,与平均指标相对应,从另一个围或参差程度,与平均指标相对应,从另一个围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特征。侧面反映了总体的特征。侧面反映了总体的特征。侧面反映了总体的特征。(3)离散趋势测量)离散趋势测量全距全距全距全距(极差极差极差极差Range)Range)R=R=最大值最大值最大值最大值 最小值最小值最小值最小值(R=XR=Xmaxmax X Xminmin)优、缺点优、缺点优、缺
41、点优、缺点 计算简便,意义清楚,但反映现象的差异程度计算简便,意义清楚,但反映现象的差异程度计算简便,意义清楚,但反映现象的差异程度计算简便,意义清楚,但反映现象的差异程度较粗略,实用价值甚小。较粗略,实用价值甚小。较粗略,实用价值甚小。较粗略,实用价值甚小。(3)离散趋势测量)离散趋势测量异众比率异众比率异众比率异众比率所谓异众比率,是指非众数的频数与总体单位数的比值,用所谓异众比率,是指非众数的频数与总体单位数的比值,用所谓异众比率,是指非众数的频数与总体单位数的比值,用所谓异众比率,是指非众数的频数与总体单位数的比值,用VRVR来表示来表示来表示来表示 其中:其中:其中:其中:f fmo
42、mo为众数的频数;为众数的频数;为众数的频数;为众数的频数;n n是总体单位数是总体单位数是总体单位数是总体单位数 异众比率能表明众数所不能代表的那一异众比率能表明众数所不能代表的那一异众比率能表明众数所不能代表的那一异众比率能表明众数所不能代表的那一部分变量值在总体中的比重。部分变量值在总体中的比重。部分变量值在总体中的比重。部分变量值在总体中的比重。例:根据下表中的数据,计算例:根据下表中的数据,计算异众比率。异众比率。某城市居民关注广告类型的频数分布解:根据公式,得广告类型广告类型广告类型广告类型人数人数人数人数(人)(人)(人)(人)频率频率频率频率(%)(%)商品广告商品广告商品广告
43、商品广告 112 112 112 112 56.0 56.0 56.0 56.0 服务广告服务广告服务广告服务广告 51 51 51 51 25.5 25.5 25.5 25.5 金融广告金融广告金融广告金融广告 9 9 9 9 4.5 4.5 4.5 4.5 房地产广告房地产广告房地产广告房地产广告 16 16 16 16 8.0 8.0 8.0 8.0 招生招聘广告招生招聘广告招生招聘广告招生招聘广告 10 10 10 10 5.0 5.0 5.0 5.0 其他广告其他广告其他广告其他广告 2 2 2 2 1.0 1.0 1.0 1.0 合计合计合计合计 200 200 200 200 1
44、00.0 100.0 100.0 100.0 这说这说这说这说明在所明在所明在所明在所调查调查调查调查的的的的200 200 人人人人当中,关注非商品广告的当中,关注非商品广告的当中,关注非商品广告的当中,关注非商品广告的人数占人数占人数占人数占44%44%,即关注商品,即关注商品,即关注商品,即关注商品广告的人数占广告的人数占广告的人数占广告的人数占 56%56%。由于。由于。由于。由于异众比率异众比率异众比率异众比率值较值较值较值较大,从而用大,从而用大,从而用大,从而用“商品广告商品广告商品广告商品广告”来反映城市居民来反映城市居民来反映城市居民来反映城市居民对对对对广告关注的一般广告关
45、注的一般广告关注的一般广告关注的一般趋势趋势趋势趋势,代表性代表性代表性代表性还还还还不是很好。不是很好。不是很好。不是很好。(3)离散趋势测量)离散趋势测量异众比率异众比率异众比率异众比率 例:某项调查发现,现今三口之家的家庭最多例:某项调查发现,现今三口之家的家庭最多例:某项调查发现,现今三口之家的家庭最多例:某项调查发现,现今三口之家的家庭最多(32%32%),求异众比率。某开发商根据这一报导,将),求异众比率。某开发商根据这一报导,将),求异众比率。某开发商根据这一报导,将),求异众比率。某开发商根据这一报导,将房屋的户型大部分都设计为适合三口之家居住的样房屋的户型大部分都设计为适合三
46、口之家居住的样房屋的户型大部分都设计为适合三口之家居住的样房屋的户型大部分都设计为适合三口之家居住的样式和面积,你认为如何呢?式和面积,你认为如何呢?式和面积,你认为如何呢?式和面积,你认为如何呢?(3)离散趋势测量)离散趋势测量四分位差四分位差四分位差四分位差(Quartile deviation)(Quartile deviation)四分位数(四分位数(四分位数(四分位数(QuartileQuartile)(三个四分位数)(三个四分位数)(三个四分位数)(三个四分位数)一组数据按从小到大排列时,处于一组数据按从小到大排列时,处于一组数据按从小到大排列时,处于一组数据按从小到大排列时,处于
47、1/41/4位置上的位置上的位置上的位置上的变量值称为第一个四分位数(下四分位数),处变量值称为第一个四分位数(下四分位数),处变量值称为第一个四分位数(下四分位数),处变量值称为第一个四分位数(下四分位数),处于于于于3/43/4位置上的变量值称为第三个四分位数(上位置上的变量值称为第三个四分位数(上位置上的变量值称为第三个四分位数(上位置上的变量值称为第三个四分位数(上四分位数),而中位数就是第二个四分位数。四分位数),而中位数就是第二个四分位数。四分位数),而中位数就是第二个四分位数。四分位数),而中位数就是第二个四分位数。四分位数通常用符号四分位数通常用符号四分位数通常用符号四分位数通
48、常用符号Q Q表示。表示。表示。表示。在未分在未分组时组时下四分位数(下四分位数(Q1)的位置)的位置上四分位数(上四分位数(Q3)的位置)的位置显显然,中然,中间间的四分位数(的四分位数(Q2)就等于)就等于Md。(3)离散)离散趋势测趋势测量量四分位差四分位差四分位差四分位差(Quartile deviation)(Quartile deviation)四分位数的确定四分位数的确定四分位数的确定四分位数的确定例:根据下表中的数据,计算甲城市例:根据下表中的数据,计算甲城市例:根据下表中的数据,计算甲城市例:根据下表中的数据,计算甲城市家庭对住房满意状况评价的四分位数。家庭对住房满意状况评价
49、的四分位数。家庭对住房满意状况评价的四分位数。家庭对住房满意状况评价的四分位数。甲城市家庭对住房状况的评价解:已知解:已知N=300,得,得下四分位数的位置下四分位数的位置上四分位数的位置上四分位数的位置则则根据累根据累积频积频数数Q1=不不满满意,意,Q3=满满意意回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数(户)(户)(户)(户)累积累积累积累积户数户数户数户数(户)(户)(户)(户)非常不满意非常不满意非常不满意非常不满意24242424不满意不满意不满意不满意108108132132一般一般一般一般9393225225满意满意满意满意4545270270非常
50、满意非常满意非常满意非常满意3030300300合计合计合计合计300300(3)离散趋势测量)离散趋势测量四分位差四分位差四分位差四分位差 四分位差是第三四分位数(上四分位数)和第四分位差是第三四分位数(上四分位数)和第四分位差是第三四分位数(上四分位数)和第四分位差是第三四分位数(上四分位数)和第一四分位数(下四分位数)的半距。一四分位数(下四分位数)的半距。一四分位数(下四分位数)的半距。一四分位数(下四分位数)的半距。其作用是避免全距受极端值影响大的缺点。其作用是避免全距受极端值影响大的缺点。其作用是避免全距受极端值影响大的缺点。其作用是避免全距受极端值影响大的缺点。计算公式计算公式计