1 实验数据的收集、整理.ppt

上传人:gsy****95 文档编号:85141060 上传时间:2023-04-10 格式:PPT 页数:61 大小:4.97MB
返回 下载 相关 举报
1 实验数据的收集、整理.ppt_第1页
第1页 / 共61页
1 实验数据的收集、整理.ppt_第2页
第2页 / 共61页
点击查看更多>>
资源描述

《1 实验数据的收集、整理.ppt》由会员分享,可在线阅读,更多相关《1 实验数据的收集、整理.ppt(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第一章第一章 统计数据的收集、整理统计数据的收集、整理教学基本要求:教学基本要求:了解资料的类型;理解次数分布表与次数分布图的概了解资料的类型;理解次数分布表与次数分布图的概念;掌握次数分布表与次数分布图的制作方法。了解念;掌握次数分布表与次数分布图的制作方法。了解常用统计量的种类;理解样本平均数、样本标准差、常用统计量的种类;理解样本平均数、样本标准差、样本变异系数的意义、作用;掌握样本平均数、样本样本变异系数的意义、作用;掌握样本平均数、样本标准差、样本变异系数的计算方法。标准差、样本变异系数的计算方法。教学重点难点:教学重点难点:重点:大样本连续型变数资料的分组方法,次数分布表重点:大样

2、本连续型变数资料的分组方法,次数分布表与次数分布图的制作。样本平均数、样本标准差、样与次数分布图的制作。样本平均数、样本标准差、样本变异系数的意义、作用和计算方法。本变异系数的意义、作用和计算方法。难点:分组数列的确定。样本标准差的统计意义难点:分组数列的确定。样本标准差的统计意义教学建议:教学建议:分组收集资料分组收集资料1一、攻关目标一、攻关目标建立节水型的优质高效农业发展建立节水型的优质高效农业发展模式。模式。提高区域农业水资源利用率及生提高区域农业水资源利用率及生产效率。产效率。为节水条件下农业高效持续发展为节水条件下农业高效持续发展提供技术支持和示范模式。提供技术支持和示范模式。第一

3、章 实验数据的收集、整理n1.1 1.1 资料的分类资料的分类n1.2 1.2 数据的收集数据的收集n1.3 1.3 资料的检查和核对资料的检查和核对n1.4 1.4 资料的整理和分组资料的整理和分组n1.5 1.5 特征数特征数n 1.5.1 1.5.1 平均数平均数n 1.5.2 1.5.2 变异数变异数2一、攻关目标一、攻关目标建立节水型的优质高效农业发展建立节水型的优质高效农业发展模式。模式。提高区域农业水资源利用率及生提高区域农业水资源利用率及生产效率。产效率。为节水条件下农业高效持续发展为节水条件下农业高效持续发展提供技术支持和示范模式。提供技术支持和示范模式。第一节 资料的分类n

4、正确地进行资料的分类是资料整理的前正确地进行资料的分类是资料整理的前提。在调查或试验中,由观察、测量所提。在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分得的数据按其性质的不同,一般可以分为:为:n数量性状资料数量性状资料n质量性状资料质量性状资料 3一、攻关目标一、攻关目标建立节水型的优质高效农业发展建立节水型的优质高效农业发展模式。模式。提高区域农业水资源利用率及生提高区域农业水资源利用率及生产效率。产效率。为节水条件下农业高效持续发展为节水条件下农业高效持续发展提供技术支持和示范模式。提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n一、数量性状资料一、数量性状

5、资料n n能由计数和量测的方式获得的性状能由计数和量测的方式获得的性状数量资料为数量资料为数量性状资料数量性状资料。因数量。因数量性状性状(quantitative trait)的度量有的度量有计数和量测两种方式,其所得数据计数和量测两种方式,其所得数据不同。不同。4一、攻关目标一、攻关目标建立节水型的优质高效农业发展建立节水型的优质高效农业发展模式。模式。提高区域农业水资源利用率及生提高区域农业水资源利用率及生产效率。产效率。为节水条件下农业高效持续发展为节水条件下农业高效持续发展提供技术支持和示范模式。提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n n1、连续型数据连续型数据

6、(continuous variable):指由称量、度量或测):指由称量、度量或测量、分析化验等方法所得到的数据。量、分析化验等方法所得到的数据。其各个变量并不仅限于整数,在两其各个变量并不仅限于整数,在两个相邻数值之间可以有微量差异的个相邻数值之间可以有微量差异的其他数值存在。其他数值存在。n n例如:测定粒重,产量、株高、长例如:测定粒重,产量、株高、长度、营养元素的含量等。度、营养元素的含量等。5一、攻关目标一、攻关目标建立节水型的优质高效农业发展建立节水型的优质高效农业发展模式。模式。提高区域农业水资源利用率及生提高区域农业水资源利用率及生产效率。产效率。为节水条件下农业高效持续发展

7、为节水条件下农业高效持续发展提供技术支持和示范模式。提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n n2、间断型数据、间断型数据(discrete variable):):是指由是指由计数计数方法所获得的数据,其各个方法所获得的数据,其各个数据必须以数据必须以整数整数表示,在两个相邻的整表示,在两个相邻的整数间不能有带小数的数值存在。由于两数间不能有带小数的数值存在。由于两个整数间是不连续的故称为不连续型或个整数间是不连续的故称为不连续型或间断型数据。间断型数据。n n如动物头数、穗数、每穗粒数等。如动物头数、穗数、每穗粒数等。6一、攻关目标一、攻关目标建立节水型的优质高效农业发

8、展建立节水型的优质高效农业发展模式。模式。提高区域农业水资源利用率及生提高区域农业水资源利用率及生产效率。产效率。为节水条件下农业高效持续发展为节水条件下农业高效持续发展提供技术支持和示范模式。提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n二、质量性状资料二、质量性状资料n质量性状质量性状(qualitative trait)指能观察而不能指能观察而不能量测的性状,即属性性状,如肤色,花、子粒量测的性状,即属性性状,如肤色,花、子粒等器官的颜色,绒毛的有无等。等器官的颜色,绒毛的有无等。n由只能观察描述或感觉而难以量测的性状获得由只能观察描述或感觉而难以量测的性状获得的数量资料为

9、的数量资料为质量性状资料质量性状资料。这些性状本身不。这些性状本身不能以数字来表示,要获得这类性状的数量资料,能以数字来表示,要获得这类性状的数量资料,可采用下列两种方法进行数量化可采用下列两种方法进行数量化:7一、攻关目标一、攻关目标建立节水型的优质高效农业发展建立节水型的优质高效农业发展模式。模式。提高区域农业水资源利用率及生提高区域农业水资源利用率及生产效率。产效率。为节水条件下农业高效持续发展为节水条件下农业高效持续发展提供技术支持和示范模式。提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n1.统计次数法统计次数法 在一定总体或样本内,统计其在一定总体或样本内,统计其具有某

10、个性状的个体数目及具有不同性状的个具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数,以次数体数目,按类别计其次数或相对次数,以次数作为质量性状的数据。作为质量性状的数据。n例如在例如在320株水稻植株中有株水稻植株中有240株为紫色柱头株为紫色柱头的,的,80株黄色柱头的。这类由质量性状数量株黄色柱头的。这类由质量性状数量化得来的资料也称为化得来的资料也称为次数次数(或频次或频次)资料资料。8一、攻关目标一、攻关目标建立节水型的优质高效农业发展建立节水型的优质高效农业发展模式。模式。提高区域农业水资源利用率及生提高区域农业水资源利用率及生产效率。产效率。为节水条件下农业

11、高效持续发展为节水条件下农业高效持续发展提供技术支持和示范模式。提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n2.给予每类性状以相对数量的方法给予每类性状以相对数量的方法(给分法给分法)对某一质量性状,因其类别不同,分别给予不对某一质量性状,因其类别不同,分别给予不同的级别或分值,例如,小麦子粒颜色有白有同的级别或分值,例如,小麦子粒颜色有白有红,可令白色的数量值为红,可令白色的数量值为0,呈红色的数量值,呈红色的数量值为为1。从这类变异所得资料,处理方法同间断。从这类变异所得资料,处理方法同间断型变数资料。型变数资料。9第二节 数据的收集n1、数据的收集方法、数据的收集方法:n

12、 调查调查n 试验试验n2、收集数据的要求、收集数据的要求:n1.突出研究目的突出研究目的n2.严格执行研究方案严格执行研究方案n3.控制误差控制误差10一、攻关目标一、攻关目标第三节 资料的检查和核对 检查和核对原始资料的目的在于确保原始资料的检查和核对原始资料的目的在于确保原始资料的完整性完整性和和正确性正确性。完整性完整性是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。正确性正确性是指原始资料的测量和记载无差错或未进行不合是指原始资料的测量和记载无差错或未进行不合理的归并。理的归并。要特别注意特大、特小和异常数据;要特别注意特大、特小和异常数据;有重复、异常或遗漏的资料有重复、异常或

13、遗漏的资料 ,应予以删除或补齐,应予以删除或补齐;有错误、相互矛盾的资料应进行更正,必要时复查。有错误、相互矛盾的资料应进行更正,必要时复查。资料的检查与核对工作虽然简单,但却是一项非常重要资料的检查与核对工作虽然简单,但却是一项非常重要的步骤,只有完整、正确的资料,才能真实地反映出调查或的步骤,只有完整、正确的资料,才能真实地反映出调查或试验的客观情况,才能经过统计分析得出正确的结论。试验的客观情况,才能经过统计分析得出正确的结论。11第四节 资料的整理和分组n n试验或调查研究所得资料,经检查核对后,根据试验或调查研究所得资料,经检查核对后,根据试验或调查研究所得资料,经检查核对后,根据试

14、验或调查研究所得资料,经检查核对后,根据资料中观测值的多少确定是否分组。资料中观测值的多少确定是否分组。资料中观测值的多少确定是否分组。资料中观测值的多少确定是否分组。n n当观测值不多当观测值不多当观测值不多当观测值不多(n30n30)时,不必分组,直接进行时,不必分组,直接进行时,不必分组,直接进行时,不必分组,直接进行统计分析。统计分析。统计分析。统计分析。n n倘包含很多观察值,未加整理很难得到明确的概倘包含很多观察值,未加整理很难得到明确的概倘包含很多观察值,未加整理很难得到明确的概倘包含很多观察值,未加整理很难得到明确的概念。如果把这些观察值按数值大小或数据的类别进念。如果把这些观

15、察值按数值大小或数据的类别进念。如果把这些观察值按数值大小或数据的类别进念。如果把这些观察值按数值大小或数据的类别进行分组,制成不同组别或不同分类单位的频数分布行分组,制成不同组别或不同分类单位的频数分布行分组,制成不同组别或不同分类单位的频数分布行分组,制成不同组别或不同分类单位的频数分布表,就可以看出资料中不同表现的观察值与其频率表,就可以看出资料中不同表现的观察值与其频率表,就可以看出资料中不同表现的观察值与其频率表,就可以看出资料中不同表现的观察值与其频率间的规律性,即可以看出资料的频率分布的初步情间的规律性,即可以看出资料的频率分布的初步情间的规律性,即可以看出资料的频率分布的初步情

16、间的规律性,即可以看出资料的频率分布的初步情况,从而对资料得到一个初步概念,以便统计分析。况,从而对资料得到一个初步概念,以便统计分析。况,从而对资料得到一个初步概念,以便统计分析。况,从而对资料得到一个初步概念,以便统计分析。12一、攻关目标一、攻关目标第四节 资料的整理和分组n n一、次一、次一、次一、次(频频频频)数分布表的编制数分布表的编制数分布表的编制数分布表的编制n n将数据可能出现的整个范围化分成若干个互斥的将数据可能出现的整个范围化分成若干个互斥的将数据可能出现的整个范围化分成若干个互斥的将数据可能出现的整个范围化分成若干个互斥的组区间,再统计出现在各个组区间内的数据个数组区间

17、,再统计出现在各个组区间内的数据个数组区间,再统计出现在各个组区间内的数据个数组区间,再统计出现在各个组区间内的数据个数(次数),可以发现数据都有着一定的分布规律。(次数),可以发现数据都有着一定的分布规律。(次数),可以发现数据都有着一定的分布规律。(次数),可以发现数据都有着一定的分布规律。n n由不同区间内数据出现的次数组成的分布,就叫由不同区间内数据出现的次数组成的分布,就叫由不同区间内数据出现的次数组成的分布,就叫由不同区间内数据出现的次数组成的分布,就叫做变数的次数分布,简称次做变数的次数分布,简称次做变数的次数分布,简称次做变数的次数分布,简称次(频频频频)数分布数分布数分布数分

18、布。n n资料整理方法之一,就是编制次资料整理方法之一,就是编制次资料整理方法之一,就是编制次资料整理方法之一,就是编制次(频频频频)数分布表。数分布表。数分布表。数分布表。n n次次次次(频频频频)数分布表的制作方法因数据种类不同而略数分布表的制作方法因数据种类不同而略数分布表的制作方法因数据种类不同而略数分布表的制作方法因数据种类不同而略有不同,分述如下。有不同,分述如下。有不同,分述如下。有不同,分述如下。13一、攻关目标一、攻关目标第四节 资料的整理和分组n n(一一一一)、间断型数据资料的整理、间断型数据资料的整理、间断型数据资料的整理、间断型数据资料的整理n n1 1、相同观察值归

19、一组、相同观察值归一组、相同观察值归一组、相同观察值归一组n n以某小麦品种的每穗小穗数为例,随机采取以某小麦品种的每穗小穗数为例,随机采取以某小麦品种的每穗小穗数为例,随机采取以某小麦品种的每穗小穗数为例,随机采取100100个麦穗,计数每穗小穗数,未加整理的资料列成表。个麦穗,计数每穗小穗数,未加整理的资料列成表。个麦穗,计数每穗小穗数,未加整理的资料列成表。个麦穗,计数每穗小穗数,未加整理的资料列成表。14第四节 资料的整理和分组n n上述资料为间断型数据资料,每穗小穗数在上述资料为间断型数据资料,每穗小穗数在上述资料为间断型数据资料,每穗小穗数在上述资料为间断型数据资料,每穗小穗数在

20、15-2015-20的范的范的范的范围内变动,有围内变动,有围内变动,有围内变动,有6 6个不同的观察值,把所有观察值按每穗小穗个不同的观察值,把所有观察值按每穗小穗个不同的观察值,把所有观察值按每穗小穗个不同的观察值,把所有观察值按每穗小穗数多少加以归类,共分为数多少加以归类,共分为数多少加以归类,共分为数多少加以归类,共分为6 6组,组与组间相差为组,组与组间相差为组,组与组间相差为组,组与组间相差为1 1小穗,称小穗,称小穗,称小穗,称为组距。这样可得次数分布表:为组距。这样可得次数分布表:为组距。这样可得次数分布表:为组距。这样可得次数分布表:n n从表中看到,一堆杂乱的原始资料,经初

21、步整理后,就可从表中看到,一堆杂乱的原始资料,经初步整理后,就可从表中看到,一堆杂乱的原始资料,经初步整理后,就可从表中看到,一堆杂乱的原始资料,经初步整理后,就可了解资料的大致情况。另外,经过整理的资料也便于进一步了解资料的大致情况。另外,经过整理的资料也便于进一步了解资料的大致情况。另外,经过整理的资料也便于进一步了解资料的大致情况。另外,经过整理的资料也便于进一步的分析。的分析。的分析。的分析。P3P3例例例例1.11.1属此类属此类属此类属此类。15第四节 资料的整理和分组n n2 2、相邻几个观察值归一组、相邻几个观察值归一组、相邻几个观察值归一组、相邻几个观察值归一组 n n资料观

22、察值较多,变异幅度较大,若以每一观察资料观察值较多,变异幅度较大,若以每一观察资料观察值较多,变异幅度较大,若以每一观察资料观察值较多,变异幅度较大,若以每一观察值为一组,则组数太多,而每组内包含的观察值太值为一组,则组数太多,而每组内包含的观察值太值为一组,则组数太多,而每组内包含的观察值太值为一组,则组数太多,而每组内包含的观察值太少,资料的规律性显示不出来。对这类资料,可扩少,资料的规律性显示不出来。对这类资料,可扩少,资料的规律性显示不出来。对这类资料,可扩少,资料的规律性显示不出来。对这类资料,可扩大为以大为以大为以大为以几个相邻观察值几个相邻观察值几个相邻观察值几个相邻观察值为一组

23、,适当减少组数,资为一组,适当减少组数,资为一组,适当减少组数,资为一组,适当减少组数,资料的规律性就较明显,对资料进一步计算分析也比料的规律性就较明显,对资料进一步计算分析也比料的规律性就较明显,对资料进一步计算分析也比料的规律性就较明显,对资料进一步计算分析也比较方便。较方便。较方便。较方便。n n如每组包含若干粒数的幅度,例如以如每组包含若干粒数的幅度,例如以如每组包含若干粒数的幅度,例如以如每组包含若干粒数的幅度,例如以5 5粒为一组,粒为一组,粒为一组,粒为一组,则可使组数适当减少。则可使组数适当减少。则可使组数适当减少。则可使组数适当减少。16一、攻关目标一、攻关目标第四节 资料的

24、整理和分组n n从下表可以看出,半数多的稻穗的每穗粒数在从下表可以看出,半数多的稻穗的每穗粒数在从下表可以看出,半数多的稻穗的每穗粒数在从下表可以看出,半数多的稻穗的每穗粒数在46-6046-60粒间,粒间,粒间,粒间,大部分稻穗的每穗粒数在大部分稻穗的每穗粒数在大部分稻穗的每穗粒数在大部分稻穗的每穗粒数在41-70 41-70 间间间间;但也有少数稻穗少到但也有少数稻穗少到但也有少数稻穗少到但也有少数稻穗少到26-3026-30粒的,多到粒的,多到粒的,多到粒的,多到81818585的。的。的。的。17一、攻关目标一、攻关目标第四节 资料的整理和分组n n(二二二二)、连续型数据资料的整理、

25、连续型数据资料的整理、连续型数据资料的整理、连续型数据资料的整理 n n连续型数据资料不能按间断型数据资料的分组方连续型数据资料不能按间断型数据资料的分组方连续型数据资料不能按间断型数据资料的分组方连续型数据资料不能按间断型数据资料的分组方法进行整理,在分组前需要确定全距、组数、组距、法进行整理,在分组前需要确定全距、组数、组距、法进行整理,在分组前需要确定全距、组数、组距、法进行整理,在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值划线计数归组,组中值及组限,然后将全部观测值划线计数归组,组中值及组限,然后将全部观测值划线计数归组,组中值及组限,然后将全部观测值划线计数归组,

26、制作成制作成制作成制作成次次次次(频频频频)数分布表数分布表数分布表数分布表。n n以以以以140140行水稻试验的产量为例,说明整理方法。行水稻试验的产量为例,说明整理方法。行水稻试验的产量为例,说明整理方法。行水稻试验的产量为例,说明整理方法。18第四节 资料的整理和分组n n次次次次(频频频频)数分布表的制作步骤:数分布表的制作步骤:数分布表的制作步骤:数分布表的制作步骤:n n1.1.数据排序:将所取得的数据按从小到大排列数据排序:将所取得的数据按从小到大排列数据排序:将所取得的数据按从小到大排列数据排序:将所取得的数据按从小到大排列(升序升序升序升序)或从大到小排列或从大到小排列或从

27、大到小排列或从大到小排列(降序降序降序降序)。n n2.2.求极差求极差求极差求极差R R:资料中最大观察值与最小观察值之:资料中最大观察值与最小观察值之:资料中最大观察值与最小观察值之:资料中最大观察值与最小观察值之差,即整个样本的变异幅度。用差,即整个样本的变异幅度。用差,即整个样本的变异幅度。用差,即整个样本的变异幅度。用R R表示,即表示,即表示,即表示,即n nR=R=Ymax-YminYmax-Ymin n n从表中查到最大观察值为从表中查到最大观察值为从表中查到最大观察值为从表中查到最大观察值为254g254g,最小观察值为,最小观察值为,最小观察值为,最小观察值为75g75g,

28、极差为:,极差为:,极差为:,极差为:n nR=R=254-75=179g254-75=179g19第四节 资料的整理和分组n n3.3.确定组数和组距:确定组数和组距:确定组数和组距:确定组数和组距:n n组数组数组数组数指将数据出现的整个数量范围分成多少个组指将数据出现的整个数量范围分成多少个组指将数据出现的整个数量范围分成多少个组指将数据出现的整个数量范围分成多少个组区间。每组的距离称为区间。每组的距离称为区间。每组的距离称为区间。每组的距离称为组距组距组距组距。n n组数和组距是相互决定的,一般以达到既简化资组数和组距是相互决定的,一般以达到既简化资组数和组距是相互决定的,一般以达到既

29、简化资组数和组距是相互决定的,一般以达到既简化资料又不影响反映资料的规律性为原则。组数过多或料又不影响反映资料的规律性为原则。组数过多或料又不影响反映资料的规律性为原则。组数过多或料又不影响反映资料的规律性为原则。组数过多或过少,不能反映资料的规律性。如果组数过多,看过少,不能反映资料的规律性。如果组数过多,看过少,不能反映资料的规律性。如果组数过多,看过少,不能反映资料的规律性。如果组数过多,看不到资料的集中情况,且不便于以后的继续分析。不到资料的集中情况,且不便于以后的继续分析。不到资料的集中情况,且不便于以后的继续分析。不到资料的集中情况,且不便于以后的继续分析。20第四节 资料的整理和

30、分组n n3.3.确定组数和组距:确定组数和组距:确定组数和组距:确定组数和组距:n n在确定组数和组距时应考虑在确定组数和组距时应考虑在确定组数和组距时应考虑在确定组数和组距时应考虑:n n(1)(1)数据个数的多少;数据个数的多少;数据个数的多少;数据个数的多少;n n(2)(2)极差的大小;极差的大小;极差的大小;极差的大小;n n(3)(3)便于计算;便于计算;便于计算;便于计算;n n(4)(4)能反映出资料的真实面貌等方面。能反映出资料的真实面貌等方面。能反映出资料的真实面貌等方面。能反映出资料的真实面貌等方面。21第四节 资料的整理和分组样本大小(即样本内包含观察值个数的多少)样

31、本大小(即样本内包含观察值个数的多少)与组数多少的关系可参照下表来确定。与组数多少的关系可参照下表来确定。22第四节 资料的整理和分组n n确定确定组距组距。指每个组区间的高限和低限的。指每个组区间的高限和低限的差值,组距的大小由全距与组数确定,记作差值,组距的大小由全距与组数确定,记作i。n ni=极差极差/分组数分组数n n以以140行水稻产量为例,样本内观察值的行水稻产量为例,样本内观察值的个数为个数为140,查表可分为,查表可分为8-16组,假定分为组,假定分为12组,则组距为组,则组距为n ni179/12=14.9g15gn n以以15g作为组距,方便分组。作为组距,方便分组。23

32、第四节 资料的整理和分组n n4.4.确定组界确定组界确定组界确定组界和和和和组中值组中值组中值组中值(组值组值组值组值):n n每组应有明确的界限,才能使各个观察值划入一定的组内,每组应有明确的界限,才能使各个观察值划入一定的组内,每组应有明确的界限,才能使各个观察值划入一定的组内,每组应有明确的界限,才能使各个观察值划入一定的组内,为此必须选定适当的组中点值及组限。为此必须选定适当的组中点值及组限。为此必须选定适当的组中点值及组限。为此必须选定适当的组中点值及组限。n n各组的最大值与最小值称为各组的最大值与最小值称为各组的最大值与最小值称为各组的最大值与最小值称为组界组界组界组界,最小值

33、称为,最小值称为,最小值称为,最小值称为下界下界下界下界,最大最大最大最大值称为值称为值称为值称为上界上界上界上界,反映各组的的变异范围。,反映各组的的变异范围。,反映各组的的变异范围。,反映各组的的变异范围。n n组中值组中值组中值组中值是各组的上界(数值大者)与下界之和除以是各组的上界(数值大者)与下界之和除以是各组的上界(数值大者)与下界之和除以是各组的上界(数值大者)与下界之和除以2 2所得,所得,所得,所得,即:即:即:即:n n组中值组中值组中值组中值=(上限(上限(上限(上限+下限)下限)下限)下限)/2/2n n =组下限组下限组下限组下限1/21/2组距组距组距组距n n =

34、组上限组上限组上限组上限1/21/2组距组距组距组距n n每组组中值是该组的代表数值每组组中值是该组的代表数值每组组中值是该组的代表数值每组组中值是该组的代表数值。24第四节 资料的整理和分组n n确定组距后,确定组距后,确定组距后,确定组距后,首先要选定第一组的组中值首先要选定第一组的组中值首先要选定第一组的组中值首先要选定第一组的组中值。第一。第一。第一。第一组的中点值以最接近最小观察值为好。确定第一组组的中点值以最接近最小观察值为好。确定第一组组的中点值以最接近最小观察值为好。确定第一组组的中点值以最接近最小观察值为好。确定第一组的组限以后,其余各组的组中值和组限便可依次确的组限以后,其

35、余各组的组中值和组限便可依次确的组限以后,其余各组的组中值和组限便可依次确的组限以后,其余各组的组中值和组限便可依次确定。定。定。定。n n以以以以140140行水稻产量为例:行水稻产量为例:行水稻产量为例:行水稻产量为例:n n选定第一组的中点值为选定第一组的中点值为选定第一组的中点值为选定第一组的中点值为75g75g,与最小观察值,与最小观察值,与最小观察值,与最小观察值75g75g相等;则第二组的中点值为相等;则第二组的中点值为相等;则第二组的中点值为相等;则第二组的中点值为75+15=90g75+15=90g,余类,余类,余类,余类推。推。推。推。n n各组的中点值选定后,就可以求得各

36、组组界。第各组的中点值选定后,就可以求得各组组界。第各组的中点值选定后,就可以求得各组组界。第各组的中点值选定后,就可以求得各组组界。第一组的组限为一组的组限为一组的组限为一组的组限为67.5-82.5g67.5-82.5g。按照此法计算其余各。按照此法计算其余各。按照此法计算其余各。按照此法计算其余各组的组界。组的组界。组的组界。组的组界。25第四节 资料的整理和分组n n注意:注意:注意:注意:n n组值最好为整数或与观察值的位数相同,以便于组值最好为整数或与观察值的位数相同,以便于组值最好为整数或与观察值的位数相同,以便于组值最好为整数或与观察值的位数相同,以便于以后的计算。以后的计算。

37、以后的计算。以后的计算。n n组限要明确,最好比原始资料的数字多一位小数,组限要明确,最好比原始资料的数字多一位小数,组限要明确,最好比原始资料的数字多一位小数,组限要明确,最好比原始资料的数字多一位小数,便于归组。便于归组。便于归组。便于归组。n n最末一组的上限应大于资料中的最大值。最末一组的上限应大于资料中的最大值。最末一组的上限应大于资料中的最大值。最末一组的上限应大于资料中的最大值。26第四节 资料的整理和分组n n5.5.归组归组归组归组:n n按依次表将观察值归入各个组按依次表将观察值归入各个组按依次表将观察值归入各个组按依次表将观察值归入各个组内,并统计各组数据出现的次数,内,

38、并统计各组数据出现的次数,内,并统计各组数据出现的次数,内,并统计各组数据出现的次数,制成频数分布表。制成频数分布表。制成频数分布表。制成频数分布表。n n例如表中第一个观察值例如表中第一个观察值例如表中第一个观察值例如表中第一个观察值177177应应应应归于第归于第归于第归于第8 8组,组限为组,组限为组,组限为组,组限为172.5-172.5-187.5187.5;。依次把。依次把。依次把。依次把140140个观个观个观个观察值都进行归组,即可制成察值都进行归组,即可制成察值都进行归组,即可制成察值都进行归组,即可制成140140行水稻产量的次数分布表。行水稻产量的次数分布表。行水稻产量的

39、次数分布表。行水稻产量的次数分布表。n n“上限不在内上限不在内上限不在内上限不在内”约定约定约定约定27第四节 资料的整理和分组n n(三三三三)、属性数据资料的整理、属性数据资料的整理、属性数据资料的整理、属性数据资料的整理 n n属性数据的资料,也可以用类似次数分布的方法来整理。属性数据的资料,也可以用类似次数分布的方法来整理。属性数据的资料,也可以用类似次数分布的方法来整理。属性数据的资料,也可以用类似次数分布的方法来整理。在整理前,把资料按各种质量性状进行分类,分类数等于组在整理前,把资料按各种质量性状进行分类,分类数等于组在整理前,把资料按各种质量性状进行分类,分类数等于组在整理前

40、,把资料按各种质量性状进行分类,分类数等于组数,然后根据各个体在质量属性上的具体表现,分别归入相数,然后根据各个体在质量属性上的具体表现,分别归入相数,然后根据各个体在质量属性上的具体表现,分别归入相数,然后根据各个体在质量属性上的具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。应的组中,即可得到属性分布的规律性认识。应的组中,即可得到属性分布的规律性认识。应的组中,即可得到属性分布的规律性认识。n n例如,某水稻杂种第二代植株米粒性状的分离情况,归于例如,某水稻杂种第二代植株米粒性状的分离情况,归于例如,某水稻杂种第二代植株米粒性状的分离情况,归于例如,某水稻杂种第二代植株米粒性

41、状的分离情况,归于下表。下表。下表。下表。28第四节 资料的整理和分组n n如果把频数分布表中频次换算成频率如果把频数分布表中频次换算成频率(组频组频数数/总数总数),则可做成频率分布表。如,则可做成频率分布表。如P3表表1-1、P5表表1-3。29第四节 资料的整理和分组n n二、频数分布图:二、频数分布图:n n试验资料除用频数分布表来表示外,也可试验资料除用频数分布表来表示外,也可以用图形来表示,频数分布图可以更形象地以用图形来表示,频数分布图可以更形象地表明频数分布的情况。较普遍应用的图示有表明频数分布的情况。较普遍应用的图示有:方柱形图、多边形图、条形图和饼图。方柱形图、多边形图、条

42、形图和饼图。30第四节 资料的整理和分组n n(一一一一)方柱形图方柱形图方柱形图方柱形图n n方柱形图方柱形图方柱形图方柱形图(histogram)(histogram)适用于表示连续型数据的频数分布。适用于表示连续型数据的频数分布。适用于表示连续型数据的频数分布。适用于表示连续型数据的频数分布。n n以以以以140140行水稻产量的次数分布表为例加以说明。行水稻产量的次数分布表为例加以说明。行水稻产量的次数分布表为例加以说明。行水稻产量的次数分布表为例加以说明。n n1.1.等分横轴:在横轴上分为等分横轴:在横轴上分为等分横轴:在横轴上分为等分横轴:在横轴上分为1313等分等分等分等分(因

43、第一组下限不是从因第一组下限不是从因第一组下限不是从因第一组下限不是从0 0开始,在开始,在开始,在开始,在其前加其前加其前加其前加),每一等分代表一组。第一组的上限即为第二组的下限,如,每一等分代表一组。第一组的上限即为第二组的下限,如,每一等分代表一组。第一组的上限即为第二组的下限,如,每一等分代表一组。第一组的上限即为第二组的下限,如此依次类推。此依次类推。此依次类推。此依次类推。n n2.2.标定次数:在纵轴上标定次数。横坐标与纵坐标的长度比例一般为标定次数:在纵轴上标定次数。横坐标与纵坐标的长度比例一般为标定次数:在纵轴上标定次数。横坐标与纵坐标的长度比例一般为标定次数:在纵轴上标定

44、次数。横坐标与纵坐标的长度比例一般为5:45:4或或或或6:56:5为好。为好。为好。为好。n n3.3.画方柱:画方柱:画方柱:画方柱:查表查表查表查表3.63.6第一组有次数为第一组有次数为第一组有次数为第一组有次数为2 2,所以,所以,所以,所以在两组限处绘两条纵线,其高度等于纵坐标上在两组限处绘两条纵线,其高度等于纵坐标上在两组限处绘两条纵线,其高度等于纵坐标上在两组限处绘两条纵线,其高度等于纵坐标上两个单位,再画一横线连接两纵线的顶端,成两个单位,再画一横线连接两纵线的顶端,成两个单位,再画一横线连接两纵线的顶端,成两个单位,再画一横线连接两纵线的顶端,成为方柱形。其余各组可依次绘制

45、,即成方柱形为方柱形。其余各组可依次绘制,即成方柱形为方柱形。其余各组可依次绘制,即成方柱形为方柱形。其余各组可依次绘制,即成方柱形次数分布图次数分布图次数分布图次数分布图3.13.1。31第四节 资料的整理和分组n n(二二二二)多边形图多边形图多边形图多边形图n n多边形图是表示连续型数据资料的一种普通方法,且在同一图上可比多边形图是表示连续型数据资料的一种普通方法,且在同一图上可比多边形图是表示连续型数据资料的一种普通方法,且在同一图上可比多边形图是表示连续型数据资料的一种普通方法,且在同一图上可比较两组以上的资料。较两组以上的资料。较两组以上的资料。较两组以上的资料。n n以以以以14

46、0140行水稻产量次数分布为例,图示时:行水稻产量次数分布为例,图示时:行水稻产量次数分布为例,图示时:行水稻产量次数分布为例,图示时:n n以每组的中点值为代表,在横坐标各等分的中点向上等于该组单位数以每组的中点值为代表,在横坐标各等分的中点向上等于该组单位数以每组的中点值为代表,在横坐标各等分的中点向上等于该组单位数以每组的中点值为代表,在横坐标各等分的中点向上等于该组单位数处标标点,表示该组含有的次数。处标标点,表示该组含有的次数。处标标点,表示该组含有的次数。处标标点,表示该组含有的次数。n n把各点依次用直线连接,所成图形即为把各点依次用直线连接,所成图形即为把各点依次用直线连接,所

47、成图形即为把各点依次用直线连接,所成图形即为频数多边形图。频数多边形图。频数多边形图。频数多边形图。n n多边形图的折线在左边最小组的组中点外和多边形图的折线在左边最小组的组中点外和多边形图的折线在左边最小组的组中点外和多边形图的折线在左边最小组的组中点外和右边最大组的组中点外,应各伸出一个组距右边最大组的组中点外,应各伸出一个组距右边最大组的组中点外,应各伸出一个组距右边最大组的组中点外,应各伸出一个组距的距离而交于横轴,因该两组次数为的距离而交于横轴,因该两组次数为的距离而交于横轴,因该两组次数为的距离而交于横轴,因该两组次数为0 0,这可,这可,这可,这可以使多边形的面积大致上与方柱形图

48、相同。以使多边形的面积大致上与方柱形图相同。以使多边形的面积大致上与方柱形图相同。以使多边形的面积大致上与方柱形图相同。32第四节 资料的整理和分组n n(三三三三)条形图条形图条形图条形图n n条形图条形图条形图条形图(bar diagram)(bar diagram)适用于表示间断型数据和属性数据资料的次数适用于表示间断型数据和属性数据资料的次数适用于表示间断型数据和属性数据资料的次数适用于表示间断型数据和属性数据资料的次数分布状况。一般其横轴标出间断的中点值或分类性状,纵轴标出次数。分布状况。一般其横轴标出间断的中点值或分类性状,纵轴标出次数。分布状况。一般其横轴标出间断的中点值或分类性

49、状,纵轴标出次数。分布状况。一般其横轴标出间断的中点值或分类性状,纵轴标出次数。n n现以水稻杂种第二代米粒性状的分离情况为例,在横轴上按等距离分现以水稻杂种第二代米粒性状的分离情况为例,在横轴上按等距离分现以水稻杂种第二代米粒性状的分离情况为例,在横轴上按等距离分现以水稻杂种第二代米粒性状的分离情况为例,在横轴上按等距离分别标定别标定别标定别标定4 4种米粒性状,在纵轴上标定次数种米粒性状,在纵轴上标定次数种米粒性状,在纵轴上标定次数种米粒性状,在纵轴上标定次数(f)(f)。可画成水稻杂种第二代植。可画成水稻杂种第二代植。可画成水稻杂种第二代植。可画成水稻杂种第二代植株株株株4 4种米粒性状

50、分离情况条形图。种米粒性状分离情况条形图。种米粒性状分离情况条形图。种米粒性状分离情况条形图。33第四节 资料的整理和分组n n(四四)饼图饼图n n饼图饼图饼图饼图(pie diagram)(pie diagram)适用于间断型数据和属性数适用于间断型数据和属性数适用于间断型数据和属性数适用于间断型数据和属性数据资料,用以表示这些数据中各种属性或各种间断据资料,用以表示这些数据中各种属性或各种间断据资料,用以表示这些数据中各种属性或各种间断据资料,用以表示这些数据中各种属性或各种间断性数据观察值在总观察个数中的百分比。如图中白性数据观察值在总观察个数中的百分比。如图中白性数据观察值在总观察个

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁