田间试验统计资料的整理与描述.pptx

上传人:莉*** 文档编号:36619774 上传时间:2022-08-28 格式:PPTX 页数:99 大小:509.58KB
返回 下载 相关 举报
田间试验统计资料的整理与描述.pptx_第1页
第1页 / 共99页
田间试验统计资料的整理与描述.pptx_第2页
第2页 / 共99页
点击查看更多>>
资源描述

《田间试验统计资料的整理与描述.pptx》由会员分享,可在线阅读,更多相关《田间试验统计资料的整理与描述.pptx(99页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 在试验研究中,通过观察、测量和记载,可获得大量的原始数据资料。这些资料往往是零乱的,无规律性可循。 通过对资料的整理整理,才能发现其内部联系和规律性; 利用平均数平均数、标准差标准差和变异系数变异系数三个统计数来描述描述资料的特征特性,以便对资料作进一步的统计分析。 退 出 第1页/共99页第一节第一节 资料的整理资料的整理一、一、资料的分类资料的分类 在田间试验中,由观察、测量所得的资料,按其性质的不同,一般可分为两大类: : (一)数量性状资料 (二)质量性状资料下一张 主 页 退 出 上一张 第2页/共99页 (一)数量性状资料 数量性状数量性状是指能够以量测或计数的方式表示其特征的性

2、状。观察测定数量性状而获得的数据就是数量性状资料数量性状资料。 数量性状资料的获得有量测量测和计数计数两种方式,因而数量性状资料又分为以下两种: : 1 1、计量资料 2 2、计数资料下一张 主 页 退 出 上一张 第3页/共99页 1 1、计量资料 指用量测量测方式获得的数量性状资料,即用度、量、衡等计量工具直接测定而获得的数量性状资料。其数据是用长度、重量、容积等来表示。 计量资料的观测值不一定是整数,两个相邻整数间允许有带小数的任何数值出现,其小数位数多少由度量工具的精度而定。数据间的变异是连续的。因此,计量资料也称为连续性变异资料。下一张 主 页 退 出 上一张 第4页/共99页 2

3、2、计数资料 指用计数计数方法获得的数量性状资料。计数资料的观察值只能以整数表示,在两个相邻整数间不允许有任何带小数的数值出现。 这些观察值只能以整数来表示,各个观察值是不连续的。因此,计数资料也称为不连续性变量资料或间断性变量资料。下一张 主 页 退 出 上一张 第5页/共99页 (二)质量性状资料 质量性状质量性状又称属性性状属性性状,是指能观察到而不能直接测量的性状。 这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,方法有以下两种: 1 1、统计次数法 2 2、评分法 下一张 主 页 退 出 上一张 第6页/共99页 1 1、统计次数法 在一定的总体

4、或样本内,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。 例如,红花豌豆与白花豌豆杂交,统计F F2 2不同花色的植株时,在10001000株植株中,有红花266266株、紫花494494株、白花240240株。 这种利用统计次数法对质量性状数量化得来的资料又叫次数资料次数资料。 下一张 主 页 退 出 上一张 第7页/共99页 2 2、评分法 这种方法是用数字级别表示某种现象在表现程度上的差别。 例如,小麦感染锈病的严重程度可划分为0 0(免疫)、1 1(高度抵抗)、2 2(中度抵抗)、3 3(感染)级。又如,观察施用某种农药后害虫的死亡情况,记“死”为0 0,记“活”为1 1

5、等。 下一张 主 页 退 出 上一张 第8页/共99页二、资料的检查与核对二、资料的检查与核对 检查、核对原始资料是为了确保原始资料的完整性和正确性。 完整性指原始资料无缺失或重复。 正确性指原始资料的测量和记载无差错,或未进行不合理的归并。 下一张 主 页 退 出 上一张 第9页/共99页 第10页/共99页三、资料整理的方法三、资料整理的方法 试验资料经检查核对后,根据样本大小确定是否分组分组。 对小样本(n30n30)资料不必分组,直接进行统计分析。 当样本较大(n n3030)时,宜将观测值分成若干组,制成次数分布表,以了解资料集中与分散的情况。 不同类型的资料,整理方法不同。 下一张

6、 主 页 退 出 上一张 第11页/共99页 1 1、计数资料的整理 对于观察值不多、变异范围不大的计数资料,以每一观察值为一组进行分组,然后制成次数分布表。 例如,随机调查100100个麦穗,计数每穗小穗数,原始数据列于表2-12-1。 下一张 主 页 退 出 上一张 第12页/共99页表2-1 1002-1 100个麦穗的每穗小穗数下一张 主 页 退 出 上一张 18 15 17 19 16 15 20 18 19 17 17 18 17 16 18 20 19 17 16 1817 16 17 19 18 18 17 17 17 1818 15 16 18 18 18 17 20 19

7、1817 19 15 17 17 17 16 17 18 1817 19 19 17 19 17 18 16 18 1717 19 16 16 17 17 17 15 17 1618 19 18 18 19 19 20 17 16 1918 17 18 20 19 16 18 19 17 1615 16 18 17 18 17 17 16 19 17第13页/共99页 第14页/共99页 下一张 主 页 退 出 上一张 每穗小穗数(x x) 划线计数 次数( )15 616 1517 3218 2519 1720 5 总次数 100表2-2 1002-2 100个麦穗每穗小穗数的次数分布表第1

8、5页/共99页 有些计数资料,观察值较多,变异范围较大,若以每一观察值为一组,则组数太多而每组所包含的观察值太少,资料的规律性显示不出来。 对于这样的资料,可扩大为几个相邻的观察值为一组 , 适当减少组数,分组后,资料的规律性就较明显。 第16页/共99页 第17页/共99页 每穗粒数(x x) 次数( ) 2630 1 3135 3 3640 10 4145 21 4650 32 5155 41 5660 38 6165 25 6670 16 7175 8 7680 3 8185 2 合 计 200第18页/共99页 2 2、计量资料的整理 计量资料在分组前需要确定全距、组数、组距、组中值及

9、组限,然后将全部观测值划线计数归组制成次数分布表。 以表2-42-4中140140行水稻产量为例,说明计量资料整理的方法与步骤。下一张 主 页 退 出 上一张 第19页/共99页 表2-4 1402-4 140行水稻产量 (单位:g)177 215 197 97 123 159 245 119 119 131 149 152 177 215 197 97 123 159 245 119 119 131 149 152 167 104 167 104 161 214 125 175 219 118 192 176 175 95 136 199 161 214 125 175 219 118 19

10、2 176 175 95 136 199 116 165116 165214 95 158 83 137 80 138 151 187 126 196 134 214 95 158 83 137 80 138 151 187 126 196 134 206 137206 137 98 97 129 143 179 174 159 165 136 108 101 141 98 97 129 143 179 174 159 165 136 108 101 141 148 168148 168163 176 102 194 145 173 163 176 102 194 145 173 7575 1

11、30 149 150 161 155 130 149 150 161 155 111 158111 158131 189 91 142 140 154 152 163 123 205 149 155 131 189 91 142 140 154 152 163 123 205 149 155 131 209131 209183 97 119 181 149 187 131 215 111 186 118 150 183 97 119 181 149 187 131 215 111 186 118 150 155 197155 197116 116 254254 239 160 172 179

12、151 198 124 179 135 184 239 160 172 179 151 198 124 179 135 184 168 169168 169173 181 188 211 197 175 122 151 171 166 175 143 173 181 188 211 197 175 122 151 171 166 175 143 190 213190 213192 231 163 159 158 159 177 147 194 227 141 169 192 231 163 159 158 159 177 147 194 227 141 169 124 159124 159 第

13、20页/共99页 (1)求全距 全距全距是资料中最大值与最小值之差,又称为极差极差,用R表示,即 R=Max(x)-Min(x) 表2-4中,水稻产量最大观测值为254g,最小观测值为75g,全距为: R = 254 75 = 179(g) 下一张 主 页 退 出 上一张 第21页/共99页 (2) (2) 确定组数和组距 组数的多少视样本容量及资料全距的大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。 组数要适当,不宜过多,亦不宜过少。分组越多所求得的统计数越准确,但增大了运算量;若分组过少,资料的规律性就反映不出来,计算出的统计数的准确性也较差。 下一张 主 页 退 出 上一

14、张 第22页/共99页表2-5 2-5 样本容量与组数 样本容量 组 数 303060 5 60 5 8 8 60 60100 8 100 8 1010 100 100200 10200 101212 200 200500 12500 121818 500 500以上 18183030下一张 主 页 退 出 上一张 第23页/共99页 组距组距指每组的最大值与最小值之差,记为i i。分组时要求各组的组距相等。 组距(i i)= = 全距/ /组数 表2-42-4中的观测值个数即样本含量为140140,查表2-52-5,取组数为1212,则组距为: 组距(i i)= 179/12=14.9= 1

15、79/12=14.9(g g) 以15g15g作为组距。 下一张 主 页 退 出 上一张 第24页/共99页 (3 3)确定组限和组中值 各组的最大值与最小值称为组限,最小值称为下限下限,最大值称上限上限。每一组的中点值称为组中值组中值,是该组的代表值。组中值与组限、组距的关系为: 组中值 = = (组下限+ +组上限)/2/2 = = 组下限 + + 组距/2/2 = = 组上限 - - 组距/2/2 下一张 主 页 退 出 上一张 第25页/共99页 由于相邻两组的组中值之差等于组距,所以当第一组的组中值确定后,加上组距就是第二组的组中值,第二组的组中值加上组距就是第三组的组中值,其余类推

16、。 在资料分组时为了避免第一组中的观测值过多,第一组的组中值以接近或等于资料中的最小观测值为好。第一组的组中值确定后,则该组组限也随之确定,其余各组的组中值和组限也可相继确定。注意,最后一组的上限应大于资料中的最大值。下一张 主 页 退 出 上一张 第26页/共99页 表2-42-4中,最小观测值为7575,选取7575为第一组的组中值;因组距为1515,所以 第一组的下限为75-15/2=67.575-15/2=67.5; 第一组的上限也就是第二组的下限为 67.5+15=82.567.5+15=82.5; 第二组的上限也就是第三组的下限为 82.5+15=97.582.5+15=97.5;

17、 下一张 主 页 退 出 上一张 第27页/共99页 第28页/共99页 为了使恰好等于前一组上限和后一组下限的数据能确切归组,约定将其归入后一组,即约定“上限不在内上限不在内”。 通常将上限略去不写: : 如第一组记为67.5 67.5 ; 第二组记为82.5 82.5 ; 第三组记为97.5 97.5 ; ; 最后一组记为247.5.5 247.5.5 。下一张 主 页 退 出 上一张 第29页/共99页 (4 4)归组、划线计数、作次数分布表 分组结束后,将资料中的每一观测值逐一归组,划线计数,然后制成次数分布表。 如表2-42-4中,第一个观测值177177,应归入表2-62-6中第8

18、 8组, ,其组限为172.5172.5; 第二个观测值215215,应归入第1010组,其组限为202.5202.5; 依次把140140个观测值都进行归组、划线计数,制成次数分布表,见表2-62-6。 第30页/共99页 表表2-6 1402-6 140行水稻产量数据的次数分布表行水稻产量数据的次数分布表组组 限限 组中值组中值 (x) 划线计数划线计数 次数(次数() 累加次数累加次数67.5 75 2 22 282.5 90 7 997.5 105 7 167 16112.5 120 13 2913 29127.5 135 17 4617 46142.5 150 20 6620 661

19、57.5 165 25 9125 91172.5 180 21 11221 112187.5 195 13 12513 125202.5 210 9 1349 134217.5 225 3 1373 137232.5 240 2 1392 139 247.5 255 1 1401 140 合计(合计(n) 140 140第31页/共99页 前面确定分1212组,但由于第一组的组中值等于最小观测值,故第一组的下限小于最小观测值,实际上增加了1/21/2组,这样也使最后一组的组中值接近于最大值,又差不多增加了1/21/2组,所以实际的组数比原来确定的要多一组实际的组数比原来确定的要多一组,为131

20、3组。 下一张 主 页 退 出 上一张 第32页/共99页第33页/共99页 3 3、质量性状质量性状资料的整理 对于质量性状资料可按性状或属性进行分组,分别统计各组的次数,然后制成次数分布表。 例如,水稻杂种F F2 2植株米粒性状的分离情况,见表2-72-7。下一张 主 页 退 出 上一张 第34页/共99页表2-7 2-7 水稻杂种F F2 2植株米粒性状分离情况 下一张 主 页 退 出 上一张 性状分组 次数( ) 频率(% %) 红米非糯 96 5496 54 红米糯稻 37 2137 21 白米非糯 31 1731 17 白米糯稻 15 815 8 合 计 179 100179 1

21、00第35页/共99页四、四、 常用统计表与统计图常用统计表与统计图 统计表:用表格形式来表示数据间的数量关系; 统计图:用几何图形来表示数据间的数量关系。 使用统计表和统计图,可以把研究对象的特征、内部构成、相互关系等简明、形象地表达出来,便于比较分析。下一张 主 页 退 出 上一张 第36页/共99页表号 标题 编制统计表的总原则编制统计表的总原则:结构简单,层次分明,内容安排合理,重点突出,数据准确,便于理解和比较分析。具体要求如下:下一张 主 页 退 出 上一张 第37页/共99页 1 1)标题:标题要简明扼要、准确地说明表的内容,有时须注明时间、地点。 2 2)标目:标目分横标目和纵

22、标目两项。横标目列在表的左侧,用以表示被说明事物的主要标志;纵标目列在表的上端,说明横标目各统计指标内容,并注明计算单位,如、kgkg、cmcm等等。 下一张 主 页 退 出 上一张 第38页/共99页 3 3)数字:一律用阿拉伯数字,数字以小数点对齐,小数位数一致,无数字的用“ ”表示,数字是“0”0”的,则填写“0”0”。 4 4)线条:表的上下两条边线略粗,纵、横标目间及合计用细线分开,表的左右边线可省去,表的左上角一般不用斜线。下一张 主 页 退 出 上一张 第39页/共99页 2 2、统计表的种类 (1 1)简单表:由一组横标目和一组纵标目组成,纵横标目都未分组。此类表适于简单资料的

23、统计。 例如,表2-82-8由一组横标目和一组纵标目组成,是一张简单表。 下一张 主 页 退 出 上一张 第40页/共99页表2-82-8、大豆花色一对等位基因杂种二代分离情况 下一张 主 页 退 出 上一张 花色 次数() () 频率(%)(%)紫色 221 73.42221 73.42白色 80 26.5880 26.58合 计 301 100.00301 100.00第41页/共99页 (2 2)复合表:由两组或两组以上的横标目与一组纵标目结合而成,或由一组横标目与两组或两组以上的纵标目结合而成,或由两组或两组以上的横、纵标目结合而成。此类表适用于复杂资料的统计。 例如,表2-92-9由

24、一组横标目与两组纵标目结合而成,是一张复合表。 下一张 主 页 退 出 上一张 第42页/共99页表2-9 2-9 刺人参根皮、全根脂溶性化合物的组成与含量 下一张 主 页 退 出 上一张 化合物类别根 皮 全 根种类 相对含量(% %) 种类 相对含量(% %)单萜类倍半萜类芳香族脂肪族7 1.89 9 2.0312 25.75 12 27.069 7.79 7 6.5628 16.89 24 18.52合 计56 52.32 52 54.17第43页/共99页 ( (二) ) 统计图 常用的统计图有直方图、条形图、折线图或线图、圆图等。 图形的选择取决于资料的性质。 一般,计量资料采用直方

25、图、多边形图和折线图(线图),计数资料、质量性状资料常采用条形图、圆图。下一张 主 页 退 出 上一张 第44页/共99页 1 1、统计图绘制的基本要求 1 1)标题简明扼要,列于图的下方。 2 2)纵、横两轴应有刻度,注明单位。 3 3)横轴由左至右、纵轴由下而上,数值由小到大; 图形长宽比例约5 5:4 4或6 6:5 5。 4 4)图中需用不同颜色或线条代表不同事物时,应有图例说明。下一张 主 页 退 出 上一张 第45页/共99页 2 2、常用统计图及其绘制方法 (1 1)直方图( (柱形图、矩形图) ) 对计量资料,可根据次数分布表作出直方图以表示资料的分布情况。 其作法是:在横轴上

26、标记组限,纵轴标记次数(在横轴上标记组限,纵轴标记次数(f f),在各组上作出其高等于次),在各组上作出其高等于次数的矩形,即得次数分布直方图数的矩形,即得次数分布直方图。图2-12-1。 下一张 主 页 退 出 上一张 第46页/共99页 (2 2)多边形图:对于计量资料也可根据其次数分布表绘出多边形图。 在作图时,在横轴上标记组中值(为节省篇幅 , 在第一组组中值与原点间加折断号),在纵轴上标记次数;以每组的组中值为横坐标、次数为纵坐标描点,把各点依次用线段连接,并在两端各伸出一个组距的距离交于横轴即得次数分布多边形图。图2-22-2。 下一张 主 页 退 出 上一张 第47页/共99页

27、(3 3)条形图:对于计数资料、质量性状资料用条形图来表示其次数分布情况,通过等宽长条的长短或高低表示研究指标划分属性种类的次数或频率分布。 一般在横轴上标出分类性状,在纵轴上标出次数或频率。如果只涉及一项指标,则采用单式条形图;如果涉及两个或两个以上的指标,则采用复式条形图。 下一张 主 页 退 出 上一张 第48页/共99页 绘制条形图时,应注意: (1 1)纵轴尺度从“0”0”开始,间隔相等,标明所表示指标的尺度及单位。 (2 2)横轴是长条图的共同基线,应标明各长条的内容。长条的宽度要相等,间隔相同。间隔的宽度可与长条宽度相同或是其一半。 下一张 主 页 退 出 上一张 第49页/共9

28、9页 第50页/共99页 图2-42-4是根据四个不同水稻品种类型不同时期的叶绿素含量测定数据绘制的复式条形图。 第51页/共99页 (4 4)园图:用于表示计数资料、质量性状资料或半定量(等级)资料的构成构成比比。 所谓构成比构成比,就是各类别、等级的观测值个数( (次数) )与观测值总个数( (样本含量) )的百分比。 把园图的全面积看成100%100%,按各类别、等级的构成比将园面积分成若干分 , 以扇形面积的大小表分别表示各类别、等级的比例。 下一张 主 页 退 出 上一张 第52页/共99页 绘制园图时,应注意以下三点: (1 1)园图每3.63.6园心角所对应的扇形面积为1%1%。

29、 (2 2)园图上各部分按资料顺序或大小顺序,以时钟9 9时或1212时为起点,顺时针方向排列。 (3 3)园图中各部分用线条分开,注明简要文字及百分比。 例如,根据表2-72-7的数据绘制的水稻杂种F F2 2米粒性状分离圆图,见图2-52-5。 下一张 主 页 退 出 上一张 第53页/共99页图2-5 2-5 水稻杂种F F2 2米粒性状分离圆图 第54页/共99页 (5 5)线图 用来表示事物或现象随时间而变化发展的情况。 1 1)单式线图:表示某一事物或现象的动态。 例如,根据某地区1985200219852002年小麦生产年的降水量,绘制成单式线图,见图2-2-6 6。年降水量在6

30、00600以上为丰水年;在500600 500600 之间为常态年;在500500以下为干旱年。 下一张 主 页 退 出 上一张 第55页/共99页第56页/共99页一、平均数 第57页/共99页 资料中各观测值的总和除以观测值的个数所得的商,称为算术平均数算术平均数,简称为平平均数均数或均数均数。用符号 表示。 1 1、计算方法 (1 1)直接法直接法:适用于样本含量较小(n30) (n30) 和未分组的资料。 x第58页/共99页 其中, 为总和符号总和符号, 表示从第一个观察值x x1 1累加到第n n个观察值x xn n,若在意义上已明确时,简记为 。nxnxxxxniin121xni

31、ix1nxx第59页/共99页 【例2121】 在大豆区域试验中, ,吉农904904的6 6个小区产量分别为25.025.0、26.026.0、22.022.0、21.021.0、24.524.5、23.523.5(kgkg)。求该品种的小区平均产量。 即吉农904904的小区平均产量为23.5kg23.5kg)( 5 .23614165 .235 .240 .200 .220 .260 .25kgnxx第60页/共99页 对于大样本(n(n30)30)且已分组资料,可在次数分布表的基础上采用加权法计算平均数: : 11221121kiikkikkiif xfxf xf xf xxfffff

32、 x xi i 各组组中值; f fi i 各组次数; k k 分组数。第61页/共99页 【例2222】 用加权法计算表2-62-6资料中140140行水稻平均产量。 即140140行水稻平均产量为157.93g157.93g。 采用直接法算得 =157.47g=157.47g,用加权法计算的结果与其十分接近。 )(93.1571402551907752gffxx x第62页/共99页2 2、算术平均数的基本性质 性质性质1 1 样本各个观察值与平均数之差的和为零,即离均差之和为零离均差之和为零; 性质性质2 2 样本各观察值与平均数之差的平方和为最小,即离均差的平方和最小离均差的平方和最小

33、。 0, 0)(1)(简记为xxxxnii22xxxaax第63页/共99页 3、总体平均数总体平均数 通常用表示总体平均数。包含N个个体的有限总体的平均数的计算公式为:1NiixN 在统计学中,用样本平均数 估计总体平均数。x第64页/共99页 无偏估计无偏估计 当一个统计量的数学期望值等于所估计的总体参数时,则称该统计数为其总体参数的无偏估计无偏估计。 统计学已证明样本平均数 是总体平均数的无偏估计。 xx第65页/共99页 将资料中所有观测值从小到大依次排列,位于中间位置的观测值,称为中位数中位数,简称中中数数,记作Md。 当观测值的个数为偶数时,则以位于中间位置的两个观测值的平均数作为

34、中位数。 第66页/共99页2/ )1( ndxM/2/2 12nndxxM 1、未分组资料中位数的计算方法 对于未分组资料,先将各观测值由小到大依次排列。 (1)当观测值个数为奇数时,(n+1)/2位置的观测值为中位数 ,即:(2)当观测值个数为偶数时,n/2和n/2+1位置的两个观测值之和的1/2为中位数,即:第67页/共99页 【例2323】测量9 9株玉米的株高并将各观测值由小到大依次排列为:154154、155155、157157、159159、160160、161161、163163、166166、167167(cmcm)。求其中位数。 由于n=9n=9,为奇数,则: 即9 9株玉

35、米株高的中位数为160 cm160 cm。 )(16052/192/1cmxxxMnd第68页/共99页 【例2424】调查1010个大豆品种百粒重并将各观测值由小到大依次排列为:17.017.0、17.217.2、18.018.0、18.418.4、19.219.2、19.419.4、20.420.4、20.620.6、21.021.0、22.222.2(g g)。求其中位数。 由于n=10,n=10,为偶数,则: : 即1010个大豆品种百粒重的中位数为19.3g19.3g。 )( 3 .1924 .192 .19226512/2/gxxxxMnnd第69页/共99页 2 2、已分组资料中

36、位数的计算方法: 若资料已分组,并编制成了次数分布表,可利用次数分布表计算中数。 其中:L L 中数所在组的下限;i i 组距; f f 中数所在组的次数;n n 总次数; c c 小于中数所在组的累积次数。)2(cnfiLMd第70页/共99页 【例2525】利用表2-62-6的数据计算140140行水稻产量的中位数。 由表2-62-6可知:i=15i=15,n=140n=140,中位数只能在累加次数为9191所对应的组限为157.5172.5157.5172.5这一组,于是可确定L=157.5L=157.5,=25=25,c=66c=66,代入(2-62-6)式得: 即140140行水稻产

37、量的中位数为159.9g159.9g。)(9 .15966214025155 .1572gcnfiLMd第71页/共99页 资料中出现次数最多的那个数或次数最多一组的组中值称为众数众数,记为MoMo。 表2-22-2所列100100个麦穗每穗小穗数的次数分布表中,1717出现的次数最多,则该资料的众数为1717。 表2-62-6所列140140行水稻产量的次数分布表中,157.5172.5157.5172.5这一组的次数最多,其组中值为 165165,则该资料的众数为165g165g。 第72页/共99页nnnnxxxxxxG1).(.2121 n个观测值相乘之积开n次方所得的方根,称为几何平

38、均数几何平均数,记作G。 niixnG11lg1lg或第73页/共99页日日 期期 根长(根长(mmmm) 日增长率日增长率 x 1gx x 1gx 第第1 1天天 17 17 2 23 0.35294 -0.45230 2 23 0.35294 -0.45230 3 30 0.30435 -0.51663 3 30 0.30435 -0.51663 4 38 0.26667 -0.57403 4 38 0.26667 -0.57403 5 51 0.34211 -0.46583 5 51 0.34211 -0.46583 6 72 0.41176 -0.38536 6 72 0.41176

39、-0.38536 7 86 0.19444 -0.71121 7 86 0.19444 -0.71121 总总 和和 1 187227 -3.1053687227 -3.10536第74页/共99页 G=1g-1(1gx1+1gx2+1gxn)/6 =1g-1(-0.45230-0.51663-0.57403-0.46583 - 0.38536-0.71121)/6 =1g-1( ) =1g-1(-0.51765) =0.30370 即蚕豆根长的日平均增长率为0.30370.3037或30.37%30.37%。610536. 3第75页/共99页 (五) 调和平均数 资料中各观测值倒数的算术平

40、均数的倒数,称为调和平均数调和平均数,记作H,即 inxnxxxnH1)111(1121第76页/共99页 【例2727】测定水分在某种土壤毛细管中的上升速率,得表2-112-11结果。试计算该土壤毛细管中水的平均上升速率。表2-112-11、土壤毛管水的上升速率 上升高度(cm) 上升速率(x,cm/min.) 1/x 010 6 1/6 1020 4 1/4 2030 2 1/2 合 计 11/12第77页/共99页 即该土壤毛细管中水的平均上升速率为每分钟3.27cm3.27cm。 注意:就同一资料而言, 算术平均数算术平均数几何平均数几何平均数调和平均数调和平均数min)/(27. 3

41、11361211311214161311cmH第78页/共99页 (一)标准差的意义(一)标准差的意义 用平均数作为样本的代表,其代表性的强弱受样本中各观测值变异程度的影响。如果各观测值变异小,则平均数的代表性强;如果各观测值变异大,则平均数代表性弱。 仅用平均数对一个资料的特征特性作统计描述是不全面的,还需引入一个表示表示资料中各观测值变异程度大小资料中各观测值变异程度大小的统计数。第79页/共99页 极差(全距)是表示资料中各观测值变异程度大小最简便的统计数 。 但计算极差时,只用了资料中的最大值和最小值,因而极差不能准确表达资料中全部观测值的变异程度,较粗略。当资料很多而又要迅速对资料的

42、变异程度作出判断时,可利用极差。 为了克服极差的缺点,常使用标准差来表示资料的变异程度。 第80页/共99页 设一样本有n n个观测值: 。为了准确描述样本内各观测值的变异程度,人们首先想到以平均数为标准,求各个观测值与平均数的差, ,即离均差离均差。离均差大,变异就大,反之,变异就小。 离均差离均差可表达观测值偏离平均数的程度和性质,但由于离均差之和为零,不可能把离均差之和作为描述样本内所有观测值总变异程度的统计数。 nxxxx,321)(xx 第81页/共99页 将每个离均差平方,进而求得离均差的平方和离均差的平方和,简称平方和平方和,记作 SS ,用来反映资料所有观测值的总变异程度。21

43、()niiSSxxnixxSS12第82页/共99页 由于平方和常随样本容量n而改变,为了消除样本容量的影响,用平方和除以样本容量n,即2() /xxn求出离均差平方和的平均数离均差平方和的平均数; 为了使所得的统计数是相应总体参数的无偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本容量 n,而用自由度自由度n-n-1 1。 第83页/共99页 用统计数 表示资料所有观测值的总变异程度。 2() /(1)xxn22()(1)xxSn2S 统计数 称为均方均方(缩写为MS),又称样本方差样本方差,记为S2,即2() /(1)xxn第84页/共99页 相应的总体参数叫总体方差总体方差

44、,记为2 2。 对于含有N N个个体的有限总体而言,2 2的计算公式为: NxNii122第85页/共99页 统计学上把样本方差统计学上把样本方差 S S2 2的平方根叫做的平方根叫做样本标准差样本标准差,记为S,即: 112nxxSnii第86页/共99页12nxxS简写为: 或: 122nnxxS第87页/共99页 前式中,根号里面分母n-1n-1称为离均差平方和的自由度离均差平方和的自由度,简称为自由度自由度,记为d=n-1d=n-1。 其统计意义是指在计算离均差平方和时,能够自由变动的离均差的个数在计算离均差平方和时,能够自由变动的离均差的个数。在计算离均差平方和时, n n个离均差受

45、到 这一条件的约束,能自由变动的离均差的个数是n-1n-1。当n-1n-1个离均差确定了,第 n n个离均差也就随之而定了,不能再任意变动。 0)(xx第88页/共99页 第89页/共99页 1 1、直接法直接法 对小样本(n30)(n30)和未经分组的资料,直接利用下式计算标准差。 22() /1xxnSn第90页/共99页 【例2828】 测量某一水稻单株粒重得5 5个观测值:3 3、8 8、7 7、6 6、4 4(g g)。计算其标准差S S。 即该样本标准差为2.07g2.07g。 )(07. 2155)28(1741222gnnxxS第91页/共99页 对于大样本(n(n30)30)

46、且已分组的资料,可在次数分布表的基础上采用加权法加权法计算标准差,计算公式为: 其中,f f为第i i组的次数;x x为第i i组的组中值;n n为样本观测值的总个数。22()1fxfxnSn第92页/共99页 【例2929】 根据表2-62-6的次数分布资料采用加权法计算每行水稻产量的标准差。 若采用直接法直接法计算标准差,S=36.24gS=36.24g。采用加权法加权法计算的的标准差与用直接法计算的标准差很接近。2222221221102 757 901 25514036.45( )140 1fxf xnSng 第93页/共99页 标准差标准差带有与样本资料相同的度量单位,不能用来比较度

47、量单位不同、或者度量单位相同但平均数不同的两个或多个样本资料的变异程度的大小。 需引入 另一个度量资料变异程度的统计数,使其既能反映样本资料的变异性,又能解决度量单位及平均数不同的问题。变异系数变异系数正是这样的统计数。 第94页/共99页 变异系数是样本标准差与样本平均数的比值变异系数是样本标准差与样本平均数的比值,以百分数形式表示,计算公式为: 变异系数是一个不带单位的纯数,可用以比较两个或多个样本资料变异变异系数是一个不带单位的纯数,可用以比较两个或多个样本资料变异程度的大小。程度的大小。 )172(%100 xSCV第95页/共99页 表2-13 2-13 两个小麦品种主茎高度的平均

48、数、标准差与变异系数 x第96页/共99页 从标准差看,品种甲的主茎高度比品种乙的变异程度大。因两者的平均数不同,在这种情况下,须用变异系数进行比较。 品种甲的变异系数 CVCV甲=9.23%=9.23% 品种乙的变异系数 CVCV乙=10.92%=10.92% 可见品种甲的主茎高度的变异程度比品种乙小。 第97页/共99页 在田间试验选择试验地时,常用变异系数作为表示试验地土壤差异程度的指标。 在使用变异系数时,由于它既受标准差S S的影响,也受平均数的影响,因此,在使用变异系数表示资料变异程度或进行资料间变异程度的比较时,应同时列出在使用变异系数表示资料变异程度或进行资料间变异程度的比较时,应同时列出平均数和标准差平均数和标准差,以避免产生误解。 第98页/共99页感谢您的观看!第99页/共99页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁