《特征数讲解知识讲解.ppt》由会员分享,可在线阅读,更多相关《特征数讲解知识讲解.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、跳转到第一页特征数讲解符号及其运算规则n n连加符号连加符号(sigma):(里昂海里昂海.尤拉尤拉Leonhard Eular17071783)可可简写成简写成:的运算规则的运算规则1122334455n n(连乘符号连乘符号)n n3“”(roof):估计值估计值n n算术平均数算术平均数算术平均数算术平均数应用广泛应用广泛应用广泛应用广泛,通常作为代表总体或样本的通常作为代表总体或样本的通常作为代表总体或样本的通常作为代表总体或样本的点估计值点估计值点估计值点估计值,与其它数据比较与其它数据比较与其它数据比较与其它数据比较,简单却很重要简单却很重要简单却很重要简单却很重要.11基本公式基
2、本公式基本公式基本公式:FF总体平均数总体平均数总体平均数总体平均数FF样本平均数样本平均数样本平均数样本平均数1算术平均数(Arithmetic mean)uu该公式常用于不分组资料,尤其是个数不多的资料。该公式常用于不分组资料,尤其是个数不多的资料。该公式常用于不分组资料,尤其是个数不多的资料。该公式常用于不分组资料,尤其是个数不多的资料。FF例例例例:30:30C C下三化螟蛹的历期如下下三化螟蛹的历期如下下三化螟蛹的历期如下下三化螟蛹的历期如下(单位单位单位单位:天天天天):):8,8,9,9,9,10,10,10,10,10,108,8,9,9,9,10,10,10,10,10,10
3、n n22加权平均加权平均加权平均加权平均(weighted averageweighted average)uu样本内观察值个数多,经过分级,制成频数分布表样本内观察值个数多,经过分级,制成频数分布表样本内观察值个数多,经过分级,制成频数分布表样本内观察值个数多,经过分级,制成频数分布表之后,计算平均数不必采用上述的基本公式,而应之后,计算平均数不必采用上述的基本公式,而应之后,计算平均数不必采用上述的基本公式,而应之后,计算平均数不必采用上述的基本公式,而应采用加权平均公式。采用加权平均公式。采用加权平均公式。采用加权平均公式。FFk:k:组数组数组数组数;x:x:组值或组中值组值或组中值
4、组值或组中值组值或组中值;f:f:频数频数频数频数,权重权重权重权重,“,“份量份量份量份量”FF例例例例:45:45个小区三化螟卵块数资料的频数分布表个小区三化螟卵块数资料的频数分布表个小区三化螟卵块数资料的频数分布表个小区三化螟卵块数资料的频数分布表:x x(组值组值组值组值)f f(频数频数频数频数)fxfx 0 19 0 0 19 0 1 14 14 1 14 14 2 10 20 2 10 20 3 2 6 3 2 6uu加权平均法的优点加权平均法的优点加权平均法的优点加权平均法的优点FFA A 简化计算简化计算简化计算简化计算FFB B 在调查和统计中有实际意义在调查和统计中有实际
5、意义在调查和统计中有实际意义在调查和统计中有实际意义 例例例例:某地区水稻三化螟卵块密度调查得下表某地区水稻三化螟卵块密度调查得下表某地区水稻三化螟卵块密度调查得下表某地区水稻三化螟卵块密度调查得下表:类型田类型田类型田类型田 卵块密度卵块密度卵块密度卵块密度 块块块块(1/15(1/15公倾公倾公倾公倾)-1-1 面积面积面积面积 早熟种早熟种早熟种早熟种 60 60 60 60 中熟种中熟种中熟种中熟种 240 100 240 100 迟熟种迟熟种迟熟种迟熟种 200 40 200 40 不能这样算不能这样算不能这样算不能这样算:算术平均数的特征算术平均数的特征算术平均数是通过变量资料中每
6、一个变员数计算出来的,因此能够较好地表示出资料的集中程度。算术平均数容易受极大和极小变员数的影响,因而减弱其对资料的代表性。计算方便。比较稳定,受抽样变动的影响较小。各离均差的总和等于零。各离均差的平方和为最小。2 众数(众数(Mode,Mo)n众数:是一个样本中频数最大,即重复出现最多的众数:是一个样本中频数最大,即重复出现最多的数据。数据。u例:例:测定测定10粒卵的历期为:粒卵的历期为:F7、6、8、8、8、8、8、8、11、10(天):(天):Mo=8(天):众数历期天):众数历期u众数的特点:众数的特点:可为可为0;可有多个。;可有多个。u众数的意义:众数的意义:往往大多数个体的动向
7、是最引人关心往往大多数个体的动向是最引人关心的,如盛孵期、盛发期等。众数表明种群动态的主的,如盛孵期、盛发期等。众数表明种群动态的主导方面。导方面。u众数的缺点众数的缺点:1有时不能精确估计;有时不能精确估计;2有时没有有时没有代表性,因为最大的频数只是相对而言,如代表性,因为最大的频数只是相对而言,如“大大”的不多则没代表性。的不多则没代表性。u以组限分组资料众数的确定:以组限分组资料众数的确定:例:例:组限组限 f 1000 105 15003 中位数(中位数(md)n第i=(n+1)/2个数。(n为奇数)uu例如:例如:3 3、6 6、8 8、3030、2020:mmd d=8=8uu又
8、如:又如:3 3、6 6、8 8、1111、5050:mmd d=8=8n n如如n n为偶数,则为中间两数的平均值。为偶数,则为中间两数的平均值。uu如:如:3 3、6 6、8 8、1111:mmd d=(6+8)/2=7=(6+8)/2=7众数、中位数和平均数的关系众数、中位数和平均数的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分
9、布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值众数、中位数、平均数的众数、中位数、平均数的特点和应用特点和应用1.众数众数u不受极端值影响不受极端值影响u具有不惟一性具有不惟一性u数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用2.中位数中位数u不受极端值影响不受极端值影响u数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用3.平均数平均数u易受极端值影响易受极端值影响u数学性质优良数学性质优良u数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用4 平均拥挤度平均拥挤度(mean crowding)n定义:在同一样方
10、中,平均每个个体拥有多少个其他个体。即平均每个个体与多少个其它个体在同一样方中(Lloyd,1967)。n公式推导:Lloyd用框调查某昆虫,共37框,每框虫数如下:u0、2、0、0、1、0、2、0、2、0、0、0、0、0、2、0、2、0、1、1、1、2、1、1、0、0、3、1、0、3、1、2、0、1、0、1、0 此数列为xi,其平均数为:n上面的数列因为无虫的框数太多,平均数不能完全反映资料的真实情况。如果用伙伴数(每框内每头虫别的同框虫数)来考虑,则可列出另一数列xj:u(1,1)(0)(1,1)(1,1)(1,1)(1,1)(0)(0)(0)(1,1)(0)(0)(2,2,2)(0)(2
11、,2,2)(0)(1,1)(0)(0)F设此数列的变员数个数为k,这时k=30.这个数列的平均数即为平均拥挤度:F原数列为:0、2、0、0、1、0、2、0、2、0、0、0、0、0、2、0、2、0、1、1、1、2、1、1、0、0、3、1、0、3、1、2、0、1、0、1、0nA:1头昆虫独居,没有伙伴,1(1-1)=0nB:没有昆虫,谈不上伙伴。0(0-0)=0nC:2(2-1)=2,2个“伙伴关系”nD:3(3-1)=6,6个“伙伴关系”n总伙伴数:0+0+2+6=8n n用原数列用原数列x xi i可直接计算平均拥挤度:可直接计算平均拥挤度:n n平均拥挤度的意义:平均拥挤度的意义:平均数相同
12、的资料可用平均平均数相同的资料可用平均拥挤度显示其集中程度,资料越集中,拥挤度越拥挤度显示其集中程度,资料越集中,拥挤度越大大。5 方差和标准差方差和标准差n平均数是样本或总体中各个变员数的代表值,但平均数是样本或总体中各个变员数的代表值,但它的代表性的强弱,与资料的变异程度有密切关它的代表性的强弱,与资料的变异程度有密切关系。两组变异程度不同的资料,它们的平均数完系。两组变异程度不同的资料,它们的平均数完全有可能相等。全有可能相等。u举一个夸张些的例子:举一个夸张些的例子:n因此,为描述样本或总体的特征,只求平均数是因此,为描述样本或总体的特征,只求平均数是不够的,必须同时测定其变异程度。不
13、够的,必须同时测定其变异程度。n极差(Range,R)u最粗放的变异程度指标,只计算了最大和最小两个变员数,不能完全表达样本或总体的变异程度。n方差(variance)和标准差(standard deviation)u(1)必须找一个标准值,以此标准值与各个变员数逐一进行比较,人们发现这个标准值采用算术平均数是最合适的:0)(:)(21=-xxxxxxxxn但把它们相加得离均差(、(Ln即各离均差的总和等于零。因为:n(2)uS2便是样本离均差平方和的平均值,简称均方,即样本方差,是总体方差的估计值。为什么要用n-1?n因为:一点样本方差的分母取稍小即即设)()()(:,0)()()()(0,
14、2222222-D+-=-=-=D-=D-=-DD=D=-,)(2-xxxnxxxxx)(22D+-DnxxxxxxxxxxmmmmmmQ)(2-xxn-1称为自由度(degree of freedom),一组数据中可以自由取值的数据的个数,当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当 x=5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值;比如x1=6,x2=7,那么x3则必然取2,而不能取其他值如此类推,如果某一统计量受k个条件限制,则自
15、由度为:df=n-k样本方差分母中的样本方差分母中的n-1uu方差的正平方根即为标准差(为了和平均数的单位方差的正平方根即为标准差(为了和平均数的单位一致):一致):标准差标准差计算标准差的简易公式计算标准差的简易公式n例:20头越冬三化螟幼虫体重资料(mg)如下:55.3、34.7、63.3、42.6、30.4、33.6、54.3、71.6、60.7、30.4、36.6、24.6、25.4、38.6、39.6、37.5、47.0、45.5、22.2、28.5,其标准差为:2分组资料:样本资料若已制成频数分布表,标准差可以下式计算:以组限分组时用组中值,计算结果为近似值。F例:以下是45个小区
16、三化螟卵块资料,利用频数分布表计算标准差。X f fx fx20 19 0 01 14 14 142 10 20 403 2 6 18 n=45 fx=40 fx2=72n(4)标准差的统计学意义标准差的统计学意义u1标准差越大,资料的变异程度越大,平均数的标准差越大,资料的变异程度越大,平均数的代表性越小。反之亦然。代表性越小。反之亦然。u2与算术平均数一样,标准差的计算要通过每个与算术平均数一样,标准差的计算要通过每个变员数,因而受到每个变员数的影响,尤其是最大变员数,因而受到每个变员数的影响,尤其是最大值和最小值的影响。值和最小值的影响。u3标准差的得名基于一个重要特征,即离均差平标准差
17、的得名基于一个重要特征,即离均差平方和是最小值,所以是最稳定的、能最准确表达变方和是最小值,所以是最稳定的、能最准确表达变异程度的特征数。异程度的特征数。(见书见书21页页)u4标准差与平均数一起表述的一些理论分布具有标准差与平均数一起表述的一些理论分布具有重要的意义。重要的意义。6 标准误标准误n n标准误(标准误(标准误(标准误(standard errorstandard error):):):):标准误差,简称标标准误差,简称标标准误差,简称标标准误差,简称标准误。准误。准误。准误。n n标准差和标准误的区别:标准差和标准误的区别:F标准差(标准差(standard deviation
18、):样本内变员数 偏离样本平均数 的程度的指标。F标准误(标准误(standard error):):样本平均数 偏离总体平均数 的程度的指标。误差条图误差条图(Error Bar Charts)7 变异系数变异系数n变异系数变异系数(Coefficient of variation,CV)是一是一个百分比指标,是一个相对的变异程度指标。个百分比指标,是一个相对的变异程度指标。u两个样本的变异程度的相互比较,不能单独以标两个样本的变异程度的相互比较,不能单独以标准差比较,特别是:准差比较,特别是:1单位(量纲)不同;单位(量纲)不同;2平均数不同;平均数不同;3数量水平不同时。数量水平不同时。
19、n例:8 相对变异相对变异 n相对变异(Relative variation,RV):也是一个相对的变异程度指标:相对变异在昆虫生态学研究中应用较多附:计算器的统计功能附:计算器的统计功能n1CASIO fx-3600PA:uMode 3 SD 进入统计功能uSHIFT AC 清除内存u 1 RUN 2 RUN 3 输入数据uSHIFT :uKOUT :n2SHARP EL-506P:u2ndF AC STAT 进入统计功能练习二练习二n1.就练习一第1题的数据计算如下特征数:u1利用基本公式计算算术平均数;2利用加权平均法公式计算算术平均数;3计算平均拥挤度;4指出众数;5利用基本公式计算标准差;6利用频数分布表计算标准差;7计算标准误;8计算变异系数。n2.就练习一第2题的数据计算如下特征数:u1利用基本公式计算算术平均数;2利用频数分布表计算平均数;3利用基本公式计算标准差;4利用频数分布表计算标准差;5计算标准误。6用两种方法计算的平均数和标准差相等吗?为什么?跳转到第一页此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢