《Excel中一些常用统计分析工具的功能_操作和注意事项.pdf》由会员分享,可在线阅读,更多相关《Excel中一些常用统计分析工具的功能_操作和注意事项.pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第 24 卷第 2 期(总第 140期)辐射防护通讯2004 年 4 月讲座Excel 中一些常用统计分析工具的功能、操作和注意事项Functions,Operations and Precautions ofthe Statistically Analytical Tools of Excel胡逢全肖运实(中国辐射防护研究院,太原,030006)Hu FengquanXiao Yunshi(China Institute for Radiation Protection,太原,030006)摘要在当今科研及其成果报告中,成熟的统计分析软件被广泛使用。本文介绍 Excel(中文版)中一些常用统
2、计分析工具的功能、操作和注意事项;指出了在实例检验中发现此软件中存在的一些缺陷和问题,强调进行全面的实例检验对正确使用此软件和深入学习数理统计的基本原理及重要概念均有重要价值。关键词:Excel统计软件统计描述统计检验方差分析相关和回归中图分类号:TP317.3文献标识码:A文章编号:1004-6356(2004)02-0033-08AbstractThe mature statistically analytical software is widely used in the scientific researchesand the resultant reports nowadays.T
3、his paper is to describe the functions,operations andprecautions of the statistically analytical tools of Excel(Chinese edition)in common use,indicating several drawbacks and problems discovered in case test.It is underscored thatconducting comprehensive case test will be of great help in corrective
4、 application of Excels toolsand serious study of the fundamental of mathematical statistics.Key words:ExcelStatistical softwareStatistical descriptionStatistical testVariance analysisCorrelation regression1引言在科研及其成果报告中,数据的统计和分析是保证和提高质量的一个十分重要的步骤。随着计算机的普遍使用,现成的如 Sas、Spss 和 Excel这些国际公认的成熟的统计分析软件的出现,使统
5、计分析的应用越来越便捷、准确和有效。由于Excel 有中文版,加上已有很多应用手册、培训班和电视讲座,目前国内辐射防护界科研和工作人员,已较普遍地能把 Excel 作为一般的电子表格程序应用,将如辐射监测等数据用 Excel 表格汇总给出;但很少使用 Excel 中十分有用的统计检验、方差分析及相关和回归等统计分析工具,Excel 的应用手册中也没有介绍这方面的内容。本文主要介绍 Excel 中一些常用统计分析工具的功能、操作和注意事项。笔者在使用Excel 中的统计分析工具中,逐一用过去做过的统计分析的例题作了检验,发现其中有些描述不当或缺陷(或错误),为此特别在表格中以“注意事项”给出,并
6、在建议中予以强调,这些对防止应用错误是十分重要的。2Excel 常用统计分析工具介绍表 1表 5 给出的依次是 Excel 中有关统计描述、t 检验和F 检验、V2检验、方差分析、相关与回归分析等统计分析工具的功能、操作和注意事项。在 Excel 中的这些统计分析工具,分别在“插33收稿日期:2003-12-23作者简介:胡逢全(1940-),男,1965年毕业于北京大学技术物理系核物理专业,研究员。入”菜单下的“fx函数统计”和“工具”菜单下“数据分析”中(如果“工具”菜单下没有这个命令,则需要安装“分析工具库”,可以在“工具”菜单中,单击“加载宏”命令,选择“分析工具库”,详情参见Exce
7、l 帮助)。在表中的“粘贴函数或分析工具”中,分别表示所使用的“粘贴函数”和“分析工具”。为了便于区分和阐述,凡是在 Excel 统计分析工具的输入和输出数据框中所用的量名或标志,在本文及其各表中均打上“”号,如“x”、“standard-dev”、“array1”等。表 1Excel中有关统计描述的功能、操作和注意事项粘贴函数或分析工具功能及其输出结果输入参数注意事项工具数据分析统计描述1)以列表方式给出输入的一组或多组数据各自的以下统计参数:均值、单次测量标准差、样本容量、范围;均值标准差、95%置信区间半宽度;合计、中位数、方差;峰度、偏斜度;最大值、最小值、第几个最大和最小值。(1)在
8、“输入区域”,输入包括标志单元在内的数据的区域(以单元格起止位置表示);(2)在“分组方式”中选择按列还是按行排列,并选中标志位于第 1行;(3)按输出内容要求,选择“汇总统计”、置信区间的置信度及第几个最大值、最小值;(4)输出表的位置(输出区域的起始单元格)。(1)输出参数的译名,与通常或标准术语有的差别很大,如:“置信度”、“标准误差”、“标准偏差”、“区域”和“计数”实际上分别是置信区间半宽度、均值标准差、单次测量标准差、最大与最小值之差和样本容量(或样品数);(2)“峰值”就是通常用于检验正态分布的“峰度”,但是减去了 3,即是a4-3;(3)用一二个“粘贴函数”计算的参数值,可检验
9、输入有否错误。average2)给出一组数据的算术平均值输入数据的区域(不包括标志单元)stdev给出一组数据的单次测量标准差,在Excel中常又称“样本标准偏差”同上count给出一组数据的样本容量同上var给出一组数据的方差同上confidence给出一组数据均值的置信区间半宽度,但它是按 u 统计量计算的,即按 t=1.96 计算(与样品数无关)(1)在“alpha”中输入显著性水平,即A值;(2)在“stadard-dev”中输入单次测量标准差;(3)在“Size”中输入样本容量。(1)输 入 参 数“standard-dev”,不 是confidence 框中所写的已知总体标准差,而
10、是样本标准偏差;(2)给出的不是自由度为(n-1)的置信区间,而是自由度为时的置信区间;(3)给出的不是置信区间,而是置信区间的半宽度。kurt给出一组数据的峰度输入数据的区域减了3 的峰度值 a4-3,a4是第4 阶原点矩skew给出一组数据的偏斜度同上covar给出两组数据的协方差在“array1”和“array2”分别输入两组数据的区域(不包括标志单元)sum给出一组数据的合计(总和)输入数据的区域median给出一组数据的中位数同上mode给出一组数据的众数同上max给出一组数据的最大值同上min给出一组数据的最小值同上precentile给出一组数据的第p位百分位数Pp(1)在“ar
11、ray”中输入数据的区域;(2)在“K”中输入 p/100(如第 50位百分位数,p=50,则 K=0.5)K=p/100,p 为第几位百分位数的序号1)由下拉菜单的操作途径为:工具数据分析分析工具统计描述,以下只给出分析工具的名称,省略菜单操作路径;2)本文所有表中列出的“粘贴函数”全部是在“fx统计”分类下的粘贴函数。34辐射防护通讯2004年 4月 第 24 卷 第 2 期表 2Excel中有关t检验和F检验的功能、操作和注意事项粘贴函数或分析工具功能及其输出结果输入参数注意事项Ttest已知比较的两组数据,给出t 检验的概率“p”,即可能犯第一类错误的概率(否定原假 设可能 犯错 误的
12、 概率),p 的含义下同(1)在“array1”和“array2”中分别输入两组样本数据的区域,分别以各自的单元区域表示,如 D4:D13 和 E4:E15;也可用D4:D13 和E4:E15;(2)在“tails”选框中选择单侧还是双侧检验:输入 1 和 2,分别代表单侧和双侧;(3)在“type”选框中选择成组还是成对检验:输入 1、2 和 3 分别代表成对、方差相等的成组和方差不等的成组检验只用于两组数据间的 t 检验,不能用于一组样本数据的参数与总体参数间的 t 检验Tdist已知比较数据的t 值和自由度,给出成组比较 t 检验的概率p(1)在“X”中输入由比较数据算得的 t 值;(2
13、)在“deg-freedom”中输入自由度 df;(3)在“tails”选框中选择单侧还是双侧检验:输入 1 和 2 分别代表单侧和双侧只能给出成组等方差的 t 检验结果;也可用于一组样本数据的参数与总体参数的 t 检验Tinv已知双侧检验的概率和自由度,给出相应的 t 分布的上侧分位数,即通常所称的临界值,相当于 tA/2,df表(1)在“probability”中输入预定的双侧 t 检验的(否定区)概率 A;(2)在“deg-freedom”中输入自由度 df输入的概率,应是双侧的 A(不能是A/2);给出的是双侧的上侧分位数,也是概率为 A/2 时的单侧的上侧分位数t检验:平均值的成对二
14、样本分析以列表形式给出包括以下内容的结果:各组样本数据均值、方差和样品数;两组数据按成对合并后的方差、自由度和 t 值;成对 t 检验双侧和单侧检验的概率 p;选定A下双侧和单侧的t 临界值(1)在“变量 1”和“变量 2”中分别输入两组比较数据的区域 包括“标志”(即数据名称)单元;(2)选中“标志”选框;(3)在“A”选框中填入预定的显著性水平值 A;(4)输出区域(给出起始单元格);也可另在新工作组表中给出,余处类同(1)主要功能与Ttest相同,但给出了中间阶段的更多信息;(2)若只要检验结果,用 Ttest 更简易,结果便于直接并入数据表内;(3)可用于检验 Ttest 和均值、方差
15、等参数的粘贴函数计算结果;(4)输出数据框中样品数误译为观测值t 检验:双样本等方差假设除给出方差相等的成组 t 检验结果外,输出包含的内容同上同上同上t检验:双样本异方差假设除给出方差不等的成组t检验结果外,输出包含的内容同上同上同上Ftest已知比较的两组样本数据,给出双侧F 检验概率 p在“array1”和“array2”中分别输入两组样本的数据区域给出的不是 Ftest 数据框中指出的单侧检验的概率“p”而是 2p,即双侧F 检验的概率Fdist已知比较的两组数据的 F值及各组数据的自由度,给出单侧F 检验的概率“p”(1)在“X”中输入 F 值,如 var1/var2(两组数据的方差
16、之比);(2)在“deg-freedom1”和“deg-freedom2”中分别输入两组数据的自由度df 1和df 2(1)Fdist 数据框中没有说明给出的概率是单侧还是双侧的,实际上给出的是单侧的“p”;(2)df 1和df 2不能颠倒,计算F值时分子数据对应的为 df 1;(3)常用双侧检验,其概率应乘以 2Finv已知单侧 F 检验的概率 A及两组数据各自的自由度,给出F 统计量单侧分位数,即 FA,df 1,df 2,(1)在“probability”中输入单侧 F 检验(否定区)的概率 A;(2)在“deg-freedom1”和“deg-freedom2”中分别输入两组数据的自由度
17、df 1 和 df 2(1)同上;(2)用于双侧,“probability”要输入A/2F 检验:双样本方差”(比较)以列表形式给出包括以下内容的结果:各组样本数据均值、方差和样品数;两组数据合并的自由度和 F 值;单侧检验的概率 p;选定A(0.05)下单侧的F 临界值(1)在“变量 1”和“变量 2”中分别输入两组比较数据的区域(包括“标志”单元),并选中“标志”选框;(2)在“A”选框中填入预定的显著性水平值;(3)输出区域(给出起始单元格)给出的是单侧检验的概率“p”,对双侧检验的概率,要乘以 235Excel中一些常用统计分析工具的功能、操作和注意事项胡逢全表 3Excel 中有关
18、V2检验的功能、操作和注意事项粘贴函数功能及其输出结果输入参数注意事项Chitest已知一组数据在一定分组条件下,在各区段内的实际频数和(假定满足某种分布的)理论频数,给出判定是否满足该分布的 V2检验的概率“p”,但其自由度固定为(n-1),n为分组的区段数(1)在“actual-range”中 输入 实际频数的数据区域,如C5:C14;(2)在“expected-range”中 输入 理论频数的数据区域,如 D5:D14(1)各区段的实测频数和理论频数,在chitest框中分别为“actual-range”和“expected-range”,并分别译为“观察值的值域”和“理论值的值域”均是
19、不合适的;(2)输出的是自由度为(n-1)的单侧 V2检验的概率p,而实际中自由度不是(n-1),而是(n-k),k 是计算理论频数时所用的包括总频数在内的统计量数(如样本均值、样本标准差),所以在配合泊松分布和正态分布的 V2检验时,自由度分别为(n-2)和(n-3);(3)可由Chitest给出的概率p 和自由度(n-1),作为Chiinv的输入参数,得出相应的 V2值;再将这个V2值和实际的自由度(n-2)或(n-3)作为 Chidest 的输入参数,才能给出所需的对应实际自由度配合分布的V2检验的概率;(4)V2分布随自由度变化十分明显,尤其在自由度小的时候,所以用Chitest 时,
20、纠正其结果与实际自由度的差别是十分重要和必需的Chidist已知V2值和自由度,给出单侧 V2检验的概率“p”(1)在“X”中输入已知(或已算得的)V2值;(2)在“deg-freedom”中 输 入相应的自由度 df(1)给出的 p 是单侧检验的概率;在双侧检验时,若 A=0.05,接受和否定原假设的判据是:0.025 p 0.975 和 p 0.975;(2)在chidist框中,给出的结果译为“返回V2分布的收尾概率”,需注意上面的实际含义,这类难理解的翻译很多Chiinv已知单侧检验的概率 A和自由度 df,给出相应的 V2分布的分位数 V2A,df,功能同通常数理统计书中的 V2分布
21、表(1)在“probability”中输入预选的概率 A;(2)在“deg-freedom”中 输 入相应的自由度 df在 chiinv 框中,给出的结果译为“返回具有给定概率的收尾 V2分布的区间点”,注意在“功能和输出结果”中所述的实际含义表 4Excel 中有关方差分析的功能、操作和注意事项分析工具功能及其输出结果输入参数注意事项方差分析:单因素方差分析以列表方式给出满足各组方差齐性条件下(无论各组重复测量数是否相同)的单因素方差分析结果:在“summary”表中给出各组的样本容量、总和、均值和方差;在“方差分析”表中给出组间、组内和总计的平 方 和(SS)、自 由 度(df)、均 方(
22、MS),以及 F 临界值、F 值及其相应的概率p(1)在“输入区域”输入数据的区域,包括标志行(或列);(2)在“分组方式”中,选择按列还是按行,并选中“标志位于第 1 行”;(3)选择显著性水平 A;(4)选择输出表的位置(1)没有指出适用条件是方差须齐性,是否齐性,多数情况下可以由比较各组方差大小大致判定;(2)即使 p A,只是各组均值均相等的原假设被否定,但哪些组间存在显著差异,还需由多重比较求得,而Excel 中没有现成的这类程序;所以,多数情况为获得单因素方差分析的结果,不如用 t 检验更方便方差分析:无重复双因素方差分析在“sammary”表中分别给出各行和各列数据的样本容量、总
23、和、均值和方差;在“方差分析”表中给出行间、列间、误差和总计的以下各值:平方和(SS)、自由度(df)、均方(MS);以及分别给出行间和列间均方对误差均方的 F 值及其相应的概率p 和 F 临界值(1)在“输入区域”输入数据的区域,包括标志行和列;(2)选中“标志”;(3)选择显著性水平 A;(4)选择输出表的位置仅用于没有重复测量的双因素方差分析方差分析:可重复双因素方差分析基本同上,但在“方差分析”表中增加给出反映有否交互作用的 F 值及其相应的概率 p 和 F 临界值,当然也定有交互项的SS、df 和 MS(1)在“输入区域”输入数据的区域,包括标志行和列;(2)在“每一样本的行数”中输
24、入重复测量(或样品)数;(3)选择显著性水平 A;(4)选择输出表的位置仅用于重复测量数相同条件下的双因素方差分析,表的设计有专门要求,即重复样品的数据要分别排在同列的不同行内,如重复数=4,则每种“处理”的 4 个数据,要排在同列的4 行中36辐射防护通讯2004年 4月 第 24 卷 第 2 期表 5Excel中有关回归和相关分析的功能、操作和注意事项粘贴函数或分析工具功能及其输出结果输入参数注意事项回归在“summary”表中给 出(线性回归的)相关系数R、R2、回归的误差SE;给出截距、斜率及其误差和置信区间;还可选择给出残差表、残差图和拟合曲线图,在拟合图上还可进一步给出拟合方程(线
25、性、对数、指数、多项式)的拟合曲线及其方程和R2(1)在“Y 值输入区域”和“X值输入区域”分别输入因变量和自变量的区域(不包括标志);(2)选中“标志”,选择是否要求通过原点和置信水平;(3)在“残差”选框中分别选择是否要求输出残差、标准残差、残差图和拟合曲线图;(4)输出图表的位置(1)数据必须按列排列,不能按行排列!(2)Y必须是因变量,而X是自变量,不能颠倒!否则截距、斜率值及其误差和置信区间等均将不同;(3)在“summary output”的最后 1 个子表中,第 1 行以 intercept 为栏名的是截距行,第 2 行以自变量标志为栏名的是斜率行,依此可以判定输入的 Y 和 X
26、是否颠倒;(4)输出的标准残差=残差/(残差的误差S0),这里的 S0相当于 n 个残差的标准差,不是真正的残差的误差(summary output中的)SE(自由度为(n-2),SE/S0=(n-1)/(n-2)0.5correl(array1,array2)给出线性回归的相关系数R在“array1”和“array2”中分别输入相关分析的两组数据的区域(不包括标志)RSQ(array1,array2)给出线性回归的相关指数R2同上covar(array1,array2)给出两组数据的协方差同上intercept(know-ys,know-x s)给出线性回归的截距在“know-y s”和“k
27、now-x s”中分别输入因变量和自变量的区域(不包括标志)know-y s 必须是因变量,know-x s 是自变量,不能颠倒!slope(know-ys,know-x s)给出线性回归的斜率同上同上steyx(know-ys,know-x s)给出线性回归的误差 SE同上同上forecast(x,know-y s,know-x s)给出线性回归的一个预测值同上。此外,在“x”中输入需要预测的数据点的自变量数值同上3举例为了更直观地理解这些统计分析工具的功能和操作,以下给出 2 个使用 Excel 进行统计分析的例子。3.1 例 1此例 4 条河流中铀浓度数据取自文献 1 方差分析一章中的表
28、 7-3。用 Excel 中的“粘贴函数”和“工具数据分析分析工具”,给出了各组数据的统计描述、各组数据均值间的 t 检验和全部数据的方差分析结果。原始数据见表 6;统计描述和 t 检验结果示于表 7;方差分析结果示于表8。这些表(除原始数据)都是 Excel 的原输出表结果(对保留的小数点位数经过处理),所有量名都是 Excel 中的原名。从表 7和表 8 可见:(1)数据的统计描述由“粘贴函数”和”分析工具”给出的结果,除置信区间半宽度 d 外,都是一致的。(2)方差分析的结果全部与文献 1 中的相同;F 值的概率p=0.0026 0.05,表明4 条河流铀浓度均相等的原假设被否定,但未能
29、给出哪些河流间有显著差异;而从 Ttest 的成对双侧t 检验结果,表明 C与 A、B、D 均有显著差异,其他河流间未见显著差异;从置信区间是否相离判断,仅是 C 与 B、D 间有显著差异。(3)如果采用 Excel 数据表,那么如平均值、标准差、n、范围、置信区间等描述数据的必要的统计量的数值,均可利用粘贴函数方便地完成,并与原始数据合并在同一表中;多组数据的结果是由单组(或两组比较)数据,经单元地址按相对引用“拖拉”而得到的(见第 4 节)。37Excel中一些常用统计分析工具的功能、操作和注意事项胡逢全表 64 条河流中铀浓度(Lg/L)序号河流中铀浓度(Lg/L)ABCD10.540.
30、750.630.8520.700.800.610.8730.680.720.590.7240.710.710.560.7850.520.560.420.6360.750.680.400.9070.780.660.530.5480.610.610.550.63表 74 条河流的铀浓度数据的统计描述和 t 检验结果粘贴函数:插入fx函数统计粘贴函数量名ABCDAverage平均值x-0.6610.6860.5360.740stdev标准差Sx0.0950.0770.0850.131count样品容量n8888min最小值xmin0.520.560.400.54max最大值xmax0.780.80.
31、630.9范围xmin xmax0.520.780.560.80.400.630.540.9confidence置信区间半宽度 d10.0660.0530.0590.091取自“统计描述”置信区间半宽度 d20.07960.06410.07060.1195%上置信限 L=x-+d20.7410.7500.6070.85095%下置信限 U=x-d20.5820.6220.4660.63095%置信区间 L U0.5820.7410.6220.7500.4660.6070.6300.850Ttest成对比较双侧t检验pj-(j+1)0.507010250.0002880.005606j-(j+2
32、)0.0308249630.158060298j-(j+3)0.20116679注释B与C,C与D差异显著;A与C差异显著分析工具:工具数据分析统计描述分析工具ABCD平均0.6610.6860.5360.740标准误差0.0340.0270.0300.046中值0.690.6950.5550.75标准偏差0.0950.0770.0850.131样本方差0.009070.005880.007140.01726峰值-1.190-0.207-0.578-1.466偏斜度-0.481-0.292-0.854-0.251区域0.260.240.230.36最小值0.520.560.40.54最大值0.
33、780.80.630.9求和5.295.494.295.92计数8888最大(1)0.780.80.630.9最小(1)0.520.560.40.54置信度(95.0%)0.07960.06410.07060.109838辐射防护通讯2004年 4月 第 24 卷 第 2 期表 84 条河流中铀浓度数据的方差分析输出结果分析工具:工具数据分析方差分析单因素方差分析SUMMARY组计数求和平均方差A85.290.661250.00907B85.490.686250.005884C84.290.536250.007141D85.920.740.017257方差分析差异源SSdfMSFP-value
34、F crit组间 0.17870930.05957 6.055104 0.0026 2.946685组内 0.275463 280.009838总计 0.454172 313.2 例 2此例数据(见表 9)取自文献 2 7.2 节的表12;用“粘贴函数”和“分析工具”所得结果示于表10;拟合曲线图示于图 1。表10 中,“分析工具:工具数据分析回归”的量名和符号,均是 Excel中的原名(或符号),要注意其中第 3 个子表中Intercept 列和X Variable 1 列分别是截距(a)列和斜率(b)列,表中第 2 行“标准误差”给出的就是 a 和 b的误差,余此类推(参见表 5);回归统
35、计中的“标准误差”是回归的误差 RE。表 9某厂离废水排放口不同距离 x 处的底泥表面 C 照射量率 yy(LR/h)x(m)y(LR/h)x(m)1061033.190802024.5110663019.213041.74018.415041.75024.920038.27010.5300表 10某厂底泥表面C照射量率y与离废水排放口的距离 x 的相关分析粘贴函数:插入 fx函数统计(线性回归参数)粘贴函数量名数值correl相关系数 R-0.761intercept截距 a67.383slope斜率 m-0.254RSQ相关指数 R20.58steyx回归误差 RE19.313分析工具:工
36、具数据分析回归SUMMARY OUTPUT回归统计Multiple R0.761R Square0.58Adjusted R Square0.538标准误差19.313观测值12InterceptX Variable 1Coefficients67.383-0.254标准误差8.8150.068t Stat7.644-3.715P-value1.75E-050.004Lower 95%47.741-0.406Upper95%87.024-0.102RESIDUAL OUTPUT观测值预测Y残差164.8541.15262.3117.69359.776.23457.24-15.54554.70-
37、13.00649.63-11.43744.55-11.45839.48-14.98934.41-15.211029.33-10.931116.658.2512-8.7219.22图 1底泥表面C照射量率y与离废水排放口的距离x的拟合曲线图39Excel中一些常用统计分析工具的功能、操作和注意事项胡逢全从表 10 和图 1 可见,由“粘贴函数”与“分析工具”给出的同一量的结果完全相同,表与图给出的结果也相同,且其与文献2计算的结果也一致。图 1 是在原始图上,执行以下步骤得到的:(1)选中图上任一数据点,点击鼠标右键,选“添加趋势线”。(2)在“添加趋势线”的“类型”选框中选择拟合曲线的函数类型
38、:线性、对数、指数、幂函数和多项式;再在“选项”框选中“显示公式”和“显示 R平方值”。4使用中的几点建议4.1 使用前需进行实例检验从上述表 1表5 的注意事项看,Excel(中文版)中的统计工具还存在以下一些缺陷和问题:(1)一些输入参数和输出量的术语,有不少是非标准的或非专业人员通用的,而且不经过实例检验是容易被误解的。如“统计描述”中的“置信度”和“峰值”实际应分别是置信区间半宽度和减3 后的峰度 a4-3;“回归”输出的两个表中的“标准误差”,是十分有用的,其分别是回归误差 RE和截距a、斜率b的误差Sa、Sb,但不经实例检验很难确认(见表 5)。(2)有些输出数据的含义是错误的或不
39、明确的。如“Ftest”输出的不是“单侧检验的概率”而是双侧检验的概率;“confidence”输出的不是通常的自由度为(n-1)的置信区间半宽度,而是自由度为时的置信区间半宽度;“Chitest”输出的是单侧 V2检验的概率,但没有说明其对应的自由度df=n-1,这又恰是配合分布检验中不大能用的(常用的配合泊松分布检验 df=n-2 或正态分布检验df=n-3,见表 3)。(3)有些对输入数据的排列有专门要求,但又没有给出必要的指示。如“回归”要求两组数据按列排列;“可重复双因素方差分析”中要求重复样品数据排在同列的不同行内等。这类缺陷和问题,对初次使用者准确地理解输入和输出数据的确切含义及
40、其如何输入造成很大困难,甚至妨碍了它的推广应用。但是,以笔者的体会,只要在使用前经过实例检验,这些困难就很容易解决,就能便捷、准确、有效地使用这类统计软件。检验所用实例最好是用自己过去作过统计分析计算的例子或有关数理统计教材中的举例,也可自己编些计算简单的例子,以便于核对。另外,数理统计应用的学习,特别是掌握常用统计分析方法的基本原理和重要概念,非常需要多做实例计算3;而 Excel 中的统计分析功能能很迅速地计算复杂例题,而且计算准确,所以它还可用作数理统计的学习工具。因此,在使用前对 Excel中的这些常用工具进行全面的实例检验,具有使用和深入学习的双重价值。4.2 利用“粘贴函数”和“分
41、析工具”互检无论数据统计描述、统计检验或相关和回归分析,Excel 可从“粘贴函数”和“分析工具”两个途径得到结果。一般来说,“粘贴函数”给出的结果比较单一,但便于直接汇总于包括原始数据的数据表中;“分析工具”输出的参数更多,但有的不是汇总数据表中所需要的。两者的输入方式有的也有些不同,如“粘贴函数”输入数据区域不包括标志,而“分析工具”一般包括标志;“粘贴函数”对单元 区域使用“相对引用”如 D7:D14,而“分析工具”多用“绝对引用”如D7:D14(最好用鼠标选中,Excel 将会自动给出合理的引用格式)等。除了仔细核对输入数据外,采用“粘贴函数”和“分析工具”两种输出,是很省力的互检手段
42、;然后再根据需要,将结果汇总于数据表。4.3 使用“粘贴函数”时宜多用“拖拉”操作在多组数据进行相同操作时,利用 Excel 的“拖拉”操作,可以大大减少工作量和差错。如在 t检验时,利用 Ttest 算相邻两列(或两行)的 t 检验结果 p,采用在该给出结果的单元格用拖拉方式,可以立即给出其他相邻列(或行)间同类检验的p 值;为了用拖拉方式,输出表的格式要稍作加工(见表 7)。至于要给出各自的统计参数,只需在给出一组数据的统计结果的单元格用拖拉方式,即可给出其余各组的相应结果。5参考文献1高玉堂,主编.环境监测常用统计方法.北京:原子能出版社,1980.2胡逢全.数据处理中常用统计方法的基本原理及重要概念(II).辐射防护通讯,1996,16(3):34.3胡逢全.数据处理中常用统计方法的基本原理及重要概念(I).辐射防护通讯,1996,16(1):27.(责任编辑:赵宁)40辐射防护通讯2004年 4月 第 24 卷 第 2 期