《EXCEL与数据分析7.ppt》由会员分享,可在线阅读,更多相关《EXCEL与数据分析7.ppt(102页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、7.1Excel统计函数7.2用Excel做统计推断7.3随机发生器和Excel抽样7.4相关分析与协方差分析7.5方差分析7.6回归分析7.7趋势预测/回归分析模型7.8卡方检验7.97.9指数平滑法指数平滑法7.10 7.10 移动平均移动平均第七章Excel数据分析实战1.AVERAGE1.AVERAGE算术平均数算术平均数AVERAGE(number1,number2,.)Number1,number2,.为需要计算平均值的为需要计算平均值的1到到30个参数。个参数。说明参数可以是数字,或者是包含数字的名称、数参数可以是数字,或者是包含数字的名称、数组或引用。组或引用。如果数组或引用参
2、数包含文本、逻辑值或空白如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单单元格,则这些值将被忽略;但包含零值的单元格将计算在内。元格将计算在内。7.1Excel统计函数2.AVERAGEA2.AVERAGEA计算参数列表中数值的平均值(算数平均值)。不仅数字,计算参数列表中数值的平均值(算数平均值)。不仅数字,而且文本和逻辑值(如而且文本和逻辑值(如TRUE和和FALSE)也将计算在内。)也将计算在内。语法AVERAGEA(value1,value2,.)Value1,value2,.为需要计算平均值的为需要计算平均值的1到到30个单元格、个单元格、单元格区域或
3、数值。单元格区域或数值。说明参数必须为数值、名称、数组或引用。参数必须为数值、名称、数组或引用。包含文本的数组或引用参数将作为包含文本的数组或引用参数将作为0(零)计算。空文本(零)计算。空文本()也作为也作为0(零)计算。如果在平均值的计算中不能包含文本值,(零)计算。如果在平均值的计算中不能包含文本值,请使用函数请使用函数AVERAGE。包含包含TRUE的参数作为的参数作为1计算;包含计算;包含FALSE的参数作为的参数作为0计算。计算。7.1Excel统计函数3.TRIMMEAN3.TRIMMEAN返回数据集的返回数据集的内部平均值内部平均值。函数。函数TRIMMEAN先从数据集的头部先
4、从数据集的头部和尾部除去一定百分比的数据点,然后再求平均值。当希望在分和尾部除去一定百分比的数据点,然后再求平均值。当希望在分析中剔除一部分数据的计算时,可以使用此函数。析中剔除一部分数据的计算时,可以使用此函数。语法语法TRIMMEAN(array,percent)Array为需要进行整理并求平均值的数组或数值区域。为需要进行整理并求平均值的数组或数值区域。Percent为计算时所要除去的数据点的比例,例如,如果为计算时所要除去的数据点的比例,例如,如果percent=0.2,在,在20个数据点的集合中,就要除去个数据点的集合中,就要除去4个数据点个数据点(20 x0.2):头部除去:头部除
5、去2个,尾部除去个,尾部除去2个。个。说明说明如果如果percent1,函数,函数TRIMMEAN返回错误值返回错误值#NUM!。函数函数TRIMMEAN将除去的数据点数目向下舍入为最接近的将除去的数据点数目向下舍入为最接近的2的的倍数。如果倍数。如果percent=0.1,30个数据点的个数据点的10%等于等于3个数据点。个数据点。函数函数TRIMMEAN将对称地在数据集的头部和尾部各除去一个数将对称地在数据集的头部和尾部各除去一个数据。据。7.1Excel统计函数4.AVEDEV4.AVEDEV返回一组数据与其均值的绝对偏差的平均值,返回一组数据与其均值的绝对偏差的平均值,ADEDEV用于
6、评测这组数据的离散度。用于评测这组数据的离散度。语法语法AVEDEV(number1,number2,.)Number1,number2,.用于计算绝对偏差平均值的一用于计算绝对偏差平均值的一组参数,参数的个数可以有组参数,参数的个数可以有1到到30个,可以用单一数个,可以用单一数组(即对数组区域的引用)代替用逗号分隔的参数。组(即对数组区域的引用)代替用逗号分隔的参数。说明说明参数必须是数字,或者是包含数字的名称、数组或引用。参数必须是数字,或者是包含数字的名称、数组或引用。如果数组或引用参数包含文本、逻辑值或空白单元格,如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包
7、含零值的单元格将计算在内。则这些值将被忽略;但包含零值的单元格将计算在内。7.1Excel统计函数5.COUNT5.COUNT返回包含数字以及包含参数列表中的数字的单元格的个数。利用返回包含数字以及包含参数列表中的数字的单元格的个数。利用函数函数COUNT可以计算单元格区域或数字数组中数字字段的输入可以计算单元格区域或数字数组中数字字段的输入项个数。项个数。语法语法COUNT(value1,value2,.)Value1,value2,.为包含或引用各种类型数据的参数(为包含或引用各种类型数据的参数(1到到30个),但只有数字类型的数据才被计算。个),但只有数字类型的数据才被计算。说明说明函数
8、函数COUNT在计数时,将把数字、日期、或以文本代表的数字在计数时,将把数字、日期、或以文本代表的数字计算在内;但是错误值或其他无法转换成数字的文字将被忽略。计算在内;但是错误值或其他无法转换成数字的文字将被忽略。如果参数是一个数组或引用,那么只统计数组或引用中的数字;如果参数是一个数组或引用,那么只统计数组或引用中的数字;数组或引用中的空白单元格、逻辑值、文字或错误值都将被忽略。数组或引用中的空白单元格、逻辑值、文字或错误值都将被忽略。如果要统计逻辑值、文字或错误值,请使用函数如果要统计逻辑值、文字或错误值,请使用函数COUNTA7.1Excel统计函数6.COUNTA6.COUNTA返回参
9、数列表中非空值的单元格个数。利用函数返回参数列表中非空值的单元格个数。利用函数COUNTA可以可以计算单元格区域或数组中包含数据的单元格个数。计算单元格区域或数组中包含数据的单元格个数。语法COUNTA(value1,value2,.)Value1,value2,.为所要计算的值,参数个数为为所要计算的值,参数个数为1到到30个。个。在这种情况下,参数值可以是任何类型,它们可以包括空字符在这种情况下,参数值可以是任何类型,它们可以包括空字符(),但不包括空白单元格。如果参数是数组或单元格引用,则,但不包括空白单元格。如果参数是数组或单元格引用,则数组或引用中的空白单元格将被忽略。如果不需要统计
10、逻辑值、数组或引用中的空白单元格将被忽略。如果不需要统计逻辑值、文字或错误值,请使用函数文字或错误值,请使用函数COUNT。7.1Excel统计函数7.COUNTBLANK7.COUNTBLANK计算指定单元格区域中空白单元格的个数。计算指定单元格区域中空白单元格的个数。语法COUNTBLANK(range)Range为需要计算其中空白单元格个数的区域。为需要计算其中空白单元格个数的区域。说明即使单元格中含有返回值为空文本即使单元格中含有返回值为空文本()的公式,该单元格也会计的公式,该单元格也会计算在内,但包含零值的单元格不计算在内。算在内,但包含零值的单元格不计算在内。7.1Excel统计
11、函数8.COUNTIF8.COUNTIF计算区域中满足给定条件的单元格的个数。计算区域中满足给定条件的单元格的个数。语法语法COUNTIF(range,criteria)Range为需要计算其中满足条件的单元格数目的单元格区域。为需要计算其中满足条件的单元格数目的单元格区域。Criteria为确定哪些单元格将被计算在内的条件,其形式可以为为确定哪些单元格将被计算在内的条件,其形式可以为数字、表达式、单元格引用或文本。例如,条件可以表示为数字、表达式、单元格引用或文本。例如,条件可以表示为32、32、32、apples或或B4。说明说明MicrosoftExcel还提供了其他一些函数,它们可根据
12、条件来分还提供了其他一些函数,它们可根据条件来分析数据。析数据。若要计算基于一个文本字符串或某范围内的一个数值的总和,可若要计算基于一个文本字符串或某范围内的一个数值的总和,可使用使用SUMIF工作表函数。工作表函数。若要使公式返回两个基于条件的值之一,例如某指定销售金额的若要使公式返回两个基于条件的值之一,例如某指定销售金额的销售红利,可使用销售红利,可使用IF工作表函数。工作表函数。若要计算空或非空单元格的个数,可使用若要计算空或非空单元格的个数,可使用COUNTA和和COUNTBLANK函数。函数。7.1Excel统计函数9.MAX9.MAX返回一组值中的最大值。返回一组值中的最大值。语
13、法MAX(number1,number2,.)Number1,number2,.是要从中找出最大值的是要从中找出最大值的1到到30个数字个数字参数。参数。说明可以将参数指定为数字、空白单元格、逻辑值或数字的文本表达可以将参数指定为数字、空白单元格、逻辑值或数字的文本表达式。如果参数为错误值或不能转换成数字的文本,将产生错误。式。如果参数为错误值或不能转换成数字的文本,将产生错误。如果参数为数组或引用,则只有数组或引用中的数字将被计算。如果参数为数组或引用,则只有数组或引用中的数字将被计算。数组或引用中的空白单元格、逻辑值或文本将被忽略。如果逻辑数组或引用中的空白单元格、逻辑值或文本将被忽略。如
14、果逻辑值和文本不能忽略,请使用函数值和文本不能忽略,请使用函数MAXA来代替。来代替。如果参数不包含数字,函数如果参数不包含数字,函数MAX返回返回0(零)。(零)。示例7.1Excel统计函数10.MAXA10.MAXA返回参数列表中的最大值。文本值和逻辑值(如返回参数列表中的最大值。文本值和逻辑值(如TRUE和和FALSE)也作为数字来计算。)也作为数字来计算。函数函数MAXA与函数与函数MINA相似。有关详细信息,请参阅函数相似。有关详细信息,请参阅函数MINA的示例。的示例。语法MAXA(value1,value2,.)Value1,value2,.为需要从中查找最大数值的为需要从中查
15、找最大数值的1到到30个参数。个参数。说明参数可以为数字、空白单元格、逻辑值或数字的文本表达式。如参数可以为数字、空白单元格、逻辑值或数字的文本表达式。如果参数为错误值,则会产生错误。如果在计算中不能包含文本或果参数为错误值,则会产生错误。如果在计算中不能包含文本或逻辑值,请使用逻辑值,请使用MAX工作表函数来代替。工作表函数来代替。如果参数为数组或引用,则只使用数组或引用中的数值。忽略数如果参数为数组或引用,则只使用数组或引用中的数值。忽略数组或引用中的空白单元格和文本值。组或引用中的空白单元格和文本值。包含包含TRUE的参数作为的参数作为1计算;包含文本或计算;包含文本或FALSE的参数作
16、为的参数作为0计算。计算。如果参数不包含任何值,函数如果参数不包含任何值,函数MAXA返回返回0。7.1Excel统计函数11.MEDIAN11.MEDIAN返回给定数值集合的中值。中值是在一组数据中居于中间的数,返回给定数值集合的中值。中值是在一组数据中居于中间的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。即在这组数据中,有一半的数据比它大,有一半的数据比它小。语法MEDIAN(number1,number2,.)Number1,number2,.要计算中值的要计算中值的1到到30个数值。个数值。说明参数应为数字,或者是包含数字的名称、数组或引用。参数应为数字,或者是包含数字
17、的名称、数组或引用。MicrosoftExcel会检查每一数组参数或引用中的所有数字。会检查每一数组参数或引用中的所有数字。如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。将被忽略;但包含零值的单元格将计算在内。如果参数集合中包含偶数个数字,函数如果参数集合中包含偶数个数字,函数MEDIAN将返回位于中将返回位于中间的两个数的平均值。请参阅示例中的第二个公式。间的两个数的平均值。请参阅示例中的第二个公式。7.1Excel统计函数12.MIN12.MIN返回一组值中的最小值。返回一组值中的最小
18、值。语法MIN(number1,number2,.)Number1,number2,.是要从中找出最小值的是要从中找出最小值的1到到30个数字参个数字参数。数。说明可以将参数指定为数字、空白单元格、逻辑值或数字的文本表达可以将参数指定为数字、空白单元格、逻辑值或数字的文本表达式。如果参数为错误值或不能转换成数字的文本,将产生错误。式。如果参数为错误值或不能转换成数字的文本,将产生错误。如果参数是数组或引用,则函数如果参数是数组或引用,则函数MIN仅使用其中的数字,空白单仅使用其中的数字,空白单元格,逻辑值、文本或错误值将被忽略。如果逻辑值和文本字符元格,逻辑值、文本或错误值将被忽略。如果逻辑值
19、和文本字符串不能忽略,请使用串不能忽略,请使用MINA函数。函数。如果参数中不含数字,则函数如果参数中不含数字,则函数MIN返回返回0。7.1Excel统计函数13.MINA13.MINA返回参数列表中的最小值。文本值和逻辑值(如返回参数列表中的最小值。文本值和逻辑值(如TRUE和和FALSE)也作为数字来计算。)也作为数字来计算。语法MINA(value1,value2,.)Value1,value2,.为需要从中查找最小值的为需要从中查找最小值的1到到30个参数。个参数。说明参数可以为数字、空白单元格、逻辑值或数字的文本表达式。如参数可以为数字、空白单元格、逻辑值或数字的文本表达式。如果参
20、数为错误值,则会产生错误。如果在计算中不能包含文本或果参数为错误值,则会产生错误。如果在计算中不能包含文本或逻辑值,请使用逻辑值,请使用MIN工作表函数来代替。工作表函数来代替。如果参数为数组或引用,则只使用其中的数值。数组或引用中的如果参数为数组或引用,则只使用其中的数值。数组或引用中的空白单元格和文本值将被忽略。空白单元格和文本值将被忽略。包含包含TRUE的参数作为的参数作为1计算;包含文本或计算;包含文本或FALSE的参数作为的参数作为0计算。计算。如果参数不包含任何值,函数如果参数不包含任何值,函数MINA返回返回0。7.1Excel统计函数14.MODE14.MODE返回在某一数组或
21、数据区域中出现频率最多的数值。同返回在某一数组或数据区域中出现频率最多的数值。同MEDIAN一样,一样,MODE也是一个位置测量函数。也是一个位置测量函数。语法MODE(number1,number2,.)Number1,number2,.是用于众数计算的是用于众数计算的1到到30个参数,也个参数,也可以使用单一数组(即对数组区域的引用)来代替由逗号分隔的可以使用单一数组(即对数组区域的引用)来代替由逗号分隔的参数。参数。说明参数可以是数字,或者是包含数字的名称、数组或引用。参数可以是数字,或者是包含数字的名称、数组或引用。如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值如果数组或引用
22、参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。将被忽略;但包含零值的单元格将计算在内。如果数据集合中不含有重复的数据,则如果数据集合中不含有重复的数据,则MODE数返回错误值数返回错误值N/A。7.1Excel统计函数15.FREQUENCY15.FREQUENCY计算数值在某个区域内的出现频率,然后返回一个垂直数组。例如,使用函数计算数值在某个区域内的出现频率,然后返回一个垂直数组。例如,使用函数FREQUENCY可以在分数区域内计算测验分数的个数。由于函数可以在分数区域内计算测验分数的个数。由于函数FREQUENCY返回一个数组,所以它必须以数组公式的形
23、式输入。返回一个数组,所以它必须以数组公式的形式输入。语法FREQUENCY(data_array,bins_array)Data_array是一个数组或对一组数值的引用,您要为它计算频率。如果是一个数组或对一组数值的引用,您要为它计算频率。如果data_array中不包含任何数值,函数中不包含任何数值,函数FREQUENCY将返回一个零数组。将返回一个零数组。Bins_array是一个区间数组或对区间的引用,该区间用于对是一个区间数组或对区间的引用,该区间用于对data_array中的数中的数值进行分组。如果值进行分组。如果bins_array中不包含任何数值,函数中不包含任何数值,函数FR
24、EQUENCY返回的值返回的值与与data_array中的元素个数相等。中的元素个数相等。说明在选择了用于显示返回的分布结果的相邻单元格区域后,函数在选择了用于显示返回的分布结果的相邻单元格区域后,函数FREQUENCY应应以数组公式的形式输入。以数组公式的形式输入。返回的数组中的元素个数比返回的数组中的元素个数比bins_array中的元素个数多中的元素个数多1个。多出来的元素表个。多出来的元素表示最高区间之上的数值个数。例如,如果要为三个单元格中输入的三个数值区间示最高区间之上的数值个数。例如,如果要为三个单元格中输入的三个数值区间计数,请务必在四个单元格中输入计数,请务必在四个单元格中输
25、入FREQUENCY函数获得计算结果。多出来的函数获得计算结果。多出来的单元格将返回单元格将返回data_array中第三个区间值以上的数值个数。中第三个区间值以上的数值个数。函数函数FREQUENCY将忽略空白单元格和文本。将忽略空白单元格和文本。如果公式的返回结果为数组,该公式必须以数组公式的形式输入。如果公式的返回结果为数组,该公式必须以数组公式的形式输入。7.1Excel统计函数16.QUARTILE16.QUARTILE返回数据集的四分位数。四分位数通常用于在销售额和测量数据中返回数据集的四分位数。四分位数通常用于在销售额和测量数据中对总体进行分组。例如,可以使用函数对总体进行分组。
26、例如,可以使用函数QUARTILE求得总体中前求得总体中前25%的收入值。的收入值。语法QUARTILE(array,quart)Array为需要求得四分位数值的数组或数字型单元格区域。为需要求得四分位数值的数组或数字型单元格区域。Quart决定返回哪一个四分位值。决定返回哪一个四分位值。如果如果qurart等于函数等于函数QUARTILE返回返回0最小值最小值1第一个四分位数(第一个四分位数(第第25个百分点值)个百分点值)2中分位数(第中分位数(第50个百分点值)个百分点值)3第三个四分位第三个四分位数(第数(第75个百分点值)个百分点值)4最大值最大值说明如果数组为空,函数如果数组为空,
27、函数QUARTILE返回错误值返回错误值#NUM!。如果如果quart不为整数,将被截尾取整。不为整数,将被截尾取整。如果如果quart4,函数,函数QUARTILE返回错误值返回错误值#NUM!。当当quart分别等于分别等于0、2和和4时,函数时,函数MIN、MEDIAN和和MAX返回返回的值与函数的值与函数QUARTILE返回的值相同。返回的值相同。7.1Excel统计函数17.RANK17.RANK返回一个数字在数字列表中的排位。数字的排位是其大小与列表中其他值的比值(如果列表返回一个数字在数字列表中的排位。数字的排位是其大小与列表中其他值的比值(如果列表已排过序,则数字的排位就是它当
28、前的位置)。已排过序,则数字的排位就是它当前的位置)。语法RANK(number,ref,order)Number为需要找到排位的数字。为需要找到排位的数字。Ref为数字列表数组或对数字列表的引用。为数字列表数组或对数字列表的引用。Ref中的非数值型参数将被忽略。中的非数值型参数将被忽略。Order为一数字,指明排位的方式。为一数字,指明排位的方式。如果如果order为为0(零)或省略,(零)或省略,MicrosoftExcel对数字的排位是基于对数字的排位是基于ref为按照降序排列的为按照降序排列的列表。列表。如果如果order不为零,不为零,MicrosoftExcel对数字的排位是基于对
29、数字的排位是基于ref为按照升序排列的列表。为按照升序排列的列表。说明函数函数RANK对重复数的排位相同。但重复数的存在将影响后续数值的排位。例如,在一列按对重复数的排位相同。但重复数的存在将影响后续数值的排位。例如,在一列按升序排列的整数中,如果整数升序排列的整数中,如果整数10出现两次,其排位为出现两次,其排位为5,则,则11的排位为的排位为7(没有排位为(没有排位为6的数值)。的数值)。由于某些原因,用户可能使用考虑重复数字的排位定义。在前面的示例中,用户可能要将整由于某些原因,用户可能使用考虑重复数字的排位定义。在前面的示例中,用户可能要将整数数10的排位改为的排位改为5.5。这可通过
30、将下列修正因素添加到按排位返回的值来实现。该修正因素。这可通过将下列修正因素添加到按排位返回的值来实现。该修正因素对于按照升序计算排位(顺序对于按照升序计算排位(顺序=非零值)或按照降序计算排位(顺序非零值)或按照降序计算排位(顺序=0或被忽略)的情况或被忽略)的情况都是正确的。都是正确的。重复数排位的修正因素重复数排位的修正因素=COUNT(ref)+1RANK(number,ref,0)RANK(number,ref,1)/2。在下列示例中,在下列示例中,RANK(A2,A1:A5,1)等于等于3。修正因素是。修正因素是(5+123)/2=0.5,考虑重复,考虑重复数排位的修改排位是数排位
31、的修改排位是3+0.5=3.5。如果数字仅在。如果数字仅在ref出现一次,由于不必调整出现一次,由于不必调整RANK,因,因此修正因素为此修正因素为0。7.1Excel统计函数18.SMALL18.SMALL返回数据集中第返回数据集中第k个最小值。使用此函数可以返回数据集中特定个最小值。使用此函数可以返回数据集中特定位置上的数值。位置上的数值。语法SMALL(array,k)Array为需要找到第为需要找到第k个最小值的数组或数字型数据区域。个最小值的数组或数字型数据区域。K为返回的数据在数组或数据区域里的位置(从小到大)。为返回的数据在数组或数据区域里的位置(从小到大)。说明如果如果arra
32、y为空,函数为空,函数SMALL返回错误值返回错误值#NUM!。如果如果k0或或k超过了数据点个数,函数超过了数据点个数,函数SMALL返回错误值返回错误值#NUM!。如果如果n为数组中的数据点个数,则为数组中的数据点个数,则SMALL(array,1)等于最小值,等于最小值,SMALL(array,n)等于最大值。等于最大值。7.1Excel统计函数19.PERCENTILE19.PERCENTILE返回区域中数值的第返回区域中数值的第K个百分点的值。可以使用此函数来建立接受个百分点的值。可以使用此函数来建立接受阈值。例如,可以确定得分排名在第阈值。例如,可以确定得分排名在第90个百分点之上
33、的检测侯选人。个百分点之上的检测侯选人。语法PERCENTILE(array,k)Array为定义相对位置的数组或数据区域。为定义相对位置的数组或数据区域。K0到到1之间的百分点值,包含之间的百分点值,包含0和和1。说明如果如果array为空或其数据点超过为空或其数据点超过8,191个,函数个,函数PERCENTILE返返回错误值回错误值#NUM!。如果如果k为非数字型,函数为非数字型,函数PERCENTILE返回错误值返回错误值#VALUE!。如果如果k1,函数,函数PERCENTILE返回错误值返回错误值#NUM!。如果如果k不是不是1/(n-1)的倍数,函数的倍数,函数PERCENTIL
34、E使用插值法来确定使用插值法来确定第第k个百分点的值。个百分点的值。7.1Excel统计函数20.PERCENTRANK20.PERCENTRANK返回特定数值在一个数据集中的百分比排位。此函数可用于查看返回特定数值在一个数据集中的百分比排位。此函数可用于查看特定数据在数据集中所处的位置。例如,可以使用函数特定数据在数据集中所处的位置。例如,可以使用函数PERCENTRANK计算某个特定的能力测试得分在所有的能力测计算某个特定的能力测试得分在所有的能力测试得分中的位置。试得分中的位置。语法PERCENTRANK(array,x,significance)Array为定义相对位置的数组或数字区域
35、。为定义相对位置的数组或数字区域。X为数组中需要得到其排位的值。为数组中需要得到其排位的值。Significance为可选项,表示返回的百分数值的有效位数。如果为可选项,表示返回的百分数值的有效位数。如果省略,函数省略,函数PERCENTRANK保留保留3位小数。位小数。说明如果数组为空,函数如果数组为空,函数PERCENTRANK返回错误值返回错误值#NUM!。如果如果significane1,函数,函数PERCENTRANK返回错误值返回错误值#NUM!。如果数组里没有与如果数组里没有与x相匹配的值,函数相匹配的值,函数PERCENTRANK将进行将进行插值以返回正确的百分比排位。插值以返
36、回正确的百分比排位。7.1Excel统计函数21.CORREL21.CORREL返回单元格区域返回单元格区域array1和和array2之间的相关系数。使用相关系之间的相关系数。使用相关系数可以确定两种属性之间的关系。例如,可以检测某地的平均温数可以确定两种属性之间的关系。例如,可以检测某地的平均温度和空调使用情况之间的关系。度和空调使用情况之间的关系。语法CORREL(array1,array2)Array1第一组数值单元格区域。第一组数值单元格区域。Array2第二组数值单元格区域。第二组数值单元格区域。说明如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值如果数组或引用参数包含文本
37、、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。将被忽略;但包含零值的单元格将计算在内。如果如果array1和和array2的数据点的个数不同,函数的数据点的个数不同,函数CORREL返返回错误值回错误值#N/A。如果如果array1或或array2为空,或者其数值的为空,或者其数值的s(标准偏差)等于(标准偏差)等于零,函数零,函数CORREL返回错误值返回错误值#DIV/0!。相关系数的计算公式为相关系数的计算公式为7.1Excel统计函数22.PEARSON22.PEARSON返回返回Pearson(皮尔生)乘积矩相关系数(皮尔生)乘积矩相关系数r,这是一个范围在,
38、这是一个范围在-1.0到到1.0之间(包括之间(包括-1.0和和1.0在内)的无量纲指数,反映了在内)的无量纲指数,反映了两个数据集合之间的线性相关程度。两个数据集合之间的线性相关程度。语法PEARSON(array1,array2)Array1为自变量集合。为自变量集合。Array2为因变量集合。为因变量集合。说明参数可以是数字,或者是包含数字的名称、数组常量或引用。参数可以是数字,或者是包含数字的名称、数组常量或引用。如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。将被忽略;但包含零值的
39、单元格将计算在内。如果如果array1和和array2为空或其数据点个数不同,函数为空或其数据点个数不同,函数PEARSON返回错误值返回错误值#N/A。Pearson(皮尔生)乘积矩相关系数(皮尔生)乘积矩相关系数r的公式为:的公式为:7.1Excel统计函数23.LOGEST23.LOGEST在回归分析中,计算最符合数据的指数回归拟合曲线,在回归分析中,计算最符合数据的指数回归拟合曲线,并返回描述该曲线的数值数组。因为此函数返回数值并返回描述该曲线的数值数组。因为此函数返回数值数组,故必须以数组公式的形式输入。数组,故必须以数组公式的形式输入。此曲线的公式为:此曲线的公式为:y=b*mX或
40、或y=(b*(m1x1)*(m2x2)*_)(如果有多个(如果有多个x值)值)其中因变量其中因变量y是自变量是自变量x的函数值。的函数值。m值是各指数值是各指数x的底,而的底,而b值是常量值。注意:公式中的值是常量值。注意:公式中的y、x和和m均可以是向量,均可以是向量,LOGEST函数返回的数组为函数返回的数组为mn,mn-i,.,m1,b。7.1Excel统计函数语法语法LOGEST(known_ys,known_xs,const,stats)Known_ys满足指数回归拟合曲线y=b*mx的一组已知的y值。如果数组known_ys在单独一列中,则known_xs的每一列被视为一个独立的变
41、量。如果数组known-ys在单独一行中,则known-xs的每一行被视为一个独立的变量。Known_xs满足指数回归拟合曲线y=b*mx的一组已知的x值,为可选参数。known_xs数组可以包括一组或多组自变量。如果仅使用一个变量,那么只要known_xs和known_ys具有相同的维数,则它们可以是任何形状的区域。如果使用多个变量,则known_ys必须是向量(即具有一列高度或一行宽度的单元格区域)。如果省略known_xs,则假设该数组为1,2,3,.,其大小与known_ys相同。Const为一逻辑值,用于指定是否将常数b强制设为1。如果const为TRUE或省略,b将按正常计算。如果
42、const为FALSE,则常量b将设为1,而m的值满足公式y=mx。Stats为一逻辑值,指定是否返回附加回归统计值。如果stats为TRUE,函数LOGEST将返回附加的回归统计值,因此返回的数组为mn,mn-1,.,m1,b;sen,sen-1,.,se1,seb;r2,sey;F,df;ssreg,ssresid。如果stats为FALSE或省略,则函数LOGSET只返回系数m和常量b。说明说明由数据绘出的图越近似于指数曲线,则计算出来的曲线就越符合原来给定的数据。正如LINEST函数一样,LOGEST函数返回一组描述数值间相互关系的数值数组,但LINEST函数是用直线来拟合数据,而LO
43、GEST函数则以指数曲线来拟合数据。有关详细信息,请参阅LINEST函数。当仅有一个自变量x时,可直接用下面的公式计算出斜率(m)和y轴截距(b)的值。斜率(m):INDEX(LOGEST(known_ys,known_xs),1)Y轴截距(b):INDEX(LOGEST(known_ys,known_xs),2)可用y=b*mx公式来预测y的值,但是MicrosoftExcel另外提供了可以预测因变量y值的GROWTH函数。有关详细信息,请参阅GROWTH函数。对于返回结果为数组的公式,必须以数组公式的形式输入。当需要输入一个数组常量(如known_xs)作为参数时,以逗号作为同一行中数据的
44、分隔符,以分号作为不同行数据的分隔符。分隔符可能因“区域设置”中或“控制面板”的“区域选项”中区域设置的不同而有所不同。应注意的一点是:如果由回归公式所预测的y值超出用来计算回归公式的y的取值区间,则该值可能无效。m1.4632756495.30477bsem0.00263340.0358343sebr20.99980860.0110163seyF20896.8014 dfssreg2.53601880.0004854ssresid步骤:1.选定待输出数据区域,如:C1:D52.输入公式:“=logest(a1:a6,b1:b6,true,true)”3.先按F2键,在按组合键:ctrl+sh
45、ift+enter结果如下表se1,se2,.,sen系数m1,m2,.,mn的标准误差值。seb常量b的标准误差值(当const为FALSE时,seb=#N/A)r2判定系数。Y的估计值与实际值之比,范围在0到1之间。如果为1,则样本有很好的相关性,Y的估计值与实际值之间没有差别。如果判定系数为0,则回归公式不能用来预测Y值。有关计算r2的方法的详细信息,请参阅本主题后面的“说明”。SeyY估计值的标准误差。FF统计或F观察值。使用F统计可以判断因变量和自变量之间是否偶尔发生过可观察到的关系。df自由度。用于在统计表上查找F临界值。所查得的值和LINEST函数返回的F统计值的比值可用来判断模
46、型的置信度。有关如何计算df,请参阅在此主题中后面的“说明”。示例4说明了F和df的使用。ssreg回归平方和。ssresid残差平方和。24.CONFIDENCE24.CONFIDENCE返回一个值,您可使用该值构建总体平均值的置信区间。置信区间为一个值区域。返回一个值,您可使用该值构建总体平均值的置信区间。置信区间为一个值区域。样本平均值样本平均值x位于该区域的中间,区域范围为位于该区域的中间,区域范围为xCONFIDENCE。语法CONFIDENCE(alpha,standard_dev,size)Alpha是用于计算置信度的显著水平参数。置信度等于是用于计算置信度的显著水平参数。置信度
47、等于100*(1-alpha)%,亦,亦即,如果即,如果alpha为为0.05,则置信度为,则置信度为95%。Standard_dev数据区域的总体标准偏差,假设为已知。数据区域的总体标准偏差,假设为已知。Size样本容量。样本容量。说明如果任意参数为非数值型,函数如果任意参数为非数值型,函数CONFIDENCE返回错误值返回错误值#VALUE!。如果如果alpha0或或alpha1,函数,函数CONFIDENCE返回错误值返回错误值#NUM!。如果如果standard_dev0,函数,函数CONFIDENCE返回错误值返回错误值#NUM!。如果如果size不是整数,将被截尾取整。不是整数,将
48、被截尾取整。如果如果sizeF ,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响若F F ,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响 单因素方差分析例:在一项工业实验中,工程师想要知道生产线的产量如何,在5种不同的操作程序之间发生变化。对每一种操作程序进行了6种实验。数据如下:单因素方差分析步骤:1.向Excel表格中输入数据2.在菜单栏中单击“工具”,在“工具”中选择“数据分析”,在数据分析”中选择“方差分析:单因素方差分析”,然后确定。3.在“方差分析:单因素方差分析”对话框如下图填写,然后确定。单因素方差分析分析结果:无重复双因
49、素方差分析例:为研究食品的包装和销售地区对销售量是否有影响,在某周的三个不同地区用三种不同包装方法进行销售,获得销售数据如下步骤:1.向Excel表格中输入数据2.在菜单栏中单击“工具”,在“工具”中选择“数据分析”,在数据分析”中选择“方差分析:无重复双因素分析”,然后确定。3.在“方差分析:无重复双因素分析”对话框如下图填写,然后确定。无重复双因素方差分析分析结果:无重复双因素方差分析可重复双因素方差分析例:P162步骤:1.向Excel表格中输入数据2.在菜单栏中单击“工具”,在“工具”中选择“数据分析”,在数据分析”中选择“方差分析:可重复双因素分析”,然后确定。3.在“方差分析:可重
50、复双因素分析”对话框如下图填写,然后确定。可重复双因素方差分析分析结果可重复双因素方差分析一元线性回归分析一元线性回归分析多元线性回归分析多元线性回归分析一元非线性回归分析一元非线性回归分析7.6回归分析一元线性回归分析一元线性回归分析例:某市1990-2003年GDP及人口总数如右表。试以GDP为自变量、人口数为因变量,做回归分析步骤:1.向Excel表格中输入数据2.在菜单栏中单击“工具”,在“工具”中选择“数据分析”,在数据分析”中选择“回归”,然后确定。3.在“回归”对话框如下图填写,然后确定。一元线性回归分析一元线性回归分析分析结果一元线性回归分析一元线性回归分析多元线性回归分析多元