《(高职)第八章:《统计学》ppt课件.pptx》由会员分享,可在线阅读,更多相关《(高职)第八章:《统计学》ppt课件.pptx(34页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、(高职)第八章:统计学ppt课件统计学统计学目录CONTENT010302040507060809通过本章的学习,要明晰相关关系的含义与种类;掌握通过本章的学习,要明晰相关关系的含义与种类;掌握相关关系的测定方法;掌握相关系数的计算和相关系数相关关系的测定方法;掌握相关系数的计算和相关系数的意义;掌握回归分析与相关分析各自的特点;能熟练的意义;掌握回归分析与相关分析各自的特点;能熟练地进行回归分析计算。地进行回归分析计算。相关分析概述8 8.1.18.1.1相关关系的含义n 在自然界和社会经济现象中,任何现象都不是孤立存在的,现象间存在着普遍联系和相互制约的关系。现象间的普遍联系、相互制约的关
2、系往往表现为相互依存的关系,这种关系通常有两种类型,即函数关系和相关关系。类型(1)函数关系(2)相关关系相关分析概述8 8.1.18.1.2相关关系的种类n 现象之间的相关关系从不同的角度可以分为不同的类型:相关分析概述8 8.1.18.1.2相关关系的种类(a)正相关,(b)负相关,(c)曲线相关,(d)特例相关函数关系,(e)不相关,如图8-1所示。相关分析概述8 8.1.18.1.3相关分析的主要内容n 相关关系表现的是现象之间存在的非确定性的数量关系,但其变化规律也并非不可掌握。就是要通过对大量现象、资料的分析,探索具有相关关系的现象之间关系的表现形式和密切程度,并对其数量上的变化规
3、律做出判断。依据对现象分析研究的层次不同,相关分析的内容可分为狭义的相关分析和广义的相关分析。相关分析概述8 8.1.18.1.3相关分析的主要内容相关关系的测定8 8. .2 2,首先要判定现象之间是否存在着相关关系,可根据分析者所掌握的知识和经验来判定。比如家庭收入与支出的关系、GDP与教育经费投入之间的关系等,都是有一定的数量依存关系的,这是人们根据长时间的经验和知识得到的结论。但这种关系是一种什么形式的关系呢?是正相关还是负相关,相关的程度又如何呢?这需要通过以下方式进一步判断。相关关系的测定8 8. .2 28.2.1相关表和相关图相关表是一种反映变量之间相关关系的统计表。它包括简单
4、相关表、单变量分组相关表和双变量分组相关表。将相关的两个变量的变量值一一对应地填列在同一张表格上,这样的表格叫简单相关表。对自变量进行分组,对因变量不分组,只是计算出其次数和平均数,这种表格称为单变量分组相关表。将自变量和因变量都进行分组编制成的统计表,称为双变量分组相关表。相关关系的测定8 8. .2 28.2.1相关表和相关图 相关图又称散点图,它是用直角坐标系的x轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。相关关系的测定8 8. .2 28.2.2相关系数 相关表和相关图可以反映变量之间的相互关系及相关方向,但无法确切地表
5、明变量之间相关的密切程度。为了进一步掌握现象之间相关的密切程度,我们可以通过相关系数来测定。相关系数是描述相关的变量之间密切程度的统计分析指标。相关关系的测定8 8. .2 28.2.2相关系数 相关系数根据所要分析的现象的相关形式及相关变量的多少不同,主要分为以下四种:1234相关关系的测定8 8. .2 28.2.2相关系数 相关系数通常用r来表示,其计算公式有两种形式:一个是积差法公式;另一个是简捷法公式。 积差法的计算公式为: 上式经过变换,可得到简捷法的计算公式为:相关关系的测定8 8. .2 28.2.2相关系数 相关系数的值介于-1和1之间,即-1r1。其性质如下:一元直线回归分
6、析8 8. .3 38.3.1回归分析的含义n 相关分析中的相关系数指标,可以从数量上说明在直线相关的条件下,变量之间相关关系的方向和密切程度,但它不能反映一个变量发生一定数量的变化,而另一个变量会发生多少变化。为解决这一问题,就必须采用回归分析方法。是指通过一个变量或一些变量的变化,解释另一变量的变化。其主要内容和步骤是:首先,根据理论和对问题的分析判断,将变量分为自变量和因变量;其次,设法找出合适的数学方程式(即回归模型)描述变量间的关系;再次,由于涉及的变量具有不确定性,还要对回归模型进行统计检验;统计检验通过后,最后是利用回归模型,根据自变量的数值去估计因变量的数值。一元直线回归分析8
7、 8. .3 38.3.1回归分析的含义n 回归分析可以从不同的角度划分为不同的种类。按照自变量的个数多少可分为一元回归分析和多元回归分析。只有一个自变量的回归分析叫一元回归分析;有两个或两个以上自变量的回归分析叫多元回归分析。按照回归的形式可分为直线回归分析和曲线回归分析。这里我们只讨论一元直线回归分析。一元直线回归分析8 8. .3 38.3.2相关分析和回归分析的关系(1)在相关分析中涉及的变量不存在自变量和因变量的划分问题,变量之间的关系是对等的;而在回归分析中,则必须根据研究对象的性质和研究分析的目的,对变量进行自变量和因变量的划分,因此其变量之间的关系是不对等的。(2)在相关分析中
8、所有的变量都必须是随机变量;而在回归分析中,自变量是给定的,因变量才是随机的。(3)相关分析主要是通过一个指标即相关系数来反映变量之间相关密切程度的大小,由于变量之间是对等的,因此相关系数是唯一确定的;而在回归分析中,对于互为因果关系的两个变量(如人的身高与体重),则有可能存在两个回归方程。相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在对变量之间是否相关以及相关方向和程度做出正确判断之前
9、,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。NegativePositive一元直线回归分析8 8. .3 38.3.3一元直线回归模型的建立 一元直线回归模型又称简单直线回归模型,它是根据成对的两个变量的数据,配合直线方程,并根据自变量的变动,来推算因变量发展趋势和水平的一种数学关系式。其数学表达式为:(8-3)一元直线回归分析8 8. .3 38.3.3一元直线回归模型的建立 在回归直线的数学表达式中,只要能确定两个待定参数a和b
10、,那么回归模型也就确定了。统计理论已经证明,用最小平方法求解待定参数a和b而建立的回归模型最具有代表性,也是所有观测点的最优拟合线。 应用最小平方法配合直线方程,其基本要求是实际值与估计理论值的离差平方和为最小值,用公式表示为:一元直线回归分析8 8. .3 38.3.4多元线性回归分析n 在统计中,把研究一个因变量与多个自变量之间相互关系的理论和方法,称为。n 多元回归分析可以分为多元线性回归分析和多元非线性回归分析。我们在这里只讨论多元线性回归分析的问题。n 多元线性回归分析是在现象之间存在着直线相关关系的条件下,研究现象之间的一般规律,即建立回归方程,并通过回归方程来进行预测。n 多元回
11、归方程是用于表达一个因变量与多个自变量之间相互关系及其规律性的一种数学模型。当研究一个变量y值的变动受x1,x2,x3,xn等多个因素的影响时,我们可以把y作为因变量,把x1,x2,x3,xn作为自变量。如果它们之间存在着直线相关的关系,这时可以建立的直线回归方程为:(8-9)一元直线回归分析8 8. .3 38.3.4多元线性回归分析n 与研究一元回归时的情形相似,求参数a0,a1,a2,a3,an的方法,还是采用最小平方法,即要求:n 通过求极值的方法 ,我们可以得到多元线性回归方程的参数的求解方程组。以两个自变量为例,设其直线回归方程为:n 则其求解参数a0,a1,a2的回归方程组为:一
12、元直线回归分析8 8. .3 38.3.5估计标准误差 回归方程的一个重要作用在于根据自变量的已知值去估计因变量的理论值,而理论值yc与实际值y存在着差距,这就产生了推算结果的准确性问题。如果差距小,说明推算结果的准确性高;反之,说明推算结果的准确性差。为此,分析理论值与实际值的差距有很现实的意义。为了度量y的实际水平和估计值yc离差的一般水平,可计算估计标准误差。估计标准误差是说明回归直线代表性大小的统计分析指标,它说明观察值围绕着回归直线的变化程度或分散程度。一元直线回归分析8 8. .3 38.3.5估计标准误差 估计标准误差通常用Syx表示,其计算公式为:一元直线回归分析8 8. .3
13、 38.3.5估计标准误差 在相关分析中,一个很重要的任务就是要利用相关资料来建立回归方程,并利用回归方程来预测。那么,这个回归方程是否能更好地代表现象之间的一般关系,根据这个方程进行预测得到的预测值(理论值)是否准确,准确程度怎样,这些问题的解决都是要通过估计标准误差来完成的。概括起来,估计标准误差有如下三个作用:一元直线回归分析8 8. .3 38.3.5估计标准误差 估计标准误差Syx与相关系数r在数量上也存在着密切的关系,这就从另一个角度说明了相关分析与回归分析之间的关系。二者之间的关系可由下列公式来表述:一元直线回归分析8 8. .3 38.3.6回归分析的预测和估计n 回归方程概括
14、地描述了现象之间的数量关系,可以反映现象之间的一般规律性,我们可以通过回归方程,用自变量的数值,来估计因变量的数值。估计方法一元直线回归分析8 8. .3 38.3.6回归分析的预测和估计 点估计就是将给定的自变量x0代入回归方程求出y0的估计值。例如,利用年广告投入和月销售收入之间的回归方程式,当自变量年广告投入为50万元时,我们对因变量月销售收入进行点估计,其估计值为: yc=a+bx=11.61+0.8849x=11.61+0.884950=55.86(万元)一元直线回归分析8 8. .3 38.3.6回归分析的预测和估计 回归分析的区间估计是在一定的概率下,给出一个自变量x0,然后利用
15、回归方程,求出一个因变量y0的估计值的区间范围。 因变量估计值的区间为:(yc-tSyx,yc+tSyx)。其中:t可通过查正态分布概率表来求得,其方法与抽样推断概率度的求法一样。相关分析与回归分析的应用8 8. .4 48.4.1相关分析应用实例n 应用相关分析的理论,我们可以根据现象之间数量关系的变化规律,进行静态和动态预测。我们在这里主要讨论在一定时间上对现象之间因果关系的预测,而对于现象未来发展的动态预测,将另作讨论。相关分析与回归分析的应用8 8. .4 48.4.2应用相关分析和回归分析需注意的问题谢 谢 聆 听T H A N K S F O R Y O U R A T T E N T I O N