回归分析的概念和分析报告.doc

上传人:可****阿 文档编号:42287242 上传时间:2022-09-15 格式:DOC 页数:19 大小:563KB
返回 下载 相关 举报
回归分析的概念和分析报告.doc_第1页
第1页 / 共19页
回归分析的概念和分析报告.doc_第2页
第2页 / 共19页
点击查看更多>>
资源描述

《回归分析的概念和分析报告.doc》由会员分享,可在线阅读,更多相关《回归分析的概念和分析报告.doc(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 第七章 回归分折 讨论随机变量与非随机变量之间的关系的问题称回归分析;讨论随机变量之间的关系的问题称相关分析对于这两种问题,或统称回归分析,或统称相关分析都可以但是,自然界的众多的变量间,还有另一类重要关系,我们称之为相关关系例如,施肥量与农作物产量之间的关系,这种关系虽不能用函数关系来描述,但施肥量与产量有关系,这种关系就是相关关系,又比如,人的身高与体重的关系也是相关关系,虽然人的身高不能确定体重,但总的说来,身高者,体也重些,总之,在生产斗争与科学实验中,甚至在日常生活中,变量之间的相关关系是普遍存在的其实,即使是具有确定性关系的变量间,由于实验误差的影响,其表现形式也具有某种的不确定

2、性 回归分折方法是数理统计中一个常用方法,是处理多个变量之间相关关系的一种数学方法,它不仅提供了建立变量间关系的数学表达-通常称为经验公式的一般方法,而且还可以进行分析,从而能判明所建立的经验公式的有效性,以与如何利用经验公式达到预测与控制的目的因而回归分析法得到了越来越广泛地应用 回归分析主要涉与下列容:(1)从一组数据出发,分析变量间存在什么样的关系,建立这些变量之间的关系式(回归方程),并对关系式的可信度进行统计检验;(2)利用回归方程式,根据一个或几个变量的值,预测或控制男一个变量的取值;(3)从影响某一个变量的许多变量中,判断哪些变量的影响是显著的,哪些是不显著的,从而可建立更实用的

3、回归方程,(4)根据预测和控制所提出的要求,选择试验点,对试验进行设计我们在本章,重点讨论一元线性回归,对多元回归只作简单地介绍1 一元线性回归一元线性回归分析中要考察的是:随机变量与一个普通变量之间的联系。对有一定联系的两个变量:与, 我们的任务是根据一组观察值判断与是否存在线性关系,我们能否通过这组观察值将确定系数与出来呢?这就是回归问题要解决的问题,且判断与是否真存在此线性关系. 一 . 经验公式与最小二乘法: 例1 纤维的强度与拉伸倍数有关下表给出的是24个纤维样品的强度与拉伸倍数的实测记录我们希望通过这表能找出强度y与拉伸倍数x之间的关系式们将观察值作为24个点,将它们画在平面上,这

4、图称为散点图,这散点图启示我们,这些点虽然是散乱的,但大体上散布在一条直线的周围也就是说,拉伸倍数与强度之间大致成线性关系我们用()确定,是线性的,要完全确定经验公式,就要确定()中的系数和,这里通常称为回归系数,关系式叫做回归方程 从散点图来看,要找出与是不困难的,在图上划一条直线,使该直线总的来看最“接近”这24个点于是,这直线在y轴上的截距就是所求的,它的斜率就是所求的几何方法虽然简单,但是太祖糙,而对非线性形式的问题,就几乎无法实行然而,它的基本思想,即“使该直线总的说来最接近这24个点”,却是很可取的,问题是把这基本思想精确化,数量化下面介绍一种方法,求一条直线使其“总的来看最接近这

5、24个点”,这就是最小二乘法给定的个点,那么,对于平面上任意一条直线:我们用数量来刻画点到直线的远近程度, 于是二元函数就定量的描述了直线跟这个点的总的远近程度,这个量是随不同的直线而变化,或者说是随不同的与而变化的,于是要找一条直线,使得该直线总的来看最“接近” 这 n个点的问题就转化为:要找两个数与, 使得二元函数在处达到最小,即 由于是个量平方之和,所以“使最小”的原则称为平方和最小原则,习惯上称为最小二乘原则由最小二乘原则求与估计值的方法称为最小二乘法按照最小二乘原则,具体求的问题就是利用极值原理,求解二元一次联立方程组有唯一解:于是, 对于给定的个点,先算出,再算出,就得到了所求的回

6、归方程:可计算例的因此所求经验公式, 即回归方程为例2P236例1.2 对任意两个相关变量,即使它们不存在线性关系,都可以通过它们的一组观测值用最小二乘法,在形式上求得和的回归直线方程. 实际上,如果和没有线性相关关系,所求的回归直线方程是没有意义的因此建立了回归直线方程之后,还需要判断与间是否真有线性相关关系,这就是回归效果的检验问题称为回归效果的显著性检验 首先介绍“平方和分解公式”二. 平方和分解公式与线性相关关系::对于任意的组数据, 恒有:+ 其中 现记,则平方和分解公式是:证明:因为 ,,并且 0 所以即+是回归直线上,其横坐标为点的纵坐标,因为所以的平均值也等于我们还可以通过的均

7、值,进一步说明它们之间的关系有了上面这些对于的分析表明: (1)的离差平方和由两部分组成:回归平方和和残差平方和, 其中完全由随机因素引起,(2)中虽然也有随机因素,但是当时,主要是由与线性相关关系决定因而与之比的比值反映了这种线性相关关系与随机因素对的影响的大小比值越大,线性相关关系越强大到什么程度才能说明有线性相关关系,还要进行检验,因而应寻找检验的统计量则 . (参看P.244+3, 注意:这是常用的计算公式) 三相关性检验:(1)提出原假设: (2)选择统计量:(3)求出在假设成立的条件下, ,(4)选择检验水平,查第一 自由度为与第二 自由度为.的,分布表(附表4),得临界值 ,使得

8、(5) 根据样本值计算统计量的观察值,给出拒绝或接受H。的判断: 当时,则拒绝H。;当时, 则接受H。如果值相当大则表明与线性影响较大,就可以认为与间有线性相关关系;反之,如果值较小,则没有理由认为与间有线性相关关系 衡量回归效果的好坏,除了采用回归问题的方差分析外, 还可以用统计量来描述两个变量线性关系的密切程度,当接近, 与之间的线性相关程度愈小,反之,当接近愈大,愈接近1,与之间的线性相关就愈为密切对一个具体问题,只有当相关系数的绝对值大到一定程度时才可用回归直线来近似地表示与之间的关系. 对于假设,由和提供的两钟形式上不同的检验方法,实质上是一回事。(参看P. 243 - P.244)

9、例3 P.244例1.4 【例4】 钢的含碳量与抗拉强度之间具有相关关系。抽查某种钢材12根,测得含碳量()和抗拉强度(kgmm)的观测值如下:根据这组数据,求对的线性回归方程,解:(1) 计算与回归系数:编号11.3411.6953.3168121.4441.9661.6193631.4451.9663202541.5432.2564.5184951.6462.5673.6211661.6472.5675.2220971.7472.8979.9220981.8463.2482.8211691.9463.6187.42116102.0494.00982401112.1494.41102.92401122.2514.84112.22601总和20.555435.97954.425660,, 对的线性回归方程:(2) 检验与线性相关性:取统计量:, 在假设成立的条件下, ,,得,计算:则拒绝H。,即抗拉强度与钢的含碳量之间是真有显著的线性相关关系,【例5】 为了确定老鼠血镕的减少量和注射胰岛素A的剂量之间的关系,将在同样条件下繁殖的7只老鼠注射了不同剂量的胰岛素A,所得数据如下:解:计算回归系数:四 习题: P254 - 1,2附表 相关系数临界值表19 / 19

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作计划

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁