第九章方差分析及回归分析 (第2讲).ppt

上传人:qwe****56 文档编号:80587042 上传时间:2023-03-23 格式:PPT 页数:91 大小:1.32MB
返回 下载 相关 举报
第九章方差分析及回归分析 (第2讲).ppt_第1页
第1页 / 共91页
第九章方差分析及回归分析 (第2讲).ppt_第2页
第2页 / 共91页
点击查看更多>>
资源描述

《第九章方差分析及回归分析 (第2讲).ppt》由会员分享,可在线阅读,更多相关《第九章方差分析及回归分析 (第2讲).ppt(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、概率论与数理统计 第第 14 14 讲(讲(B B)福建师范大学福清分校福建师范大学福清分校数学与计算机科学系数学与计算机科学系1 1 3 一元线性回归2 2 一些基本概念一些基本概念n n在客观世界中普遍存在着变量之间的关系,变量之间的关系一般来说可分为确定性的与非确定性的两种。n n确定性关系是指变量之间的关系可以用函数关系来表达.n n非确定性的关系即所谓相关关系.3 3例子例子:n n1 1、居民按人口计算的平均收入与某种商品(如糖、居民按人口计算的平均收入与某种商品(如糖果)的消费量之间,有一定的联系。一般来说平果)的消费量之间,有一定的联系。一般来说平均收入高的消费量大,但平均收入

2、相同时,这种均收入高的消费量大,但平均收入相同时,这种商品的消费量却不一定是完全相同的。为此,这商品的消费量却不一定是完全相同的。为此,这种关系不能用函数关系来表达;种关系不能用函数关系来表达;n n2 2、森林中的同一种树木,其断面直径与高度之间、森林中的同一种树木,其断面直径与高度之间是有联系的。一般说来,较粗的树较高,但直径是有联系的。一般说来,较粗的树较高,但直径相同的树其高度也不完全是相同的。为此,这种相同的树其高度也不完全是相同的。为此,这种关系不能用函数关系来表达;关系不能用函数关系来表达;n n3 3、农作物的产量与施肥量、气候、农药也有这种、农作物的产量与施肥量、气候、农药也

3、有这种不确定的关系。不确定的关系。4 4n n4、人的身高与体重之间存在着关系,一般来说,人高一些,体重要重一些,但同样高度的人,体重往往不相同,为此,这种关系不能用函数关系来表达;n n5、人的血压与年龄之间也存在着关系,一般来说,年龄较大的人血压较年龄小的高,但同年龄的人的血压往往不同,为此,这种关系也不能用函数关系来表达。5 5n n上述这些变量关系都上述这些变量关系都是非确定性的。这种是非确定性的。这种非确定性的关系称为非确定性的关系称为相关关系相关关系相关关系相关关系.6 6n n对于具有相关关系的变量,虽然不能找到它们之间的精确表达式,但是通过大量的观测数据,可以发现它们之间存在一

4、定的统计规律性。回归分析回归分析就是研究相关关系的一种数学工具。n n由一个或一组非随机变量来估计或预测某一个随机变量的观察值时所建立的数学模型及所进行的统计分析称为回归分析7 7n n如果这个模型是线性的就称为如果这个模型是线性的就称为线性回归分析线性回归分析n n这种方法是处理变量间相关关系的有力工具,是这种方法是处理变量间相关关系的有力工具,是数理统计工作中一种常用的方法。它不仅告诉人数理统计工作中一种常用的方法。它不仅告诉人们怎样建立变量间的数学表达式,即经验公式,们怎样建立变量间的数学表达式,即经验公式,而且还利用概率统计知识进行分析讨论,判断出而且还利用概率统计知识进行分析讨论,判

5、断出所建立的经验公式的有效性,从而可以进行预测所建立的经验公式的有效性,从而可以进行预测或估计。或估计。n n本章主要介绍如何建立经验公式。本章主要介绍如何建立经验公式。8 8(一)一元线性回归n n具有相关关系的变量间虽然不具有确定的函数关系,但是可以借助函数关系表达它们之间的统计规律性。用以近似地描述具有相关关系的变量间联系的函数称为回归函数。n n在实际中,最简单的情况是由两个变量组成的关系。9 9n n设随机变量Y与X之间存在着某种相关关系。这里,X是可以控制或可以精确观察的变量,如年龄,试验时的温度,施加的压力,电压、时间等等。即可以随意指定n个值n n n n因此干脆不把X看成随机

6、变量,而将它当作普通的变量。X的变化将使Y发生相应的变化,但它们之间的变化是不确定的。由于Y是随机变量,当X取得任一个可能的值x时,Y都相应地服从一定的概率分布。1010设进行设进行设进行设进行 n n 次独立试验,测得试验数据如下表:次独立试验,测得试验数据如下表:次独立试验,测得试验数据如下表:次独立试验,测得试验数据如下表:111112121313例例1 为研究某一化学反应过程中,温度x(C)对产品得率Y(%)的影响,测得数据及散点图如下:14141515再看一道例题再看一道例题n n补充例题补充例题 :以家庭为单位,某种商品年需求量:以家庭为单位,某种商品年需求量与该商品价格的一组数据

7、如下表所示;与该商品价格的一组数据如下表所示;价格价格1 12 22 22.32.32.52.52.62.62.82.83 33.33.33.53.5需求量需求量5 53.53.53 32.72.72.42.42.52.52 21.51.51.21.21.21.21616n n从上表的统计结果表明,尽管价格不变,需求仍可能从上表的统计结果表明,尽管价格不变,需求仍可能变化,价格改变,需求也可能不变。但是,总趋势是变化,价格改变,需求也可能不变。但是,总趋势是家庭对该商品的年需求量随着价格的上升而减少,即家庭对该商品的年需求量随着价格的上升而减少,即它们之间存在着密切的联系。它们之间存在着密切的

8、联系。n n为了确定回归函数为了确定回归函数 的类型,可将每对观察值在的类型,可将每对观察值在直角坐标系中描出它的相应的点直角坐标系中描出它的相应的点,得出得出散点图散点图散点图散点图 如下如下.17171818需求量需求量d与价格与价格p关系的散点图关系的散点图:1919n n可以看出可以看出,所有散点大体上都分布在一条直线的所有散点大体上都分布在一条直线的周围周围.即得率与温度大致成线性关系;同样,需即得率与温度大致成线性关系;同样,需求量与价格大致成线性关系。,因而可以看出回求量与价格大致成线性关系。,因而可以看出回归函数归函数 具有线性函数具有线性函数 a+bxa+bx 的形式的形式

9、。20202121n n由上面的回归模型可以看出由上面的回归模型可以看出:Y:Y由两部分组成由两部分组成,一部分一部分是是x x的线性函数的线性函数 另一部分是另一部分是 ,称为随机误差称为随机误差,是人们不可控制的。是人们不可控制的。2222(二)二)a ,b的估计的估计n n对对X X取取n n个不全相同的值个不全相同的值 做独做独立试验,得到样本立试验,得到样本n n由(由(3.23.2)式)式 23232424显然显然显然显然,要要要要L L取最大值取最大值取最大值取最大值,只要只要只要只要 (34)(34)右端方括弧中的平方和部右端方括弧中的平方和部右端方括弧中的平方和部右端方括弧中

10、的平方和部分为最小分为最小分为最小分为最小,即只需即只需即只需即只需2525262627272828 2929 30303131为了计算上的方便为了计算上的方便,引入下述记号:引入下述记号:3232n n例例例例2 2 (续例续例1)1)n n例例例例1 1数据为:数据为:数据为:数据为:为研究某一化学反应过程中为研究某一化学反应过程中,温度温度x(Cx(C)对产对产品得率品得率Y(%)Y(%)的影响的影响,测得数据如下测得数据如下,假设随机变量假设随机变量Y Y符合符合(3.23.2)式所述的条件:即)式所述的条件:即 n n其中未知参数其中未知参数 a,b,a,b,都不依赖于都不依赖于x,

11、x,试求试求Y Y关于关于x x的一元线的一元线性回归方程性回归方程.温度温度10100 011110 012120 013130 014140 015150 016160 017170 018180 019190 0得率得率Y(%Y(%)454550505454616166667070747478788585898933331001004545100001000020252025450045001101105151121001210026012601561056101201205454144001440029162916648064801301306161169001690037213721

12、793079301401406666196001960043564356924092401501507070225002250049004900105001050016016074742560025600547654761184011840170170787828900289006084608413260132601801808585324003240072257225153001530019019089893610036100792179211691016910 1450 14506736732185002185004722547225101570101570 145145 67.367.3

13、343435353636例题例题2 求补充例题的一元线性回归直线方程求补充例题的一元线性回归直线方程所需数据列表如下所需数据列表如下1.01.05.05.01.001.0025.0025.005.005.002.02.03.53.54.004.0012.2512.257.007.002.02.03.03.04.004.009.009.006.006.002.32.32.72.75.295.297.297.296.216.212.52.52.42.46.256.255.765.766.006.002.62.62.52.56.766.766.256.256.506.502.82.82.02.07.

14、847.844.004.005.605.603.03.01.51.59.009.002.252.254.504.503.33.31.21.210.8910.891.441.443.963.963.53.51.21.212.2512.251.441.444.204.2025.025.025.025.067.2867.2874.6874.6854.9754.97 2.52.5 2.52.5373738383939404041414242434344444545(四四)线性假设的显著性检验线性假设的显著性检验4646474748484949当假设 b=0 被拒绝时,认为回归效果是显著的,反之,就认为

15、回归效果不显著.回归效果不显著的原因可能有如下几种:1、影响 Y 取值的,除 x 及随机误差外还要其它不可忽略的因素.2、E(Y)与 x 的关系不是线性的,而存在着其它的关系.3、Y与 x 不存在关系.因此需要进一步分析原因,分别处理.5050515152525353(4)列表求值列表求值:x xy yx x2 2y y2 2xyxy1 15 51 125255 52 23.53.54 412.2512.257 72 23 34 49 96 62.32.32.72.75.295.297.297.296.216.212.52.52.42.46.256.255.765.766 62.62.62.5

16、2.56.766.766.256.256.56.52.82.82 27.847.844 45.65.63 31.51.59 92.252.254.54.53.33.31.21.210.8910.891.441.443.963.963.53.51.21.212.2512.251.441.444.24.2 25.0 25.025.025.067.2867.2874.6874.6854.9754.97545455555656(5)结论结论5757(五五)系数系数b b的置信区间的置信区间5858595960606161626263636464(七七)Y的观察值的点预测和预测区间的观察值的点预测和预测

17、区间656566666767686869697070717172727373747475757676n n例例例例5 5 (续例续例2)2)n n(1)求回归函数 在x=125处的值 的置信水平为0.95的置信区间,求在x=125处Y的新观察值 的置信水平为0.95的预测区间;n n(2)求在x=处Y的新观察值 的置信水平为0.95预测区间.77777878797980808181 x0 x0125=(55.30,59.98)57.64150 =(67.42,72.02)69.72130=(57.73,62.37)60.05155 =(69.82,74.44)72.13135 =(60.16,64.78)62.46160 =(72.23,76.87)74.55140=(62.58,67.18)64.88165 =(74.62,79.30)76.96145 =(65.01,69.59)67.3828283838484本章的内容就介绍这些本章的内容就介绍这些本章要求同学们掌握的内容如下:本章要求同学们掌握的内容如下:8585(二)(二)未知参数的点估计未知参数的点估计8686(三)两总体均值差的区间估计(三)两总体均值差的区间估计8787二、一元线性回归二、一元线性回归8888898990909191

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁