第十五章 数理统计初步.ppt

上传人:hwp****526 文档编号:84383947 上传时间:2023-04-05 格式:PPT 页数:114 大小:2.84MB
返回 下载 相关 举报
第十五章 数理统计初步.ppt_第1页
第1页 / 共114页
第十五章 数理统计初步.ppt_第2页
第2页 / 共114页
点击查看更多>>
资源描述

《第十五章 数理统计初步.ppt》由会员分享,可在线阅读,更多相关《第十五章 数理统计初步.ppt(114页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、湖南教育出版社湖南教育出版社第十五章 数理统计初步 15.1 总体与样本 15.2 常用统计量的分布 15.3 参数的点估计 15.4 区间估计 15.5 假设检验 15.6 一元线性回归 湖南教育出版社湖南教育出版社下页下页湖南教育出版社湖南教育出版社15.1 总体与样本 1总体与样本总体与样本2分布密度的近似求法分布密度的近似求法3样本的数字特征样本的数字特征首页首页上页上页下页下页湖南教育出版社湖南教育出版社 研究对象的全体称为总体总体(或母体母体),组成总体的每一个基本单位称为个体个体.婴儿湿疹婴儿湿疹从总体中抽取的一部分个体称为样本样本,样本中所包含的个体数称为样本容量样本容量.15

2、.1 总体与样本 1总体与样本总体与样本 例如例如:欲检查1000只灯泡的质量,这1000只灯泡的质量就是总体,其中的每一只灯泡的质量就是一个个体.若从中抽取10个灯泡进行检查,则这10只灯泡组成样本,样本容量为10.定义定义1首页首页上页上页下页下页湖南教育出版社湖南教育出版社 说总体X也就是指它所对应的随机变量X;说总体X的分布也就是指它对应婴儿湿疹婴儿湿疹的随机变量X的分布.如果从总体X中抽取n个个体组成一个样本,http:/则记作:第i次从总体X中取得的个体.15.1 总体与样本 随机样本随机样本 首页首页上页上页下页下页湖南教育出版社湖南教育出版社称为简单随机样本简单随机样本.为了研

3、究方便,常常假定样本满足下面两个性质:(1)独立性:具有上述两个性质的随机样本15.1 总体与样本(2)代表性:首页首页上页上页下页下页湖南教育出版社湖南教育出版社解解 设X表示从袋中取得球的号码数,则总体X仅由3个数0,1,2构成,又设第i次抽得球的号码数为 由于抽样是有放回的,故所有可能的样本观测值为:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2).例例1 设袋中有3个球,依次编号为0、1、2,有放回地从该总体中抽取容量为n=2的样本,求样本的所有可能的样本观测值.则样本为15.1 总体与样本 首页首页上页上页下页下页湖南教育出版

4、社湖南教育出版社2分布密度的近似求法分布密度的近似求法例例2 从某商场过去3年中每天商品零售额的统计资料中抽出50天的零售额,结果数字婴儿湿疹婴儿湿疹如下(单位:万元):33.0 23.0 35.0 35.5 26.0 32.3 41.0 29.0 38.5 42.031.0 54.2 34.0 26.5 27.0 37.0 40.1 30.0 39.0 43.023.0 36.5 43.0 45.0 31.0 46.3 42.8 52.1 49.0 48.040.0 52.7 39.0 37.0 48.1 35.0 58.0 32.0 31.5 37.028.0 19.0 34.0 38.0

5、 59.5 32.5 43.0 47.0 33.0 26.015.1 总体与样本 试求该商场商品零售额的近似概率分布密度.首页首页上页上页下页下页湖南教育出版社湖南教育出版社(1)找出数据中的最大值L,最小值S和极差R=LS.解解R=59.519=40.5.(2)决定分组的组数.组数k可由下表决定:15.1 总体与样本 样本容量n50100100250250以上组数k6107121020取k=9.首页首页上页上页下页下页湖南教育出版社湖南教育出版社(3)计算组距h,决定分点.15.1 总体与样本 选一个比最小值S稍小的数B,作为左边第一组的起点.为了使样本数据不成为分点,B要比样本数据多取一位

6、小数.这里,取a=12.25.然后,由公式就可计算出每个组的端点值,从而得到分组的情况.(4)统计频数,计算频率和频率密度.首页首页上页上页下页下页湖南教育出版社湖南教育出版社表表15-1 频率分布表频率分布表15.1 总体与样本 首页首页上页上页下页下页湖南教育出版社湖南教育出版社(5)绘绘频率直方图频率直方图.15.1 总体与样本 首页首页上页上页下页下页湖南教育出版社湖南教育出版社 3样本的数字特征样本的数字特征是来自总体X的样本,则我们称 样本均值样本均值样本方差样本方差15.1 总体与样本 定义定义2样本均方差样本均方差或样本标准差样本标准差首页首页上页上页下页下页湖南教育出版社湖南

7、教育出版社 例例3 某商店抽查9个柜组,每个柜组某日的销售额(万元)分别为10,9,8,8,7,6,6,5,4.求该商店http:/9个柜组销售额的样本均值与方差.解解 15.1 总体与样本 首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.1 总体与样本 首页首页上页上页下页下页湖南教育出版社湖南教育出版社 例例4 对某批花生仁中的含油量作了5次抽样检测,结果如下(%):59.30,59.24,59.41,59.35,59.36,求样本均值和标准差.解解又15.1 总体与样本 首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.1 总体与样本 首页首页上页上页下页下页湖南教育

8、出版社湖南教育出版社首页首页上页上页下页下页15.2 常用统计量的分布 1样本均值的分布样本均值的分布3t分布分布2.分布分布湖南教育出版社湖南教育出版社15.2 常用统计量的分布 1样本均值的分布样本均值的分布是服从正态分布的随机变量.定义定义3定理定理首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.2 常用统计量的分布 首页首页上页上页下页下页湖南教育出版社湖南教育出版社为n=6,查表求 例例1 设有一个来自正态总体N(4,24)的随机样本,其容量解解即15.2 常用统计量的分布 首页首页上页上页下页下页湖南教育出版社湖南教育出版社推论推论 如果总体 为来自总体X的样本,则统计量

9、 U 服婴儿湿疹婴儿湿疹从标准正态分布,即15.2 常用统计量的分布 解解例例2 求查附表2,得 首页首页上页上页下页下页湖南教育出版社湖南教育出版社例例3 求解解15.2 常用统计量的分布 查表,得 首页首页上页上页下页下页湖南教育出版社湖南教育出版社一般地,若已知a查表求 ,使则根据标准正态分布的对称性,有 反查正态分布表,即得 .通常记 ,并称 为临界值临界值,即15.2 常用统计量的分布 首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.2 常用统计量的分布 首页首页上页上页下页下页湖南教育出版社湖南教育出版社是n个随机变量的和,但这n个随机变量必须满足约束条件在n个随机变量中

10、只有n-1个可以“自由”变化,即只有n-1个独立的随机变量.因此,n-1叫做 的自由度自由度,记作 15.2 常用统计量的分布 首页首页上页上页下页下页湖南教育出版社湖南教育出版社则 (读作“卡方”)的自由度亦为n-1,因此称之为自由度是n-1的 变量变量,它的概率分布叫做自由度为n-1的 分布分布,记作 即 的临界值可由附表3查得.15.2 常用统计量的分布 首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.2 常用统计量的分布 变量的密度曲线.首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.2 常用统计量的分布 例例4 查表得解解首页首页上页上页下页下页湖南教育出版社湖南

11、教育出版社例例5 如果样本容量 n=11,15.2 常用统计量的分布 解解首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.2 常用统计量的分布 选取这样一组 ,使两尾部的面积都等于0.05,即首页首页上页上页下页下页湖南教育出版社湖南教育出版社查表即得 的值.通常记和样本容量n,求 一般地,已知使可根据自由度即及15.2 常用统计量的分布 首页首页上页上页下页下页湖南教育出版社湖南教育出版社3t分布分布可用样本均值 代替,从而得到统计量它的概率分布称为自由度为n-1的t分布分布,简记作t分布临界值表见附表4.在统计量中,当总体X的方差未知时,15.2 常用统计量的分布 首页首页上页上

12、页下页下页湖南教育出版社湖南教育出版社 15.2 常用统计量的分布 t分布的密度曲线图分布的密度曲线图首页首页上页上页下页下页湖南教育出版社湖南教育出版社(1)当解解 例例6 若 ,试求自由度为7、10、14时的 值.(2)当(3)当15.2 常用统计量的分布 首页首页上页上页下页下页湖南教育出版社湖南教育出版社可根据自由度 及查表即得 .15.2 常用统计量的分布 一般地,已知a和样本容量n,求 使首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.3 参数的点估计 1点估计的概念点估计的概念首页首页上页上页下页下页2点估计的评价点估计的评价湖南教育出版社湖南教育出版社15.3 参数的

13、点估计 1点估计的概念点估计的概念为来自总体X的样本.如果我们构造一个统计量的一个一个估计量估计量,并记作设是总体X的需要估计的参数(称为待估参数),作为参数 的估计,则称这个统计量为参数定义定义1就是的一个点估计值点估计值.首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.3 参数的点估计 总体均值、总体方差和总体标准差的点估计分别记作:首页首页上页上页下页下页湖南教育出版社湖南教育出版社例例1 已知某厂生产一批圆钢,现只检测其直径,随机抽取12根,测得直径(单位:cm)如下:13.30,13.38,13.40,13.32,13.43,13.48,13.51,13.31,13.34,

14、13.47,13.44,13.5.试估计该批圆钢直径的均值E(X)和方差D(X).15.3 参数的点估计 解解首页首页上页上页下页下页湖南教育出版社湖南教育出版社 设 是未知参数 的估计量,若 ,则称 为 的无偏估计无偏估计.2点估计的评价点估计的评价 设 是来自总体X的样本,且总体的均值E(X)存在,则样本均值 是总体均值E(X)的无偏估计,即 15.3 参数的点估计 定义定义2定理定理1首页首页上页上页下页下页湖南教育出版社湖南教育出版社 设 是来自总体X的样本,且总体的均值E(X)与方差D(X)存在,则样本方差 是总体方差D(X)的无偏估计,即 15.3 参数的点估计 证证定理定理2首页

15、首页上页上页下页下页湖南教育出版社湖南教育出版社注意注意 统计量称 为D(X)的渐近无偏估计.不是总体方差D(X)的无偏估计.15.3 参数的点估计 定义定义3设 和 都是 的无偏估计,若则称 是较 有效的估计.如果在 的一切无偏估计中,的方差达到最小,则 称为 的最优无偏估计.首页首页上页上页下页下页湖南教育出版社湖南教育出版社例例2 设某批稻谷的发芽率为p,并规定则X服从二点分布,且现从该批稻种中取n颗作发芽试验,并记15.3 参数的点估计 则 是总体X的样本.首页首页上页上页下页下页湖南教育出版社湖南教育出版社(1)证明 均是p的无偏估计.(2)比较 的有效性.解解15.3 参数的点估计

16、 首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.3 参数的点估计 首页首页上页上页下页下页湖南教育出版社湖南教育出版社 注意注意 (1)上例表明,在二点分布总体中,样本均值 是总体参数p的无偏估计.如果在n颗稻谷中,有m颗发了芽,则 15.3 参数的点估计 (2)对于一般总体X,不一定存在参数的最优无偏估计.但对正态总体 ,可以证明:样本均值 和方差 分别是总体均值 和方差 的最优无偏估计.首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.4 区间估计 1区间估计的概念区间估计的概念首页首页上页上页下页下页2正态总体均值的区间估计正态总体均值的区间估计3正态总体方差的区间估

17、计正态总体方差的区间估计湖南教育出版社湖南教育出版社15.4 区间估计 1区间估计的概念区间估计的概念则称随机区间 为 的置信区间置信区间,定义定义1 设 是总体X的未知参数,对于事先给定的 若由样本 确定的统计量1-称为置信区间的置信概率置信概率或置信度置信度.首页首页上页上页下页下页湖南教育出版社湖南教育出版社 的意义是:由样本统计量得到的随机区间 能以95%的可靠性包含 的真值.具体地说,抽取100个随机样本,可以得到100个随机区间,则在这100个随机区间中,约有95个区间包含 的真值.15.4 区间估计 首页首页上页上页下页下页例如例如,如果置度 ,则等式湖南教育出版社湖南教育出版社

18、设总体 是来自总体X的样本,由前面的讨论知 是 的无偏估计自然想到利用 来求得 的置信区间.当 时,统计量(1)方差已知时,均值的区间估计方差已知时,均值的区间估计15.4 区间估计 2正态总体均值的区间估计正态总体均值的区间估计首页首页上页上页下页下页湖南教育出版社湖南教育出版社 即15.4 区间估计 首页首页上页上页下页下页对于给定的置信度 查正态分布表,可求得 ,使 上式表明,的置信度为 的置信区间为:湖南教育出版社湖南教育出版社 置信度临界值置信区间0.901.650.951.960.992.58表表15-2 U区间估计表区间估计表15.4 区间估计 首页首页上页上页下页下页湖南教育出

19、版社湖南教育出版社因此,该品种水稻的平均亩产量有95%的可能性在例例1 某农场试种新品种水稻,假定水稻亩产量X服从正态分布 .现从该农场的水稻田中随机抽16亩实割实测,平均亩产为412.5kg.试以95%的置信度估计该种水稻的平均亩产量.解解15.4 区间估计 首页首页上页上页下页下页湖南教育出版社湖南教育出版社解解 设从总体X中取得的样本为 ,则例例2 设总体X服从二点分布,即 求p的置信区间.可以证明,当n充分大(一般要求 时,统计量 15.4 区间估计 近似地服从标准正态分布N(1,0).首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.4 区间估计 解出p的变化范围,就可得到p

20、的置信区间.首页首页上页上页下页下页湖南教育出版社湖南教育出版社 有两个实根 所以p的置信区间是 15.4 区间估计 首页首页上页上页下页下页湖南教育出版社湖南教育出版社均大于5.例例3 在某大学学生会主席选举前,随机挑选了400名大学生进行民意测验,发现有240名学生都支持主席连任.试求原学生会主席的支持率的置信区间().解解15.4 区间估计 首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.4 区间估计 p的区间估计为(0.5513,0.6468).首页首页上页上页下页下页湖南教育出版社湖南教育出版社(2)方差未知时,均值的区间估计)方差未知时,均值的区间估计 用样本方差 估计总

21、体方差 .因此,代替U统计量,考虑统计量15.4 区间估计 服从自由度为n-1的t分布.首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.4 区间估计 首页首页上页上页下页下页湖南教育出版社湖南教育出版社例例4 用某仪器间接测量温度,重复测量5次,得到如下数据(单位:):1250,1265,1245,1260,1275 假设温度服从正态分布 ,试求温度真值的置信区间.解解15.4 区间估计 于是,所求置信区间为 首页首页上页上页下页下页湖南教育出版社湖南教育出版社3正态总体方差的区间估计正态总体方差的区间估计设是来自总体的样本,由于样本方差 是 的无偏估计.均未知.因此可以利用 来求得

22、 的置信区间.对于给定的 和自由度查 分布表,可得到临界值.15.4 区间估计 首页首页上页上页下页下页湖南教育出版社湖南教育出版社使15.4 区间估计 首页首页上页上页下页下页湖南教育出版社湖南教育出版社例例5 假定初生婴儿(男孩)的体重服从正态分布,随机抽取12名新生婴儿,测其体重为(单位:g):3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2640 试对新生婴儿体重的方差进行区间估计(置信度为0.95).15.4 区间估计 解解于是,所求置信区间为 首页首页上页上页下页下页湖南教育出版社湖南教育出版社15.5 假设检验1假设

23、检验原理假设检验原理首页首页上页上页下页下页2U检验法检验法3t 检验法检验法4 检验法检验法湖南教育出版社湖南教育出版社15.5 假设检验 例例1 某厂有一批产品,共10000件,需经检验后方可出厂.按规定,次品率不得超过5%.今在其中任意选取25件产品进行检查,发现有2件次品,问这批产品能否出厂?1假设检验原理假设检验原理 例例2 某车间有一台包装机包装白糖,额定标准为每袋净重50kg.假定包装机称得糖的重量服从正态分布,且根据经验知其标准差 kg.某天开工后,为检验包装机工作是否正常,随机抽取它包装的糖9袋,称得的重量为(单位:kg):49.65,48.35,50.25,49.15,49

24、.85,49.75,51.05,50.25.这一天包装机工作得是否正常?首页首页上页上页下页下页湖南教育出版社湖南教育出版社作为检验对象的假设称为原假设原假设,通常用H0表示.15.5 假设检验例如例如,例2中的原假设为H0:用样本提供的信息来推断原假设是否成立的过程叫做假设检验假设检验.假设检验的基本原理是:先假设H0为真;其次在H0成立的条件下,构造一个小概率事件B;然后通过样本提供的信息判断小概率事件B是否发生了:如果B发生了,而小概率原理认为,概率很小的事件在一次试验中是几乎不可能发生的,从而导出了一个违背小概率原理的不合理现象,这表明假设H0为真是不正确的,因此应拒绝H0;否则,应接

25、受H0.首页首页上页上页下页下页湖南教育出版社湖南教育出版社 当H0真实时,如果否定了它,则这种错误称为第第一一类类错错误误;当H0虚假时,如果否定了它,则这种错误称为第二类错误第二类错误.在实际中,通常总是先固定第一类错误的概率值,然后适当地选取样本容量去控制第二类错误的概率尽量小.小概率事件的概率用 表示,一般可取0.1,0.05,0.01等值.通常称 为显著性水平显著性水平或检验水平检验水平.15.5 假设检验首页首页上页上页下页下页湖南教育出版社湖南教育出版社解解 例例3 某种商品的寿命X服从正态分布 ,现从这种商品中任取16件,测得其寿命为:9.3,8.5,8.7,8.9,9.8,9

26、.1,8.6,8.0,8.9,9.8,8.8,9.0,9.4,9.0,8.3,9.9.根据经验,该种商品的寿命方差不会变,试根据样本判断该种商品的寿命的均值有无变化.15.5 假设检验2U检验法检验法首页首页上页上页下页下页湖南教育出版社湖南教育出版社 对于给定的 ,查正态分布表,可得临界值 ,使得这就是说,事件 是一个小概率事件.根据样本值算得,代入统计量U,得15.5 假设检验首页首页上页上页下页下页湖南教育出版社湖南教育出版社 所以小概率事件 发生了,故应拒绝原假设 .即认为这天生产的产品的寿命均值在 检验水平下有显著变化.一般地,设总体 ,其中方差 为已知,检验原假设15.5 假设检验

27、(为已知)可用U统计量作检验.这种检验方法叫做U检验法检验法.首页首页上页上页下页下页湖南教育出版社湖南教育出版社U检验法检验法的的一般步骤如下:(2)根据样本值计算统计量 的值.(3)根据给定的检验水平,查表确定临界值 ,使(4)判断:若 ,则拒绝 ;否则接受(1)提出原假设15.5 假设检验首页首页上页上页下页下页湖南教育出版社湖南教育出版社 已知饮料中钙含量服从正态分布 ,且方差问新工艺下钙含量比旧工艺钙含量是否有显著差异?例例4 用传统工艺加工的某种加钙饮料中,每100ml平均钙的含量为60mg.现改进了加工工艺,随机抽查了9瓶(100ml/瓶),测得其钙含量分别为(单位:mg):63

28、.5 61.3,58.7,59.6,62.5,63.8,61.5,60.7,59.2.15.5 假设检验首页首页上页上页下页下页湖南教育出版社湖南教育出版社(4)因为 ,所以接受原假设 ,即在 的检验水平下,可以认为新工艺下钙含量比旧工艺钙含量没有显著差异.解解 (1)提出原假设 (2)由得(3)根据检验水平查表得临界值15.5 假设检验首页首页上页上页下页下页湖南教育出版社湖南教育出版社 在U检验中,当 未知时,就无法算出U统计量的值,这时自然想到用样本方差 代替 ,得到统计量当原假设 成立时,总体3t 检验法检验法于是有15.5 假设检验用t统计量对原假设进行检验的方法称为t检验法检验法.

29、首页首页上页上页下页下页湖南教育出版社湖南教育出版社(2)根据样本值计算统计量 的值.(3)根据给定的检验水平 和自由度 ,查t分布表确定临界值 ,使 .(4)判断:若 ,则拒绝 ;否则接受 .t检验法检验法步骤如下:(1)提出原假设15.5 假设检验首页首页上页上页下页下页湖南教育出版社湖南教育出版社 例例5 某工厂生产某种产品,该产品的重量服从正态分布,其标准重量为 kg,某日开工后从这批产品中随机测得9件产品的重量如下(单位:kg):99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5.问:该日生产是否正常()?15.5 假设检验解解(1)提出

30、原假设(2)首页首页上页上页下页下页湖南教育出版社湖南教育出版社所以只能接受原假设,即可以认为该日工厂生产正常.(3)由查表得(4)15.5 假设检验首页首页上页上页下页下页湖南教育出版社湖南教育出版社 4 检验法检验法即设 ,检验原假设 .用统计量来做检验,这种检验称为 检验检验.15.5 假设检验首页首页上页上页下页下页湖南教育出版社湖南教育出版社(3)根据给定的检验水平 和自由度 ,查 分布表确定临界值则拒绝 ;否则接受 .(4)判断:若(1)提出原假设(2)根据样本值计算统计量15.5 假设检验 检验的步骤如下检验的步骤如下.首页首页上页上页下页下页湖南教育出版社湖南教育出版社 例例6

31、 某电池厂生产的电池,其寿命服从方差 的正态分布.今生产一批这样的电池,从生产情况看,寿命波动性较大,为了判断这种想法是否合乎实际,随机抽取了26只电池,测得其寿命的样本方差 ,问这批电池的寿命较以往的有无显著性的差异()?(1)提出原假设(2)由已知算得统计量的值为15.5 假设检验解解首页首页上页上页下页下页湖南教育出版社湖南教育出版社 (3)由查表得(4)由于 因此接受即可以认为这批电池寿命的波动性与原来的无显著差异.15.5 假设检验首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.6 一元线性回归1回归分析的概念回归分析的概念首页首页上页上页下页下页2一元线性回归方程的建立

32、一元线性回归方程的建立3相关性检验相关性检验湖南教育出版社湖南教育出版社变量之间的关系 确定性关系确定性关系:非确定性关系非确定性关系:人的身高与体重之间的关系.15.6 一元线性回归1回归分析的概念回归分析的概念非确定性关系又称为相关关系相关关系.由一个或一组非随机变量来估计或预测某一个随机变量的观察值时,所建立的数学模型及所进行的统计分析,称为回归分析回归分析.如果这个模型是线性的就称为线性回归分析线性回归分析.首页首页上页上页下页下页湖南教育出版社湖南教育出版社 对两个变量间相关关系的研究称为一元回归一元回归.在一元回归中,如果所得的经验公式是线性方程,则称为一元线性回一元线性回归方程归

33、方程.设X与Y为具有相关关系的两个变量,X是可控的,Y是随机变量,它们之间呈线性关系.由于随机因素的干扰,线性关系中含随机误差项 ,即 假定随机项 ,则对于每个给定的X值,各次Y值会有所波动,但平均说来,波动为零,即应有2一元线性回归方程的建立一元线性回归方程的建立 15.6 一元线性回归总体回归方程总体回归方程回归截距回归截距回归系数回归系数首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.6 一元线性回归样本回归方程样本回归方程首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社于是,n个点与回归直线的靠

34、近程度可用Q(a,b)进行描述.15.6 一元线性回归 因此,要找一条总的看来最接近这n个点的直线,就要找出使得Q达到最小值的 分别称它们为的最小二乘法估计最小二乘法估计.首页首页上页上页下页下页湖南教育出版社湖南教育出版社对 关于a,b求偏导数,得整理,得 的求法,可用二元函数求极值的方法:15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社可以证明,确实在 取得最小值.故样本回归方程为(1)解方程组,得它是总体回归方程的最好估计.15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社例例1 以家庭为单位,某种商品年需求量与该商品价格之间的一组调查数

35、据如下表:解解 (1)作散点图.15.6 一元线性回归求X与Y的回归方程.首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.6 一元线性回归(2)求参数a和b的最小二乘法估计首页首页上页上页下页下页湖南教育出版社湖南教育出版社注意到(3)写出回归方程:为了便于记忆公式,常记 15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社在上式中令 ,就得到(2)于是有因此,公式(1)可简单地表示为 15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社 如果用电子计算器计算,则

36、 按下述公式计算比较精确:15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社试求一元线性回归方程.例例2 为了找到向日葵空壳率与开花期大气湿度的关系,研究人员作了一组观察试验,结果如下:15.6 一元线性回归解解 用有统计功能的计算器,可算得首页首页上页上页下页下页湖南教育出版社湖南教育出版社于是,得 15.6 一元线性回归所以,由公式(2)得故所求回归方程为首页首页上页上页下页下页湖南教育出版社湖南教育出版社 (平方和公解公式平方和公解公式)如果一组数据 的回归方程为证证其中则有3相关性检验相关性检验 15.6 一元线性回归定理定理首页首页上页上页下页下页湖南教育出版

37、社湖南教育出版社其中交叉项 15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社平方和分解公式中,左端的和式常记作 即 平方和分解公式中,右端的第二个平方和常记作U,即 15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社U是由X的与Y的线性因素所引起的,通常称U为回归平方和回归平方和.15.6 一元线性回归平方和分解公式中,右端的第一个平方和常记作Q,即 产生Q可能有两个原因:一个是测量或实验误差所致;另一个是X与Y的非线性因素所致.总之,Q是扣除了线性因素所剩余的部分,因此称为剩余平方和剩余平方和或残差平方和残差平方和.首页首页上页上页下页下页湖

38、南教育出版社湖南教育出版社 15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社(12-23)15.6 一元线性回归相关系数相关系数首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.6 一元线性回归完全正相关完全正相关 完全负相关完全负相关 首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.6 一元线性回归没有线性相关性没有线性相关性 首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.6 一元线性回归正相关正相关 负相关负相关 首页首页上页上页下页下页湖南教育出版社湖南教育出版社例例3 试求例2中变量X与Y的相关系数.解解 15.6 一元线性

39、回归用统计量r可进行相关性检验的方法称为r检验法检验法.首页首页上页上页下页下页湖南教育出版社湖南教育出版社例例4 试检验例2中,变量X与Y相关是否显著().15.6 一元线性回归解解查r检验临界表得首页首页上页上页下页下页湖南教育出版社湖南教育出版社试求回归方程,作相关显著性检验(),并求当 时的回归值.例例5 已知某产品的消费量Y和与它有关的因素X的数据如下:(2)求回归直线.(1)确定关系模型.作散点图(下页).15.6 一元线性回归解解首页首页上页上页下页下页湖南教育出版社湖南教育出版社 15.6 一元线性回归X与Y大到成线性关系,因此可选用线性模型.首页首页上页上页下页下页湖南教育出

40、版社湖南教育出版社(3)相关性检验.15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社(4)将 代入回归方程中,得查r检验临界表,得 这就是说,当因素X的值为20时,该产品的消费量大约是25.52(这个值称为预测值预测值).15.6 一元线性回归首页首页上页上页下页下页湖南教育出版社湖南教育出版社(1)理解总体、样本和统计量的概念.会计算样本的平均值、方差和标准差.了解几个常见统计量的分布,会查临界值表.(2)了解用频率分布估计总体分布的方法.理解数学期望和方差的点估计、估计的无偏性、期望和方差的置信区间的概念.会求正态总体的均值和方差的估计值和置信区间.(3)了解假设检验的基本原理.会使用 检验、t检验和 检验.(4)了解一元线性回归的概念,能求简单的回归直线方程,并会进行相关性检验.课堂小结课堂小结首页首页上页上页下页下页一一 内容提要内容提要 本章的主要内容有总体和样本的概念,参数的点估计和区间估计,假设检验及一元线性回归.二二 基本要求基本要求

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁