《第六章 化学试验设计法中的回归分析优秀课件.ppt》由会员分享,可在线阅读,更多相关《第六章 化学试验设计法中的回归分析优秀课件.ppt(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第六章 化学试验设计法中的回归分析1第1 页,本讲稿共23 页那么如何在这些关系不确定的变量之间找到一些内在的规律,从而为科学研究做出一定的预测?譬如在我们的化学试验中,如何才能从有限的试验数据中找出一定的规律,从而为获得指标最优化做出正确地判断?2第2 页,本讲稿共23 页通常,回归分析(RegressionAnalysis)是试验数据处理中最常用的一种方法,也是比较好的一种方法。所谓回归分析,其实就是研究相关关系的一种数学工具,它能提供变量之间关系的一种近似表达,即回归方程,根据回归方程作图,就可以得到对各数据点误差最小,因而也是最好的一条曲线,即回归曲线。回归方程可用来达到预测和控制的目
2、的。3第3 页,本讲稿共23 页回归分析分类:按自变量的数目分类:一元回归:多元回归:一个因变量和一个自变量(Y&X)一个因变量和多个自变量(2)(Y&X1、X2)按回归关系分类:线性回归和非线性回归。这两种分类方式相互交叉,可以产生常见的四种回归模式:一元线性回归、一元非线性回归、多元线性回归,多元非线性回归。4第4 页,本讲稿共23 页62 一元线性回归假设用(xi,yi)表示一组数据点(i1,2,n)。请问一下:这些数据点代表什么样的试验设计方案?是不是代表单因素试验设计?任意一条直线的函数关系可表示为:y*=a+bx(1)如果用这条直线代表(xi,yi)里x和y的关系,则每个点的误差为
3、:yi-y*=yi-a-bxi(2)5第5 页,本讲稿共23 页(3)若各数据点的差方和为Qi*,则总的差方和Q*为:一元线性回归就是指在所有的直线中,使差方和Q*最小的一条直线。即回归直线的系数b和截距a应使Q*达到最小值。即:Q*(a,b)=minQ*(a,b)那么怎样的a、b值才能使Q*最小呢?(3)式分别对a、b求偏微分,并使之等于零:6第6 页,本讲稿共23 页(4)(5)(4)式和(5)式经转换分别可得:(6)(7)7第7 页,本讲稿共23 页(6)、(7)式构成一个二元一次方程组,因此肯定有唯一解。这就是一元线性回归的基础。经过一系列推导,最终:其中:(8)(9)8第8 页,本讲
4、稿共23 页上面所讲的就是确定一元回归方程所根据的原则。即应使回归方程与所有观测数值的差方和达到极小值。因为平方运算也称为“二乘”运算,因此这种回归方法就通称为“最小二乘法”。最小二乘法就是最小差方和法。事实上,现在计算机线性拟和(如excel、origin等)就是依据的上述(8)、(9)式,实际工作中根本不需要大家计算。但是我们应该知道这个原理。当然,大家也可以自己写一个小程序进行这些工作。9第9 页,本讲稿共23 页如何判断一元线性回归方程是否有意义?在数学上有一个非常重要的判别方法,就是相关系数法。即我们经常求的R值法。(10)或者:(10)这里sx、sy为x和y的标准偏差。10第10
5、页,本讲稿共23 页关于R的说明:R1,说明没有试验误差;R0说明回归线与x轴平行,y与x没有线性相关。0R1,有相关性。其中R愈接近1,相关性越强。一般只有当R大于某个临界值时,y与x的线性关系才是显著相关,回归才有意义。R的临界值与样本个数、显著性水平都有关系。一般的,R最起码应大于0.95。一元线性回归在单因素法中有很重要的应用。11第11 页,本讲稿共23 页63一元非线性回归 在很多实际的工作中,我们碰到的y-x按线性回归时,相关系数很差,意味着y-x不是一个线性关系。这时需要考虑非线性回归。自变量只有一个时,就是一元非线性回归。在一些情况下,一元非线性回归经过适当的变换,可以转化为
6、线性回归问题。12第12 页,本讲稿共23 页具体做法是:(1)根据样本数据,先作出散点图;(2)根据散点图推测yx之间的函数关系;(3)选择适当的变换,使之变成线性关系;(4)用线性回归方法求出线性回归方程;(5)最后返回原来的函数关系,得到要求的回归方程。13第13 页,本讲稿共23 页如:1.双曲线 可令;2.抛物线 可令;3.幂函数可令;4.指数函数 可令;5.S型函数可令;等等14第14 页,本讲稿共23 页事实上,我们在很多情况下对数学曲线的类型了解的并没有这么深入,这个时候就主要靠对各种函数进行试验,然后看相关系数是否接近于1来判断拟和的函数是否有用。15第15 页,本讲稿共23
7、 页例题13.发光半导体纳米晶体也叫作量子点(Quantum Dots,QDs),最近15年才得以迅速发展起来。它具有非常优异的光学性能。和有机荧光染料相比,量子点具有亮度高,光稳定性好,荧光发射波长窄(fwhm=25-30nm,fullwidthathalf-maximum),激发和发射波长依赖于粒径等优点。通常粒径是用TEM测定的,但是对于水溶性QDs,直接用TEM测定时经常会在铜网上聚集,从而得不到有用的电镜照片。为此发展了一种荧光相关光谱法(FCS)测定量子点的粒径。(Zhang PD et al,Anal.Chim.Acta.546(2005)4651)16第16 页,本讲稿共23
8、页FCS依据的原理就是下面这个公式:其中:实际测得的最大激发波长和粒径的对应关系如下:labs(nm)516 525 533 540 553 564 580d(nm)2.40.33.20.43.20.34.60.45.20.75.80.710.81.2如何对他们进行回归呢?R:动力学半径17第17 页,本讲稿共23 页事实上,只要我们知道了回归模型,回归分析将变得很简单。譬如,单分子在微区中的运动轨迹就可按照FCS模型进行非线性拟和(这里不讨论 这里不讨论)。如果不知道回归模型,那么只能从常规的线性回归开始尝试。在本例中,将测定的激发波长作为自变量x,粒径作为因变量y,那么通过excel或者o
9、rigin很容易对其作出散点图:18第18 页,本讲稿共23 页如果按照线性回归,得到的图形线性很差。19第19 页,本讲稿共23 页观察图形,并考虑到实际测定的误差,试图用一元二次函数进行回归:从R2可以看出,回归有所改进。进一步分析,将多项式回归的阶数再增高一阶,即一元三次多项式回归。20第20 页,本讲稿共23 页更进一步,一元四次、五次、六次回归得到的图形:21第21 页,本讲稿共23 页可以看出,似乎拟和阶数越高,回归的相关系数越高,但事实上6次式是不对的,因为在实际的QD合成中,粒径是随着激发波长单调增长的。而且,我们也看到,5次式、4次式、3次式的相关系数都大于0.99,已远远大
10、于99的置信度范围的临界R值(对7个试验点,临界R值为0.874),因此实际工作中选一元三次式回归方程。事实上,考虑到试验的误差,试验点数目的限制等因素,一元三次回归方程已经完全能满足预测功能。22第22 页,本讲稿共23 页补充说明:任何一条单变量的曲线,如光谱曲线、极谱或伏安曲线、动力学曲线等,都可以用一个合适的多项式函数来表示,也就是说可以用一个非线性逼近拟和函数或模型进行拟和(如例题13):无论原试验数据是否符合所设定的多项式,都可用上述方法估计多项式的系数。一般来说,提高多项式的次数,则实验的相关性越好,曲线拟和的程度越高。注意在拟和中要求试验点mn+1。23第23 页,本讲稿共23 页