《统计学教案习题直线相关与回归.docx》由会员分享,可在线阅读,更多相关《统计学教案习题直线相关与回归.docx(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -第十章直线相关与回来一、教学大纲要求(一)把握内容直线相关与回来的基本概念。相关系数与回来系数的意义及运算。相关系数与回来系数相互的区分与联系。(二)熟识内容相关系数与回来系数的假设检验。直线回来方程的应用。秩相关与秩回来的意义。(三)明白内容曲线直线化。二、学内容精要一 直线回来1. 基本概念直线回来 linear regression 建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回来是回来分析中最基本、最简洁的一种,故又称简洁回来(simple reg
2、ression)。可编辑资料 - - - 欢迎下载精品名师归纳总结直线回来方程Y.abX 中, a、b 是打算直线的两个系数,见表10-1。 表 10-1 直线回来方程a、b 两系数对比ab可编辑资料 - - - 欢迎下载精品名师归纳总结含义回来直线在 Y 轴上的截距( intercept)。表示 X 为零时, Y 的平均水平的估量值。系数 0a0 表示直线与纵轴的交点在原点的上方系数 0a0,表示直线从左下方走向右上方,即 Y随 X 增大而增大br 0.05 n-2时,可认为两变量X 与 Y 间()A 有肯定关系B. 有正相关关系C肯定有直线关系D. 有直线关系答案:D 评析 此题考点:直线
3、相关系数假设检验的懂得。由于直线相关系数r 是样本的相关系数,它是相应总体相关系数的估量值。由于抽样误差的影响,必需进行显可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 2 页,共 10 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -著性检验。 r 的假设检验是检验两变量是否有直线相关关系。|r |r 0.05 n-2时, P0D.0 ,b0, b0Cr0D. r 与 b 的符号毫无关系答案:B 评析 此题考点:直线
4、相关与回来的区分与联系的懂得。由于对同一资料而言直线相关系数与回来系数的方向一样,如能同时运算b 和 r,它们的符号一样。因此,同一双变量资料,进行直线相关与回来分析,有r 0, b0。四、习题(一) 单项挑选题1以下 式可显现负值。A ( X X )2B Y 2( Y) 2/nC Y Y 2D( X X )( Y Y )2Y=14+4 X 是 17 岁儿童以年龄(岁)估量体重(市斤)的回来方程,如体重换成国际单位kg,就此方程 。A 截距转变B 回来系数转变C两者都转变D 两者都不转变 3已知 r =1,就肯定有 。A b=1B a=1CSY. X=0D SY. X= SY4用最小二乘法确定
5、直线回来方程的原就是各观看点。 A 距直线的纵向距离相等B 距直线的纵向距离的平方和最小 C与直线的垂直距离相等D 与直线的垂直距离的平方和最小5直线回来分析中,X 的影响被扣除后,Y 方面的变异可用指标表示。可编辑资料 - - - 欢迎下载精品名师归纳总结A Sx , y XX 2n2B. SrYY$ 2n1可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结2C. Sy, x YY$ 2n2D. SbSxyXX可编辑资料 - - - 欢迎下载精品名师归纳总结6直线回来系数假设检验,其自由度为。A nB n 1Cn 2D 2n 17应变量 Y 的离
6、均差平方和划分,可显现。A SS 剩=SS 回B SS总=SS 剩CSS 总=SS回D以上均可8以下运算 SS剩的公式不正确选项。可编辑资料 - - - 欢迎下载精品名师归纳总结A l YYl XY bB lYYbl XX可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 3 页,共 10 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结2C.lllD 1资料word 精心总结归纳 - - - - - - - - - - - -r 2 l可编辑资料
7、 - - - 欢迎下载精品名师归纳总结YYXYXXYY9直线相关系数可用运算。可编辑资料 - - - 欢迎下载精品名师归纳总结A l XYl XX lYYB bYXl XXlYY可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结CbYX bXYD 以上均可可编辑资料 - - - 欢迎下载精品名师归纳总结10当 r=0 时, Y.abX 回来方程中有 。可编辑资料 - - - 欢迎下载精品名师归纳总结A a 必大于零B. a 必等于 XCa 必等于零D. a 必等于 Y(二) 名词说明1.直线回来2.回来系数3.剩余平方和4.回来平方和5.直线相关6
8、.零相关7.相关系数8.打算系数9.曲线直线化10.秩相关(三) 是非题1 剩余平方和SS剩 1=SS剩 2,就 r 1 必定等于r 2。2 直线回来反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。3 两变量关系越亲密r 值越大。(四)简答题1 用什么方法考察回来直线图示是否正确?2 剩余标准差的意义和用途?3 某资料 n=100,X 与 Y 的相关系数为r =0.1 ,可否认为X 与 Y 有较亲密的相关关系?4 r 与 r s 的应用条件有何不同?5 应用直线回来和相关分析时应留意哪些问题?6 举例说明如何用直线回来方程进行猜测和掌握?7 直线回来分析时怎样确定因变量与自变量?
9、(五)运算题110 名 20 岁男青年身高与前臂长的数据见表10-2。运算相关系数并对=0 进行假设检验。运算总体 的 95%可信区间。表 10-210 名 20 岁男青年身高与前臂长17017316015517318817818318016545424441475047464943身高( cm) 前 臂 长( cm)2 某单位讨论代乳粉养分价值时,用大白鼠作试验,得到大白鼠进食量和增加体重的数据见表10-3。此资料有无可疑的反常点?求直线回来方程并对回来系数作假设检验。试估量进食量为900g 时,大白鼠的体重平均增加多少,运算其95% 的可信区间,并说明其含义。求进食量为900g 时,个体Y
10、 值的 95%容许区间,并说明其意义。表 10-3八只大白鼠的进食量和体重增加量12345678800780720867690787934750185158130180134167186133鼠号进食量( g)增量( g)3 某省卫生防疫站对八个城市进行肺癌死亡回忆调查,并对大气中苯并(a)芘进行监测,结果如下,试检验两者有无相关?肺癌标化死亡率(1/10 万)5.6018.5016.2311.4013.808.1318.0012.10苯并( a)芘( g/100m3)0.051.171.050.100.750.500.651.20表 10-4八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度城
11、市编号12345678可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 4 页,共 10 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -4 就下表资料分析血小板和出血症的关系。表 10-512 例病人的血小板浓度和出血症的关系病例号123456789101112血小板数12013016031042054074010601260123014402000( 109/L ) 出血症状+五、习题答题要点(一)单项挑选题1. D
12、2.C3.C4.B5.C6.C7.D8.B9.D10.D(二)名词说明1 直线回来( linearregression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵 向距离的平方和为最小。直线回来是回来分析中最基本、最简洁的一种,故又称简洁回来(simple regression)。2 回来系数( regression coefficient)即直线的斜率slope,在直线回来方程中用b 表示, b 的统计意义为X 每增(减)一个单位时,Y 平均转变 b 个单位。可编辑资料 - - - 欢迎下载精品名师归纳总结3 剩余平方和( residual sum of squar
13、es ), SS剩即YY. 22,它反映 X 对 Y 的线性影响之外的一切因素对Y 的可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结变异的作用,也就是在总平方和中无法用X 说明的部分。在散点图中,各实测点离回来直线越近,小,说明直线回来的估量误差越小。YY.也就越可编辑资料 - - - 欢迎下载精品名师归纳总结4 回来平方和( regression sum of squares), SS回即Y.Y2,它反映由于X 与 Y 的直线关系而使Y 的总变异可编辑资料 - - - 欢迎下载精品名师归纳总结所减小的部分,也就是在总平方和中可以用X 说明的部
14、分。回来平方和越大,说明回来成效越好。5 直线相关( linear correlation )又称简洁相关(simple correlation ),用于双变量正态分布资料。有正相关、负相关和零相关等关系。直线相关的性质可由散点图直观的说明。6 零相关( zerro correlation )是指两变量间没有直线相关关系。211 相关系数又称积差相关系数(coefficient of product-moment correlation ),以符号 r 表示样本相关系数,表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的亲密程度与相关方向的指标。可编辑资料 - - - 欢迎下载精品
15、名师归纳总结l212 打算系数 ( coefficient of determination )即 r 的平方, r 2XYl XYl XXSS回,说明当 SS总固定不变时,可编辑资料 - - - 欢迎下载精品名师归纳总结l XX l YYl YYSS总可编辑资料 - - - 欢迎下载精品名师归纳总结回来平方和的大小打算了r 平方的大小。回来平方和越接近总平方和,就r 平方值越接近1。13 曲线直线化( rectification )是曲线拟合的重要手段之一。对于某些非线性的资料可以通过简洁的变量变换使之直线化,用直线回来分析方法来分析。14.秩相关又称等级相关(rank correlatio
16、n ),是用双变量等级数据作直线相关分析,适用于以下资料:不听从双变量正态分布而不宜作积差相关分析。总体分布型未知。用等级表示的原始数据。(三)是非题1错。两样本剩余平方和SS 剩 1=SS剩 2,但两样本总平方和SS 总及回来平方和SS 回不肯定相等,故两样本相关系数 r1 与 r2 不肯定相等。2正确。3错。相关系数r 有正负之分,其值为1 r1,在总体相关系数不为零,即两变量确有直线关系前提下,r 肯定值愈接近1,两个变量间的直线相关愈亲密。愈接近0,相关愈不亲密。(四)简答题1用以下三种方法判定:可编辑资料 - - - 欢迎下载精品名师归纳总结直线必需通过点(X, Y ) 。可编辑资料
17、 - - - 欢迎下载精品名师归纳总结如纵坐标、横坐标无折断号时,将此线左端延长与纵轴相交,交点的纵坐标必等于截距a。直线是否在自变量X 的实测范畴内。可编辑资料 - - - 欢迎下载精品名师归纳总结22剩余标准差用sY. X 表示:sY . XSS剩n2YY.n2可编辑资料 - - - 欢迎下载精品名师归纳总结其意义是指当X 对 Y 的影响被扣除后,Y 方面仍有变异。这部分变异与X 无关,纯属抽样变异。故sY. X 是用来反映Y可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 5 页,共 10 页 - - - - - - - - -
18、 -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -的剩余变异的,即不考虑X 以后 Y 本身的随机变异。剩余标准差可用于:可编辑资料 - - - 欢迎下载精品名师归纳总结估量回来系数b 的标准误,sbsY.Xl XX,进行回来系数的区间估量和假设检验。可编辑资料 - - - 欢迎下载精品名师归纳总结估量总体中当X 为某肯定值时,估量值Y. 的标准误。并可运算 Y. 的可信区间, sY. X 可作为预报精度的指标。22估量总体中当X 为某肯定值时,个体Y 值的标准差。sY.sY.X1 nXX2XX2可编辑资料 - - -
19、欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结sY.sY . X1 n XX XX ,并运算个体Y 值的容许区间。可编辑资料 - - - 欢迎下载精品名师归纳总结3n=100, r=0.1 时,对相关系数进行t 检验,按检验水准=0.05,拒绝 H0 =0,接受 H 1 0,认为两变量有相关关系, 但打算系数r 2=0.12=0.01,表示回来平方和在总平方和中仅占1%,说明两变量间相关关系实际意义不大。4积差相关系数r 用于描述双变量正态分布资料的相关关系。等级相关系数rs 适用于以下资料:不听从双变量正态分布而不宜作积差相关分析的资料。总体分布型未知的资料。原始资
20、料是用等级表示的资料。5留意以下五个问题作回来分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回来、相关分析,必需对两种现象间的内在联系有所熟识。在进行回来分析和相关分析之前,应绘制散点图。但观看点的分布有直线趋势时,才相宜作回来、相关分析。假如散点图呈明显曲线趋势,应使之直线化再行分析。散点图仍能提示资料有无可疑反常点。直线回来方程的应用范畴一般以自变量的取值范畴为限。如无充分理由证明超过自变量取值范畴外仍是直线,应防止外延。双变量的小样本经t 检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必需很大。相关或回来关系不肯定是因果关系,也可能是
21、相伴关系,有相关或回来关系不能证明事物间确有内在联系。6用直线回来方程进行猜测和掌握的步骤依据讨论目的确定预报因子(X)和预报量( Y),由 X 估量 Y 值,收集资料。可编辑资料 - - - 欢迎下载精品名师归纳总结建立预报方程Y.abX ,并进行回来系数假设检验。如P 小于临界值,就回来方程成立。可编辑资料 - - - 欢迎下载精品名师归纳总结依据回来方程在X 实测范畴内对Y 进行猜测,并运算X 为某定值时,个体Y 值波动范畴(容许区间) 。例如, 17 岁儿童, X 为年龄, Y 为体重,可依据年龄猜测(估量)体重。统计掌握是利用回来方程进行逆估量,如要求因变量Y 值在肯定范畴内波动,可
22、以通过掌握自变量X 的取值来实现。步骤同前。例如,针刺哑门穴,进针深度Y 与颈围 X 间存在直线关系,可依据X 取值达到掌握Y 的目的。7型回来中,X 为精密测量和严格掌握的变量,Y 为正态变量。型回来中,X、Y 均为听从正态分布的随机变量,可运算两个回来方程。何者为X,何者为Y,依据讨论目的确定。例如,测得某一人群的身高和体重两变量,如目的只是由身高估量体重,就确定X 为身高, Y 为体重。(五)运算题1由原始数据及散点图的初步分析(图10-1),估量本资料有直线趋势。可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 6 页,共 1
23、0 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结514947cm45 长 43臂 41前393735150160170180190身高cm图10-1 10 名20岁男青年身高与前臂长散点图可编辑资料 - - - 欢迎下载精品名师归纳总结( 1)运算相关系数可编辑资料 - - - 欢迎下载精品名师归纳总结X1725,X 2298525, X172.5可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精
24、品名师归纳总结Y454, Y 220690, Y45.4,XY78541可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结l XXX 2X 2n29852517252 10962.5可编辑资料 - - - 欢迎下载精品名师归纳总结2lYYY2Yn206904542 1078.4可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结l XYrXYl XYXY226n785410.82271725454 10226可编辑资料 - - - 欢迎下载精品名师归纳总结l XX l YY962.578.4可编辑资料 -
25、 - - 欢迎下载精品名师归纳总结与=0 进行假设检验。H0: =0,即身高与前臂长间无直线相关关系H1: 0,即身高与前臂长间有直线相关关系可编辑资料 - - - 欢迎下载精品名师归纳总结tr0r0.82271024.09可编辑资料 - - - 欢迎下载精品名师归纳总结sr1r 2n2210.8227可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结=0.05n21028 ,查 t 界值表,得0.002P0.005,按 =0.05 水准拒绝 H0,接受 H 1,故可认为20 岁男青可编辑资料 - - - 欢迎下载精品名师归纳总结年身高与前臂长呈正
26、直线相关。 算总体 的 95% 可信区间。对 r 作 z 变换:可编辑资料 - - - 欢迎下载精品名师归纳总结1 1rzln2 1r110.8227ln210.82271.1651可编辑资料 - - - 欢迎下载精品名师归纳总结或, z=tanh 10.8227=1.1651z 的 95%可信区间:可编辑资料 - - - 欢迎下载精品名师归纳总结zu0.05n3, zu0 .05n3可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结1.16511.96103,1.16511.96103可编辑资料 - - - 欢迎下载精品名师归纳总结0.4243,
27、1.9059按 r =tanhz 对 z 作反变换,得20 岁男青年身高与与前臂长总体相关系数的95%可信区间为( 0.4005, 0.9567)。 2由原始数据及散点图初步分析(图10-2),估本资料有直线趋势,故作以下运算。可编辑资料 - - - 欢迎下载精品名师归纳总结 X=6328, X2=5048814, X791可编辑资料 - - - 欢迎下载精品名师归纳总结Y=1273, Y2=206619, Y159 .125, XY=1018263可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - -
28、 - -第 7 页,共 10 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结l XXX 2X 2n22504881463282 8243366可编辑资料 - - - 欢迎下载精品名师归纳总结lYYYYn206619127384052.875可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结l XYXYX Yn101826363281273 811320可编辑资料 - - - 欢迎下载精
29、品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结bl XYl XX11320433660.261可编辑资料 - - - 欢迎下载精品名师归纳总结aYbX159.1250.26179147.326可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结200180g160重增140Y= 172.94+0.42X Y= 47.33+0.26X Y=78.29+0.10X可编辑资料 - - - 欢迎下载精品名师归纳总结1201006007008009001000进食量g图 10-2 大白鼠的进食量与增加体重散点图( 1)回来系数假设检验:H0: 0,即进食量与增重之间无直线关系H1: 0,即