《1、统计案例 教师版.docx》由会员分享,可在线阅读,更多相关《1、统计案例 教师版.docx(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、个性化教学辅导教案教学过程学生姓名年级学 科上课时间教师姓名课 题统计案例教学目标1.回归方程2.独立性检验学生活动进门测评分(老师根据学生情况进行添加)。问题定位1、设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样A本数据(, y)(i=l,2,,n),用最小二乘法建立的回归方程为y=0.85x85.71,则下列 结论中正确的是(填序号).(l)y与工具有正的线性相关关系;(2)回归直线过样本点的中心(三,7);(3)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;(4)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.【
2、解析】回归方程中的系数为0.850,因此y与工具有正的线性相关关系,(1)正确;由回归方程系数的意义可知回归直线过样本点的中心(;,亍),(2)正确;AA依据回归方程中b的含义可知,X每变化1个单位,y相应变化约0.85个单位,(3)正 确;用回归方程对总体进行估计不能得到肯定结论,故(4)不正确.【答案】2y作出y与的散点图如图所示.2y6 4 2 0 8 6 4 2 O1111 -由图可知y与(近似地呈线性相关关系._55又 =L55, j =7.2, &y=94.25,Z匹=21312 5, 尸1尸15力9一5 t yA 尸1 b 5-刀一5 t 2 i=i=-4 134 421.312
3、 5 - 5X1.552JA A a= y-b t =7.2-4.134 4X 1.550.8,AA j = 4.134 4/+0.8.a 4 134 4所以y与x之间的回归方程是y =要上+0.8.类题通法非线性回归分析的步骤非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幕函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后 采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:变式训练为了研究某种细菌随时间X变化繁殖个数y的变化,收集数据如下时间/天123456繁殖个数y612254995190
4、用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;求y与x之间的回归方程.解:(1)散点图如图所示:繁殖个数200180160140120100806040200(2)由散点图看出样本点分布在一条指数函数yi=ciec2X(ci0)的周围,则In y=ln q+ck,于是 令z=lny,则X1234561.792.483.223.894.555.25画出相应的散点图(图略),可知变换后的样本点分布在一条直线附近,因此可用线性回归方程来AA,拟合,由表中数据得到线性回归方程为z=0.69*+L115,则有y = eO6%+iU5.易错题:错误理解残差的概念而致误典例某种产品的广告费支出(
5、单元:万元)与销售额y(单位:万元)之间有下表关系:X24568y3040605070Ay与x的线性回归方程为y =6.5x+17.5,当广告费支出5万元时,随机误差的效应(残差)为()A. 10B. 20 C. 30 D. 40AA解析因为y与x的线性回归方程为y = 6.5x+17.5,当x=5时,y=50,当广告费支出5万元 时,由表格得y=60,故随机误差的效应(残差)为6050=10.答案A易错防范AA AA A1 .对残差右不理解,误认为&=贺一y=g-ai=l,2,,2 .残差平方和越小,说明模型的拟合效果就越好.变式训练A已知方程=0.85%82.71是根据女大学生的身高预报她
6、的体重的回归方程,其中工的单位是cm,Ay的单位是kg,那么针对某个体(160,53)的残差是. AAAA解析:把 x=160 代入y=0.85x-82.71,=0.85X 160-82.71=53.29,所以残差。=)一=53-53.29=-0.29.答案:一0.29. 2独立性检验的基本思想及其初步应用知识点独立性检验的有关概念1 .分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.1 . 2X2列联表假设有两个分类变量X和匕它们的取值分别为XI,必和U1, ,其样本频数列联表(也称2X2 列联表)为:)1J2总计X1aba+bX2Cdc+d总计+cb+da+b+c
7、+d2 .等高条形图将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这 就是等高条形图.3 .依统计量为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量昭= (4+5)(%(%(方+打其中=a+b+c+d为样本容量.4 .独立性检验利用随机变量心来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类 变量独立性检验.反证法原理与独立性检验原理的比较反证法原理一一在假设为下,如果推出一个矛盾,就证明了不成立.独立性检验原理一一在假设“0下,如果出现一个与为相矛盾的小概率事件,就推断“0不成立, 且该推断犯错误的概率不超过小概率.1Ali
8、 沪上.独立性检验的步骤7独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界处然后查右表 确定临界值公.P(,初0.500.400.250.150.10ko0.4550.7081.3232.0722.706尸(整2心)0.050.0250.0100.0050.001Ao3.8415.0246.6357.87910.828利用公式蜉=日炭粽瑞谢,计算随机变量群的观测值此(3)如果42公,就推断“X与y有关系”,这种推断犯错误的概率不超过a;否则,就认为在犯 错误的概率不超过a的前提下不能推断“X与丫有关系”,或者在样本数据中没有发现足够证据支 持结论“
9、X与y有关系”.详析独立性检验(1)通过列联表或观察等高条形图判断两个分类变量之间有关系,属于直观判断,不足之处是不 能给出推断“两个分类变量有关系”犯错误的概率,而独立性检验可以弥补这个不足.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的 方法确认所得结论在多大程度上适用于总体.睡Ml列联表和等高条形图的应用例1某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人 中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图, 利用图形判断考前心情紧张与性格类别是否有关系.解作列联表如下:性格内
10、向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020相应的等高条形图如图所示:0987654321 1000000000父母 吸烟父母不 吸烟匚=1性格外向Z3性格内向为0 考前心 考前心情紧张 情不紧张图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情 紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与 性格类型有关.类题通法细解等高条形图(1)绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度 是相同的;两列的数据对应不同的颜色.(2)等高条形
11、图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高 度,如果两个高度相差比较明显即帚和扁相差很大,就判断两个分类变量之间有关系.变式训练为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟6785221 200总计9156051520利用等高条形图判断父母吸烟对子女吸烟是否有影响.解:等高条形图如下:由图形观察可以看出子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.题型二独立性检验的原理例2(辽宁高考节选)某大学餐饮中心为了解新
12、生的饮食习惯,在全校一年级学生中进行了抽 样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问:是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面 有差异”?解将2X2列联表中的数据代入公式计算,得左=100 义(60 X10-20 义 10尸 100 70X30X80X20=3F4762由于4.7623.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有 差异”.类题通法解决独立性检验问题的思路解决一般的独立性检验问题,首先由题目所给的2X2列联表确定a, b, c, d, 的值
13、,然后代 入随机变量K2的计算公式求出观测值A,将欠与临界值心进行对比,确定有多大的把握认为“两个 分类变量有关系”.变式训练某医院对治疗支气管肺炎的两种方案A, B进行比较研究,将志愿者分为两组,分别采用方案A和方案3进行治疗,统计结果如下:有效无效总计使用方案A组96120使用方案5组72总计32完成上述列联表;能否在犯错误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关?解:(1)列联表如下:有效无效总计使用方案A组9624120使用方案5组72880总计16832200八 200X(96X8-24X72)2森=120 x 80X168X32 571 V3.84L所以不能在犯错
14、误的概率不超过0.05的前提下认为治疗是否有效与方案选择有关.题型3、独立性检验与统计的综合应用典例(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外 750名工人参加过长期培训(称为B类工人).现用分层抽样的方法(按A类、B类分两层)从该工厂的 工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表.表1: A类工人生产能力的频数分布表生产能力分组110,120)120,130)130,140)140,150)人数8X32表2: B类工人生产能力的频数分布表生产能力分组110,120)120,130)130,140)14
15、0,150)人数6y2718(1)确定B y的值;(2)完成下面2X2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能 力与工人的类别有关系.产能力分组工人类百110430)130,150)总计A类工人B类工人总计nad- bcY(a+b)(c+d)(a+c)(b+d)P(烂2初0.0500.0100.0013.8416.63510.828解题流程审结论,明解题方向审条件,挖解题信息1建联系,找解题突破口1LX(1)确定上,、的值,可根据分层 抽样解决;(2)判断能否在犯错误的概率 不超过0.001的前提下认为工 人的生产能力与工人的类别有 关系(1)某工厂中A类工人、
16、B类工 人的人数以及抽取的总人数;(2)根据分层抽样的特点可求V的值;(3)求出K的观测值仙然后与 临界值表中的数据比较即可利用分层抽样确定A,B两类应 抽取的人数 求上,? A完 成2 X 2列联表一 计算K2的 观测值k 对比临界值表得 出结论解答(1),从该工厂的工人中抽取100名工人,且该工厂中有250名A类工人,750名B类工人,上要丛A类工人生抽取21名一丛建工A里抽取75名,(2分)x=25-8-3-2=12, 尸75627 18=24.(4 分)(2)根据所给的数据可以完成列联表,如下表所示:产能力分组工人类别110,130)130,150)总计A类工人20525B类工人304
17、575总计5050100由列联表中的数据,得好的观测值为100X(20X45-5X30)2八k= 12 10.828.(10 分) / 3 3U / 3U因此,在犯错误的概率不超过0.001的前提下,认为工人的生产能力与工人的类别有关系.(12 分)名师批注要确定x, y的值,应先确定A类工人及B类工人中应各抽取多少人,此处易误认为x=25, y =75,从而导致解题错误(6分)此处易犯错误有两点:计算失误;将公式中的数据搞错变式训练电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了 100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率
18、分布直方图:将日均收看该体育节目时间不低于40分的观众称为“体育迷”,已知“体育迷”中有10名女性.根据已知条件完成下面的2X2列联表,据此资料,你是否认为“体育迷”与性别有关?非体育迷体育迷总计男女总计附:P(左,Ao)0.050.01左03.8416.635解:由频率分布直方图可知,在抽取的100名观众中,“体育迷”有25名,“非体育迷有75 名,又已知100名观众中女性有55名,女“体育迷”有10名,所以男性有45名,男“体育迷”有15名,从而可完成2X2列联表,如下表:非体育迷体育迷总计男301545女451055总计7525100由2X2列联表中的数据,得森的观测值为100X(30X
19、10-15X45)45X55X75X25因为3.030V3.841,所以没有充分的证据表明“体育迷”与性别有关.(g)巩固练习1 .已知变量X与y正相关,且由观测数据算得样本平均数3 =3, 7=3.5,则由该观测数据算 得的线性回归方程可能为() AAA.y = 0.4x + 2.3 B.y = 2x2.4 AAC.y= -2x + 9.5 D.y=-0.3x+4.4解析:选A 依题意知,相应的回归直线的斜率应为正,排除C、D.且直线必过点(3,3.5),代入 A、B得A正确.2 .甲、乙、丙、丁四位同学在建立变量x, y的回归模型时,分别选择了 4种不同模型,计算可 得它们的相关指数R2分
20、别如下表:甲乙丙TR20.980.780.500.85建立的回归模型拟合效果最好的同学是()A.甲B.乙C.丙D. T解析:选A相关指数R2越大,表示回归模型拟合效果越好.3 .设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据A(xi, yi)(i=l,2,n),用最小二乘法建立的回归方程为y = 0.85x85.71 ,则下列结论中不正确的是()A. y与x具有正的线性相关关系B.回归直线过样本点的中心(x , y )C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 k
21、g解析:选D回归方程中x的系数为0.850,因此y与x具有正的线性相关关系,A正确;由回归方程系数的意义可知回归直线过样本点的中心(3, 7), B正确;AA依据回归方程中b的含义可知,x每变化1个单位,y相应变化约0.85个单位,C正确;用回归方程对总体进行估计不能得到肯定结论,故D不正确.4 .甲、乙、丙、丁 4位同学各自对A, B两变量做回归分析,分别得到散点图与残差平方和Ayi)2,如下表:甲乙丙T散点图B B -B JO4OA0A1残差平方和1151061241032、甲、乙、丙、丁 4位同学各自对A、3两变量做回归分析,分别得到散点图与残差平A方和p)2如表所示:甲乙丙T散点图残差
22、平方和115106124103(填“甲”“乙”“丙”“丁”洞学的试验结果体现拟合A、8两变量关系的模 型拟合精度高.【解析】 根据线性相关的知识,散点图中各样本点条状分布越均勺,同时保持残 差平方和越小(对于已经获取的样本数据,夫2表达式中7)2为确定的数,则残差平方和越小,肥越大),由回归分析建立的线性回归模型的拟合效果就越好,由试验结果知 丁要好些.【答案】 丁3、下面是一个2X2列联表:yi*总计XIa2173X282533总计b46则表中m b处的值分别为.【解析】 V6i+21=73, :.a=52,又8=。+8 = 52+8 = 60.【答案】52,604、观察下列各图,其中两个分
23、类变量x, y之间关系最强的是哪位同学的试验结果体现拟合A, B两变量关系的模型拟合精度高?()A.甲B.乙C.丙D. T解析:选D从题中的散点图上来看,丁同学的散点图中的点更加近似在一条直线附近;从残差 平方和来看,丁同学的最小,说明拟合精度最高.5 .已知x与y之间的几组数据如下表:X123456y021334A A A假设根据上表数据所得线性回归直线方程为y = bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b + a则以下结论正确的是()AAAAAAAAA.bb aaf 8上“ aazD上vb, aa6.下列关于K2的说法中,正确的有(填序号).K2
24、的值越大,两个分类变量的相关性越大;K2的计算公式是nad-beK2=a+bc+da+cb+d若求出K2=43.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两 个分类变量有关系”的推断出现错误;独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是 与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.解析:对于,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性 大小,故错;对于,(ad-be)应为(adbc)2,故错;对.答案:7 .某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了 100名电视观
25、众, 相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关: (填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即2=场 3=磊,两者相差较大,所以经直观分析,收看新闻节 a十 b 5o c+d 42目的观众与年龄是有关的.答案:是8 .对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了 3年的跟踪研究, 调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合
26、计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据计算K2=,能否作出这两种手术对病人又发作心脏病的影响有差别的结 论(填唯或“不能”).392x39x167一29x1572解析:根据列联表中的数据,可以求得K2的观测值k=版人跳乂回 .779.Ob入今入 i1 zzOK26.635,因此,在犯错误的概率不超过0.01的前提下认为官员在经济上是否清廉与 他们寿命的长短之间是有关系的.10 .某地震观测站对地下水位的变化和发生地震的情况共进行1 700次观测,列联表如下:有震无震总计水位有变化989021 000水位无变化82618700总计1801 5
27、201 700利用图形判断地下水位的变化与地震的发生是否有关系,并用独立性检验分析是否有充分的证据 显不二者有关系.解:相应的等高条形图如图所示.图中两个阴影条的高分别表示水位有变化和水位无变化的样本中有震的频率.由图可看出,水位 有变化样本中有震的频率与水位无变化样本中有震的频率相差不大,因此不能判断地震与水位变化有 关系.根据列联表中的数据,得K2的观测值为1 700x98x618902x822k = 1 000x700x180x1 520 L5946.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.【答案】C5 .某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行
28、了抽样调查,调查结果如 下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差 异”.【解】 将2义2列联表中的数据代入公式计算,得Mad-bc?10QX(6QX IQ-20X IQ)2 lOQk=(a+b)(c+d)(a+c)(b+d)=70X30X80X20=亓9762因为4.7623.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差 异”1.判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是()A. 2x2列联表B.独立性
29、检验C.等高条形图D.其他解析:选B A、C只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立 性检验通过计算得出相关的可能性,较为准确.2.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()A. k越大,“X与Y有关系”的可信程度越小B. k越小,“X与Y有关系”的可信程度越小C. k越接近于0, “X与Y没有关系”的可信程度越小D. k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即 k越小,“X与Y有关系”的可信程度越小.故选B.E. 利用独立性检验对两个分类变量是否有关系进行研
30、究时,若在犯错误的概率不超过0.005的 前提下认为事件A和B有关系,则具体计算出的数据应该是()A. k6.635B. k7.879D. k7.879.F. (江西高考)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查 了 52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1偏高 正常 总计偏高 正常 总计成绩性别不及格及格总计男61420女102232总计163652视力,生另好差总计男41620女122032总计163652A.成绩C.智商解析:选D男81220女82432总计163652阅读量性丰富不丰富总计男14620女23032
31、总计163652B.视力D,阅读量52x6x22-14x102 因为 kl = 16x36x32x2052x8216x36x32x2052x4x20-16x122 k2= -16x36x32x2052x1122 16x36x32x2052x8x24-12x82 k3= 16x36x32x2052x962 16x36x32x2052x14x30-6x22 k4= 16x36x32x2052x4082 16x36x32x20则有 k4k2k3kl,所以阅读量与性别关联的可能性最大.G. 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好20305
32、0总计6050110,nad-bc2 任.110x40x3020x202由 K2 = a+bc + da+cb+d算何在测值 k=-60x50x60x50附表:P(K2kO)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析:选A由k7.8及P(K2*.635) = 0.010可知,在犯错误的概率不超
33、过1%的前提下认为“爱 好该项运动与性别有关“,也就是有99%以上的把握认为“爱好该项运动与性别有关”.6 .在一组样本数据(xl, yl), (x2, y2), .,(xn, yn)(n2, xl, x2,xn不全相等)的散点图 中,若所有样本点(xi, yi)(i=l,2,,n)都在直线y=x+l上,则这组样本数据的样本相关系数为解析:根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.答案:17 .某咖啡厅为了了解热饮的销售量y(个)与气温x()之间的关系,随机统计了某4天的销售量 与气温,并制作了对照表:气温()1813101尸VV销售量(个)24484A由表中数据,得
34、线性回归方程y=-2x + a.当气温为一4时、预测销售量约为. 1 1解析: x =4(18+13+10-1)=10, y =(24 + 34 + 38 + 64)=40, A40=-2xl0+a, Aa=60,当 x=4 时,y=-2x(-4) + 60 = 68. 答案:688.关于x与y有如下数据:尸240L00010AA为了对X, y两个变量进行统计分析,现有以下两种线性模型:甲:y = 6.5x+17.5,乙:y = 7x+ 17,则(填“甲”或乙”)模型拟合的效果更好.解析:设甲模型的相关指数为RT,5 .八0J yi yi 2e i=l155则 R2=1 -= Tooo=-84
35、5;J yi y 2i= 1设乙模型的相关指数为R2,QQ则 R2 1 00Q0.82.因为 0.8450.82,即 R2R2,所以甲模型拟合效果更好.答案:甲9.(新课标全国卷H谋地区2(X)7年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如 下表:年份20072008200920102Oil20122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况, 并预测该地区2015年农村居民家庭人均纯收入.n ti- t yi
36、yA i = 1A A 附:回归直线的斜率和截距的最小二乘估计公式分别为6=二,a=ybt.n ti t 2i=l解:(1)由所给数据计算得T =1x(l+2+3+4+5+6+7)=4,7=1x(2.9 + 3.3 + 3.6+4.4+4.8 + 5.2+5.9)=4.3,ti-7)2 = 9+4+1+0+1+4+9 = 28,彳ti t )(yi- y ) = ( 3)x( 1.4) + ( 2)x( 1) + (- l)x(-0.7) + 0x0.1 + lx0.5 + 2x0.9 + 3xl.6 = i= 114,7 ti- t yi- ya i=l14b = gq=0.5,7.2otl
37、- t 2i= 1A Aa= y b t =4.30.5x4 = 2.3,A所求回归方程为y = 0.5t+2.3.A(2)由知,b = 0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年 增加0.5千元.A将2015年的年份代号t=9代入(1)中的回归方程,得y = 0.5x9 + 2.3 = 6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.10.(全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.、跚左X版K轻也应用6附注:年份代码17分别对应年份20082014由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于