2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版).pdf

上传人:无*** 文档编号:93009195 上传时间:2023-06-21 格式:PDF 页数:73 大小:8.81MB
返回 下载 相关 举报
2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版).pdf_第1页
第1页 / 共73页
2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版).pdf_第2页
第2页 / 共73页
点击查看更多>>
资源描述

《2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版).pdf》由会员分享,可在线阅读,更多相关《2023艺术生新高考数学讲义 第27讲 统计案例和回归方程(学生版+解析版).pdf(73页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第27讲统计案例和回归方程【知 识 点 总 结】一、线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。对于一组具有线性相关关系的数据3,M),(X2J2),(X”,y“),其回归方程丫=嬴+”的求法为_Z(x,.x)(M-y)2 玉 -x yt _ M _2-X)a“zl=i反-y=)a-2%:-Xi=_ 1 -其中,x=-tXi,y=-tyi,(x,y)称为样本点的中心。步骤:画散点图,如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量的回归直线,直线斜率Q 0,称两个变量正相关;k 10828,有 99.9%把握称“A 取 4 或 4”对“B 取&

2、”有关系;若 10.8282心 6.635,有 99%把握称“4 取 4 或 4”对“B 取 囱,毛”有关系;若 6.6352K23.841,有 95%把握称“A 取 4 或 4”对 8 取 S,反”有关系;若犬43.841,没有把握称A 与 B 相关。【典 型 例 题】例 1.(2022 全国高三专题练习(文)在对两个变量x,y 进行回归分析时有下列步骤:对所求出的回归方程作出解释:收集数据(而”),i=l,2,,n;求回归方程;根据所收集的数据绘制散点图.则下列操作顺序正确的是()A.B.C.D.例 2.(2022全国高三专题练习)对于数据组(%,y,)(i=l,2,3,如果由线性回归方程

3、得到的对应于自变量x,的估计值是力,那 么 将 称 为 相 应 于 点(x,y)的残差.某工厂为研究某种产品产量x(吨)与所需某种原材料V吨)的相关性,在生产过程中收集4 组对应数据(x,y)如下表所示:X3456y2.534in根据表中数据,得出y关于x 的线性回归方程为y =0.7 x+a,据此计算出样本点处的残差为一0.1 5,则表中的 值 为()A.3.3 B.4.5 C.5 D.5.5例 3.(2 02 2 全国高三专题练习)据贵州省气候中心报,2 02 1 年 6月上旬,我省降水量在1 5.2-1 7 0.3 m m 之间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足5

4、0 m m,其余均在5 0 m m m 以上,局地超过 1 00mm.若我省某地区2 02 1 年端午节前后3天,每一天下雨的概率均为5 0%.通过模拟实验的方法来估计该地区这3 天中恰好有2 天下雨的概率,利用计算机或计算器可以产生0 到9 之间取整数值的随机数x(x e N,且0WxW9)表示是否下雨:当x w (U (k w Z)时表示该地区下雨,当x w 伙+1,9 时,表示该地区不下雨.因为是3天,所以每三个随机数作为一组,从随机数表中随机取得2 0 组数如下:3 3 2 7 1 4 7 4 0 94 5 5 93 4 68 4 91 2 7 2 0 7 3 4 4 5992 7 7

5、 2 95 1 4 3 1 1 69 3 3 2 4 3 5 0 2 7 898 7 1 9(1)求出女的值,使得该地区每一天下雨的概率均为5 0%;并根据上述2 0 组随机数估计该地区这3天中恰好有2天下雨的概率;(2)2 0 1 6年到2 0 2 0 年该地区端午节当天降雨量(单位:mm)如表:时间2 0 1 6 年2 0 1 7 年2 0 1 8 年2 0 1 9 年2 0 2 0 年年份f12345降雨量)2 82 72 52 32 2经研究表明:从 2 0 1 6年到2 0 2 0 年,该地区端午节有降雨的年份的降雨量丫与年份f 具有线性相关关系,求回归直线方程y =G+a.并预测该

6、地区2 0 2 2 年端午节有降雨的话,降雨量约为多少?参考公式:b=-;-;=-4-g =Z”)沙-/1=1 =1例 4.(2 0 2 2 全国高三专题练习(理)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本)(元)与生产该产品的数量x (千件)有关,经统计得到如下数据:X为 ,=96.54e、,ln),与x 的相关系数4=-0.94.(1)用反比例函数模型求y 关于*的回归方程;(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0。1),并用其估计产量为10千件时每件产品的非原料成本.参考数据:Xi=lUu2ixi=l8Zxf=l8zwZ=l,0

7、.61x6185.5e-2183.40.340.1151.5336022385.561.40.135参考公式:对于一组数据(4%),鱼,%),(,匕),其回归直线0=6+血的斜率和截距的最小一乘估计分-nu-v别为:方=号-,a=v-p u,相关系数-nu1i=2%匕 一 “万 V例 5.(2022 全国高三专题练习)如图是某小区2020年 1月至2021年 1 月当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1 13分别对应2020年 1月 2021年 1月).根据散点图选择),=。+匕&和丫=。+山 两个模型进行拟合,经过数据处理得到两个回归方程分别为=0.93 69+0

8、.0 2 85 五和y =0.95 5 4 +0.0 3 0 6 I n%.并得到以下一些统计量的值:当月在售二手房均价y1.04-1.02-1.00-*0.98-*0.96-#0 94 1 2 3 4 5 6 7 8 9 10 1 1 12 13 月份代码x(1)请利用相关指数此判断哪个模型的拟合效果更好;y =0.93 69+0.0 2 85 6y =0.95 5 4 +0.0 3 0 6 I n x残差平方和O.(X X)5 910.0 0()1 64总偏差平方和欧一习2/=10.0 0 60 5 0(2)估计该小区2 0 2 1 年 6 月份的二手房均价.(精确到0.0 0 1 万元/

9、平方米)参考数据:I n 2 =0.69,l n 3 1.1 0,ln l7 2.8 3,ln l9 2.9 4,夜 641,百 2 1.7 3,7 1 7 4.1 2 ,7 1 9 4.3 6.-y,)参考公式:相关指数R2=l-二2(%-万1=1例 6.(2 0 2 2 全国高三专题练习)近年来,明代著名医药学家李时珍故乡黄冈市新春县大力发展大健康产业,新艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知新艾的株高y(单位:cm)与一定范围内的温度x(单位:)有关,现收集了薪艾的1 3 组观测数据,得到如下的散点图:现根据散点图利用),=。+6 炭 或 y =c+4建立y关于x的回归方程

10、,令s =,/=,得到如下数据:X XXy51 0.1 51 0 9.9 43.0 40.1 6J=l/,.x-i 3 r-yi=l131 3 Tk=l%1 3 产1=1院73了J=11 3.9 4-2.11 1.6 70.2 12 1.2 2且(S,,必)与,y,)(i =l,2,3,,1 3)的相关系数分别为4,矶 且 4=-0.9 9 5 3.(1)用相关系数说明哪种模型建立y与 x的回归方程更合适;(2)根 据(1)的结果及表中数据,建立y关于x的回归方程;(3)已知斯艾的利润z 与 x、y的关系为z =2 0 y-;x,当x为何值时,z 的预报值最大.参考数据和公式:0.2 1 x

11、2 1.2 2=4.4 5 6 2,1 1.6 7 x 2 1.2 2=2 4 7.6 3 7 4,参4 7.6 3 7 4 =1 5.7 3 6 5,对于一组数据(,4)(i匕-nuv=1,2,3,),其回归直线方程u ,的斜率和截距的最小二乘法估计分别为夕=9十-。-2-2Aa=v-13u,相关系数二-nu vi=l例 7.(2 0 2 2 河北张家口高三期末)已知某区A、8两所初级中学的初一年级在校学生人数之比为9:1 1,该区教育局为了解双减政策的落实情况,用分层抽样的方法在A、8两校初一年级在校学生中共抽取了 1 0 0名学生,调查了他们课下做作业的时间,并根据调查结果绘制了如下频率

12、分布直方图:(1)在抽取的1 0 0名学生中,A、8两所学校各抽取的人数是多少?(2)该区教育局想了解学生做作业时间的平均时长(同一组中的数据用该组区间的中点值作代表)和做作业时长超过3小时的学生比例,请根据频率分布直方图,估计这两个数值;(3)另据调查,这1 0 0人中做作业时间超过3小时的人中的2 0人来自A中学,根据已知条件填写下面列联表,并根据列联表判断是否有9 9%的把握认为“做作业时间超过3小时”与“学校”有关?附表:做作业时间超过3小时做作业时间不超过3小时合计A校B校合计P(K2k)0.1 00.0 50.0 2 50.0 1 00.0 0 1k2.7 0 63.8 4 15.

13、0 2 46.6 3 51 0.8 2 8nad-bcY(+6)(c+d)(a +c)(b +d)【技 能 提 升 训 练】一、单选题i.(2 0 2 2 全国高三专题练习)某工厂的每月各项开支x 与毛利润y (单位:万元)之间有如下关系,y与x的线性回归方程y =6.5 x+a,则”=()X24568y3 04 06 05 07 0A.1 7.5 B.1 7 C.1 5 D.1 5.52.(2 0 2 1 重庆南开中学高三阶段练习)对两个变量y和 x进行回归分析,得到一组样本数据:(%,%),(x2,y2).则下列说法中不正确的是()A.由样本数据得到的回归方程y=bx+a必过样本中心(x,

14、y)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R?来刻画回归效果,R越小,说明模型的拟合效果越好D.若变量y和 x之间的相关系数为r=-0.9 3 6 2,则变量y和 x之间具有线性相关关系3.(2 0 2 1.黑龙江.漠河市高级中学高三阶段练习(文)某单位为了 了解办公楼用电量)(度)与气温x (C)之间的关系,随机统计了四个工作量与当天平均气温,并制作了对照表:气 温()1 81 31 0-1用 电 量(度)2 43 43 86 4由表中数据得到线性回归方程y =-2 x+“,当 气 温 为 时:预测用电量均为A.6 8 度 B.5 2 度 C.1 2 度 D.2 8 度4.(

15、2 0 2 2.全国高三专题练习)关于线性回归的描述,有下列命题:回归直线一定经过样本中心点;相关系数,的绝对值越大,拟合效果越好;相关指数R2越接近1 拟合效果越好:残差平方和越小,拟合效果越好.其中正确的命题个数为()A.1 B.2 C.3 D.45.(2 0 2 2 全国高三专题练习)下列表述中,正确的个数是()将一组数据中的每一个数据都加上同一个常数后,方差不变;设有一个回归方程y=3-5 x,变量*增 加 1 个单位时,平均增加5 个单位;设具有相关关系的两个变量x,y 的相关系数为,那么卜|越接近于o,x,y 之间的线性相关程度越高;在一个2x2列联表中,根据表中数据计算得到K2的

16、观测值3若k 的值越大,则认为两个变量间有关的把握就越大.A.0 B.1 C.2 D.36.(2022 全国高三专题练习(文)对两个变量y 与 x 进行回归分析,分别选择不同的模型,它们的相关系数,如下,其中拟合效果最好的模型是()A.0.2 B.0.8 C.-0.98 D.-0.77.(2022 全国高三专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()0 5 10 15 20 25 30 35X相关系数为八bL5y-5050505o332211.一10 15 20 25 30 35X相关系数为2V/5050505O3322115 10 15 20 25 30

17、35X相关系数为35 10 15 20 25 30 35rjr相关系数为7A.4 4 0 4 4C.4 0 4 4B.r4r2 0 7;勺D.r2r40rtr,8.(2022 全国高三专题练习(理)如果发现散点图中所有的样本点都落在一条斜率为非0 实数的直线上,则下列说法错误的是()A.解释变量和预报变量是一次函数关系 B.相关系数r=lC.相关指数R2=l D.残差平方和为09.(2022 全国高三专题练习(理)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()A.4 0 勺 弓C.r4 r2 0 r3 rB.q O G GD.r2 r4 0 r4,则说明变量羽 y

18、之间的线性相关性比变量如“之间的线性相关性强C.若0弓 r2 B.4 =4 C.r 2,x i,X 2,.,xn不全相等)的散点图中,若所有样本点(x“y i)(i=l,2,n)都在直线y=g x+l 上,则这组样本数据的样本相关系数为()A.-1 B.0 C;D.1213.(2 0 2 2 全国高三专题练习)如图,5个(x,y)数据,去掉。(3,10)后,下列说法错误的是()E(10,12)0(3,10)C(4,5).*5(2,4)A(l,3)OxA.相关系数r 变大 B.残差平方和变大C.R 2 变大 D.解释变量尤与预报变量y的相关性变强14.(2 0 2 2 全国高三专题练习)某公交公

19、司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:第X 天12345使用人数(y)1517 34 5 78 4 213 3 3由表中数据可得y关于x的回归方程为m =5 5/+机,则据此回归模型相应于点(2,17 3)的残差为()A.5 B.6 C.3 D.215.(2 0 2 2 全国高三专题练习)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了 1 0 0 位育龄妇女,结果如下表.下列结论正确的是()耳犬叫)0.0 5 00.0 1 00.0 0 1k。3.8 4 16.6 3 51 0.8 2 8A.在犯错误

20、的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过5%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”16.(2022 全国高三专题练习)2018世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城市入选,美丽的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了 100人,得如下所示的列联表:参考公式:K;赞成“自助游”不赞成“自助游”合计男性301545女性451055合计7

21、525100n(ad-bc)2(a+b)(c+d)(a+c)(b+d)其中 n=a+b+c+d.网片工)0.150.100.050.0250.0100.0050.001X02.0722.7063.8415.0246.6357.87910.828参照公式,得到的正确结论是()A.有99.5%以上的把握认为“赞成,自助游,与性别无关”B.有99.5%以上的把握认为“赞成,自助游,与性别有关”C.在犯错误的概率不超过的前提下,认为“赞成自助游 与性别无关”D.在犯错误的概率不超过0.1的前提下,认为“赞成自助游 与性别有关“17.(2022全国高三专题练习(文)为了了解某高中生对电视台某节目的态度,

22、在某中学随机调查了 110名同学,得到如下列联表:男女总计喜欢402060不喜欢203050总计6 0 5 01 1 0_ _ _ _ _ _()2_ _ _ _ _ _ _ 算 得 小=1 1 0(4 0 x 3 0-2 0 x 2 0)2(a +6)(c +d)(a +c)(6 +d)6 0 x 5 0 x 6 0 x 5 0 P(K22k)0.0 50.0 10.0 0 1k3.8 4 16.6 3 51 0.8 2 8参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“喜欢该节目与性别无关”

23、C.有 9 9%的把握认为“喜欢该节目与性别有关”D.有 9 9%的把握认为“喜欢该节目与性别无关”1 8.(2 0 2 2 全国高三专题练习(文)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:987654321根据图中的信息,下列结论中不正确的是()A.样本中多数男生喜欢手机支付B.样本中的女生数量少于男生数量C.样本中多数女生喜欢现金支付D.样本中喜欢现金支付的数量少于喜欢手机支付的数量1 9.(2 0 2 1 全国高三专题 练 习(文)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作

24、出如下两个等高堆积条形图:A.样本中的女生数量多于男生数量B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C.样本中的男生偏爱两理一文D.样本中的女生偏爱两文一理二、多选题20.(2021 山东聊城三模)对具有相关关系的两个变量x 和 y 进行回归分析时,经过随机抽样获得成对的样本点数据a,y j(,=i,2,则下列结论正确的是()A.若两变量x,y 具有线性相关关系,则回归直线至少经过一个样本点B.若两变量x,y 具有线性相关关系,则回归直线一定经过样本点中心门,亍)C.若以模型=四床拟合该组数据,为了求出回归方程,设 z=ln y,将其变换后得到线性方程z=6x+ln3,则a

25、,b的估计值分别是3 和 6.支(-力D.用R2=1一 一 二来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零实数的直线讣-司;=|上,则 a的值为121.(2021辽宁朝阳一模)关于变量x、y 的个样本点(x”x)、(*2,必)、(%,%)及其线性回归方程:=米+机 下 列 说 法 正 确 的 有()A.若相关系数 越小,则表示X、)的线性相关程度越弱B.若 线 性 回 归 方 程 中 的 则 表 示 变 量 x、y 正相关C.若残差平方和越大,则表示线性回归方程拟合效果越好 1 _ _ _D.若 彳=-2%,y =-y,则点(x,y)一定在回归直线=阮+%上2 2.(2 0 2

26、 2 江苏高三专题练习)则下列说法正确的是()A.在回归分析中,残差的平方和越小,模型的拟合效果越好;B.在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;C.若数据占,x2,x “的平均数为1,则2%,2,2 x ”的平均数为2;D.对分类变量x 与 y的随机变量正 的观测值上来说,出 越小,判断“尤与 有关系”的把握越大.2 3.(2 0 2 2 全国高三专题练习)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的女生喜欢抖音的人数占女生人数|,若有9 5%的把握认为是否喜欢抖音和性

27、别有关则调查人数中男生可能有()人附表:P(K2kn)0.0 5 00.0 1 0k3.8 4 16.6 3 5附:心幽也(a +b)(c+d)(a +c)(i +d)A.2 5 B.4 5 C.6 0 D.7 5三、填空题2 4.(2 0 2 2 全国高三专题练习)有人发现,多看手机容易使人近视,下表是调查机构对此现象的调查数据:近视不近视总计少看手机1 54 56 0多看手机1 552 0总计3 05 08 0则在犯错误的概率不超过 的前提下认为近视与多看手机有关系.附表:P(K2k)0.1 50.1 00.0 50.0 1 00.0 2 50.0 0 50.0 0 1参考公式:K=k2.

28、0 7 22.7 0 63.8 4 15.0 2 46.6 3 57.8 7 91 0.8 2 8其中 =a+b+c+d.nad-hc)2(a +6)(c +d)(a +c)(Z?+d)四、解答题2 5.(2 0 2 2 全国高三专题练习(文)近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,我市一家新能源企业近5个月的产值如下表:月 份5月6月7月8月9月月份代码X12345产值y亿元1 62 02 73 03 7(1)根据上表数据,计算V与x的线性相关系数人 并说明V与x 的线性相关性强弱;(Q 7 5 W 6 区1,则认为 y与元线性相关性很强;|r|0.7 5,则认为y 与

29、X 线性相关性不强)(2)求出y关于X的线性回归方程,并预测1 0 月该企业的产值./_x-nxy x-nxy _ _参考公式:=受二表,_ 25=&,H,)-嬴;V /-=1 V,=1 i=l参考数据:Ex,.y,.=4 4 2,X-2=5 5,y,2=3 6 5 4,V 2 7 4 0 5 2.3.r=l f=l i=l2 6.(2 0 2 1 江西模拟预测(文)某科技公司研发了一项新产品A,经过市场调研,对公司1 月份至6月份销售量及销售单价进行统计,销售单价 (千元)和销售量y (千件)之间的一组数据如下表所示:月份i123456销售单价天99.51 01 0.51 18销售量力1 1

30、1 08651 5(i)试根据i至 5月份的数据,建立y关于x 的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过0.6 5 千元,则认为所得到的回归直线方程是理想的,试 问(1)中所得到的回归直线方程是否理想?Yx-Ji-n-x-y参考公式:回归直线方程=加+3其中刃=上匕-Y -n x2i=l5 5参考数据:2 善=3 9 2,gx:=5 0 2.5.i=l i=l2 7.(2 0 2 2 河南温县第一高级中学高三阶段 练 习(理)身高体重指数(B M D的大小直接关系到人的健康状况,某高中 高 三(1)班班主任为了解该班学生的身体健康状况,从该班学生中随机选

31、取5名学生,测量其身高、体 重(数据如下表)并进行线性回归分析,得到线性回归方程为y =().9 x-9(),因为某些原因,3号学生的体重数据丢失.(1)求表格中的Z 值;学生编号12345身高x/c m1 6 51 7 01 7 51 7 01 7 0体重y/k g5 86 2Z6 56 3(2)已知公式丈=1-卷一下可以用来刻画回归的效果,请问学生的体重差异约有百分之多少是由身/=1高引起的.(注:结果四舍五入取整数)2 8.(2 0 2 2.全国高三专题练习)2 0 2 1年 6月 17 日9 时 2 2 分,我国酒泉卫星发射中心用长征2 F 遥十二运载火箭,成功将神舟十二号载人飞船送入

32、预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x (亿元)与产品的直接收益y (亿元)的数据统计如下:序号123456789101112X2346810132 12 22 32 42 5y152 22 74 04 85 46 06 8.56 86 7.56 66 5当0 17时,确定y与 x满足的线性回归方程为3 =-O.7x+&.(1)根据下列表格中的数据,比

33、较当0 x W 1 7 时模型,的相关指数炉的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;回归模型模型模型回归方程y =4.1x +10.9y =2 l.3 -14.4(%-订=179.132 0.2(2)为鼓励科技创新,当应用改造的投入不少于2 0 亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根 据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与2 0 亿元时公司收益(直接收益+国家补贴)的大小.y,)附:刻画回归效果的相关指数收=1-黑-,且当代越大时,回归方程的拟合效果越好.J 万Q4.1.=|用最小二乘法求线性回归

34、方程=%+&的截距:a=y-bx.2 9.(2 0 2 1 河南一模(文)近年来,政府相关部门引导乡村发展旅游的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲,乙两同学一起收集6家农户的数据,进行回归分析,得到两个回归摸型:模型:y l)=-1.6 5 x+2 8.5 7,模型:/与=变处,对以上两个回归方程进行残差分析,得到下表:种植面积X(亩)234579每亩种植管理成本(百元)2 52 42 12 21 61 4模型估计值(1)y2 5.2 72 3.6 22 1.9 71 7.0 21 3.7 2残差e r-0.2 70.3 8-0.9

35、 7-1.0 20.2 8模型(2)y2 6.8 42 0.1 71 8.8 31 7.3 11 6.4 6(2)6-1.8 40.8 33.1 7-1.3 1-2.4 6(1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好;(2)视残差号的绝对值超过1.5 的数据视为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求回归方程.附:-,%=0.2 72+0.3 82+0.9 72+1.0 22+0.2 82=2.2 7 7i=l3 0.(2 0 2 1 全国模拟预测)婺源位于江西省东北部,其境内古村落遍布乡野,保存完整,生态优美,物产丰富,拥有着油菜花之乡的美誉,被

36、誉为一颗镶嵌在赣、浙、皖三省交界处的绿色明珠.为了调查某片实验田3月份油菜花的生长高度,研究人员在当地随机抽取了 1 3 株油菜花进行高度测量,所得数据如下:1 =20.3,y =21 9.8 8,5 =6.08 1 i=0.3 2,-s)(y-夕)=5 5.7 6 ,-川 y-y)=-8.4 ,1=1/=1(.v;-5)2=4 6.6 8,(r,.-r)2=0.8 4,S(y,W=8 4.8 8.并通过绘制及观察散点图,选用两种模型进行=1 1=1 fx,其中令s=4;模型二:y=c+,其中令,=.x x(1)求模型二的回归方程;(2)试通过计算相关系数的大小,说明对于所给数据,哪一种模型更

37、加合适.参考数据:1 1.6 7 x 21.22=24 7.6 3 7 4,0.21 x 21.22=4.4 5 6 2,24 7.6 3 7 4=1 5.7 3 6 5,/4 4 5 6 2 2.1 1 1 0.附:对于一组数据(4,匕),(卬匕),(,#,3 其回归方程;=+/“的斜率和截距的最小二乘估计分别_-祖 4-弓相关系数,=-r=-;-3 1.(2021 陕西西安中学高三阶段练习(文)我国为全面建设社会主义现代化国家,制定了从2021 年到2025 年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金,现该企业为了解年研发资金投入额x (单位:亿

38、元)对年盈利额y (单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近1 0年年研发资金投入额占和年盈利额%的数据.通过对比分析,建立了两个函数模型:y =a +网2;丫:/,“,其 中 均 为 常 数,e 为自然对数的底数.令%=l”(i =1,2,1 0),经计算得如下数据:Xy10.之(玉-可-i=lio.E(x-y)-;=1uV2621 56 526 8 05.3 610、102(%-江)(%一,)i=l10E(v,.-v)2f=li oi=l1 1 25 01 3 02.61 2(1)请从相关系数的角度,分析哪一个模型拟合程度更好;(2)根 据(1)的选择及表中数据,建立

39、y关于x的回归方程(回归系数精确到0.01).t(x,T5-刃附:相关系数,=下幽-JSU-E(x-y)2V /=1(=1元)(y-,)线性回归直线方程y =K r+a,其中附:。=上 -,a=-bx.S U-)2i=l3 2.(2 0 2 1 四川成都七中一模(文)某投资公司2 0 1 2 年至2 0 2 1 年每年的投资金额x (单位:万元)与年利润增量y(单位:万元)的散点图如图:该投资公司为了预测2 0 2 2 年投资金额为2 0 万元时的年利润增量,建立了 y关于X 的两个回归模型;模型:由最小二乘公式可求得y与X 的线性回归方程:y =2.5 0 x-2.5 0;模型:由图中样本点

40、的分布,可以认为样本点集中在由线:y =的附近,对投资金额x 做换元,令10 10 10 10t=inx,则 y =b 1 +a ,且有Z,尸 2 2.0 0,Z%=2 30,t,y,=5 6 9.0 0,t;=5 0.9 2 ,/=1/=1 1=1 i=l年利润增收?(万元)454()3530252015:10.5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20投资金额。(万元)(1)根据所给的统计量,求模型中y关于犬的回归方程;(2)分别利用这两个回归模型,预测投资金额为2 0 万元时的年利润增量(结果保留两位小数);附:样本a,y )

41、(i =i,2,的最小乘估计公式为方二上,-,a=y-bT;参考数据:2()2i=lln 2 0.6 9 3 1,I n 5 1.6 0 9 4.3 3.(2 0 2 1 云南师大附中高三阶段练习(文)近年来,由于耕地面积的紧张,化肥的施用量呈增加趋势.一方面,化肥的施用对粮食增产增收起到了关键作用,另一方面,也成为环境污染、空气污染、土壤污染的重要来源之一如何合理地施用化肥,使其最大程度地促进粮食增产,减少对周围环境的污染成为需要解决的重要问题研究粮食产量与化肥施用量的关系,成为解决上述问题的前提某研究团队收集了 1 0 组化肥施用量和粮食亩产量的数据并对这些数据作了初步处理,得到了如图所示

42、的散点图及一些统计量的值化肥施用量为x(单位:公斤),粮食亩产量为y (单位:百公斤).V I108 6.4.e2;参考数据:7)24 68 10 12 14 16 18 20 22 24 26 28 3 0 10口i=l10i=l10Zx1=1101=1io立Zjf=l101=110Zz,i=l10/=!6509 1.55 2.51 4 7 8.63 0.51 51 54 6.5表中 4 =I n 占,Z,=I n=1,2,1 0).(1)根据散点图判断,y =a+6与 尸 ex,哪一个适宜作为粮食亩产量V关于化肥施用量x 的回归方程类型(给出判断即可,不必说明理由);(2)根 据(1)的判

43、断结果及表中数据,建立V关于x的回归方程;(3)根 据(2)的回归方程,并预测化肥施用量为2 7 公斤时,粮食亩产量y的值;附:对于一组数据(,/)=1,2,3,),其回归直线v=0u+a的斜率和截距的最小二乘估计分别为n-nuv8 =弋-,a=v-p u.取e=2.7.力 ;_ 疔23 4.(2 0 2 1 河北高三阶段练习)2 0 2 1 新锐品牌数字化运营白皮书中,我国提出了新锐品牌的概念,全称是国货新锐品牌.对这个名称进行拆解:国货、新、锐.新有两个层面,一是针对企业本身,指 2 0 1 1 年后成立的品牌.二是针对消费者本身,开拓了新的消费场景(需求),形成了细分化的品类.锐:是在短

44、期内实现大大高于传统品牌的爆发式增长,并且占据了一定的消费者心智.如图是11月份中国某信息网发布的我国A 市2021年上半年新锐品牌人群用户(新锐品牌人群,指在指定周期内浏览新锐品牌相关内容以及商品详情页的人群)性别分析数据.A市对购买家电类新锐品牌人群中随机调查了 100位男性顾客和100位女性顾客,统计出每位顾客购买家电消费金额,根据这些数据得到如下的频数分布表:2021Hl拓锐品牌人群用户性别分析消费金额(元)0,100(100,1000(1000,5000(5000,10000(10000,+00)女性顾客人数50301064男性顾客人数204024106(1)若以我国A市 2021年

45、上半年新锐品牌人群用户性别分析数据作为A 市抽取新锐品牌人群中性别概率,从 A市新锐品牌人群中随机抽取四人,X 为四人中男性的人数,求 X 的概率分布列和期望.(2)根据A 市统计购买家电消费金额数据频数分布表,完成下列2x2列联表,并根据列联表,判断是否有99%的把握认为购买家电类新锐品牌人群消费金额千元以上与性别有关?不超千元千元以上合计女性顾客男性顾客合计附:K=s+s(d)(a+)c)(b+d)i b+c+dP(K2k)0.0500.0100.001k3.84 16.6 3 51 0.82 83 5.(2 0 2 2 全国高三专题练习)某中学随机抽查了 5 0 名同学的每天课外阅读时间

46、,得到如下统计表:时 长(分)(0,1 0(1 0,2 0(2 0,3 0(3 0,4 0(4 0,5 0 人数41 01 41 84(1)求这5 0 名同学的平均阅读时长(用区间中点值代表每个人的阅读时长);(2)在阅读时长位于(4 0,5 0 的4 人中任选2 人,求甲同学被选中的概率;(3)进一步调查发现,语文成绩和每天的课外阅读时间有很大关系,每天的课外阅读时间多于半小时称为阅读迷”,语文成绩达到1 2 0 分视为优秀,根据每天的课外阅读时间和语文成绩是否优秀,制成一个2 x 2 列联表:阅读迷非阅读迷合计语文成绩优秀2 032 3语文成绩不优秀22 52 7合计2 22 85 0根据

47、表中数据,判断是否有9 9%的把握认为语文成绩是否优秀与课外阅读时间有关.参考公式:K (个产)几 7?,其中 =a+0+c+4.(a+b)(c+d)(a+c)(b+d)参考数据:尸(即次)0.4 00.2 50.1 00.0 1 00.7 0 81.3 2 32.7 0 66.6 3 53 6.(2 0 2 2.全国高三专题练习)为了比较注射A,8 两种药物后产生的皮肤疱疹的面积,选 2 0 0 只家兔做试验,将这2 0 0 只家兔随机地分成两组,每 组 10 0 只,其中一组注射药物A,另一组注射药物B.下 表 1 和表2分别是注射药物A 和药物8 后的试验结果.(疱疹面积单位:m m?)

48、表 1:注射药物A 后皮肤疱疹面积的频数分布表表 2:注射药物B 后皮肤疱疹面积的频数分布表疱疹面积 6 0,6 5)6 5,7 0)7 0,7 5)7 5,80)频数3 04 02 010疱疹面积 6 0,6 5)6 5,7 0)7 0,7 5)7 5,80)80,85)频数102 52 03 015(1)完成下面2 x 2 列联表;疱疹面积小于7 0 m m2疱疹面积不小于7 0 m m2总计注射药物Aa=b注射药物Bc=d=总计n=(2)能否在犯错误概率不超过0.0 1的前提下,认为“注射药物A 后的疱疹面积与注射药物3后的疱疹面积有差异”?3 7.(2 0 2 2 全国高三专题练习)某

49、淘宝店经过对春节七天假期的消费者进行统计,发现在金额不超过10 0 0元的消费者中男女比例为1:4,该店按此比例抽取了 10 0 名消费者进行进一步分析,得到下表女性消费情况:男性消费情况:消费金额(元)(0,2 0 0)2 0 0,4 0 0)4 0 0,6 0 0)6 0 0,80 0)80 0,10 0 0 人数510154 73消费金额(元)(0,2(X)2(X),4 0 0)4 0 0,6 0 0)6 0 0,8(X)8(X),1(X)0 人数231032若消费金额不低于6 0 0元的网购者为“网购达人”,低于6 0 0元的网购者为“非网购达人”(1)分别计算女性和男性消费的平均数,

50、并判断平均消费水平高的一方“网购达人”出手是否更阔绰?(2)根据以上统计数据填写如下2/2列联表,并回答能否在犯错误的概率不超过0.0 0 5的前提下认为“是否为 网购达人 与性别有关附:k2=-,其中=a +6 +c +d女性男怕:合计“网购达人”“非网购达人 合计P(K2 k0.100.0 50.0 2 50.0 100.0 0 5k2.7 0 63.84 15.0 2 46.6 3 57.87 9第27讲统计案例和回归方程【知识点总结】一、线性回归线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法。对于一组具有线性相关关系的数据(为,),(X 2 J 2),(X ,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁