《(全国通用)2022版高考数学二轮复习第二层提升篇专题四统计与概率第1讲统计、统计案例讲义.pdf》由会员分享,可在线阅读,更多相关《(全国通用)2022版高考数学二轮复习第二层提升篇专题四统计与概率第1讲统计、统计案例讲义.pdf(44页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 全国通用 2022 版高考数学二轮复习第二层提升篇专题四统计与概率第 1 讲统计、统计案例讲义 2 第 1 讲 统计、统计案例 全国卷 3 年考情分析 年份 全国卷 全国卷 全国卷 2022 系统抽样T6 样本平均数T14 随机抽样、用样本估计总体T4 独立性检验T17(2)用样本的频率分布估计总体分布样本的数字特征T19 由频率分布直方图求参数平均值T17 2022 统计图的识别与分析T3 折线图、线性回归模型问题T18 抽样方法T14 茎叶图的应用及独立性检验T18 2022 用样本的数字特征估计总体的数字特 折线图的识别与分析T3 3 征T2 (1)统计与统计案例在选择题或填空题中的命
2、题热点主要集中在随机抽样、用样本估计总体以及变量间的相关性判断等,难度较低,常出现在 24 题的位置.(2)统计与统计案例在解答题中多出现在第17、18 或 19 题位置,考查茎叶图、直方图、数字特征及统计案例,多以计算为主.考点一抽样方法 例 1(1)某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有 20000 人,其中各种态度对应的人数如下表所示:最喜爱 喜爱 一般 不喜欢 4800 7200 6400 1600 电视台为了了解观众的具体想法和意见,打算从中抽选 100 人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应 4 抽选的人数分别为()
3、A.25,25,25,25 B.48,72,64,16 C.20,40,30,10 D.24,36,32,8(2)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为 1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9,抽到的 32 人中,编号落入区间1,450的人做问卷 A,编号落入区间451,750的人做问卷 B,其余的人做问卷 C,那么抽到的人中,做问卷 B 的人数为()A.7 B.9 C.10 D.15 解析(1)因为抽样比为100200001200,所 以 每 类 人 中 应 抽 选 的 人 数 分 别 为4800120024,7200120036
4、,6400120032,160012008.应选 D.(2)由题意知应将 960 人分成 32 组,每组30 人.设每组选出的人的号码为 30k9(k0,5 1,31).由 45130k9750,解得44230k74130,又kN,故k15,16,24,共 10人.答案(1)D(2)C 解题方略 系统抽样和分层抽样中的计算(1)系统抽样 总体容量为N,样本容量为n,那么要将总体均分成n组,每组Nn个(有零头时要先去掉).假设第一组抽到编号为k的个体,那么以后各组中抽取的个体编号依次为kNn,k(n1)Nn.(2)分层抽样 按比例抽样,计算的主要依据是:各层抽取的数量之比总体中各层的数量之比.跟
5、踪训练 1.(2022全国卷)某学校为了解 1000 名 6 新生的身体素质,将这些学生编号为 1,2,1000,从这些新生中用系统抽样方法等距抽取100 名学生进行体质测验.假设 46 号学生被抽到,那么下面 4 名学生中被抽到的是()A.8 号学生 B.200 号学生 C.616 号学生 D.815 号学生 解析:选 C 根据题意,系统抽样是等距抽样,所以抽样间隔为100010010.因为 46 除以 10余 6,所以抽到的号码都是除以 10 余 6 的数,结合选项知应为 616.应选 C.2.某中学有高中生3000人,初中生2000人,男、女生所占的比例如下图.为了解学生的学习情况,用分
6、层抽样的方法从该校学生中抽取一个容量为n的样本,从高中生中抽取女生 21 人,那么从初中生中抽取的男生人数是()A.12 B.15 C.20 D.21 解析:选A 因为抽样比为21300070%1100,7 所以从初中生中抽取的男生人数为200060%110012.应选 A.考点二用样本估计总体 例2(2022全国卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100 个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组 0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数 2 24 53 14 7(1)分别估
7、计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到 0.01)附:748.602.8 解(1)根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不低于 40%的企业频率为1471000.21.产值负增长的企业频率为21000.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为 21%,产值负增长的企业比例为 2%.(2)y1100(0.102 0.1024 0.30530.50140.707)0.30,s21100i15ni(yiy)
8、2 1100(0.40)22(0.20)22402530.202140.4027 0.0296,s 0.02960.02 740.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为 0.30,0.17.9 解题方略 1.方差的计算与含义(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算.(2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大.2.从频率分布直方图中得出有关数据的方法 频率 频率分布直方图中横轴表示组数,纵轴表示频率组距,频率组距频率组距 频率比 频率分布直方图中各小长方形的面积之和为 1,各小长方形高的比也就是频率比 众数 最高小
9、长方形底边中点的横坐标 中位数 平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标 平均数 频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和 跟踪训练 1.(2022石家庄市质量检测)甲、10 乙两人 8 次测评成绩的茎叶图如图,由茎叶图知甲的成绩的平均数和乙的成绩的中位数分别是()A.23,22 B.23,22.5 C.21,22 D.21,22.5 解析:选 D 由茎叶图可得甲的成绩的平均数为1011142123233234821.将乙的成绩按从小到大的顺序排列,中间的两个成绩分别是 22,23,所以乙的成绩的中位数为2223222.5.2.为了解一种植物果实的情
10、况,随机抽取一批该植物果实样本测量重量的数据(单位:克),按照27.5,32.5),32.5,37.5),37.5,42.5),42.5,47.5),47.5,52.5分为 5 组,其频率分布直方图如下图.(1)求图中a的值;11(2)估计这种植物果实重量的平均数x和方差s2(同一组中的数据用该组区间的中点值作代表).解:(1)由 5(0.0200.0400.075a0.015)1,得a0.050.(2)各组中点值和相应的频率依次为 中点值 30 35 40 45 50 频率 0.1 0.2 0.375 0.25 0.075 x 300.1 350.2 400.375 450.25500.07
11、540,s2(10)20.1(5)20.2020.375520.251020.07528.75.考点三统计案例 题型一 回归分析在实际问题中的应用 例 3 某省的一个气象站观测点在连续 4 12 天里记录的AQI指数M与当天的空气水平可见度y(单位:cm)的情况如表 1:M 900 700 300 100 y 0.5 3.5 6.5 9.5 该省某市 2022 年11 月份AQI指数频数分布如表 2:M 0,200)200,400)400,600)600,800)800,1000 频数(天)3 6 12 6 3 (1)设xM100,假设x与y之间是线性关系,试根据表 1 的数据求出y关于x的线
12、性回归方程.(2)小李在该市开了一家洗车店,洗车店每天的平均收入与 AQI 指数存在相关关系如表 3:M 0,200,400,600,800,13 200)400)600)800)1000 日均收 入(元)2000 1000 2000 6000 8000 根据表 3 估计小李的洗车店 2022 年11月份每天的平均收入.附 参 考 公 式:ybxa,其 中b,aybx.解(1)x14(9731)5,y14(0.53.56.59.5)5,4,i1xiyi90.573.536.519.558.4,i1x2i92723212140,所以b584551404522120,a521205414,14 所
13、以y关于x的线性回归方程为y2120 x414.(2)根据表 3 可知,该月 30 天中有 3 天每天亏损 2000 元,有 6 天每天亏损 1000 元,有 12天每天收入 2000 元,有 6 天每天收入 6000 元,有 3 天每天收入 8000 元,估计小李洗车店 2022年 11 月份每天的平均收入为130(2000310006 200012 60006 80003)2400(元).解题方略 求回归直线方程的方法(1)假设所求的回归直线方程是在选择题中,常利用回归直线ybxa必经过样本点的中心(x,y)快速选择.(2)假设所求的回归直线方程是在解答题中,那么求回归直线方程的一般步骤为
14、:15 题型二 独立性检验在实际问题中的应用 例4(2022全国卷)某商场为提高效劳质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的效劳给出满意或不满意的评价,得到下面列联表:满意 不满意 男顾客 40 10 女顾客 30 20 (1)分别估计男、女顾客对该商场效劳满意的概率;(2)能否有 95%的把握认为男、女顾客对该商场效劳的评价有差异?附:K2nadbc2abcdacbd.16 P(K2k)0.050 0.010 0.001 k 3.841 6.635 10.828 解(1)由调查数据,男顾客中对该商场效劳满意的比率为40500.8,因此男顾客对该商场效劳满意的概率的估计值
15、为 0.8.女顾客中对该商场效劳满意的比率为30500.6,因此女顾客对该商场效劳满意的概率的估计值为 0.6.(2)K2的观测值k100402030102505070304.762.由于 4.7623.841,故有 95%的把握认为男、女顾客对该商场效劳的评价有差异.解题方略 独立性检验的一般步骤(1)根据样本数据制成 22 列联表;(2)根据公式K2 17 nadbc2abcdacbd(其中nabcd)计算出K2的观测值;(3)比拟K2的观测值与临界值的大小,作出统计推断.跟踪训练 1.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据
16、从中随机抽取的50份调查问卷,得到了如下的列联表:同意限定区域停车 不同意限定区域停车 总计 男 20 5 25 女 10 15 25 总计 30 20 50 那么认为“是否同意限定区域停车与家长的性别有关的把握约为()%B.0.5%C.99.5%D.99.9%附:K2 18 nadbc2abcdacbd,其中nabcd.P(K2k0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解析:选C 因为K25020155102252530208.3337.879,所以约有99.
17、5%的把握认为“是否同意限定区域停车与家长的性别有关.2.2022 年秋新学期开始,某市对全市中小学学生进行健康状况抽样调查,其中在某校调查得到了该校前五个年级近视率y的数据如下表:年级号x 1 2 3 4 5 近视率y 0.05 0.09 0.16 0.20 0.25 19 根据前五个年级的数据,利用最小二乘法求出y关于x的线性回归方程,并根据方程预测六年级学生的近视率.附:回归直线ybxa的斜率和截距的最小二乘法估计公式分别为 得b2.762.255545 0.051,a 0.15 0.05130.003,得线性回归方程为y0.051x0.003.当x6 时,代入得y0.05160.003
18、0.303,所以六年级学生的近视率在 0.303 左右.数学建模回归分析问题的求解 典例(2022合肥市第二次质量检测)20 为了了解A地区足球特色学校的开展状况,某调查机构统计得到如下数据:年份x 2022 2022 2022 2022 2022 足球特色学校数y/百个 0.30 0.60 1.00 1.40 1.70 (1)根据表中数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱(:0.75|r|1,那么认为y与x线性相关性很强;0.3|r|0.75,那么认为y与x线性相关性一般;|r|0.25,那么认为y与x线性相关性较弱);(2)求y关于x的线性回归方程,并预测A地区 202
19、2 年足球特色学校的个数(精确到个).解 (1)x 2022,y 1,r 21 i15xixyiyi15xix2i15yiy2错误!错误!0.99840.75,y与x线性相关性很强.aybx10.362022724.76,y关于x的线性回归方程是y0.36x724.76.当x2022 时,y0.362022724.762.08,即A地区2022 年足球特色学校约有 208个.素养通路 此题是典型的回归分析问题,在实际问题中收集数据,画散点图,用线性回归模型拟合变量关系,再用最小二乘法求出回归方程,进而用回归模型对实际问题进行预测,考查了数学建模这一核心素养.专题过关检测 22 A 组“633”
20、考点落实练 一、选择题 1.利用系统抽样法从编号分别为1,2,3,80 的 80 件不同产品中抽出一个容量为 16 的样本,如果抽出的产品中有一件产品的编号为 13,那么抽到产品的最大编号为()A.73 B.78 C.77 D.76 解析:选 B 样本的分段间隔为80165,所以 13 号在第三组,那么最大的编号为 13(163)578.应选 B.2.(2022全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9个原始评分相比,不变的数字特征是()A.中位数 B.平均数 C
21、.方差 D.极差 解析:选 A 中位数是将 9 个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,23 平均数、方差、极差均受影响.应选 A.3.(2022广东六校第一次联考)某单位为了落实“绿水青山就是金山银山理念,制定节能减排的目标,先调查了用电量y(单位:kWh)与气温x(单位:)之间的关系,随机选取了 4天的用电量与当天气温,并制作了如下对照表:x(单位:)17 14 10 1 y(单位:kWh)24 34 38 a 由表中数据得线性回归方程:y2x60,那么a的值为()A.48 B.62 C.64 D.68 解析:选 C 由题意,得x
22、1714101410,y243438a496a4.样本点的中心(x,y)在回归直线y2x60 上,代入线性回归方程可得96a42060,解得a64,应 24 选 C.4.如图是民航部门统计的 2022 年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面表达不正确的选项是()A.深圳的变化幅度最小,北京的平均价格最高 B.深圳和厦门的春运期间往返机票价格同去年相比有所下降 C.平均价格从高到低居于前三位的城市为北京、深圳、广州 D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门 解析:选 D 由图可知深圳对应的小黑点最接近 0%,故变化幅
23、度最小,北京对应的条形图最高,那么北京的平均价格最高,故 A 正确;由图可知深圳和厦门对应的小黑点在 0%以下,故 25 深圳和厦门的价格同去年相比有所下降,故 B 正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故 C 正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故 D 错误,选 D.5.一个样本容量为 10 的样本数据,它们组成一个公差不为 0 的等差数列an,假设a38,且a1,a3,a7成等比数列,那么此样本的平均数和中位数分别是()A.13,12 B.13,13 C.12,13 D.13,14 解析:选 B 设等差数列an的公差为d(d0),a38,a
24、1a7a2364,(82d)(84d)64,即 2dd20,又d0,故d2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为42251013,中位数为1214213.6.(2022成都市第二次诊断性检测)为比拟甲、乙两名篮球运发动的近期竞技状态,选取这两名球员最近五场比赛的得 26 分,制成如下图的茎叶图.有以下结论:甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数;甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数;从最近五场比赛的得分看,乙比甲更稳定;从最近五场比赛的得分看,甲比乙更稳定.其中所有正确结论的编号为()A.B.C.D.解析:选 C 对
25、于,甲得分的中位数为 29,乙得分的中位数为 30,错误;对于,甲得分的平均数为15(2528293132)29,乙得分的平均数为15(2829303132)30,正确;对于,甲得分的方差为15(2529)2(2829)2(2929)2(3129)2(3229)2 27 15(161049)6,乙得分的方差为15(2830)2(2930)2(3030)2(3130)2(3230)215(41014)2,所以乙比甲更稳定,正确,错误.所以正确结论的编号为.二、填空题 7.(2022全国卷)我国高铁开展迅速,技术先进.经统计,在经停某站的高铁列车中,有10 个车次的正点率为 0.97,有 20 个
26、车次的正点率为 0.98,有 10 个车次的正点率为 0.99,那么经停该站高铁列车所有车次的平均正点率的估计值为_.解析:x100.97200.98100.991020100.98.那么经停该站高铁列车所有车次的平均正点率的估计值为 0.98.答案:0.98 8.(2022安徽五校联盟第二次质检)数据 28 a1,a2,a3,an的方差为2,那么数据 2a1,2a2,2a3,2an的方差为_.解析:设a1,a2,a3,an的平均数为a,那么 2a1,2a2,2a3,2an的平均数为 2a,2a1a2a2a2a3a2ana2n.那么 2a1,2a2,2a3,2an的方差为 错误!4a1a2a2
27、a2a3a2ana2n42.答案:42 9.某新闻媒体为了了解观众对央视?开门大吉?节目的喜爱与性别是否有关系,随机调查了观看该节目的观众 110 名,得到如下的列联表:女 男 总计 喜爱 40 20 60 29 不喜爱 20 30 50 总计 60 50 110 试根据样本估计总体的思想,估计在犯错误的概率不超过_的前提下(约有_的把握)认为“喜爱该节目与否和性别有关.参考附表:P(K2k0)0.050 0.010 0.001 k0 3.841 6.635 10.828 错误!解析:分析列联表中数据,可得K2的观测值k11040302020260506050 7.822 6.635,所以在犯
28、错误的概率不超过 0.01 的前提下(有99%的把握)认为“喜爱该节目与否和性别有关.答案:0.01 99%30 三、解答题 10.(2022全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;
29、(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)由得 0.70a0.200.15,故a0.35.31 b10.050.150.700.10.(2)甲离子残留百分比的平均值的估计值为 20.1530.2040.3050.2060.1070.054.05,乙离子残留百分比的平均值的估计值为 30.0540.1050.1560.3570.2080.156.00.11.某市教育学院从参加市级高中数学竞赛的考生中随机抽取 60 名学生,将其竞赛成绩(均为整数)分成六段:40,50),50,60),60,70),90,100,得到如下图的频率分布直方图.(1
30、)根据频率分布直方图,估计参加高中数学竞赛的考生的成绩的平均数、众数、中位数(小数点后保存一位有效数字);(2)用分层抽样的方法在各分数段的考生中抽取一个容量为 20 的样本,那么各分数段抽取的人数分别是多少?解:(1)由频率分布直方图可知,32(0.010 0.015 0.015 a 0.025 0.005)101,所以a0.03.所以参加高中数学竞赛的考生的成绩的平均数为 450.1550.15650.15750.3850.25950.0571,成绩的众数为 75.设参加高中数学竞赛的考生的成绩的中位数为x,那么 0.10.150.15(x70)0.030.5,解得x73.3,所以中位数为
31、 73.3.(2)因为各层人数分别为 6,9,9,18,15,3,各层抽取比例为206013,所以各分数段抽取人数依次为 2,3,3,6,5,1.12.(2022沈阳市质量监测(一)某篮球运发动的投篮命中率为 50%,他想提高自己的投篮水平,制定了一个夏季训练方案,为了了解训练效果,执行训练前,他统计了 10 场比赛的得分,计算出得分的中位数为 15,平均得分为 15,得 33 分的方差为 46.3.执行训练后也统计了 10 场比赛的得分,茎叶图如下图:(1)请计算该篮球运发动执行训练后统计的10 场比赛得分的中位数、平均得分与方差.(2)如果仅从执行训练前后统计的各 10 场比赛得分数据分析
32、,你认为训练方案对该运发动的投篮水平的提高是否有帮助?为什么?解:(1)训练后得分的中位数为1415214.5;平均得分为8912141415161821231015;方差为110(815)2(915)2(1215)2(1415)2(1415)2(1515)2(1615)2(1815)2(2115)2(2315)220.6.(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练前方差 20.6 小于训练前方差 34 46.3,说明训练后得分稳定性提高了(阐述观点合理即可),这是投篮水平提高的表现.故此训练方案对该篮球运发动的投篮水平的提高有帮助.B 组大题专攻强化练 1.(2022武汉市调研
33、测试)一个工厂在某年里连续 10 个月每月产品的总本钱y(万元)与该月产量x(万件)之间有如下一组数据:x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 (1)通过画散点图,发现可用线性回归模型拟合y与x的关系,请用相关系数加以说明.(2)建立月总本钱y与月产量x之间的回归方程;通过建立的y关于x的回归方程,估计某月产量为 1.98 万件时,产品的总本钱为多少万元?(均精确到 0.001)附注:参考数据:错误!i27.31,35 i110
34、 x2i10 x20.850,i110y2i10y21.042,b1.223.参考公式:相关系数 回归直线yabx中斜率和截距的最小二乘估计公式分别为:解:(1)由条件得,rbi110 x2i10 x2i110y2i10y2,r1.2230.8501.0420.998,这说明y与x正相关,且相关性很强.36(2)由求得x1.445,y2.731,aybx2.7311.2231.4450.964,所求回归直线方程为y1.223x0.964.当x 1.98 时,y 1.2231.98 0.9643.386(万元),此时产品的总本钱约为 3.386 万元.2.海水养殖场进行某水产品的新、旧网箱养殖方
35、法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)估计旧养殖法的箱产量低于 50kg 的概率并估计新养殖法的箱产量的平均值;(2)填写下面的 22 列联表,并根据列联表 37 判断是否有99%的把握认为箱产量与养殖方法有关.箱产量50kg 箱产量50kg 总计 旧养殖法 新养殖法 总计 附:K2nadbc2abcdacbd,其中nabcd.P(K2k0)0.050 0.010 0.001 k0 3.841 6.635 10.828 解:(1)旧养殖法的箱产量低于 50kg 的频率为(0.0120.0140.0240.0340.04
36、0)50.62,所以旧养殖法的箱产量低于 50kg 的概率估计值为 0.62;新养殖法的箱产量的平均值 38 为 37.50.004542.50.020547.50.044552.50.068557.50.046562.50.010567.50.008552.35.(2)根据箱产量的频率分布直方图得 22列联表如下:箱产量6.635,故有 99%的把握认为箱产量与养殖方法有关.3.(2022长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入方案,收集了近 6 个月广告投入量x(单位:万元)和收益 39 y(单位:万元)的数据如下表:月份 1 2 3 4 5 6 广告投入量/万元 2
37、 4 6 8 10 12 收益/万元 14.21 20.31 31.8 31.18 37.83 44.67 他们用两种模型ybxa,yaebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如下图的残差图及一些统计量的值:x y 7 30 1464.24 364 (1)根据残差图,比拟模型,的拟合效果,应选择哪个模型?并说明理由.(2)残差绝对值大于 2 的数据被认为是异常数据,需要剔除:()剔除异常数据后,求出(1)中所选模型的回归方程;()广告投入量x18 40 时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线ybxa的
38、斜率和截距的最小二乘估计分别为:解:(1)应该选择模型,因为模型的残差点比拟均匀地落在水平的带状区域中,且模型的带状区域比模型的带状区域窄,所以模型的拟合精度高,回归方程的预报精度高.(2)()剔除异常数据,即 3 月份的数据后,得 x15(766)7.2,y15(30631.8)29.64.41()把x18 代入()中所求回归方程得y3188.0462.04,故预报值为 62.04 万元.4.每年 10 月中上旬是小麦的最正确种植时间,但小麦的发芽会受到土壤、气候等多方面因素的影响.某科技兴趣小组为了解昼夜温差的大小与小麦发芽的多少之间的关系,在不同的温差下统计了 100 颗小麦种子的发芽数
39、,得到了如下数据:温差x()8 10 11 13 12 发芽数y(颗)79 81 85 90 86 (1)请根据统计的最后三组数据,求出y关于x的线性回归方程ybxa;(2)假设由(1)中的线性回归方程得到的估计值与前两组数据的实际值误差均不超过两颗,那么认为线性回归方程是可靠的,试判断(1)中得到的线性回归方程是否可靠;(3)假设 100 颗小麦种子的发芽数为n颗,42 那么记n%的发芽率,当发芽率为n%时,平均每亩地的收益为 10n元,某农场有土地 10 万亩,小麦种植期间昼夜温差大约为 9,根据(1)中得到的线性回归方程估计该农场种植小麦所获得的收益.附:在线性回归方程ybxa中,b 解:(1)x1113123 12,y859086387,b11851390128631287112132122312252,由bxay,即5212a87,得a57,线性回归方程为y52x57.(2)当x8 时,y5285777,与实际 43 值 79 比拟,误差没有超过两颗;当x10 时,y52105782,与实际值81 比拟,误差也没有超过两颗.所以(1)中得到的线性回归方程y52x57是可靠的.(3)由y52x57 得,当x9 时,y79.5,即每亩地的收益大约为 795 元,所以该农场种植小麦所获得的收益大约为 7950 万元.44