《02024年高二数学专项练习2回归分析的基本思想及其初步应用.doc》由会员分享,可在线阅读,更多相关《02024年高二数学专项练习2回归分析的基本思想及其初步应用.doc(12页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2024年高二数学专项练习回归分析的基本思想及其初步应用一、 知识讲解研究两个变量的相关关系:回归分析的基本步骤:1. 画散点图2. 求回归方程3. 预报、决策对于一组具有线性相关关系的数据回归方程为其中的最小二乘法估计公式分别为:二、 典型例题例1 从某大学中随机选取8名女大学生,其身高和体重的数据如下:编号12345678身高(cm) 165165157170175165155170体重(kg)4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.例2 某市居民19962003年货币收入x(单位:亿元)与购买商品支出y(单位:亿
2、元)的统计资料如下:年份19961997199819992000200120022003收入3637384042444750支出30.031.032.033.234.836.539.041.6试对x与y的关系进行相关性检验,如x与y具有线性相关关系,求出y对x的回归直线方程(结果保留3位小数)例3.一只红铃虫的产卵数和温度有关,先收集7组观察数据如下,建立与之间的回归方程温度x() 21232527293235产卵数y(个)711212466115325用样本估计总体知识引入一、回顾用样本来估计总体,是研究统计问题的一个基本思想方法某市100个家庭某年月均用水量(单位:t)3.1 2.5 2.
3、0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.
4、5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 知识讲解二、总体分布的估计总体取值的概率分布规律通常称为总体分布.样本的频率分布的常见表示:1.频率分布表 2.频率分布直方图3.茎叶图1.频率分布表:某校高一年级100名同学的身高频率分布表 分组频数频数累计频率150.5,153.5)440.04153.5,156.5)8120.08156.5,159.5)8200.08159.5,162.5)11310.11162.5,165.5)22530.22165.5,1
5、68.5)19720.19168.5,171.5)14860.14171.5,174.5)7930.07174.5,177.5)4970.04177.5,180.531000.03合计10012.频率分布直方图: 横轴为个体取值,纵轴为频率/组距.用矩形框的面积表示相应的频率. 面积之和为1画频率分布直方图的基本步骤(1)计算极差 (2)确定组距与组数 (3)将数据分组 (4)列出频率分布表 (5)画出频率分布直方图 某市100个家庭某年月均用水量(单位:t)3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2
6、0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5
7、2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 (1)计算极差 (2)确定组距与组数 (3)将数据分组(4)列出频率分布表 (5)画出频率分布直方图频率分布折线图总体密度曲线典型例题例1 对某批电子元件进行寿命调查,情况如下:寿命(h)100200200300300400400500500600个数2030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h400h以内的概率;(4)估计电子元件寿命在400h以上的概率.解析:3.茎叶图:某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩
8、,所得亩产数据(单位:千克)如下:品种A: 357,359,367,368,375,388,392,399,400,405, 412,414,415,421,423,423,427,430,430,434, 443,445,445,451,454,品种B: 363,371,374,383,385,386,391,392,394,394, 395,397,397,400,401,401,403,406,407,410, 412,415,416,422,430,AB 9 7358 73635371 48383 5 69 2391 2 4 457 75 0400 1 1 3 6 75 4 2410
9、2 5 67 3 3 14224 0 04305 5 3444 145优点:1.体现数据分布状况2.保留原始数据3.数据可随时补充和修改三、总体数字特征的估计样本的数字特征:平均数:, 刻画样本数据的平均水平 样本方差:,样本标准差:,刻画样本数据的离散水平常用的表示平均水平的数值还有: 中位数、众数表示数据集中程度(波动状况)的数值还有: 极差典型例题例2 甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm)甲机床: 10.2 10.1 10.0 9.8 9.9 10.3 9.7 10.0 9.9 10.1乙机床: 10.3 10.4 9.
10、6 9.9 10.1 10.9 8.9 9.7 10.2 10.0分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10 mm,从计算的结果来看哪台机床加工这种零件较合适?解析:例3 随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.解析:变量的相关性知识讲解一、变量间的相关关系变量之间存在着两种关系:一类是确定的函数关系;一类是非确定的关系,有随机性 正相关 两个变量的总体变化趋势一致 相关关系 知识和能力 收入水平与其科技文化素质 风险与利润 负相关 两个变量的总体变化趋势
11、相反 儿童的铅指标与智商 家庭用于消费的资金与储蓄的资金数量 散点图直观描述两个变量之间是否具有相关关系的图形 某地10户家庭的年收入与年饮食支出表(单位:万元)收入24466677810支出0.91.41.62.02.11.91.82.12.22.3二、两个变量的线性相关相关关系 线性相关 散点图中的点大致分布在一条直线附近 非线性相关人的脂肪含量与年龄之间的关系1.回归直线“最贴近”这些已知的数据点的直线 记直线为,其中表示计算值(估计值).当时得到观测值(实际值)为.方程称为y对x的回归直线方程,b叫做回归系数.2.回归直线的求解如何用数学语言来刻画 “与这些个点最贴近”? 上式中最后两
12、项与a,b无关,当且仅当前两项均为0时取最小值,即 其中a,b上方加“”表示时由观测值按最小二乘法求得的估计值3.回归直线模型的应用 (1)预测, 内插预测和外推预测 (2)控制, 典型例题例1.对变量x, y 有观测数据()(i=1,2,,10),得散点图1;对变量u ,v 有观测数据()(i=1,2,,10),得散点图2. 由这两个散点图可以判断图1 图2A.变量x 与y 正相关,u 与v 正相关B.变量x 与y 正相关,u 与v 负相关C.变量x 与y 负相关,u 与v 正相关D.变量x 与y 负相关,u 与v 负相关答案:例2.给出了随机抽取的10位男性的收缩血压.年龄x(岁)收缩压y(毫米汞柱)年龄x(岁)收缩压y(毫米汞柱)37110501463511749148411255415043130601544213865160(1)画出散点图;(2)求出收缩压与年龄之间的回归直线;(3)利用所求回归直线分别预测20岁、45岁的人的收缩压是多少?(4)就(3)所得预测结果,比较其预测的精确性。解析:练习身高x(cm)和体重y(kg)之间通常也被认为有相关关系,并有结论 y =x105 的近似结论。请验证。