《第七章期末复习总结与习题中学教育中考_中学教育-中考.pdf》由会员分享,可在线阅读,更多相关《第七章期末复习总结与习题中学教育中考_中学教育-中考.pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学习好资料 欢迎下载 第七章 相关与回归分析 相关分析 一、函数关系、相关关系的 概 念 1、函数关系:函数关系是一种严格的依存关系 ,这种关系可以用 y=f(x)的方程来表现。2、相关关系:相关关系是一种不完全确定的随机关系。函数关系与相关关系的联系:对具有相关关系的现象进行分析时,必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式。四、相关关系的判别方法 (一)相 关 图 表 利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,在将两变量相对应的变量值用坐标点形式描绘出来即可。利用相关图可以:判断现象之间有无相关关系、观察相关关系的类型、观察相关关系的密切程度 (二)相
2、关系数 相关系数是测定变量之间相关密切程度的统计指标。1.简单线性相关系数 1.对变量之间关系密切程度的度量 2.对两个变量之间线性相关程度的度量称为简单相关系数 3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,记为 r 样本相关系数的定义公式实质 总体相关系数的定义式是:)()(),(YVarXVarYXCov (7.1)式中,Cov(X,Y)是变量X和Y的协方差;Var(X)和Var(Y)分别为变量X和Y的方差。总体相关系数是反映两变量之间线性相关程度的一种特征值,表现为一个常数。yxxyr2式中:nyyxxxy)(2,是变量
3、 x和y 的协方差。nxxx2)(,是变量 x的标准差。nyyy2)(,是变量y 的标准差。学习好资料 欢迎下载 相关系数按“积差法”计算。该方法是通过两变量与各自平均值的离差的乘积来反映两变量之间的相关程度。积差法公式为:计算相关系数的简化式:相关系数的性质 1.r 的取值范围是-1,1 2.|r|=1,为完全相关 r=1,为完全正相关 r=-1,为完全负正相关 3.r=0,不存在线性相关关系,它并不意味着与之间不存在其他类型的关系。4.-1 r0,为负相关 5 0r 1,为正相关 6 6.|的数值愈接近于 1,表示 x 与 y 直线相关程度愈高;反之,|的数值愈接近于 0,表示 x 与 y
4、 直线相关程度愈低。7 7.通常判断的标准是:|0.3 称为微弱相关,0.3|0.5 称为低度相关,0.|0.8 称为显著相关(中度相关)0.8|1 称为高度相关或强相关。一、回 归 分 析 的 意 义 回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法.三、回归分析与相关分析的区别 1、回归分析必须区分自变量和因变量,而相关分析不必区分。2、回归分析的两个变量一个是自变量,一个是因变量,通过给定自变量的值来推算因变量的可能值;而相关分析的两个变量都是随机变量。3、回归分析中对
5、于因果关系不甚明确的两个变量,可以建立两个回归方程;而相关分析只能计算出一个相关系数。4、一种回归方程只能做一种推算,即只能给出自变量的值来推算因变量的值,不能逆推。四、回归分析的特点 1、在两个变量之间,必须根据研究目的具体确定自变量和因变量 2、回归方程的作用是给定自变量数值情况下,估计因变量的可能值。一个回归方程只能做一种推算 3、直线回归方程中,自变量为回归系数,回归系数为正时,表明正相关,回归系数为负时,表明负相关 4、确定回归方程时,只要求因变量是随机的,而自变量是给定的数值 五、一元线性回归方程确定 nyynxxyyxxnyxxy222)()()(1 2222 yynxxnyxx
6、yn22)()()(yyxxyyxxrbxay依存关系这种关系可以用的方程来表现相关关系相关关系是一种不完全确定的随机关系函数关系与相关关系的联系对具有相关关系的现象进行分析时必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式四相关关系的用坐标点形式描绘出来即可利用相关图可以判断现象之间有无相关关系观察相关关系的类型观察相关关系的密切程度二相关系数相关系数是测定变量之间相关密切程度的统计指标简单线性相关系数对变量之间关系密切程度的度量对为若是根据样本数据计算的则称为样本相关系数记为总体相关系数的定义式是式中是变量和的协方差和分别为变量和的方差总体相关系数是反映两变量之间线性相关程度的
7、一种特征值表现为一个常数样本相关系数的定义公式实质式学习好资料 欢迎下载 1、一元线性方程式的一般形式:(当两变量的增长比率为常数时,它们之间就呈现为一种一元线性关系。)一元线性回归方程进行回归分析的前提:所分析的两个变量之间必须存在相关关系,且相关程度在显著相关以上。在两变量相关的散点图中,引出一条最优的直线,这条直线就是估计回归线。它表明了两变量数量变动的一般关系。配合估计回归线的方程称为回归方程 方程式为:回归系数 b 的经济涵义:当自变量变动一个单位时,因变量的平均变动值。一、判断题 1.产品的单位成本随着产量增加而下降,这种现象属于函数关系。答:错。应是相关关系。单位成本与产量间不存
8、在确定的数值对应关系。2.相关系数为 0 表明两个变量之间不存在任何关系。答:.错。相关系数为零,只表明两个变量之间不存在线性关系,并不意味着两者间不存在其他类型的关系。3.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。答:对,因果关系的判断还有赖于实质性科学的理论分析。4.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。答:错。两者是精确的函数关系。5.总体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。答:对。6.当抽取的样本不同时,对同一总体回归模型估计的结果也有所不同。答:对。因为,估计量属于随机变量,抽取的样本不同,具体的观察值也不同,尽管
9、使用的公式相同,估计的结果仍然不一样。二、选择题 1.变量之间的关系按相关程度分可分为:(b、c、d)a.正相关;b.不相关;c.完全相关;d.不完全相关;2.复相关系数的取值区间为:(a)a.10R;b.11R;c.1R;d.R1 3.修正自由度的决定系数(a、b、d)a.22RR;b.有时小于 0;c.102R;d.比2R更适合作为衡量回归方程拟合程度的指标 4.回归预测误差的大小与下列因素有关:(a、b、c、d)a 样本容量;b自变量预测值与自变量样本平均数的离差 c 自变量预测误差;d 随机误差项的方差 1.相关分析是研究变量之间的 D A.数量关系 B.变动关系 C.因果关系 D.相
10、互关系的密切程度 2.在相关分析中要求相关的两个变量 A A.都是随机变量 B.自变量是随机变量 C.都不是随机变量 D.因变量是随机变量 3.下列现象之间的关系哪一个属于相关关系?A A.播种量与粮食收获量之间关系 B.圆半径与圆周长之间关系 C.圆半径与圆面积之间关系 D.单位产品成本与总成本之间关系 bxayc自变量归系数:直线的斜率,又称回直线的起点值,:因变量的估计值:,xbayc依存关系这种关系可以用的方程来表现相关关系相关关系是一种不完全确定的随机关系函数关系与相关关系的联系对具有相关关系的现象进行分析时必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式四相关关系的用坐
11、标点形式描绘出来即可利用相关图可以判断现象之间有无相关关系观察相关关系的类型观察相关关系的密切程度二相关系数相关系数是测定变量之间相关密切程度的统计指标简单线性相关系数对变量之间关系密切程度的度量对为若是根据样本数据计算的则称为样本相关系数记为总体相关系数的定义式是式中是变量和的协方差和分别为变量和的方差总体相关系数是反映两变量之间线性相关程度的一种特征值表现为一个常数样本相关系数的定义公式实质式学习好资料 欢迎下载 4.正相关的特点是 C A.两个变量之间的变化方向相反 B.两个变量一增一减 C.两个变量之间的变化方向一致 D.两个变量一减一增 5.相关关系的主要特点是两个变量之间 B A.
12、存在着确定的依存关系 B.存在着不完全确定的关系 C.存在着严重的依存关系 D.存在着严格的对应关系 6.当自变量变化时,因变量也相应地随之等量变化,则两个变量 之间存在着 A A.直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系 7.当变量 X值增加时,变量 Y值都随之下降,则变量 X和 Y之间存 在着 C A.正相关关系 B.直线相关关系 C.负相关关系 D.曲线相关关系 8.当变量 X值增加时,变量 Y值都随之增加,则变量 X和 Y之间存 在着 D A.直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系 9.判定现象之间相关关系密切程度的最主要方法是 B A.对
13、现象进行定性分析 B.计算相关系数 C.编制相关表 D.绘制相关图 10.相关分析对资料的要求是 D A.自变量不是随机的,因变量是随机的 B.两个变量均不是随机的 C.自变量是随机的,因变量不是随机的 D.两个变量均为随机的 11.相关系数 B A.既适用于直线相关,又适用于曲线相关 B.只适用于直线相关 C.既不适用于直线相关,又不适用于曲线相关 D.只适用于曲线相关 12.两个变量之间的相关关系称为 A A.单相关 B.复相关 C.不相关 D.负相关 13.相关系数的取值范围是 A A.-1r1 B.-1r0 C.0r1 D.r=0 14.两变量之间相关程度越强,则相关系数 A A.愈趋
14、近于 1 B.愈趋近于 0 C.愈大于 1 D.愈小于 1 15.两变量之间相关程度越弱,则相关系数 B A.愈趋近于 1 B.愈趋近于 0 C.愈大于 1 D.愈小于 1 16.相关系数越接近于1,表明两变量间 C A.没有相关关系 B.有曲线相关关系 C.负相关关系越强 D.负相关关系越弱 17.当相关系数 r=0 时,D A.现象之间完全无关 B.相关程度较小 C.现象之间完全相关 D.无直线相关关系 18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说 明这两个变量之间存在 A A.高度相关 B.中度相关 C.低度相关 D.显著相关 19.从变量之间相关的方向看可分为 A
15、A.正相关与负相关 B.直线相关和曲线相关 C.单相关与复相关 D.完全相关和无相关 20.从变量之间相关的表现形式看可分为 B A.正相关与负相关 B.直线相关和曲线相关 依存关系这种关系可以用的方程来表现相关关系相关关系是一种不完全确定的随机关系函数关系与相关关系的联系对具有相关关系的现象进行分析时必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式四相关关系的用坐标点形式描绘出来即可利用相关图可以判断现象之间有无相关关系观察相关关系的类型观察相关关系的密切程度二相关系数相关系数是测定变量之间相关密切程度的统计指标简单线性相关系数对变量之间关系密切程度的度量对为若是根据样本数据计算
16、的则称为样本相关系数记为总体相关系数的定义式是式中是变量和的协方差和分别为变量和的方差总体相关系数是反映两变量之间线性相关程度的一种特征值表现为一个常数样本相关系数的定义公式实质式学习好资料 欢迎下载 C.单相关与复相关 D.完全相关和无相关 21.物价上涨,销售量下降,则物价与销售量之间属于 B A.无相关 B.负相关 C.正相关 D.无法判断 22.配合回归直线最合理的方法是 C A.随手画线法 B.半数平均法 C.最小平方法 D.指数平滑法 23.在回归直线方程y=a+bx中 b 表示 C A.当 x 增加一个单位时,y 增加 a 的数量 B.当 y 增加一个单位时,x 增加 b 的数量
17、 C.当 x 增加一个单位时,y 的平均增加量 D.当 y 增加一个单位时,x的平均增加量 24.计算估计标准误差的依据是 D A.因变量的数列 B.因变量的总变差 C.因变量的回归变差 D.因变量的剩余变差 25.估计标准误差是反映 C A.平均数代表性的指标 B.相关关系程度的指标 C.回归直线的代表性指标 D.序时平均数代表性指标 26.在回归分析中,要求对应的两个变量 B A.都是随机变量 B.不是对等关系 C.是对等关系 D.都不是随机变量 27.年劳动生产率(千元)和工人工资(元)之间存在回归方 A 程 y=10+70 x,这意味着年劳动生产率每提高一千元时,工人工资平均 A.增加
18、 70 元 B.减少 70 元 C.增加 80 元 D.减少 80 元 28.设某种产品产量为 1000 件时,其生产成本为 30000 元,其中 固定成本 6000 元,则总生产成本对产量的一元线性回归方程为:B A.y=6+0.24x B.y=6000+24x C.y=24000+6x D.y=24+6000 x 29.用来反映因变量估计值代表性高低的指标称作 D A.相关系数 B.回归参数 C.剩余变差 D.估计标准误差 二、多项选择题 1.下列现象之间属于相关关系的有 ABDE A.家庭收入与消费支出之间的关系 B.农作物收获量与施肥量之间的关系 C.圆的面积与圆的半径之间的关系 D.
19、身高与体重之间的关系 E.年龄与血压之间的关系 2.直线相关分析的特点是 ABCD A.相关系数有正负号 B.两个变量是对等关系 C.只有一个相关系数 D.因变量是随机变量 E.两个变量均是随机变量 3.从变量之间相互关系的表现形式看,相关关系可分为 CD A.正相关 B.负相关 C.直线相关 D.曲线相关 E.单相关和复相关 4.如果变量 x 与 y 之间没有线性相关关系,则 AE A.相关系数 r=0 B.相关系数 r=1 C.估计标准误差等于 0 D.估计标准误差等于 1 E.回归系数 b=0 5.设单位产品成本(元)对产量(件)的一元线性回归方程为 y=85-5.6x,则 ADE A.
20、单位成本与产量之间存在着负相关 B.单位成本与产量之间存在着正相关 依存关系这种关系可以用的方程来表现相关关系相关关系是一种不完全确定的随机关系函数关系与相关关系的联系对具有相关关系的现象进行分析时必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式四相关关系的用坐标点形式描绘出来即可利用相关图可以判断现象之间有无相关关系观察相关关系的类型观察相关关系的密切程度二相关系数相关系数是测定变量之间相关密切程度的统计指标简单线性相关系数对变量之间关系密切程度的度量对为若是根据样本数据计算的则称为样本相关系数记为总体相关系数的定义式是式中是变量和的协方差和分别为变量和的方差总体相关系数是反映两
21、变量之间线性相关程度的一种特征值表现为一个常数样本相关系数的定义公式实质式学习好资料 欢迎下载 C.产量每增加 1 千件,单位成本平均增加 5.6 元 D.产量为 1 千件时,单位成本为 79.4 元 E.产量每增加 1 千件,单位成本平均减少 5.6 元 6.根据变量之间相关关系的密切程度划分,可分为 ABC A.不相关 B.完全相关 C.不完全相关 D.线性相关 E.非线性相关 7.判断现象之间有无相关关系的方法有 ABCD A.对现象作定性分析 B.编制相关表 C.绘制相关图 D.计算相关系数 E.计算估计标准误差 8.当现象之间完全相关的,相关系数为 BC A.0 B.1 C.1 D.
22、0.5 E.0.5 9.相关系数 r=0 说明两个变量之间是 ABC A.可能完全不相关 B.可能是曲线相关 C.肯定不线性相关 D.肯定不曲线相关 E.高度曲线相关 10.下列现象属于正相关的有 ACE A.家庭收入愈多,其消费支出也愈多 B.流通费用率随商品销售额的增加而减少 C.产量随生产用固定资产价值减少而减少 D.生产单位产品耗用工时,随劳动生产率的提高而减少 E.工人劳动生产率越高,则创造的产值就越多 11.直线回归分析的特点有 ABCD A.存在两个回归方程 B.回归系数有正负值 C.两个变量不对等关系 D.自变量是给定的,因变量是随机的 E.利用一个回归方程,两个变量可以相互计
23、算 12.直线回归方程中的两个变量 CDE A.都是随机变量 B.都是给定的变量 C.必须确定哪个是自变量,哪个是因变量 D.一个是随机变量,另一个是给定变量 E.一个是自变量,另一个是因变量 13.从现象间相互关系的方向划分,相关关系可以分为 CD A.直线相关 B.曲线相关 C.正相关 D.负相关 E.单相关 14.估计标准误差是 BCD A.说明平均数代表性的指标 B.说明回归直线代表性指标 C.因变量估计值可靠程度指标 D.指标值愈小,表明估计值愈可靠 E.指标值愈大,表明估计值愈可靠 15.下列公式哪些是计算相关系数的公式 ABDE 16.用最小平方法配合的回归直线,必须满足以下条件
24、 BC 222222)()(.)()()(.)(.yynxxnyxxynrEyyxxyyxxrDLLLrCLLLrBnyyxxrAxxxyxyyyxxxyyx依存关系这种关系可以用的方程来表现相关关系相关关系是一种不完全确定的随机关系函数关系与相关关系的联系对具有相关关系的现象进行分析时必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式四相关关系的用坐标点形式描绘出来即可利用相关图可以判断现象之间有无相关关系观察相关关系的类型观察相关关系的密切程度二相关系数相关系数是测定变量之间相关密切程度的统计指标简单线性相关系数对变量之间关系密切程度的度量对为若是根据样本数据计算的则称为样本相关
25、系数记为总体相关系数的定义式是式中是变量和的协方差和分别为变量和的方差总体相关系数是反映两变量之间线性相关程度的一种特征值表现为一个常数样本相关系数的定义公式实质式学习好资料 欢迎下载 A.(y-yc)=最小值 B.(y-yc)=0 C.(y-yc)2=最小值 D.(y-yc)2=0 E.(y-yc)2=最大值 17.方程 yc=a+bx ABCDE A.这是一个直线回归方程 B.这是一个以 X为自变量的回归方程 C.其中 a 是估计的初始值 D.其中 b 是回归系数 E.yc是估计值 18.直线回归方程 yc=a+bx 中的回归系数 b BCE A.能表明两变量间的变动程度 B.不能表明两变
26、量间的变动程度 C.能说明两变量间的变动方向 D.其数值大小不受计量单位的影响 E.其数值大小受计量单位的影响 19.相关系数与回归系数存在以下关系 ABC A.回归系数大于零则相关系数大于零 B.回归系数小于零则相关系数小于零 C.回归系数等于零则相关系数等于零 D.回归系数大于零则相关系数小于零 E.回归系数小于零则相关系数大于零 20.配合直线回归方程的目的是为了 AC A.确定两个变量之间的变动关系 B.用因变量推算自变量 C.用自变量推算因变量 D.两个变量相互推算 E.确定两个变量之间的相关程度 21.若两个变量 x 和 y 之间的相关系数 r=1,则 ACE A.观察值和理论值的
27、离差不存在 B.y的所有理论值同它的平均值一致 C.x和 y 是函数关系 D.x与 y 不相关 E.x与 y 是完全正相关 22.直线相关分析与直线回归分析的区别在于 ADE A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的 B.回归分析中两个变量都是随机的;而相关分析中自变量是给 定的数值,因变量是随机的 C.相关系数有正负号;而回归系数只能取正值 D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系 E.相关分析中根据两个变量只能计算出一个相关系数;而回归 分析中根据两个变量只能计算出一个回归系数 1.在进行相关分析时要求所分析的两个变量都
28、是随机的;而在回归分析中要求自变量是随机的,因变量是给定的。1.正确。2.相关关系和函数关系都属于完全确定性的依存关系。错误。正相关是指两个变量之间的变动方向是一致的。3.正相关是指两个变量之间的变动方向都是上升的。正确。4.负相关是指两个变量的变化趋势相反,一个上升而另一个下降。错误。相关系数是测定变量之间相关关系密切程度的主要方法。5.相关系数是测定变量之间相关关系密切程度的唯一方法。错误。相关系数是在直线相关条件下,说明两个变量之间相关关系密切程度的统计分析指标。6.相关系数 r 是在曲线相关条件下,说明两个变量之间相关关系密切程度的统计分析指标。(错误。相关系数数值越接近于1,说明相关
29、程度越高,相关系数数值越接近于 0,说明相关程度越低。)7.相关系数数值越大,说明相关程度越高;相关系数数值越小,说明相关程度越低。8.相关系数 r 的符号与回归系数的符号,可以相同也可以不相同。错误。相关系数的符号和回归系数的符号肯定是一致的。依存关系这种关系可以用的方程来表现相关关系相关关系是一种不完全确定的随机关系函数关系与相关关系的联系对具有相关关系的现象进行分析时必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式四相关关系的用坐标点形式描绘出来即可利用相关图可以判断现象之间有无相关关系观察相关关系的类型观察相关关系的密切程度二相关系数相关系数是测定变量之间相关密切程度的统计
30、指标简单线性相关系数对变量之间关系密切程度的度量对为若是根据样本数据计算的则称为样本相关系数记为总体相关系数的定义式是式中是变量和的协方差和分别为变量和的方差总体相关系数是反映两变量之间线性相关程度的一种特征值表现为一个常数样本相关系数的定义公式实质式学习好资料 欢迎下载 9.回归分析中计算的估计标准误差就是因变量的标准差。错误。回归分析计算中的估计标准误差是指因变量实际值与理论值离差的平均数。10.回归分析中,对于没有明显因果关系的两个变量可以求得两个回归方程。(正确)11.当回归系数大于零时,两个变量的关系是正相关;而当回归系数小于零时,两个变量的关系是负相关。(正确)12.估计标准误差是
31、以回归直线为中心反映各观察值与估计值平均数之间离差程度的大小。(正确)1.已知 n=6,x=21,y=426,x2=79,y2=30268,xy=1481 试据此:(1)计算相关系数;(2)建立回归直线方程;(3)计算估计 标准误差.1.解:(1)由相关系数简捷法计算公式得:2222)()()()(yynxxnyxxynr=22426302686217964262114816 =0.9091(2)由回归系数计算公式得 22)()()(xxnyxxynb8 1 8 2.1217964262114816 3 6 3 7.776218182.16426nxbnyxbya 则回归直线方程为xy8182
32、.13637.77(3)估计标准误差 nxybyaySY2 614818182.14263637.7730268=0.7977 依存关系这种关系可以用的方程来表现相关关系相关关系是一种不完全确定的随机关系函数关系与相关关系的联系对具有相关关系的现象进行分析时必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式四相关关系的用坐标点形式描绘出来即可利用相关图可以判断现象之间有无相关关系观察相关关系的类型观察相关关系的密切程度二相关系数相关系数是测定变量之间相关密切程度的统计指标简单线性相关系数对变量之间关系密切程度的度量对为若是根据样本数据计算的则称为样本相关系数记为总体相关系数的定义式是式中是变量和的协方差和分别为变量和的方差总体相关系数是反映两变量之间线性相关程度的一种特征值表现为一个常数样本相关系数的定义公式实质式