《变量的相关性1PPT课件.ppt》由会员分享,可在线阅读,更多相关《变量的相关性1PPT课件.ppt(27页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、变量的相关性变量的相关性1 1、变量间的关系、变量间的关系变量间的关系变量间的关系确定性确定性的的函数关系函数关系不确定不确定的的相关关系相关关系函数关系函数关系:如果当一个变量的取值一定时,如果当一个变量的取值一定时,另一个变量另一个变量的取的取值值被惟一确定被惟一确定,则这两个变量之间的关系就是一,则这两个变量之间的关系就是一个函数关系个函数关系.相关关系:相关关系:如果当一个变量的取值一定时,如果当一个变量的取值一定时,另一个变量另一个变量的的取值带取值带有一定随机性有一定随机性,这样的两个变量之间的,这样的两个变量之间的关系,叫做相关关系关系,叫做相关关系.本质差别:本质差别:函数关系
2、是确定性关系,相关关系是不确定性关系。函数关系是确定性关系,相关关系是不确定性关系。例:设某的例:设某的1010户家庭的年收入和饮食支出的统户家庭的年收入和饮食支出的统计资料如下计资料如下:年收入年收入x/x/万元万元年饮食支年饮食支出出x/x/万元万元244666778100.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3怎么判断两个变量有没有相关关系呢?怎么判断两个变量有没有相关关系呢?0123246810 xy这样的图形叫做这样的图形叫做散点图散点图。定义:定义:将样本中的将样本中的n个数据点描在平面直角坐标系中,就得个数据点描在平面直角坐标系中,就得 到了散
3、点图。到了散点图。若散点图中的点分布在一条直线或曲线附近若散点图中的点分布在一条直线或曲线附近时,则说两个变量具有相关关系;时,则说两个变量具有相关关系;若散点图中散乱的分布在各处没有规律时,则若散点图中散乱的分布在各处没有规律时,则说两个变量不具有相关关系。说两个变量不具有相关关系。利用散点图可以判断两个变量是否具有相关关系。利用散点图可以判断两个变量是否具有相关关系。如果关于两个变量的统计数据的散点图呈现图如果关于两个变量的统计数据的散点图呈现图2的形的形状,则这两个变量之间不具有相关性例如,学生的状,则这两个变量之间不具有相关性例如,学生的身高与学生的数学成绩没有相关关系,此时称变量间身
4、高与学生的数学成绩没有相关关系,此时称变量间是不相关的是不相关的.正相关:正相关:一个变量的值由小变大时,另一个一个变量的值由小变大时,另一个变量也由小变大。变量也由小变大。负相关:负相关:一个变量的值由小变大时,另一个一个变量的值由小变大时,另一个变量却由大变小。变量却由大变小。0123246810 xy0123246810 xy正相关正相关负相关负相关图图 1图图 4图图 3图图 2正正相相关关负负相相关关不具有线性相关关系不具有线性相关关系你能指出下列哪些图是线性相关,哪些不是?若线性相关是正相关还是负相关?你能指出下列哪些图是线性相关,哪些不是?若线性相关是正相关还是负相关?例:下表为
5、某小卖部例:下表为某小卖部6 6天卖出的热茶的杯数与天卖出的热茶的杯数与当天天气温度的对比表:当天天气温度的对比表:温度温度t/t/杯数杯数Y Y2618131041202434385064将表中的数据画成散点图。将表中的数据画成散点图。你能从散点图中发现温度与饮料杯数近似成你能从散点图中发现温度与饮料杯数近似成什么关系吗?什么关系吗?若数据点大致分布在一条直线附近,则两变量若数据点大致分布在一条直线附近,则两变量近似成近似成线性相关关系线性相关关系。请你制定一个标准来画出一条最佳近似直线,请你制定一个标准来画出一条最佳近似直线,并说明你画出的直线是最佳的近似直线的理由。并说明你画出的直线是最
6、佳的近似直线的理由。例例1:5个学生的数学和物理成绩如下表:个学生的数学和物理成绩如下表:ABCDE数学x8075706560物理y7066686462画出散点图,并判断它们是否有相关关系。画出散点图,并判断它们是否有相关关系。数学成绩数学成绩解:解:由散点图可见,两者之间具有正相关关系。由散点图可见,两者之间具有正相关关系。若知某同学若知某同学数学成绩为数学成绩为7373,能否估计其能否估计其物理成绩?物理成绩?幻灯片幻灯片幻灯片幻灯片 8 8 带着上面的问题,请同学们阅读带着上面的问题,请同学们阅读课本课本2.3.22.3.2例例2 2前面的内容,思考或前面的内容,思考或讨论这个问题是能否
7、得到解决讨论这个问题是能否得到解决?从上图可以看出,图中的五个点近似成一条直线,求出这些点所满足的回归直线方程,把数学成绩代入方程即可得到该同学的物理成绩的估计值。问题问题1 1:什么是离差?它刻画了什么问题?:什么是离差?它刻画了什么问题?问题问题2 2:为什么不选用:为什么不选用n n个离差的和做总离差?个离差的和做总离差?答:离差是观察值答:离差是观察值 与估计值与估计值 的差,它刻画了的差,它刻画了 观察值与回归线上相应点纵坐标之间的偏离程度。观察值与回归线上相应点纵坐标之间的偏离程度。答:因为离差有正有负,直接相加会抵消,这样就无法反映这些答:因为离差有正有负,直接相加会抵消,这样就
8、无法反映这些 数据点的贴近程度,因此不能用数据点的贴近程度,因此不能用n个离差的和做总离差。应个离差的和做总离差。应 选用离差的平方和作为总离差。这样得到的直线才是最佳近选用离差的平方和作为总离差。这样得到的直线才是最佳近 似直线(最优拟合直线)。似直线(最优拟合直线)。问题问题3 3:什么是最小二乘法?:什么是最小二乘法?答:这种使答:这种使“离差的平方和离差的平方和”为最小的方法,叫做最小二乘法。为最小的方法,叫做最小二乘法。回归直线方程为:由最小二乘法求得的由最小二乘法求得的a、b的估计值分别记为的估计值分别记为问题问题4 4:通过例通过例2 2,你能总结出求回归直线方程的步骤吗?,你能
9、总结出求回归直线方程的步骤吗?第二步:列表第二步:列表 ;第三步:计算第三步:计算 ;第四步:代入公式计算第四步:代入公式计算 的值;的值;第五步:写出回归直线方程。第五步:写出回归直线方程。第一步:做出散点图,判断是否线性相关;第一步:做出散点图,判断是否线性相关;序号数学x物理yx*xxyA807064005600B756656254950C706849004760D656442254160E606236003720求和3503302475023190例例1 解:解:例例2:有一个同学家开了一个小卖部,他为了研究气温对热饮:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统
10、计,得到一个卖出的热饮杯数与当天气销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:温的对比表:(1)画出散点图;画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一从散点图中发现气温与热饮销售杯数之间关系的一 般规律;般规律;(3)求回归方程;求回归方程;(4)如果某天的气温是如果某天的气温是 C,预测这天卖出的热饮杯数。预测这天卖出的热饮杯数。利用线性回归方程对总体进行估计利用线性回归方程对总体进行估计温温 度度-504712151923273136热饮杯数热饮杯数15615013212813011610489937654用用Excel作散点图的步骤如下作散点图的步
11、骤如下:(1)进入进入Excel,在,在A1,B1分别输入分别输入“温度温度”、“热饮杯数热饮杯数”,在,在A、B列输入相应的数据。列输入相应的数据。(2)点击点击图表图表向导图标,进入对话框,选择向导图标,进入对话框,选择“标准类型标准类型”中的中的“XY散点图散点图”,单击,单击“完成完成”。(3)选中选中“数值数值X轴轴”,单击右键选中,单击右键选中“坐标轴格式坐标轴格式”中中的的“刻度刻度”,把,把“最小值最小值”、“最大值最大值”、“刻度主要单位刻度主要单位”作相应调整,最后按作相应调整,最后按“确定确定”。y轴方法相同。轴方法相同。EXCELEXCEL解解:(1)散点图散点图(2)
12、气温与热饮杯数成负相关气温与热饮杯数成负相关,即气温越高,即气温越高,卖出去的热饮杯数越少。卖出去的热饮杯数越少。温度温度热饮杯数热饮杯数例例2:用用Excel求线性回归方程,步骤如下求线性回归方程,步骤如下:(1)进入)进入Excel作出散点图。作出散点图。(2)点击)点击“图表图表”中的中的“添加趋势线添加趋势线”,单击,单击“类类型型”中的中的“线性线性”,单击,单击“确定确定”,得到回归方程。,得到回归方程。(3)双击回归直线,弹出)双击回归直线,弹出“趋势线格式趋势线格式”,单击,单击“选项选项”,选定,选定“显示公式显示公式”,最后单击,最后单击“确定确定”。EXCELEXCEL(
13、3)从散点图可以看出,这些点大致分布从散点图可以看出,这些点大致分布在一条直线附近。在一条直线附近。Y=-2.352x+147.767(4)当)当x=2时,时,y=143.063,因此,这天大因此,这天大约可以卖出约可以卖出143杯热饮。杯热饮。(1 1)判断变量之间有无相关关系,简便)判断变量之间有无相关关系,简便 方法就是画散点图。方法就是画散点图。(2 2)当数字少时,可用人工或计算器求回)当数字少时,可用人工或计算器求回 归方程;当数字多时,用归方程;当数字多时,用ExcelExcel求回归求回归 方程。方程。(3 3)利用回归方程,可以进行预测。)利用回归方程,可以进行预测。小结:小
14、结:1、下列两变量具有相关关系的是(下列两变量具有相关关系的是()A、正方体的体积与边长、正方体的体积与边长 B、人的身高与体重、人的身高与体重 C、匀速行驶车辆的行驶距离与时间、匀速行驶车辆的行驶距离与时间 D、球的半径与体积、球的半径与体积自自我我测测评评B2、线性回归方程线性回归方程 必过(必过()D3、有下列关系:有下列关系:人的年龄与他(她)拥有的财富之间的关系;人的年龄与他(她)拥有的财富之间的关系;曲线上的点与该点的坐标之间的关系;曲线上的点与该点的坐标之间的关系;苹果的产量与气候之间的关系;苹果的产量与气候之间的关系;森林中的同一种树木,其断面直径与高度之间的森林中的同一种树木,其断面直径与高度之间的关系;关系;学生与他(她)的学号之间的关系、学生与他(她)的学号之间的关系、其中有相关关系的是其中有相关关系的是 。4、对对于回于回归归方程方程 ,当当x=28时时,y的估的估计值计值是是 。390祝同学们学习进步!祝同学们学习进步!