《第4节 变量间的相关关系、统计案例.pptx》由会员分享,可在线阅读,更多相关《第4节 变量间的相关关系、统计案例.pptx(52页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第四节变量间的相关关系、统计案例第四节变量间的相关关系、统计案例第十章第十章内容索引0102强强基础基础 增增分策略分策略增素增素能能 精精准突破准突破课标解读衍生考点核心素养1.了解回归分析的基本思想及其基本步骤.2.会作散点图,并会利用散点图判断两个变量之间是否具有相关关系.3.掌握回归方程的相关计算.4.了解独立性检验的基本思想.5.掌握利用列联表进行独立性检验的方法与步骤.1.相关关系的判断2.回归分析3.相关系数及其应用4.独立性检验1.数学建模2.数据分析3.数学运算强强基础基础 增增分策略分策略1.变量间的相关关系(1)定义:常见的两变量之间的关系有两类:一类是函数关系,另一类是
2、.当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系.与函数关系不同,相关关系是一种.(2)散点图:在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(3)曲线拟合:从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用来近似,这样近似的过程称为曲线拟合.相关关系 非确定性关系 一条光滑的曲线(4)线性相关:如果散点图中所有点看上去都在波动,就称变量间是线性相关的.此时可以用一条直线来近似.(5)非线性相关:若散点图上所
3、有点看上去都在附近波动,则称此相关为非线性相关.此时,可以用来拟合.(6)不相关:如果所有的点在散点图中,那么称变量间是不相关的.微点拨相关关系与函数关系的异同共同点:二者都是指两个变量间的关系;不同点:函数关系是一种确定性关系,体现的是因果关系,而相关关系是一种非确定性关系,体现的不一定是因果关系,也可能是伴随关系.一条直线附近某条曲线(不是一条直线)一条曲线 没有显示任何关系 2.回归分析(1)线性回归方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中a,b是待定系数.微点拨1.求回归方程的关键是确定回归系数a,b,要充分利
4、用回归直线过样本点中心();2.根据回归方程计算的y值仅是一个预报值,不是真实发生的值.当r0时,表明两个变量正相关;当r2.706时,有90%的把握判定变量A,B有关联;当23.841时,有95%的把握判定变量A,B有关联;当26.635时,有99%的把握判定变量A,B有关联.增素增素能能 精精准突破准突破考点一考点一考点二考点二考点三考点三考点四考点四考点一考点一相关关系的判断相关关系的判断典例突破例1.(1)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()A.r2r40r3r1B.r4r20r1r3C.r4r20r3r1D.r2r40r1r3考点一考点一考点二考点二
5、考点三考点三考点四考点四(2)如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是()A.DB.EC.FD.A考点一考点一考点二考点二考点三考点三考点四考点四答案:(1)A(2)B解析:(1)题中图1和图3是正相关,相关系数大于0;图2和图4是负相关,相关系数小于0;图1和图2的点相对更加集中,所以相关性要强,所以r1接近于1,r2接近于-1,由此可得r2r40r30时,正相关(2)当r0时,正相关;当b0时,负相关考点一考点一考点二考点二考点三考点三考点四考点四对点训练1(1)相关变量x,y的散点图如图所示,现对这
6、两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归方程y=b2x+a2,相关系数为r2.则()A.0r1r21B.0r2r11C.-1r1r20D.-1r2r10考点一考点一考点二考点二考点三考点三考点四考点四(2)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程y=bx+a近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,b的值为1.25B.线性相关关系较强,b的值为0
7、.83C.线性相关关系较强,b的值为-0.87D.线性相关关系较弱,无研究价值考点一考点一考点二考点二考点三考点三考点四考点四答案:(1)D(2)B解析:(1)由散点图得x与y负相关,所以r1,r20,因为剔除点(10,21)后,剩下点的数据更具有线性相关性,|r2|更接近1,所以-1r2r10,表示两个变量正相关.r0.75,则线性相关程度很高,可用线性回归模型拟合)考点一考点一考点二考点二考点三考点三考点四考点四考点一考点一考点二考点二考点三考点三考点四考点四考点一考点一考点二考点二考点三考点三考点四考点四考点四考点四独立性独立性检验典例突破例5.(2021宁夏银川二模)某公司举办了一场新
8、产品推介会,为进一步了解产品消费群体的年龄和性别特征,销售人员拟从参加现场会的人员中抽取一个容量为200的样本.(1)要使样本有更好的代表性,你认为销售人员应该采用哪种抽样方法,并说明理由.(2)经过调查,销售人员获得了如下数据:考点一考点一考点二考点二考点三考点三考点四考点四性别喜欢不喜欢合计男305080女8040120合计11090200年龄喜欢不喜欢合计50岁以上(含50岁)904013050岁以下304070合计12080200根据以上信息,判断是否喜欢该产品和性别有关吗?是否喜欢该产品和年龄有关吗?考点一考点一考点二考点二考点三考点三考点四考点四(3)根据以上信息,你对该公司这款产
9、品销售策略有何建议.P(2k)0.100.050.01k2.7063.8416.635考点一考点一考点二考点二考点三考点三考点四考点四解:(1)分层抽样,由于现场人员中个体分不同部分,所以采用分层抽样可以更好地从部分体现总体.所以有99%的把握认为是否喜欢该产品和年龄有关.(3)该产品更多受到女性与50岁以上人群喜欢,所以在销售时,对象尽量选择女性和50岁以上人群.考点一考点一考点二考点二考点三考点三考点四考点四突破技巧1.独立性检验 2个明确(1)明确两类主体;(2)明确研究的两个问题2个关键(1)准确画出22列联表;(2)准确求解2的值3个步骤(1)根据样本数据制成22列联表;(2)计算2
10、=;(3)比较2与临界值的大小关系,作统计判断考点一考点一考点二考点二考点三考点三考点四考点四2.用2的大小可以决定是否拒绝原来的统计假设H0,若2较大,就拒绝H0,即拒绝事件A与事件B无关;换一种说法,2越大,说明“两个变量有关系”的可能性越大,根据临界值表判断2大于的临界值,然后下结论.考点一考点一考点二考点二考点三考点三考点四考点四对点训练5(2021吉林白山联考三)打乒乓球是一项众多中学生喜爱的体育运动,某中学体育协会为了解这项运动与性别的关联性,随机调查了100名男生和100名女生,每位学生回答喜欢或不喜欢,得到下面的列联表:性别男生女生喜欢打乒乓球5535不喜欢打乒乓球4565(1)分别估计该中学男、女生喜欢打乒乓球的概率;(2)能否有99%的把握认为该中学学生喜欢打乒乓球与性别有关?P(2k)0.100.050.01k2.7063.8416.635考点一考点一考点二考点二考点三考点三考点四考点四