统计案例复习.pptx

上传人:莉*** 文档编号:74452613 上传时间:2023-02-26 格式:PPTX 页数:62 大小:420.87KB
返回 下载 相关 举报
统计案例复习.pptx_第1页
第1页 / 共62页
统计案例复习.pptx_第2页
第2页 / 共62页
点击查看更多>>
资源描述

《统计案例复习.pptx》由会员分享,可在线阅读,更多相关《统计案例复习.pptx(62页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、会计学1统计案例复习统计案例复习 统计案例统计案例要点梳理要点梳理1.1.回归分析回归分析 (1 1)定义:对具有)定义:对具有 的两个变量进行统计的两个变量进行统计 分析的一种常用方法分析的一种常用方法.(2 2)随随机机误误差差:线线性性回回归归模模型型用用y y=bxbx+a a+e e表表示示,其其 中中a a和和b b为模型的为模型的 ,称为随机误差称为随机误差.(3 3)样本点的中心)样本点的中心 在具有线性相关关系的数据(在具有线性相关关系的数据(x x1 1,y y1 1),(,(x x2 2,y y2 2),),(,(x xn n,y yn n)中,回归方程的截距和斜率的最小

2、二乘中,回归方程的截距和斜率的最小二乘 估计公式分别为:估计公式分别为:相关关系相关关系未知参数未知参数e e基础知识基础知识 自主学习自主学习第1页/共62页其中其中 称称为样本点的中心为样本点的中心.(4 4)相关系数)相关系数,.,r r=第2页/共62页当当r r 0 0时,表明两个变量时,表明两个变量 ;当当r r 0 0时,表明两个变量时,表明两个变量 .r r 的绝对值越接近于的绝对值越接近于1 1,表明两个变量的线性相关性,表明两个变量的线性相关性 .r r 的绝对值越接近于的绝对值越接近于0 0时,表明两个变量之间时,表明两个变量之间 .通常通常|r r|大于大于 时,认时,

3、认为两个变量有很强的线性相关性为两个变量有很强的线性相关性.正相关正相关负相关负相关越强越强几乎不存在线性相关关系几乎不存在线性相关关系0.750.75第3页/共62页2.2.残差分析残差分析 (1 1)总偏差平方和)总偏差平方和 把把每每个个效效应应(观观测测值值减减去去总总的的平平均均值值)的的平平方方加加起来即:起来即:.(2 2)残差)残差 数据点和它回归直线上相应位置的差异(数据点和它回归直线上相应位置的差异(y yi i-)是是 的效应,称的效应,称 为残差为残差.(3 3)残差平方和)残差平方和 .随机误差随机误差第4页/共62页3.3.独立性检验独立性检验 (1 1)分分类类变

4、变量量:变变量量的的不不同同“值值”表表示示个个体体所所属属的的 ,像这类变量称为分类变量,像这类变量称为分类变量.(4)(4)相关指数相关指数R R2 2=.R R2 2的值越大,说明残差平方和的值越大,说明残差平方和 ,也就是说模型,也就是说模型的拟合效果越好的拟合效果越好.在线性回归模型中,在线性回归模型中,R R2 2表示解释变表示解释变量对预报变量变化的贡献率,量对预报变量变化的贡献率,R R2 2越接近于越接近于1 1,表示回,表示回归的效果越好归的效果越好.越小越小不同类别不同类别第5页/共62页 (2 2)列列联联表表:列列出出两两个个分分类类变变量量的的 ,称称为为列列联联表

5、表.假假设设有有两两个个分分类类变变量量X X和和Y Y,它它们们的的可可能能取取值值分分别别为为 x x1 1,x x2 2 和和 y y1 1,y y2 2,其其样样本本频频数数列列联表(称为联表(称为2222列联表)为列联表)为2222列联表列联表y y1 1 y y2 2 总计总计 x x1 1 a a b b a+b a+b x x2 2 c c d d c+d c+d 总计总计 a+c a+c b+d b+d a+b+c+d a+b+c+d 频数表频数表第6页/共62页构造一个随机变量构造一个随机变量K K2 2=,其其中中n n=为样本容量为样本容量.(3 3)独立性检验)独立性

6、检验利用随机变量利用随机变量 来确定是否能以一定把握认为来确定是否能以一定把握认为“两两个分类变量个分类变量 ”的方法称为两个分类变量的独的方法称为两个分类变量的独立性检验立性检验.a+b+c+da+b+c+dK K2 2有关系有关系第7页/共62页基础自测基础自测1.1.相关系数度量相关系数度量()A.A.两个变量之间线性相关关系的强度两个变量之间线性相关关系的强度 B.B.散点图是否显示有意义的模型散点图是否显示有意义的模型 C.C.两个变量之间是否存在因果关系两个变量之间是否存在因果关系 D.D.两个变量之间是否存在关系两个变量之间是否存在关系 解解析析 相相关关系系数数来来衡衡量量两两

7、个个变变量量之之间间线线性性相相关关关关系的强弱系的强弱.A第8页/共62页2.2.甲、乙、丙、丁四位同学各自对甲、乙、丙、丁四位同学各自对A A、B B两变量的线性两变量的线性 相关性作试验,并用回归分析方法分别求得相关系相关性作试验,并用回归分析方法分别求得相关系 数数r r与残差平方和与残差平方和m m如下表:如下表:则哪位同学的试验结果体现则哪位同学的试验结果体现A A、B B两变量更强的线性两变量更强的线性相关性?相关性?()A.A.甲甲B.B.乙乙C.C.丙丙D.D.丁丁解析解析 r r0 0且丁最接近且丁最接近1 1,残差平方和越小,相关性,残差平方和越小,相关性越高,故选越高,

8、故选D.D.甲甲 乙乙 丙丙 丁丁r r0.82 0.82 0.78 0.78 0.69 0.69 0.850.85m m115 115 106 106 124 124 103 103 D第9页/共62页3.3.已已知知x x、y y之之间间的的数数据据如如表表所所示示,则则回回归归直直线线过过点点()A.(0,0)B.(,0)C.(0,)D.(,)A.(0,0)B.(,0)C.(0,)D.(,)解析解析 回归直线过样本点的中心(回归直线过样本点的中心(,).x x 1.081.08 1.121.12 1.191.19 1.281.28 y y 2.252.25 2.372.37 2.402.

9、40 2.552.55 D第10页/共62页4.4.下列说法中正确的有:下列说法中正确的有:若若r r0 0,则,则x x增大时,增大时,y y也相应也相应增大;增大;若若r r0 0,则,则x x增大时,增大时,y y也相应增大;也相应增大;若若r r=1=1或或r r=-1=-1,则,则x x与与y y的关系完全对应(有函数关系),在的关系完全对应(有函数关系),在散点图上各个点均在一条直线上散点图上各个点均在一条直线上()A.B.C.D.A.B.C.D.解析解析 若若r r0 0,表示两个相关变量正相关,表示两个相关变量正相关,x x增大时,增大时,y y也相应增大,故也相应增大,故正确

10、正确.r r0 0,表示两个变量负相关,表示两个变量负相关,x x增大时,增大时,y y相应减小,故相应减小,故错误错误.|.|r r|越接近越接近1 1,表示两,表示两个变量相关性越高,个变量相关性越高,|r r|=1|=1表示两个变量有确定的关系表示两个变量有确定的关系(即函数关系),故(即函数关系),故正确正确.C第11页/共62页5.5.在在一一项项打打鼾鼾与与患患心心脏脏病病的的调调查查中中,共共调调查查了了1 1 671671人人,经经过过计计算算K K2 2=27.63=27.63,根根据据这这一一数数据据分分析析,我我们们有有理理由由认认为为打打鼾鼾与与患患心心脏脏病病是是 的

11、的(有有关关,无关)无关).解析解析 K K2 2=27.63=27.6310.828,10.828,有有99.9%99.9%的把握认为的把握认为“打鼾与患心脏病有关打鼾与患心脏病有关”.有关有关第12页/共62页题型一题型一 线性回归分析线性回归分析【例例1 1】假假设设关关于于某某种种设设备备的的使使用用年年限限x x(年年)与与所所支支出的维修费用出的维修费用y y(万元)有如下统计资料:(万元)有如下统计资料:2 23 34 45 56 6y y2.22.23.83.85.55.56.56.57.07.0已知已知(1 1)求)求 ,;,;(2 2)对)对x x,y y进行线性相关性检验

12、;进行线性相关性检验;(3)如果)如果x与与y具有线性相关关系,求出线性回归方具有线性相关关系,求出线性回归方程;程;(4)估计使用年限为)估计使用年限为10年时,维修费用约是多少?年时,维修费用约是多少?x x第13页/共62页(3 3)如如果果x x与与y y具具有有线线性性相相关关关关系系,求求出出线线性性回回归归方方程;程;(4 4)估计使用年限为)估计使用年限为1010年时,维修费用约是多少?年时,维修费用约是多少?(1 1)先先根根据据已已知知计计算算相相关关系系数数r r,判判断断是否具有相关关系是否具有相关关系.(2 2)再利用公式求出回归方程进行回归分析)再利用公式求出回归方

13、程进行回归分析.解解 (1 1)思维启迪思维启迪第14页/共62页(2 2)步骤如下:)步骤如下:作统计假设作统计假设H H0 0:x x与与y y不具有线性相关关系不具有线性相关关系.n n-2=3-2=3时,时,r r0.050.05=0.878.=0.878.=112.3-545=12.3,=112.3-545=12.3,=90-54 =90-542 2=10,=10,=140.8-125=15.8,=140.8-125=15.8,r r=|r r|=0.987|=0.9870.878,0.878,即即|r r|r r0.050.05,所以有所以有95%95%的把握认为的把握认为“x x

14、与与y y之间具有线性相关关之间具有线性相关关系系”,去求线性回归方程是有意义的,去求线性回归方程是有意义的.第15页/共62页所以线性回归方程为所以线性回归方程为 =1.23=1.23x x+0.08.+0.08.(4 4)当)当x x=10=10时,时,=1.2310+0.08=12.38=1.2310+0.08=12.38(万元)(万元),即估计使用即估计使用1010年时,维修费用约为年时,维修费用约为12.3812.38万元万元.在解决具体问题时,要先进行相关性检在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系验,通过检验确认两个变量是否具有线性相关关系.

15、若它们之间具有相关关系,再求回归方程,否则,若它们之间具有相关关系,再求回归方程,否则,即使求出回归方程也是毫无意义的即使求出回归方程也是毫无意义的,而且用其估计和而且用其估计和预测的量也是不可信的预测的量也是不可信的.探究提高探究提高第16页/共62页题型二题型二 非线性回归分析非线性回归分析【例例2 2】下下表表是是某某年年美美国国旧旧轿轿车车价价格格的的调调查查资资料料,以以x x表表示示轿轿车车的的使使用用年年数数,y y表表示示相相应应的的年年均均价价格格,求求y y关于关于x x的回归方程的回归方程.使用年使用年数数x x 1 1 2 23 34 45 56 67 78 89 91

16、010年均价年均价格格y y(美美元元)2 6512 6511 9431 9431 4941 4941 087 1 087 765765538538484484290290226226204204 由已知表格先画出散点图,可以看出随由已知表格先画出散点图,可以看出随着使用年数的增加,轿车的平均价格在递减,但不着使用年数的增加,轿车的平均价格在递减,但不在一条直线附近在一条直线附近.但据此认为但据此认为y y与与x x之间具有线性相关之间具有线性相关关系是不科学的,要根据图形的形状进行合理转化关系是不科学的,要根据图形的形状进行合理转化,转化成线性关系的变量间的关系转化成线性关系的变量间的关系.

17、思维启迪思维启迪第20页/共62页解解 作出散点图如图所示作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因可以发现,各点并不是基本处于一条直线附近,因此,此,y y与与x x之间应是非线性相关关系之间应是非线性相关关系.与已学函数图象与已学函数图象比较,用比较,用 来刻画题中模型更为合理来刻画题中模型更为合理,令令 ,则,则 ,题中数据变成如下表所示:,题中数据变成如下表所示:第21页/共62页相应的散点图如图所示,从图中可以看出,变换的相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归样本点分布在一条直线附近,因此可以用线性回归方程拟合方

18、程拟合.x x1 12 23 34 45 56 67 78 89 91010z z7.8837.8837.5727.5727.3097.3096.9916.9916.6406.6406.2886.2886.1826.1825.6705.6705.4215.4215.3185.318第22页/共62页由表中数据可得由表中数据可得r r-0.996.|-0.996.|r r|0.75.|0.75.认为认为x x与与z z之之间具有线性相关关系,由表中数据得间具有线性相关关系,由表中数据得 -0.298,-0.298,8.165,8.165,所以所以 =-0.298=-0.298x x+8.165,

19、+8.165,最后回代最后回代 =ln ,=ln ,即即 =e=e-0.298-0.298x x+8.165+8.165为所求为所求.非线性回归问题有时并不给出经验公式非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决析问题,使之得到解决.

20、探究提高探究提高第23页/共62页题型三题型三 独立性检验独立性检验在在对对人人们们休休闲闲方方式式的的一一次次调调查查中中,共共调调查查了了124124人人,其其中中女女性性7070人人,男男性性5454人人.女女性性中中有有4343人人主主要要的的休休闲闲方方式式是是看看电电视视,另另外外2727人人的的休休闲闲方方式式是是运运动动;男男性性中中有有2121人人主主要要的的休休闲闲方方式式是是看看电电视视,另另外外3333人主要的休闲方式是运动人主要的休闲方式是运动.(1 1)根据以上数据建立一个)根据以上数据建立一个2222列联表;列联表;(2 2)画出二维条形图;)画出二维条形图;(3

21、 3)检验休闲方式是否与性别有关,可靠性有多大)检验休闲方式是否与性别有关,可靠性有多大.第34页/共62页解解 (1 1)2222列联表如图:列联表如图:看电视看电视 运动运动 合计合计 女女 4343 2727 7070 男男 212133335454合计合计 64646060124124休闲方式休闲方式 性别性别 第35页/共62页(2 2)二维条形图如图:)二维条形图如图:(3 3)假设休闲方式与性别无关,则)假设休闲方式与性别无关,则K K2 2=所以有理由认为休闲方式与性别无关是不合理的,所以有理由认为休闲方式与性别无关是不合理的,即我们有即我们有97.5%97.5%的把握认为休闲

22、方式与性别有关的把握认为休闲方式与性别有关.第36页/共62页方法与技巧方法与技巧1.1.线线性性回回归归分分析析以以散散点点图图为为基基础础,具具有有很很强强的的直直观观性性,有有散散点点图图作作比比较较时时,拟拟合合效效果果的的好好坏坏可可由由直直观观性性直直接接判判断断,没没有有散散点点图图时时,只只须须套套用用公公式式求求r r,R R2 2再作判断即可再作判断即可.2.2.独独立立性性检检验验没没有有直直观观性性,必必须须依依靠靠K K2 2的的观观测测值值作作判判断断.思想方法思想方法 感悟提高感悟提高第37页/共62页失误与防范失误与防范1.1.r r的的大大小小只只说说明明是是

23、否否相相关关并并不不能能说说明明拟拟合合效效果果的的好好坏,坏,R R2 2才是判断拟合效果好坏的依据才是判断拟合效果好坏的依据.2.2.独独立立性性检检验验的的随随机机变变量量K K2 2=2.706=2.706是是判判断断是是否否有有关关系系的的临临界界值值,K K2 22.7062.706应应判判断断为为没没有有充充分分证证据据显显示示X X与与Y Y有关系有关系第38页/共62页一、选择题一、选择题1.1.下列四个命题:下列四个命题:线线性性相相关关系系数数r r越越大大,两两个个变变量量的的线线性性相相关关性性越越强;反之,线性相关性越弱;强;反之,线性相关性越弱;残差平方和越小的模

24、型,模型拟合的效果越好;残差平方和越小的模型,模型拟合的效果越好;用用相相关关指指数数R R2 2来来刻刻画画回回归归效效果果,R R2 2越越小小,说说明明模模型的拟合效果越好;型的拟合效果越好;在在推推断断H H:“X X与与Y Y有有关关系系”的的论论述述中中,用用三三维维柱柱形形图图,只只要要主主对对角角线线上上两两个个柱柱形形高高度度的的比比值值与与副副对对角角线线上上的的两两个个柱柱形形高高度度的的比比值值相相差差越越大大,H H成成立的可能性就越大立的可能性就越大.其中真命题的个数是(其中真命题的个数是()A.1 B.2 C.3A.1 B.2 C.3D.4D.4 第39页/共62

25、页其中真命题的个数是其中真命题的个数是()A.1A.1B.2B.2C.3C.3D.4D.4解析解析 r r有正负,应为有正负,应为|r r|越大,相关性越强越大,相关性越强.正确正确.R R2 2越大,拟合效果越好越大,拟合效果越好.应为高度积的差的绝对值越大,应为高度积的差的绝对值越大,H H成立的可能性就成立的可能性就越大,故选越大,故选A.A.A第40页/共62页2.2.对两个变量对两个变量y y与与x x进行回归分析,分别选择不同的模型,进行回归分析,分别选择不同的模型,它们的相关系数它们的相关系数r r如下,其中拟合效果最好的模型是如下,其中拟合效果最好的模型是()A.A.模型模型的

26、相关系数的相关系数r r为为0.980.98 B.B.模型模型的相关系数的相关系数r r为为0.800.80 C.C.模型模型的相关系数的相关系数r r为为0.500.50 D.D.模型模型的相关系数的相关系数r r为为0.250.25 解析解析 根据相关系数的定义和计算公式可知,根据相关系数的定义和计算公式可知,|r r|1 1,且,且|r r|越接近于越接近于1 1,相关程度越大,拟合效果,相关程度越大,拟合效果越好;越好;|r r|越接近于越接近于0 0,相关程度越小,拟合效果,相关程度越小,拟合效果越弱越弱,所以所以A A正确正确.A第41页/共62页3.3.下列说法:下列说法:将将一

27、一组组数数据据中中的的每每个个数数据据都都加加上上或或减减去去同同一一个个常数后,方差恒不变;常数后,方差恒不变;设设有有一一个个回回归归方方程程 =3-5=3-5x x,变变量量x x增增加加一一个个单单位时,位时,y y平均增加平均增加5 5个单位;个单位;线性回归方程线性回归方程 必过点(必过点(,););曲线上的点与该点的坐标之间具有相关关系;曲线上的点与该点的坐标之间具有相关关系;在在一一个个2222列列联联表表中中,由由计计算算得得K K2 2=13.079=13.079,则则其两个变量间有关系的可能性是其两个变量间有关系的可能性是90%.90%.其中错误的个数是其中错误的个数是(

28、)A.1A.1B.2B.2C.3C.3D.4D.4第42页/共62页解析解析 根据方差的计算公式,可知根据方差的计算公式,可知正确;由线性正确;由线性回归方程的定义及最小二乘法的思想,知回归方程的定义及最小二乘法的思想,知正确,正确,不正确不正确.答案答案 C C第43页/共62页4.4.下面是下面是2222列联表:列联表:y y1 1 y y2 2 合计合计x x1 1a a 2121 7373x x2 2 2222 2525 4747 合计合计 b b 4646 120120 则表中则表中a a,b b的值分别为的值分别为()A.94,72A.94,72B.52,50B.52,50C.52

29、,74C.52,74D.74,52D.74,52解析解析 a a+21=73+21=73,a a=52.=52.又又a a+22=+22=b b,b b=74.=74.C第44页/共62页二、填空题二、填空题6.6.为了判断高中三年级学生是否选修文科与性别的关系,为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取现随机抽取5050名学生,得到如下名学生,得到如下2222列联表:列联表:理科理科 文科文科男男1313 1010女女 7 72020已知已知P P(K K2 23.8413.841)0.050.05,P P(K K2 25.0245.024)0.025.0.025.根据表中数

30、据,得到根据表中数据,得到则认为选修文科与性别有关系出错的可能性约为则认为选修文科与性别有关系出错的可能性约为 .第48页/共62页 解析解析 K K2 24.8444.844,这表明小概率事件发生,这表明小概率事件发生.根据根据假设检验的基本原理,应该断定假设检验的基本原理,应该断定“是否选修文科是否选修文科 与性别之间有关系与性别之间有关系”成立,并且这种判断出错的成立,并且这种判断出错的 可能性约为可能性约为5%.5%.答案答案 5%5%7.7.某医疗研究所为了检验某种血清预防感冒的作用,某医疗研究所为了检验某种血清预防感冒的作用,把把500500名使用血清的人与另外名使用血清的人与另外

31、500500名未用血清的人名未用血清的人 一年中的感冒记录作比较,提出假设一年中的感冒记录作比较,提出假设H H0 0:“这种这种 血清不能起到预防感冒的作用血清不能起到预防感冒的作用”,利用,利用2222列联列联 表计算得表计算得K K2 23.918,3.918,经查对临界值表知经查对临界值表知P P(K K2 2 3.841 3.841)0.05.0.05.对此,四名同学作出了以下的判断:对此,四名同学作出了以下的判断:第49页/共62页p p:有有95%95%的把握认为的把握认为“这种血清能起到预防感冒的作这种血清能起到预防感冒的作用用”;q q:若某人未使用该血清,那么他在一年中有若

32、某人未使用该血清,那么他在一年中有95%95%的可的可能性得感冒;能性得感冒;r r:这种血清预防感冒的有效率为这种血清预防感冒的有效率为95%95%;s s:这种血清预防感冒的有效率为这种血清预防感冒的有效率为5%.5%.则下列结论中,正确结论的序号是则下列结论中,正确结论的序号是 .(把(把你认为正确的命题序号都填上)你认为正确的命题序号都填上)p p q q p pq q (p p q q)()(r rs s)(p p r r)()(q qs s)第50页/共62页 解析解析 本题考查了独立性检验的基本思想及常用本题考查了独立性检验的基本思想及常用 逻辑用语逻辑用语.由题意,得由题意,得

33、K K2 23.9183.918,P P(K K2 23.8413.841)0.050.05,所以,只有第一位同学的判断正确,即,所以,只有第一位同学的判断正确,即 有有95%95%的把握认为的把握认为“这种血清能起到预防感冒的作这种血清能起到预防感冒的作 用用”.由真值表知由真值表知为真命题为真命题.答案答案 第51页/共62页9.9.对对196196个个接接受受心心脏脏搭搭桥桥手手术术的的病病人人和和196196个个接接受受血血管管清清障障手手术术的的病病人人进进行行了了3 3年年的的跟跟踪踪研研究究,调调查查他们是否又发作过心脏病,调查结果如下表所示:他们是否又发作过心脏病,调查结果如下

34、表所示:又发作过又发作过 心脏病心脏病 未发作过未发作过 心脏病心脏病 合计合计心脏搭心脏搭桥手术桥手术39 39 157 157 196 196 血管清血管清障手术障手术 29 29 167 167 196 196 合计合计 68 68 324 324 392 392 第52页/共62页试根据上述数据计算试根据上述数据计算K K2 2=.(保留两位小数)(保留两位小数)比较这两种手术对病人又发作心脏病的影响有没有比较这两种手术对病人又发作心脏病的影响有没有差别差别.解析解析 提出假设提出假设H H0 0:两种手术对病人又发作心脏病:两种手术对病人又发作心脏病的影响没有差别的影响没有差别.根据

35、列联表中的数据,可以求得根据列联表中的数据,可以求得当当H H0 0成立时成立时K K2 21.781.78,而,而K K2 22.0722.072的概率为的概率为0.85.0.85.所以,不能否定假设所以,不能否定假设H H0 0.也就是不能作出这两种手术也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论对病人又发作心脏病的影响有差别的结论.第53页/共62页答案答案 1.781.78不能作出这两种手术对病人又发作心脏病的影响有不能作出这两种手术对病人又发作心脏病的影响有差别的结论差别的结论三、解答题三、解答题10.10.在一次飞机航程中调查男女乘在一次飞机航程中调查男女乘 客的晕

36、机情况,其二维条形图客的晕机情况,其二维条形图 如图:如图:(1 1)写出)写出2222列联表;列联表;(2 2)判断晕机与性别是否有关?)判断晕机与性别是否有关?第54页/共62页 11.11.对某校学生进行心理障碍测试得到如下列联表对某校学生进行心理障碍测试得到如下列联表.焦虑焦虑 说谎说谎 懒惰懒惰总计总计 女生女生 5 5 10 10 15 15 30 30 男生男生 20 20 10 10 50 50 80 80 总计总计 25 25 20 20 65 65 110 110 试说明在这三种心理障碍中哪一种与性别关系最大?试说明在这三种心理障碍中哪一种与性别关系最大?第56页/共62页

37、解解 对于上述三种心理障碍分别构造三个随机变量对于上述三种心理障碍分别构造三个随机变量由表中数据可得由表中数据可得所以没有充分的证明显示焦虑与性别有关,所以没有充分的证明显示焦虑与性别有关,有有97.5%97.5%的把握认为说谎与性别有关,的把握认为说谎与性别有关,没有充分的证明显示懒惰与性别有关没有充分的证明显示懒惰与性别有关.第57页/共62页12.12.某农科所对冬季昼夜温差大小与某反季节大豆新某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分品种发芽多少之间的关系进行分析研究,他们分别记录了别记录了1212月月1 1日至日至1212月月5 5日的每天昼

38、夜温差与实日的每天昼夜温差与实验室每天每验室每天每100100颗种子中的发芽数,得到如下资料:颗种子中的发芽数,得到如下资料:日期日期 1212月月1 1日日 1212月月2 2日日 1212月月3 3日日 1212月月4 4日日 1212月月5 5日日日温差日温差x x()()1010 11111313 1212 8 8 发芽数发芽数y y(颗)(颗)2323 25253030 2626 1616第58页/共62页 该该农农科科所所确确定定的的研研究究方方案案是是:先先从从这这五五组组数数据据中中选选取取2 2组组,用用剩剩下下的的3 3组组数数据据求求线线性性回回归归方方程程,再再对被选取

39、的对被选取的2 2组数据进行检验组数据进行检验.(1 1)求求选选取取的的2 2组组数数据据恰恰好好是是不不相相邻邻2 2天天数数据据的的概概率;率;(2 2)若若选选取取的的是是1212月月1 1日日与与1212月月5 5日日的的两两组组数数据据,请请根根据据1212月月2 2日日至至1212月月4 4日日的的数数据据,求求出出y y关关于于x x的的线性回归方程线性回归方程 (3 3)若若由由线线性性回回归归方方程程得得到到的的估估计计数数据据与与所所选选出出的的检检验验数数据据的的误误差差均均不不超超过过2 2颗颗,则则认认为为得得到到的的线线性性回回归归方方程程是是可可靠靠的的,试试问

40、问(2 2)中中所所得得到到的的线性回归方程是否可靠?线性回归方程是否可靠?第59页/共62页 解解 (1 1)设设抽抽到到不不相相邻邻的的两两组组数数据据为为事事件件A A,因因为为从从5 5组组数数据据中中选选取取2 2组组数数据据共共有有1010种种情情况况:(1 1,2 2)(1 1,3 3)(1 1,4 4)(1 1,5 5)(2 2,3 3)(2 2,4 4)(2 2,5 5)(3 3,4 4)(3 3,5 5)(4 4,5 5),其其中中数数据据为为1212月份的日期数月份的日期数.每每种种情情况况都都是是可可能能出出现现的的,事事件件A A包包括括的的基基本本事事件件有有6 6种种.所以所以P P(A A)=所以选取的所以选取的2 2组数据恰好是不组数据恰好是不 相邻相邻2 2天数据的概率是天数据的概率是第60页/共62页(2 2)由数据,求得)由数据,求得 =12=12,=27.=27.由公式,求得由公式,求得所以所以y y关于关于x x的线性回归方程为的线性回归方程为(3 3)当)当x x=10=10时,时,同样,当同样,当x x=8=8时,时,所以,该研究所得到的回归方程是可靠的所以,该研究所得到的回归方程是可靠的.返回返回 第61页/共62页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁