《第十六章第3讲回归分析与独立性检验.ppt》由会员分享,可在线阅读,更多相关《第十六章第3讲回归分析与独立性检验.ppt(25页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、考纲要求考纲研读1.了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题2.独立检验了解独立性检验(只要求 22 列联表)的基本思想、方法及其简单应用3.回归分析了解回归的基本思想、方法及其简单应用.在回归分析与独立性检验中(1)利用最小二乘法求出线性回归直线(2)利用独立性检验判断两个变量是否有关第3讲回归分析与独立性检验1回归分析相关关系(1)定义:对具有_的两个变量进行统计分析的方法(2)回归分析的步骤:确定研究对象,明确解释变量和预报变量;画出散点图,观察它们是否存在相关关系(如线性相关关系);按一般规则估计回归方程中的参数(如最小二乘法);得出结果后分析残差图是否异常,若存在
2、异常,则检验数据是否有误,模型是否恰当2独立性检验没有关系(1)假设 H0:两个分类变量 X 和 Y_;(2)利用公式,计算出随机变量 K2_.其中用到两个分类变量 X 和 Y 的频数表,即 22 列联表:(3)用 K2 的大小通过查表可以决定是否拒绝原来的统计假设H0,若 K2 的值较大,就拒绝 H0,即拒绝 X 和 Y 无关.例如:当 K23.841 时,则有 95%的把握说 X 和 Y 有关当 K26.635 时,则有 99%的把握说 X 和 Y 有关)C1在两个变量的回归分析中,作散点图是为了(A直接求出回归直线方程B直接求出回归方程C根据经验选定回归方程的类型D估计回归方程的参数2在
3、画两个变量的散点图时,下面哪个叙述是正确的()BA预报变量在 x 轴上,解释变量在 y 轴上B解释变量在 x 轴上,预报变量在 y 轴上C可以选择两个变量中任意一个变量在 x 轴上D可以选择两个变量中任意一个变量在 y 轴上3对于事件 A 和事件 B,通过计算得到 K2 的观测值 k4.325,下列说法正确的是()BA有 99%以上的把握说事件 A 和事件 B 有关B有 95%以上的把握说事件 A 和事件 B 有关C有 99%以上的把握说事件 A 和事件 B 无关D有 95%以上的把握说事件 A 和事件 B 无关4下面是一个 22 列联表:则表中 a,b 的值分别为_.10,30 x0123y
4、13575已知 x 与 y 之间的一组数据:(1.5,4)则 y 与 x 的线性回归方程为 ybxa 必过点_零件的个数 x(个)2345加工的时间 y(小时)2.5344.5考点1 回归分析例1:某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:由资料知 y 对 x 呈线性关系(2)试预测加工 10 个零件需要多少时间?41422144iiiiix yxyxxx3456y2.5t44.5【互动探究】1(2010 年广东揭阳二模)下表提供了某厂节能降耗技术改造后生产 A 产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对应数据根据下表提
5、供的数据,求出 y 关于 x 的线性回归方程为 0.7x0.35,那么表中 t 的值为()AA.3B3.15C3.5D4.5杂质高杂质低旧设备37121新设备22202考点2独立性检验例2:冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示:根据以上数据试判断含杂质的高低与设备改造有无关系?杂质高杂质低总计旧设备37121158新设备22202224总计59323382由公式得K2 提出假设H0:含杂质的高低与设备改造没有关系382(3720212122)21582245932313.11.由于13.1110.828,故有99.9%的把
6、握认为含杂质的高低与设备是否改造是有关系的解析:由已知数据得到如下 22 列联表:两个分类变量X,Y 是否有关系的独立性检验的步骤:根据题意,列出22 列联表;提出假设利用公式,由观测数据,求出K2 的观测值 k;作判断,如果kk0,就以1P(K2k0)100%的把握认为“X 和 Y 有关系”否则就说样本数据没有提供充分的证据说明“X 和 Y 有关系”冷漠不冷漠总计多看电视6842110少看电视203858总计8880168【互动探究】2有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则大约有多大的把握认为多看电视与人变冷漠有关系( )AA99.9%B97.5%C95%
7、D90%喜爱运动不喜爱运动总计男1016女614总计30考点3独立性检验与概率的结合例3:第 16 届亚运会于 2010 年 11 月 12 日至 27 日在中国广州进行,为了搞好接待工作,组委会招募了 16 名男志愿者和 14名女志愿者,调查发现,男、女志愿者中分别有 10 人和 6 人喜爱运动,其余不喜爱(1)根据以上数据完成以下 22 列联表:P(K2 k0)0.400.250.100.010k00.7081.3232.7066.635参考公式:K (2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10 的前提下认为性别与喜爱运动有关?(3)如果从喜欢运动的女志愿者中(其中恰有
8、4 人会外语),抽取2 名负责翻译工作,则抽出的志愿者中 2 人都能胜任翻译工作的概率是多少?2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd.参考数据:喜爱运动 不喜爱运动总计男10616女6814总计161430解析:(1) 完成 22 列联表如下:(2)假设:是否喜爱运动与性别无关,由已知数据可求得:K230(10866)2(106)(68)(106)(68)1.157 57.879.614713当H0 成立时,P(K27.879)0.005.所以我们有99.5%的把握认为:学生的数学成绩与物理成绩之间有关系.(3)由(1)可知数学成绩与物理成绩都优秀的学生的人数为
9、5人,则数学成绩与物理成绩至少有一门不优秀的学生人数为 15 人故从 20 名学生中抽出 1 名,抽到的学生数学成绩与物理成绩至少1独立性检验的思想来自于统计上的假设检验思想,它与反证法类似,它们都是先假设结论不成立,然后根据是否能推出“矛盾”来判定结论是否成立但二者“矛盾”的含义不同,反证法中的“矛盾”是指不符合逻辑的事件发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件发生,即在结论不成立的假设下推出有利于结论成立的小概率事件的发生2独立事件没有直观性,必须依靠 K2 的观测值 k 作判断独立性检验的随机变量 K22.706 是判断是否有关系的临界值,K22.706 应判断为没有充分证据显示 X 与 Y 有关系,而不能作为小于 90%的量化值来判断