《全国新课标高考数学大二轮复习专题整合突破专题七概率与统计第二讲统计与统计案例适考素能特训文_中学教育-高考.pdf》由会员分享,可在线阅读,更多相关《全国新课标高考数学大二轮复习专题整合突破专题七概率与统计第二讲统计与统计案例适考素能特训文_中学教育-高考.pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、学习必备 欢迎下载 专题七 概率与统计 第二讲 统计与统计案例适考素能特训 文 一、选择题 12016兰州双基测试 某乡政府调查A、B、C、D四个村的村民外出打工的情况,拟采用分层抽样的方法从四个村中抽取一个容量为 500 的样本进行调查已知A、B、C、D四个村的人数之比为 4556,则应从C村中抽取的村民人数为()A100 B125 C150 D175 答案 B 解析 由题意可知,应从C村中抽取 50054556125 名村民 2 2016湖北武汉第二次调研 如图是依据某城市年龄在 20 岁到 45 岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在30,35),35,40),40,4
2、5)的上网人数呈现递减的等差数列分布,则年龄在35,40)的网民出现的频率为()A0.04 B0.06 C0.2 D0.3 答案 C 解析 由频率分布直方图的知识得,年龄在20,25)的频率为 0.015 0.05,25,30)的频率为 0.075 0.35,设年龄在30,35),35,40),40,45 的频率为x,y,z,又x,y,z成等差数列,所以可得 xyz10.05 0.35,xz2y,解得y0.2,所以年龄在35,40)的网民出现的频率为 0.2.故选 C.32016开封一模 下列说法错误的是()A 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系 B在
3、线性回归分析中,相关系数r的值越大,变量间的相关性越强 C在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高 D在回归分析中,R2为 0.98 的模型比R2为 0.80 的模型拟合的效果好 学习必备 欢迎下载 答案 B 解析 根据相关关系的概念知A正确;当r0 时,r越大,相关性越强,当r0 时,r越大,相关性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好二是R2越大,拟合效果越好,所以R2为 0.98 的模型比R2为 0.80 的模型拟合的效果好,C,D正确,故选 B.4 2016河南郑州二模 某工厂为了对新研发的一种产品进行
4、合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价(元)4 5 6 7 8 9 销量(件)90 84 83 80 75 68 由表中数据,求得线性回归方程y4xa,若在这些样本点中任取一点,则它在回归直线左下方的概率为()A.16 B.13 C.12 D.23 答案 B 解析 由表中数据得x6.5,y80.由(x,y)在直线y4xa上,得a106.即线性回归方程为y4x106.经过计算只有(5,84)和(9,68)在直线的下方,故所求概率为2613,选 B.52016湖南永州一模 为大力提倡“厉行节约,反对浪费”,某市通过随机询问 100名性别不同的居民是否能做到“光盘”行动,得到
5、如下的列联表:做不到“光盘”能做到“光盘”男 45 10 女 30 15 附:P(K2k)0.10 0.05 0.025 k 2.706 3.841 5.024 K2nadbc2abcdacbd.参照附表,得到的正确结论是()A 在犯错误的概率不超过 1%的前提下,认为“该市居民能否做到光盘与性别有关”B 在犯错误的概率不超过 1%的前提下,认为“该市居民能否做到光盘与性别无关”C有 90%以上的把握认为“该市居民能否做到光盘与性别有关”D有 90%以上的把握认为“该市居民能否做到光盘与性别无关”四个村的村民外出打工的情况拟采用分层抽样的方法从四个村中抽取一个容量为的样本进行调查已知四个村的人
6、数之比为则应从村中抽取的村民人数为答案解析由题意可知应从村中抽取名村民湖北武汉第二次调研如图是依据某城市龄在的网民出现的频率为答案解析由频率分布直方图的知识得年龄在的频率为的频率为设年龄在的频率为又成等数列所以可得解得所以年龄在的网民出现的频率为故选开封一模下列说法错误的是自变量取值一定时因变量的取值带有中残点分布的带状区域的宽度越狭窄其模型拟合的精度越高在回归分析中为的模型比为的模型拟合的效果好学习必备欢迎下载答案解析根据相关关系的概念知正确当时越大相关性越强当时越大相关性越弱故不正确对于一组数据的拟学习必备 欢迎下载 答案 C 解析 由题设知,a45,b10,c30,d15,所以K2255
7、4575253.0303.27063.03033.841.由附表可知,有 90%以上的把握认为“该市居民能否做到光盘与性别有关”,故选C.二、填空题 62016石家庄质检二 将高三(1)班参加体检的 36 名学生,编号为:1,2,3,36,若采用系统抽样的方法抽取一个容量为 4 的样本,已知样本中含有编号为 6、24、33 的学生,则样本中剩余一名学生的编号是_ 答案 15 解析 根据系统抽样的特点可知抽取的 4 名学生的编号依次成等差数列,故剩余一名学生的编号是 15.7 2015豫北十校联考 20XX年的NBA全明星赛于北京时间 20XX年 2 月 14 日举行 如图是参加此次比赛的甲、乙
8、两名篮球运动员以往几场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是_ 答案 64 解析 应用茎叶图的知识得,甲、乙两人这几场比赛得分的中位数分别为 28,36,因此甲、乙两人这几场比赛得分的中位数之和是 64.82016吉林通化月考 某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:广告费用x(万元)3 4 5 6 销售额y(万元)25 30 40 45 根据上表可得回归方程ybxa中的b为7.据此模型预测广告费用为10万元时销售额为_万元 答案 73.5 解析 由题表可知,x4.5,y35,代入回归方程y7xa,得a3.5,所以回归四个村的村民外出打工的情况拟采用分
9、层抽样的方法从四个村中抽取一个容量为的样本进行调查已知四个村的人数之比为则应从村中抽取的村民人数为答案解析由题意可知应从村中抽取名村民湖北武汉第二次调研如图是依据某城市龄在的网民出现的频率为答案解析由频率分布直方图的知识得年龄在的频率为的频率为设年龄在的频率为又成等数列所以可得解得所以年龄在的网民出现的频率为故选开封一模下列说法错误的是自变量取值一定时因变量的取值带有中残点分布的带状区域的宽度越狭窄其模型拟合的精度越高在回归分析中为的模型比为的模型拟合的效果好学习必备欢迎下载答案解析根据相关关系的概念知正确当时越大相关性越强当时越大相关性越弱故不正确对于一组数据的拟学习必备 欢迎下载 方程为y
10、7x3.5.所以当x10 时,y7103.5 73.5.三、解答题 92016河北三市二联 下表是高三某位文科生连续 5 次月考的历史、政治的成绩,结果统计如下:月份 9 10 11 12 1 历史(x分)79 81 83 85 87 政治(y分)77 79 79 82 83(1)求该生 5 次月考历史成绩的平均分和政治成绩的方差;(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x、y的线性回归方程ybxa.附:bi1n xixyiyi1n xix2i1nxiyin x yi1nx2in x2,ayb x 解(1)x15(79 81838587)83
11、,y15(77 79798283)80,s2y15(77 80)2(79 80)2(79 80)2(82 80)2(83 80)2 4.8.(2)i15(xix)(yiy)30,i15(xix)240,b0.75,ayb x17.75.则所求的线性回归方程为y0.75x17.75.102016江淮十校一联 某学校在高一、高二两个年级学生中各抽取 100 人的样本,进行普法知识调查,其结果如下表:高一 高二 总数 合格人数 70 x 150 不合格人数 y 20 50 总数 100 100 200(1)求x,y的值;(2)有没有 99%的把握认为“高一、高二两个年级这次普法知识调查结果有差异”;
12、(3)用分层抽样的方法从样本的不合格同学中抽取 5 人的辅导小组,在 5 人中随机选 2四个村的村民外出打工的情况拟采用分层抽样的方法从四个村中抽取一个容量为的样本进行调查已知四个村的人数之比为则应从村中抽取的村民人数为答案解析由题意可知应从村中抽取名村民湖北武汉第二次调研如图是依据某城市龄在的网民出现的频率为答案解析由频率分布直方图的知识得年龄在的频率为的频率为设年龄在的频率为又成等数列所以可得解得所以年龄在的网民出现的频率为故选开封一模下列说法错误的是自变量取值一定时因变量的取值带有中残点分布的带状区域的宽度越狭窄其模型拟合的精度越高在回归分析中为的模型比为的模型拟合的效果好学习必备欢迎下
13、载答案解析根据相关关系的概念知正确当时越大相关性越强当时越大相关性越弱故不正确对于一组数据的拟学习必备 欢迎下载 人,这 2 人中,正好高一、高二各 1 人的概率为多少?参考公式:2nadbc2abcdacbd 2 5.024 6.635 7.879 10.828 97.5%99%99.5%99.9%解(1)x80,y30.(2)由(1)得 22150501001002.676.635,所以没有 99%的把握认为“高一、高二两个年级这次普法知识调查结果有差异”(3)由分层抽样得从高一抽取 3 人,设为A,B,C,从高二抽取 2 人,设为 1,2.从 5 人中选 2 人,有(AB),(AC),(
14、A1),(A2),(BC),(B1),(B2),(C1),(C2),(12),共 10 种选法 其中正好高一、高二各 1 人,有(A1),(A2),(B1),(B2),(C1),(C2),共 6 种选法 所以所求概率为P35.112016重庆测试 从甲、乙两部门中各任选 10 名员工进行职业技能测试,测试成绩(单位:分)数据的茎叶图如图 1 所示:(1)分别求出甲、乙两组数据的中位数,并比较两组数据的分散程度(只需给出结论);(2)甲组数据频率分布直方图如图 2 所示,求a、b、c的值;(3)从甲、乙两组数据中各任取一个,求所取两数之差的绝对值大于 20 的概率 解(1)甲组数据的中位数为78
15、79278.5,乙组数据的中位数为7582278.5.从茎叶图可以看出,甲组数据比较集中,乙组数据比较分散(2)由图易知a0.05,b0.02,c0.01.(3)从甲、乙两组数据中各任取一个,得到的所有基本事件共有 100 个,其中满足“两数之差的绝对值大于 20”的基本事件有 16 个,故所求概率P16100425.12为了调查学生星期天晚上学习时间的利用问题,某校从高二年级 1000 名学生(其中走读生 450 名,住宿生 550 名)中,采用分层抽样的方法抽取n名学生进行问卷调查根据问四个村的村民外出打工的情况拟采用分层抽样的方法从四个村中抽取一个容量为的样本进行调查已知四个村的人数之比
16、为则应从村中抽取的村民人数为答案解析由题意可知应从村中抽取名村民湖北武汉第二次调研如图是依据某城市龄在的网民出现的频率为答案解析由频率分布直方图的知识得年龄在的频率为的频率为设年龄在的频率为又成等数列所以可得解得所以年龄在的网民出现的频率为故选开封一模下列说法错误的是自变量取值一定时因变量的取值带有中残点分布的带状区域的宽度越狭窄其模型拟合的精度越高在回归分析中为的模型比为的模型拟合的效果好学习必备欢迎下载答案解析根据相关关系的概念知正确当时越大相关性越强当时越大相关性越弱故不正确对于一组数据的拟学习必备 欢迎下载 卷取得了这n名同学星期天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组
17、:0,30),30,60),60,90),90,120),120,150),150,180),180,210),210,240),得到频率分布直方图如图,已知抽取的学生中星期天晚上学习时间少于 60分钟的人数为 5 人 (1)求n的值并补全频率分布直方图;(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列 22 列联表:利用时间充分 利用时间不充分 总计 走读生 住宿生 10 总计 据此资料,是否有 95%的把握认为学生“利用时间是否充分”与走读、住宿有关?(3)若在第组、第组共抽出 2 人调查影响有效利用时间的原因,求抽出的 2 人中第组、第组各
18、有 1 人的概率 参考数据:P(K2k)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 参考公式:K2nn11n22n12n212n1n2n1n2 解(1)设第i组的频率为Pi(i1,2,8),由图可知P111500302100,P211000303100,学习时间少于 60 分钟的频率为P1P25100,四个村的村民外出打工的情况拟采用分层抽样的方法从四个村中抽取一个容量为的样本进行调查已知四个村的人数之比为则应从村中抽取的村民人数为答案解析由题意可知应从村中抽取名村民湖北
19、武汉第二次调研如图是依据某城市龄在的网民出现的频率为答案解析由频率分布直方图的知识得年龄在的频率为的频率为设年龄在的频率为又成等数列所以可得解得所以年龄在的网民出现的频率为故选开封一模下列说法错误的是自变量取值一定时因变量的取值带有中残点分布的带状区域的宽度越狭窄其模型拟合的精度越高在回归分析中为的模型比为的模型拟合的效果好学习必备欢迎下载答案解析根据相关关系的概念知正确当时越大相关性越强当时越大相关性越弱故不正确对于一组数据的拟学习必备 欢迎下载 由题意得n51005,n100.又P31375308100,P511003030100,P611203025100,P712003015100,P
20、81600305100,P41(P1P2P3P5P6P7P8)12100,第组的高度为h121001301230001250,频率分布直方图如图 (2)由频率分布直方图可知,在抽取的 100 人中,“住宿生”有 55 人,“走读生”有 45人,利用时间不充分的有 100(P1P2P3P4)25 人,从而 22 列联表如下:利用时间充分 利用时间不充分 总计 走读生 30 15 45 住宿生 45 10 55 总计 75 25 100 将 22 列联表中的数据代入公式计算,得K2nn11n22n12n212n1n2n1n2245557525 375210046406253.030.3.0303.
21、841,没有理由认为学生“利用时间是否充分”与走读、住宿有关(3)由题可知第组人数为 100P12(人),第组人数为 100P23(人),四个村的村民外出打工的情况拟采用分层抽样的方法从四个村中抽取一个容量为的样本进行调查已知四个村的人数之比为则应从村中抽取的村民人数为答案解析由题意可知应从村中抽取名村民湖北武汉第二次调研如图是依据某城市龄在的网民出现的频率为答案解析由频率分布直方图的知识得年龄在的频率为的频率为设年龄在的频率为又成等数列所以可得解得所以年龄在的网民出现的频率为故选开封一模下列说法错误的是自变量取值一定时因变量的取值带有中残点分布的带状区域的宽度越狭窄其模型拟合的精度越高在回归
22、分析中为的模型比为的模型拟合的效果好学习必备欢迎下载答案解析根据相关关系的概念知正确当时越大相关性越强当时越大相关性越弱故不正确对于一组数据的拟学习必备 欢迎下载 记第组的 2 人为A1,A2,第组的 3 人为B1,B2,B3,则“从 5 人中抽取 2 人”所构成的基本事件有A1A2,A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,B1B2,B1B3,B2B3”,共 10 个基本事件;记“抽取 2 人中第组、第组各有 1 人”记作事件A,则事件A所包含的基本事件有A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,共 6 个基本事件,P(A)61035,即抽出的 2 人中第
23、组、第组各有 1 人的概率为35.四个村的村民外出打工的情况拟采用分层抽样的方法从四个村中抽取一个容量为的样本进行调查已知四个村的人数之比为则应从村中抽取的村民人数为答案解析由题意可知应从村中抽取名村民湖北武汉第二次调研如图是依据某城市龄在的网民出现的频率为答案解析由频率分布直方图的知识得年龄在的频率为的频率为设年龄在的频率为又成等数列所以可得解得所以年龄在的网民出现的频率为故选开封一模下列说法错误的是自变量取值一定时因变量的取值带有中残点分布的带状区域的宽度越狭窄其模型拟合的精度越高在回归分析中为的模型比为的模型拟合的效果好学习必备欢迎下载答案解析根据相关关系的概念知正确当时越大相关性越强当时越大相关性越弱故不正确对于一组数据的拟