《必修三统计高考真题.doc》由会员分享,可在线阅读,更多相关《必修三统计高考真题.doc(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流必修三统计高考真题【精品文档】第 18 页2017年04月19日的高中数学组卷一选择题(共11小题)1为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为()A11.4万元B11.8万元C12.0万元D12.2万元2已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是()A=0.4x+2.3B=2x
2、2.4C=2x+9.5D=0.3x+4.43根据如下样本数据,得到回归方程=bx+a,则()x345678y4.02.50.50.52.03.0Aa0,b0Ba0,b0Ca0,b0Da0,b04某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A抽签法B系统抽样法C分层抽样法D随机数法5根据如图给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效C2006年以来我
3、国二氧化硫年排放量呈减少趋势D2006年以来我国二氧化硫年排放量与年份正相关6重庆市2013年各月的平均气温()数据的茎叶图如,则这组数据的中位数是()A19B20C21.5D237在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A3B4C5D68若样本数据x1,x2,x10的标准差为8,则数据2x11,2x21,2x101的标准差为()A8B15C16D329为了研究某药品的疗效,选取若干名志愿者进行临床试验所有志愿者的舒张压数据(单位:kPa)的分组区间
4、为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组如图是根据试验数据制成的频率分布直方图已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A6B8C12D1810某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()A11B12C13D1411一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人为了解职工收入情况,决定采用分层
5、抽样的方法,从中抽取容量为40的样本则从上述各层中依次抽取的人数分别是()A12,24,15,9B9,12,12,7C8,15,12,5D8,16,10,6二解答题(共7小题)12某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值(xi)2(wi)2(xi)(yi)(wi)(yi)46.65636.8289.81.61469108.8表中wi=i,=()根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量
6、y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)()根据()的判断结果及表中数据,建立y关于x的回归方程;()已知这种产品的年利润z与x、y的关系为z=0.2yx根据()的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1 v1),(u2 v2).(un vn),其回归线v=+u的斜率和截距的最小二乘估计分别为:=,=13如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20082014(1)由折线图看出,可用线性回归模型拟合y与t的
7、关系,请用相关系数加以证明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量附注:参考数据:yi=9.32,tiyi=40.17,=0.55,2.646参考公式:r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为:14某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9()求y关于t的线性回归方程;()利用()中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情
8、况,并预测该地区2015年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=15从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得,()求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;()判断变量x与y之间是正相关还是负相关;()若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程y=bx+a中,其中,为样本平均值,线性回归方程也可写为16我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数
9、据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图(I)求直方图中的a值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数说明理由;()估计居民月均用水量的中位数17某城市100户居民的月平均用电量(单位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300)分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,220,240),240,260),260,280),280,300)的四组用户中,用分层抽样的方法
10、抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?18某工厂36名工人年龄数据如图:工人编号年龄工人编号年龄工人编号年龄工人编号年龄123456789404440413340454243101112131415161718363138394345393836192021222324252627274341373442374442282930313233343536343943384253374939(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值和方差s2;(3)36名工人中
11、年龄在s和+s之间有多少人?所占百分比是多少(精确到0.01%)?2017年04月19日的高中数学组卷参考答案与试题解析一选择题(共11小题)1(2015福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为()A11.4万元B11.8万元C12.0万元D12.2万元【解答】解:由题意可得=(8.2+8.6+10.0+11.3+11.9)=10,=(6.2+7.5+8.0+8.5+9
12、.8)=8,代入回归方程可得=80.7610=0.4,回归方程为=0.76x+0.4,把x=15代入方程可得y=0.7615+0.4=11.8,故选:B2(2014重庆)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是()A=0.4x+2.3B=2x2.4C=2x+9.5D=0.3x+4.4【解答】解:变量x与y正相关,可以排除C,D;样本平均数=3,=3.5,代入A符合,B不符合,故选:A3(2014湖北)根据如下样本数据,得到回归方程=bx+a,则()x345678y4.02.50.50.52.03.0Aa0,b0Ba0,b0Ca0,b
13、0Da0,b0【解答】解:由题意可知:回归方程经过的样本数据对应的点附近,是减函数,所以b0,且回归方程经过(3,4)与(4,3.5)附近,所以a0故选:B4(2015四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A抽签法B系统抽样法C分层抽样法D随机数法【解答】解:我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,这种方式具有代表性,比较合理故选:C5(2015新课标)根据如图给出的2004年至20
14、13年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效C2006年以来我国二氧化硫年排放量呈减少趋势D2006年以来我国二氧化硫年排放量与年份正相关【解答】解:A从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量明显减少,且减少的最多,故A正确;B20042006年二氧化硫排放量越来越多,从2007年开始二氧化硫排放量变少,故B正确;C从图中看出,2006年以来我国二氧化硫年排放量越来越少,故C正确;D2006年以来我国二氧化硫年排放量越来越少,而不是与年份正相关,故D
15、错误故选:D6(2015重庆)重庆市2013年各月的平均气温()数据的茎叶图如,则这组数据的中位数是()A19B20C21.5D23【解答】解:样本数据有12个,位于中间的两个数为20,20,则中位数为,故选:B7(2015湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A3B4C5D6【解答】解:由已知,将个数据分为三个层次是130,138,139,151,152,153,根据系统抽样方法从中抽取7人,得到抽取比例为,所以成绩在区间139,151中共
16、有20名运动员,抽取人数为20=4;故选B8(2015安徽)若样本数据x1,x2,x10的标准差为8,则数据2x11,2x21,2x101的标准差为()A8B15C16D32【解答】解:样本数据x1,x2,x10的标准差为8,=8,即DX=64,数据2x11,2x21,2x101的方差为D(2X1)=4DX=464,则对应的标准差为=16,故选:C9(2014山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组如图是根据试
17、验数据制成的频率分布直方图已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A6B8C12D18【解答】解:由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人故选:C10(2013陕西)某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()A11B12C13D14【解答】解:使
18、用系统抽样方法,从840人中抽取42人,即从20人抽取1人所以从编号1480的人中,恰好抽取=24人,接着从编号481720共240人中抽取=12人故:B11(2010四川)一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本则从上述各层中依次抽取的人数分别是()A12,24,15,9B9,12,12,7C8,15,12,5D8,16,10,6【解答】解:因为=,故各层中依次抽取的人数分别是=8,=16,=10,=6,故选D二解答题(共7小题)12(2015新课标
19、)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值(xi)2(wi)2(xi)(yi)(wi)(yi)46.65636.8289.81.61469108.8表中wi=i,=()根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)()根据()的判断结果及表中数据,建立y关于x的回归方程;()已知这种产品的年利润z与x、y的关系为z=0.2yx根
20、据()的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1 v1),(u2 v2).(un vn),其回归线v=+u的斜率和截距的最小二乘估计分别为:=,=【解答】解:()由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型;()令w=,先建立y关于w的线性回归方程,由于=68,=563686.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68,()(i)由()知,当x=49时,年销售量y的预报值=100.6+68=57
21、6.6,年利润z的预报值=576.60.249=66.32,(ii)根据()的结果可知,年利润z的预报值=0.2(100.6+68)x=x+13.6+20.12,当=6.8时,即当x=46.24时,年利润的预报值最大13(2016新课标)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20082014(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量附注:参考数据:yi=9.32,tiyi=40.17,=0.55,2.646参
22、考公式:r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为:【解答】解:(1)由折线图看出,y与t之间存在较强的正相关关系,理由如下:r=0.993,0.9930.75,故y与t之间存在较强的正相关关系;(2)=0.103,=1.3310.10340.92,y关于t的回归方程=0.10t+0.92,2016年对应的t值为9,故=0.109+0.92=1.82,预测2016年我国生活垃圾无害化处理量为1.82亿吨14(2014新课标)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:年份2007200820092010201120122013年份代号t12345
23、67人均纯收入y2.93.33.64.44.85.25.9()求y关于t的线性回归方程;()利用()中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=【解答】解:()由题意,=(1+2+3+4+5+6+7)=4,=(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,=0.5,=4.30.54=2.3y关于t的线性回归方程为=0.5t+2.3;()由()知,b=0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千
24、元将2015年的年份代号t=9代入=0.5t+2.3,得:=0.59+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元15(2013重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得,()求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;()判断变量x与y之间是正相关还是负相关;()若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程y=bx+a中,其中,为样本平均值,线性回归方程也可写为【解答】解:()由题意可知n=10,=8,=2,故lxx=7201082=80,lxy=18410
25、82=24,故可得b=0.3,a=20.38=0.4,故所求的回归方程为:y=0.3x0.4;()由()可知b=0.30,即变量y随x的增加而增加,故x与y之间是正相关;()把x=7代入回归方程可预测该家庭的月储蓄为y=0.370.4=1.7(千元)16(2016四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图(I)求直方图中的a值;(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数说明理
26、由;()估计居民月均用水量的中位数【解答】解:(I)1=(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)0.5,整理可得:2=1.4+2a,解得:a=0.3(II)估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.12+0.08+0.04)0.5=0.12,又样本容量=30万,则样本中月均用水量不低于3吨的户数为300.12=3.6万()根据频率分布直方图,得;0.080.5+0.160.5+0.300.5+0.400.5=0.470.5,0.47+0.50.52=0.730.5,中位数应
27、在(2,2.5组内,设出未知数x,令0.080.5+0.160.5+0.300.5+0.40.5+0.5x=0.5,解得x=0.06;中位数是2+0.06=2.0617(2015广东)某城市100户居民的月平均用电量(单位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300)分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为,220,240),240,260),260,280),280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在22
28、0,240)的用户中应抽取多少户?【解答】解:(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)20=1,解方程可得x=0.0075,直方图中x的值为0.0075;(2)月平均用电量的众数是=230,(0.002+0.0095+0.011)20=0.450.5,月平均用电量的中位数在220,240)内,设中位数为a,由(0.002+0.0095+0.011)20+0.0125(a220)=0.5可得a=224,月平均用电量的中位数为224;(3)月平均用电量为220,240)的用户有0.012520100=25,月平均用电量为240,2
29、60)的用户有0.007520100=15,月平均用电量为260,280)的用户有0.00520100=10,月平均用电量为280,300)的用户有0.002520100=5,抽取比例为=,月平均用电量在220,240)的用户中应抽取25=5户18(2015广东)某工厂36名工人年龄数据如图:工人编号年龄工人编号年龄工人编号年龄工人编号年龄123456789404440413340454243101112131415161718363138394345393836192021222324252627274341373442374442282930313233343536343943384253
30、374939(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值和方差s2;(3)36名工人中年龄在s和+s之间有多少人?所占百分比是多少(精确到0.01%)?【解答】解:(1)由系统抽样知,36人分成9组,每组4人,其中第一组的工人年龄为44,所以其编号为2,所有样本数据的编号为:4n2,(n=1,2,9),其数据为:44,40,36,43,36,37,44,43,37(2)由平均值公式得=(44+40+36+43+36+37+44+43+37)=40由方差公式得s2=(4440)2+(4040)2+(3740)2=(3)s2=s=(3,4),36名工人中年龄在s和+s之间的人数等于区间37,43的人数,即40,40,41,39,共23人36名工人中年龄在s和+s之间所占百分比为63.89%