《高考数学复习- 统计与统计案例.pdf》由会员分享,可在线阅读,更多相关《高考数学复习- 统计与统计案例.pdf(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第10章概率与统计1 0.3统计与统计案例象 命 题探究骨本部分的主要内容有:抽样方法、用样本估计总体、变量间的相关关系、独立性检验,其中随机抽样和总体估计是高考考查的热点内容,一般以选择题、填空题的形式出现,主要考查对抽样方法的理解与选择,各种统计图表的识别以及有关样本数据、数字特征的计算等.独立性检验一般在解答题中出现,常结合概率考查,一般难度不大.片承新题速递1.(2022乙卷)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如图茎叶图:则下列结论中错误的是()甲 乙6 1 5.8 5 3 0 6.7 5 3 2 7.6 4 2 1 8.4 2 9.10.34 61
2、 2 2 5 6 6 6 60 2 3 81A.甲同学周课外体育运动时长的样本中位数为7.4B.乙同学周课外体育运动时长的样本平均数大于8C.甲同学周课外体育运动时长大于8 的概率的估计值大于0.4D.乙同学周课外体育运动时长大于8 的概率的估计值大于0.67 3+7 5【解答】解:由茎叶图可知,甲同学周课外体育运动时长的样本中位数为=7.4,选项A 说法正确;由茎叶图可知,乙同学周课外体育运动时长的样本平均数大于8,选项8 说法正确;s a甲同学周课外体育运动时长大于8 的 概 率 的 估 计 值 为=7 0.6,选项D说法正确.故选:C.2.(2 0 2 2 甲卷)某社区通过公益讲座以普及
3、社区居民的垃圾分类知识.为了解讲座效果,随 机 抽 取 1 0 位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这 1 0 位社区居民在讲座前和讲座后问卷答题的正确率如图:则()A.讲座前问卷答题的正确率的中位数小于7 0%B.讲座后问卷答题的正确率的平均数大于8 5%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差【解答】解:对于A,讲座前问卷答题的正确率从小到大为:6 0%,6 0%,6 5%,6 5%,7 0%,7 5%,8 0%,8 5%,9 0%,9 5%,讲座前问卷答题的正确率的中位数为:(7 0%+7
4、5%)/2=7 2.5%,故 A错误;对于8,讲座后问卷答题的正确率的平均数为:1(8 0%+8 5%+8 5%+8 5%+8 5%+9 0%+9 0%+9 5%+1 0 0%+1 0 0%)=8 9.5%8 5%,故 8 正确;10对 于 C,由图形知讲座前问卷答题的正确率相对分散,讲座后问卷答题的正确率相对集中,.讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故 C错误:对于。,讲座后问卷答题的正确率的极差为:1 0 0%-8 0%=2 0%,讲座前正确率的极差为:9 5%-6 0%=3 5%,讲座后问卷答题的正确率的极差小于讲座前正确率的极差,故。错误.故选:B.3.(2 0
5、2 2 新高考H)在某地区进行流行病学调查,随机调查了 1 0 0 位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间 2 0,7 0)的概率;(3)已知该地区这种疾病的患者的患病率为0.1%,该地区年龄位于区间 4 0,5 0)的人口占该地区总人口 的1 6%.从该地区中任选一人,若此人的年龄位于区间 4 0,5 0,求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0 0 0 1 ).【解答】解:(1)
6、由频率分布直方图得该地区这种疾病患者的平均年龄为:x =5 X 0.0 0 1 X 1 0+1 5 X 0.0 0 2 X 1 0+2 5 X 0.0 1 2 X 1 0+3 5 X 0.0 1 7X 1 0+4 5 X 0.0 2 3 X 1 0+5 5 X 0.0 2 0 X 1 0+65 X0.0 1 7X 1 0+75 X0.0 0 6X 1 0+8 5 X0.0 0 2 X 1 0=4 7.9 岁(2)该地区一位这种疾病患者的年龄位于区间 2 0,7 0)的频率为:(0.0 1 2+0.0 1 7+0.0 2 3+0.0 2 0+0.0 1 7)X 1 0=0.8 9,估计该地区一位
7、这种疾病患者的年龄位于区间 2 0,7 0)的概率为0.8 9.(3)设从该地区中任选一人,此人的年龄位于区间 4 0,5 0)为事件B,此人患这种疾病为事件C,贝!P(C|B)=多 需=6 1%:歌3x10=0 0 0 1 4.4.(2 0 2 2甲卷)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的5 0 0个班次,得到下面列联表:准点班次数未准点班次数A2 4 02 0B2 1 03 0(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有9 0%的把握认为甲、乙两城之间的长途客车是否准点与客车所属
8、公司有关?_ _ _ _ _ _.(a d-b e/_ _ _ _ _ _(a+b)(c+d)(a+c)(b+d),p(K2上)0.1 0 00.0 5 00.0 1 0k2.70 63.8 4 16.63 5【解答】解:(1)A 公司一共调查了 260辆车,其中有240辆准点,故 A 公司准点的概率为一=一;260 13210 7B 公司一共调查了 240辆车,其中有210辆准点,故 8 公司准点的概率为240 8(2)由题设数据可知,准点班次数共450辆,未准点班次数共50辆,A 公司共260辆,B 公司共240辆,:.K27500 x(240 x30 210 x20)/260 x240
9、x450 x50-一 有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.5.(2022乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了 10棵这种树木,测量每棵树的根部横截面积(单位:/)和材积量(单位:m3),得到如下数据:样本号i10总和根部横截面积为 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.060.6材积量yi0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.403.923456789并计算得 旦 婷=0.0 3 8,型
10、1”=1.6158,旦 孙=0.2474.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186届.己知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数,生1 8:祖yy)VL896 1.377.闻1(一书4 1 1 刃【解答】解:(1)设这棵树木平均一棵的根部横截面积为运平均一棵的材积量为歹,则根据题中数据得:x=0.06/n2,y=0.39m3;(2)由题可
11、知,*耳 一 一刃 工 旦 M f 药 0.01346-1 (x元)2*耳 刃2 J(鹉叶一位2)白昌 为2一冲2)V0.002x0,09480.0134 _ 0,01340.01X/L896=0.01377 印 “;(3)设总根部面积和X,总材积量为匕 则-=故 丫=需 186=1209(m3).真题归纳题型一 抽样方法与统计图表1.(2 0 1 5 福建)某校高一年级有9 0 0 名学生,其中女生4 0 0 名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为4 5 的样本,则应抽取的男生人数为25 .45 1【解答】解:根据题意得,用分层抽样在各层中的抽样比为 =900 20则应
12、抽取的男生人数是5 0 0 X 4=2 5 人,故答案为:25.2.(20 18新课标I )某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【解答】解:设建设前经济收入为小 建设后经济收入为2a.A 项,种植收入 3 7%X 2a-60%a=14%a 0,故建设后,种植收入增加,
13、故 A项错误.B项,建设后,其他收入为5%义2。=10%。,建设前,其他收入为4%m故 10%a+4%=2.5 2,故 2 项正确.C项,建设后,养殖收入为3 0%X 2a=60%a,建设前,养殖收入为3 0%”,故 60%公 3 0%=2,故 C项正确.。项,建设后,养殖收入与第三产业收入总和为(3 0%+28%)X 2 a=5 8%X 2 m经济收入为2m 故(5 8%*2。)+2。=5 8%5 0%,故。项正确.因为是选择不正确的一项,故选:A.3.(20 17新课标I I I)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 20 14 年 1 月至 20 16年 12月
14、期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.2014 年 2015 年 2016 年根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8 月D.各 年 1 月至6 月的月接待游客量相对于7 月 至 12月,波动性更小,变化比较平稳【解答】解:由已有中20 14 年 1 月至20 16年 12月期间月接待游客量(单位:万人)的数据可得:月接待游客量逐月有增有减,故 A错误;年接待游客量逐年增加,故 B正确;各年的月接待游客量高峰期大致在7,8 月,故 C正确;各 年 1月至6 月的月接待游客量相对于7 月 至 1
15、2月,波动性更小,变化比较平稳,故。正确;故选:A.4.(20 16新课标H I)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图,图中A点表示十月的平均最高气温约为1 5,B点表示四月的平均最低气温约为5,下面叙述不正确的是()A.各月的平均最低气温都在0 以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 的月份有5个【解答】解:4.由雷达图知各月的平均最低气温都在以上,正确艮 七月的平均温差大约在10 左右,一月的平均温差在5 左右,故七月的平均温差比一月的平均温差大,正确C.三月和十一月的平均最
16、高气温基本相同,都 为 10 ,正确D.平均最高气温高于20 的月份有7,8 两个月,故。错误,故选:D.5.(20 21 甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5 11.5 12,5 13.5 14.5 收入/万元根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5 万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5 万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5 万元D.估计该地有
17、一半以上的农户,其家庭年收入介于4.5 万元至8.5 万元之间【解答】解:对于A,该地农户家庭年收入低于4.5 万元的农户比率为(0.0 2+0.0 4)X 1=0.0 6=6%,故选项A 正确;对于8,该地农户家庭年收入不低于10.5万元的农户比率为(0.04+0.02X3)X 1=0.1=1 0%,故选项8正确:对于C,估计该地农户家庭年收入的平均值为3 X 0.02+4 X 0.04+5 X0.1+6X 0.14+7 X 0.2+8 X 0.2+9 X0.1+10X 0.1 +11 X 0.04+12 X 0.02+13 X 0.02+14 X 0.02=7.68 6.5 万元,故选项
18、C 错误;对于。,家庭年收入介于4.5万元至8.5万元之间的频率为(0.1+0.14+0.2+0.2)Xl=0.640.5,故估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,故选项。正确.故选:C.6.(2015山东)为比较甲,乙两地某月14时的气温,随机选取该月中的5 天,将这5 天 中 14时的气温数据(单 位:。C)制成如图所示的茎叶图,考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的
19、气温的标准差.其中根据茎叶图能得到的统计结论的编号为()甲 乙 9 I 1 1 3 0 1 2A.B.C.D.【解答】解:由茎叶图中的数据,我们可得甲、乙两地某月14时的气温抽取的样本温度分别为:甲:26,28,29,31,31乙:28,29,30,31,32;1可得:甲地该月14时的平均气温:-(26+28+29+31+31)=29,1乙地该月14时的平均气温:-(28+29+30+31+32)=30,故甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月 14 时温度的方差为:S =1(26-29)2+(28-29)2+(29-29)2+(31-2 9#+(31-29)2J=3.
20、6乙地该月 14 时温度的方差为:S;=g (28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2 =2,故 S%S 所以甲地该月1 4 时的气温的标准差大于乙地该月1 4 时的气温标准差.故选:B.题型二用样本估计总体1 .(2 0 1 9 新课标I I)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9个原始评分中去掉1 个最高分、1 个最低分,得 到 7个有效评分.7 个有效评分与9个原始评分相比,不变的数字特征是()A.中位数 B.平均数 C.方差 D.极差【解答】解:根据题意,从 9个原始评分中去掉1 个最高分、1 个最低分,得
21、到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变,故选:A.2.(2 0 1 7 新课标I )为评估一种农作物的种植效果,选了 块地作试验田.这块地的亩产量(单位:kg)分别是用,垃,血,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.xi,xi,X 的平均数 B.x i,X2,X”的标准差C.x,X2,X”的最大值 D.x,X2,X”的中位数【解答】解:在 A 中,平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标,故 A 不可以用来评估这种农作物亩产量稳定程度;在 B 中,标准差能反映一个数据集的离散程度,故 8可以用来评估这
22、种农作物亩产量稳定程度;在 C中,最大值是一组数据最大的量,故 C不可以用来评估这种农作物亩产量稳定程度:在。中,中位数将数据分成前半部分和后半部分,用来代表一组数据的“中等水平”,故D不可以用来评估这种农作物亩产量稳定程度.故选:B.3.(2 0 2 0 新课标HD设一组样本数据x i,%2,的方差为0.0 1,则数据1 0 制,1 0 x 2,1 0 斯的方差为()A.0.0 1 B.0.1 C.1 D.1 0【解答】解:.样本数据x i,*的方差为0.0 1,根据任何一组数据同时扩大几倍方差将变为平方倍增长,数据 1 0 X1,1 0 X2,1 0 X 的方差为:1 0 0 X0.0 1
23、 =1,故选:C.(多选)4.(2 0 2 1 新高考H)下列统计量中,能度量样本XI,X2,,初的离散程度的有()A.样本Xl,J Q,,尤 的标准差B.样本x i,X2,X”的中位数C.样本x i,X2,X”的极差D.样本x i,X2,物 的平均数【解答】解:中位数是反应数据的变化,方差是反应数据与均值之间的偏离程度,极差是用来表示统计资料中的变异量数,反映的是最大值与最小值之间的差距,平均数是反应数据的平均水平,故能反应一组数据离散程度的是标准差,极差.故选:AC.(多选)5.(2 0 2 1 新高考I )有一组样本数据加,及,xn,由这组数据得到新样本数据y i,”,yn,其中y=x/
24、+c(i=l,2,,n),c 为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同【解答】解:对于A,两组数据的平均数的差为c,故 A 错误;对于8,两组样本数据的样本中位数的差是c,故 B 错误;对 于 C,:标准差。()=D(x,+c)=D(为),两组样本数据的样本标准差相同,故 C正确;对于。,(i=1,2,n),c 为非零常数,X 的极差为 y 的极差为(X,”a t+C)-Xmax Xmint两组样本数据的样本极差相同,故。正确.故选:CD.6.(2 0 2 0 新课标I )某厂接受了一项加工
25、业务,加工出来的产品(单位:件)按标准分为A,B,C,。四个等级.加工业务约定:对于A级品、B 级品、C级品,厂家每件分别收取加工费9 0 元,5 0 元,2 0 元;对 于。级品,厂家每件要赔偿原料损失费5 0 元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为2 5 元/件,乙分厂加工成本费为2 0 元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了 1 0 0 件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表等级ABCD频数402 02 02 0等级ABCD频数2 81 73 42 1(1)分别估计甲、乙两分厂加工出来
26、的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的1 0 0 件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?40【解答】解:(1)由表格可得,甲分厂加工出来的一件产品为A级品的频数为4 0,故 频 率 为 一=0.4,10028乙分厂加工出来的一件产品为A级品的频数为2 8,故频率为=0.2 8,100故甲、乙两分厂加工出来的一件产品为A级品的概率估计值分别是0.4,0.2 8;(2)由表格可知甲分厂加工四个等级的频率分别为0.4,0.2,0.2,0.2,故其平均利润为(9 0-2 5)X 0.4+(5 0-2 5)X 0.2+(2 0 -2 5)X 0.2+(-
27、5 0 -2 5)X0.2=1 5 (元故同理乙分厂加工四个等级的频率分别为0.2 8,0.1 7,0.3 4,0.2 1,故其平均利润为(9 0 -2 0)X 0.2 8+(5 0 -2 0)X 0.1 7+(2 0-2 0)X 0.3 4+(-5 0-2 0)X 0.2 1 =1 0 (%);因 为 1 5 1 0,所以选择甲分厂承接更好.7.(2 0 1 9 新课标m)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 2 0 0 只小鼠随机分成 4、8两组,每 组 1 0 0 只,其中A组小鼠给服甲离子溶液,8组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过
28、一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:甲离子残留百分比直方图记 C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.7 0.(1)求乙离子残留百分比直方图中小 方 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解答】解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.7 0.则由频率分布直方图得:(a+0.2 0 +0.1 5 =0.71 0.0 5 +b+0.1 5 =1-0.7 解得乙离子残留百分比直方图中。=
29、0.3 5,匕=0.1 0.(2)估计甲离子残留百分比的平均值为:环=2 X 0.1 5+3 X 0.2 0+4 X 0.3 0+5 X 0.2 0+6 X 0.1 0+7 X 0.0 5=4.0 5.乙离子残留百分比的平均值为:五=3 X 0.0 5+4 X 0.1+5 X 0.1 5+6 X 0.3 5+7 X 0.2+8 X 0.1 5=6.0 0.8.(2 0 1 8 新课标I )某家庭记录了未使用节水龙头5 0 天的日用水量数据(单位:?3)和使用了节水龙头5 0 天的日用水量数据,得到频数分布表如下:未使用节水龙头5 0 天的日用水量频数分布表使用了节水龙头5 0 天的日用水量频数
30、分布表日用水量 0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)0.6,0.7)频数132492 65(1)作出使用了节水龙头5 0 天的日用水量数据的频率分布直方图;日用水量 0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)频数151 31 01 65频率/组距3.4323.02.82.62.4222.01.81.61.4121.00.80.60.4025 6日用水量m(2)估计该家庭使用节水龙头后,日用水量小于0.3 5/的概率:(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按3 6 5 天计
31、算,同一组中的数据以这组数据所在区间中点的值作代表)【解答】解:(1)根据使用了节水龙头5 0 天的日用水量频数分布表,作出使用了节水龙头5 0 天的日用水量数据的频题型三.独立性检验1.(2 0 2 1 甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了 2 0 0 件产品,产品的质量情况统计如下表:一级品二级品合计甲机床1 5 05 02 0 0乙机床1 2 08 02 0 0合计2 7 01 3 040 0(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有9 9%的把握认为甲机床的产品质量与乙机床的产品质量
32、有差异?2n(adb c):尺=(a+b)(c+d)(a+c)(b+d)P(犬2 2)0.0 5 00.0 1 00.0 0 1k3.8 416.6 3 51 0.8 2 8【解答】解:(1)由题意可得,甲机床、乙机床生产总数均为2 0 0 件,150 3因为甲的一级品的频数为1 5。,所以甲的一级品的频率为丽下120 3因为乙的一级品的频数为,所以乙的一级品的频率 为 丽=9(2)根据2X2列联表,可得非=n(ad-bc)2_ 400(150 x80 50 x120)(a+b)(c+d)(a+c)(b+d)-270 x130 x200 x200-1 0.2 5 6 6.6 3 5.所以有9
33、9%的把握认为甲机床的产品质量与乙机床的产品质量有差异.2.(2 0 2 0 新课标H I)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级 0,200(200,4 00(4 00,6 001 (优)216252(良)510123(轻度污染)6784 (中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率:(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或 2,则称这天“空气质量好”;若某天的空气质量等级为3 或 4,则
34、称这 天“空气质量不好”.根据所给数据,完成下面的2 X2 列联表,并根据列联表,判断是否有9 5%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次W4 00人次4 00空气质量好空气质量不好2附.产=_ _ _ _ _九(血一儿)_ _ _ _ _ _ _叫,A(a+b)(c+d)(a+c)(b+d)【解答】解:(1)该市一天的空气质量等级为1 的概率为:P(片&)0.0500.0100.001k3.8 4 16.6 3510.8 281002+16+25 43100该市一天的空气质量等级为2 的概率为:5+104-12 271001006+7+8 21该市一天的空气质量等级
35、为3 的概率沏-7+2+0 9该市一天的空气质量等级为4的概率沏-(2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:1x =y x 100X (2+5+6+7)+300X (16+10+7+2)+500X (25+12+8+0)J=350,(3)根据所给数据,可得下面的2 义2 列联表,人次W4 00人次4 00总计空气质量好333770空气质量不好22830总计554 51002小夷山痂捉用俎 _ _ _ _ _n(ad-bc)_ _ _ _ _ _ _ _ 100 x(33x 8-37x 22)由表中数据可信*一(q+b)(c+d)(Q+c)(b+d)-70 x 30 x 55x
36、4 52-5.8 20 3.8 4 1,所以有9 5%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.3.(2017新课标H)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100个网箱,测量各箱水产品的产量(单位:版),其频率分布直方图如下:(1)记 A表示事件“旧养殖法的箱产量低于50依”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有9 9%的把握认为箱产量与养殖方法有关:箱产量50依箱产量N 50版旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:P(K 2 K)0.0500.0100.001K3.8
37、4 16.6 3510.8 282_ _ _ _ _n(a d-b c)_ _ _ _ _ _一(a+b)(c+d)(Q+c)(b+d).【解答】解:(1)根据题意,由旧养殖法的频率分布直方图可得:P(A)=(0.012+0.014+0.024+0.034+0.04 0)X5=0.6 2;(2)根据题意,补全列联表可得:箱产量50版箱产量250万总计旧养殖法6 238100新养殖法346 6100总计9 61042002则有产=2懦湍 6.6 3 5,故有9 9%的把握认为箱产量与养殖方法有关;(3)由频率分布直方图可得:旧养殖法 100 个网箱产量的平均数元1=(27.5 X 0.012+3
38、2.5 X 0.014+37.5 X 0.024+4 2.5 X 0.034+4 7.5 X0.04 0+52.5X0.032+57.5X0.02+6 2.5X0.012+6 7.5X0.012)X5=5*9.4 2=4 7.1 ;新养殖法 100 个网箱产量的平均数元2=(37.5 X0.004+4 2.5 X 0.020+4 7.5 X 0.04 4+52.5 X 0.054+57.5 X0.04 6+6 2.5 X 0.010+6 7.5 X 0.008)*5=5 X 1 0.4 7=52.35;比较可得:7|r i l,所以模型较好;解法3,选择与2 01 8 邻近的三个年份(2 01
39、 4,2 01 5,2 01 6)计算模型对应的残差绝对值之和=2.5+5+1 5=9,模型对应的残差绝对值之和=1 2+2 3.5+2 1=5 6.5;且 9 0.75,故 y 与 f 之间存在较强的正相关关系;(2)b=却(女一下)仇一汾 二烈 女 丫 7型次=1(G T%tj-7 t2 翳=0.1 0Z oa=y-b t 1.33-0.10X40.93,;.),关于t的回归方程y=0.10r+0.93,2016年对应的f值为9,故 y=0.10X9+0.93=1.83,预测2016年我国生活垃圾无害化处理量为1.83亿吨.4.(2020新课标H)某沙漠地区经过治理,生态系统得到很大改善,
40、野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(为,)(i=l,2,,20),其中即和H分别表示第i个样区的植物覆盖 面 积(单位:公顷)和这种野生动物的数量,并计算得 幽Xi=60,陷刀=1200,幽(x,-I)2=80,Xi=i y)2=9000,雷 (x i-x)(y t-y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求 样 本(X,;)(1=1,2,20)的相关系数(精确至)0.01);(3)根据
41、现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确地估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相 关 系 数 片/(;元)。刃 V21.414.也?=i 一元)x jli(yt-y)【解答】解:(1)由己知,2&%=1200,.20个样区野生动物数量的平均数为烹匕=1200 x/=60,该地区这种野生动物数量的估计值为60X200=12000;(2)驾 幽(一盼2=g o,鹏(y t-y)2=9000,鹏(阳7)(%一为=800).=E Ji(%一 元)(%一 刃=800=_00_=巫 之 0 9 4.一 也忆(%一君2第 力2 78
42、0 x9000 600忘 3(3)更合理的抽样方法是分层抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确地估计.5.(2 0 1 5 新课标I )某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:力和年利润z (单位:千元)的影响,对 近 8年的年宣传费为和年销售量
43、(i=l,2,,8)数据作了初步处理,得到下面的散点图及一些统计量的值.年俏售里/t620-600-.580-.560-540-520 500-4801 -1-1 I I-1-1-1-1-1 I-34 36 38 40 42 44 46 48 50 52 54 56 年盲传费/千元_ 1表中 Wi=yjXi,w =wXyWZ F=1 (XL元)2S P=1 (m-w)2%1 (X,-X)(y)X i=i (wi)(y)4 6.65 6 36.82 8 9.81.61 4 6 91 0 8.8(I)根据散点图判断,y=+法 与 y=c+d 哪一个适宜作为年销售量),关于年宣传费x的回归方程类型?
44、(给出判断即可,不必说明理由)(H)根 据(I )的判断结果及表中数据,建立y关于x的回归方程;(HI)已知这种产品的年利润z 与 x、y的关系为z=0.2 y-x.根 据(I I )的结果回答下列问题:年宣传费”=4 9 时,年销售量及年利润的预报值是多少?()年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(1,V l),(2,V 2),,(物,Vn)9其回归线V=a+p M 的斜率和截距的最小二乘估计分别为:1=之1(%一.(%切,a =_ _次=1 (Ui-u)【解答】解:(I )由散点图可以判断,y=c+适 宜 作 为 年 销 售 量 y关于年宣传费X的回归方程类型;(1 1
45、)令 卬=,先建立y关于卬的线性回归方程,由于d =当 等=6 8,c=y-dw=5 6 3 -6 8 X 6,8=1 0 0.6,所以y 关于w的线性回归方程为y =1 0 0.6+6 8 卬,因此y关于x的回归方程为y =1 0 0.6+6 8 7 ,(HI)(i)由(I I)知,当 x=4 9 时,年销售量y的预报值y=1 0 0.6+6 8 倔=5 7 6.6,年利润 Z 的预报值z=576.6X0.2-49=66.32,()根 据(I I)的结果可知,年利润z 的预报值z=0.2(100.6+68衣)-x=-x+13.6代+20.12,当石=等=6.8时,即当x=46.24时,年利润
46、的预报值最大.模拟预测/(2021春长沙期末)为了解某校学生参加社区服务的情况,采用按性别分层抽样的方法进行调查.已知该校共有学生960人,其中男生560人,从全校学生中抽取了容量为”的样本,得到一周参加社区服务时间的统计数据如下:超 过 1 小时不超过1 小时男208女12m(1)求 相,;(2)能否有95%的把握认为该校学生一周参加社区服务时间是否超过1 小时与性别有关?(3)若以样本中学生参加社区服务时间超过1 小时的频率作为该事件发生的概率,现从该校随机调查60名学生,记一周参加社区服务时间超过1 小时的人数为X,求 X 的数学期望.附:2.2 _ n(ad-bc)_P(呼 沁)0.0
47、500.0100.001k3.8416.63510.828一(a+b)(c+d)(a+c)(b+d),【解答】解:(1)由已知,该校有女生400人,故 四 竺=,得机=8,从而”=20+8+12+8=48.20+8 560(2)作出列联表如下:2 _ 48(160-96)2 _ 24 K-28x20 x32x16-35 0 6 8 5 7 超 过 1 小时的人数不超过1 小时的人数合计男20828女12820合计321648所以不能有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关.7?2(3)根据以上数据,学生一周参加社区服务时间超过1 小时的概率=翥=右 所以X B(6
48、 0,-),且P(X=k)=CA(|)k x)60-k,%=(),1,2,6 0.故 X 的数学期望EX=6 0 x|=40.2.(2016春天水校级月考)班主任为了对本班学生的考试成绩进行分析,决定从全班36名女同学,24名男同学中随机抽取一个容量为5 的样本进行分析.(1)如果按性别比例分层抽样,可以得到多少个不同的样本?(只要求写出计算式即可)(2)随机抽取5 位,他们的数学分数从小到大排序是:89,91,93,95,9 7,物理分数从小到大排序是:87,89,89,92,93若规定90 分以上为优秀,求这5 位同学中恰有2 位同学的数学和物理分数均为优秀的概率;若这5位同学的数学、物理
49、分数事实上对应如表:学生编号12345数学分数X8991939597物理分数),8789899293根据上表数据,用变量y 与 x 的相关系数或散点图说明物理成绩y 与数学成绩x 之间线性相关关系的强弱.如果具有较强的线性相关关系,求 y 与 x 的线性回归方程(系数精确到0.01);如果不具有线性相关性,请说明理由.参考公式:相关系数,=笔1(/宇)仇 艺;回归直线的方程是:y=fov+a,其中对应的回归估曲(N/刃计 值 人=噩 卫 沟 4 21,a=亍_成,其是与沏对应的回归估计值.参考值:底=3.9.【解答】解:(1)按性别比例分层抽样,可以得到以6c玄个不同的样本;3(2)这5 位同学中恰有2 位同学的数学和物理分数均为优秀,有 3 人,其概率为g;洛1 Qi J)(y刃=0 9 6,有较强的线性相关关系,人21幻2工 之 用2b 0.75,a=20.25,线性回归方程是y=0.75x+20.25.