《2024版高考数学一轮总复习第9章统计与统计案例第2节用样本估计总体.docx》由会员分享,可在线阅读,更多相关《2024版高考数学一轮总复习第9章统计与统计案例第2节用样本估计总体.docx(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二节用样本估计总体考试要求:结合实例,能够利用样本估计总体的集中趋势以及离散程度,掌握分层随机抽样的样本均值和样本方差一、教材概念结论性质重现1频率分布直方图(1)频率分布表的画法第一步:求极差,极差最大值最小值;第二步:决定组数和组距,组距极差组数;第三步:将数据分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第四步:登记频数,计算频率,列出频率分布表(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小长方形的面积表示样本落在该组内的频率1频率分布直方图可以利用频率分布直方图估计总体的取值规律2频率分布直方图中的常见结论(1)众数的
2、估计值为最高的小长方形的中点对应的横坐标(2)平均数的估计值等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和(3)中位数的估计值的左边和右边的小长方形的面积和是相等的2中位数、众数、平均数(1)中位数:将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数(2)众数:一组数据中出现次数最多的数据称为这组数据的众数(3)平均数:一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,xn的平均数x1n(x1x2xn)3百分位数(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据
3、小于或等于这个值,且至少有(100p)%的数据大于或等于这个值(2)计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据第2步,计算inp%第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i1)项数据的平均数4样本的数字特征如果有n个数据x1,x2,xn,那么平均数为x1n(x1x2xn),标准差为s1nx1x2+x2x2+xnx2,方差为s21n(x1x)2(x2x)2(xnx)2(1)若数据x1,x2,xn的平均数为x,则mx1a,mx2a,mx3a,mxna的平均数是mxa.(2)若数据x1,x2,xn的方
4、差为s2,则数据ax1b,ax2b,axnb的方差为a2s2.二、基本技能思想活动经验1判断下列说法的正误,对的画“”,错的画“”(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(2)一组数据的方差越大,说明这组数据越集中()(3)在频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大()2“幸福感指数”是指某个人主观评价他对自己目前生活状态满意程度的指标,常用区间0,10内的一个数来表示,该数越接近10表示满意度越高现随机抽取10位居民,他们的幸福感指数为5,6,6,6,7,7,8,8,9,10.则这组数据的第80百分位数是()A7.5B8 C8.5D9C
5、解析:因为1080%8,所以数据5,6,6,6,7,7,8,8,9,10的第80百分位数是12(89)8.5.3某工厂技术人员对三台智能机床的生产数据进行统计,发现甲车床每天生产次品数的平均数为1.4,标准差为1.08;乙车床每天生产次品数的平均数为11,标准差为0.85;丙车床每天生产次品数的平均数为1.1,标准差为0.78.由以上数据可以判断生产性能最好且较稳定的为()A无法判断B甲车床C乙车床D丙车床D解析:因为1.11.411,0.780.851.08,所以可以判断生产性能最好且较稳定的为丙车床4从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:
6、66,70),70,74),94,98,并整理得到如下的频率分布直方图,则评分在区间82,86)内的影视作品数量是()A20B40 C64D80D解析:由频率分布直方图知,评分在区间82,86)内的影视作品的频率为(8682)0.050.2,故评分在区间82,86)内的影视作品数量是4000.280.5已知样本量为200,在样本的频率分布直方图中,共有n个小长方形若中间一个小长方形的面积等于其余(n1)个小长方形面积和的13,则该组的频数为_50解析:设除中间一个小长方形外的(n1)个小长方形面积的和为p,则中间一个小长方形面积为13p.由题意,得p13p1,所以p34,则中间一个小长方形的面
7、积为13p14,2001450,即该组的频数为50.考点1统计图表及其应用综合性习近平总书记强调:“一个忘记来路的民族必定是没有出路的民族,一个忘记初心的政党必定是没有未来的政党”某学校利用学习强国APP安排教职工(共120人)在线学习党史知识其教职工年龄情况和每周在线学习时长达3小时的情况分别如图(1)和图(2)所示,则下列说法正确的是()A该学校老年教职工在线学习党史时长达3小时的人数最多B该学校青年教职工在线学习党史时长达3小时的人数最多C该学校老年教职工在线学习党史时长达3小时和青年教职工在线学习党史时长达3小时的人数之和与中年教职工在线学习党史时长达3小时的人数相等D该学校在线学习党
8、史时长达3小时的人数占总人数的80%D解析:由图可知,该学校老年教职工在线学习党史时长达3小时的人数是12030%90%32.4,中年教职工在线学习党史时长达3小时的人数是120(130%30%)80%38.4,青年教职工在线学习党史时长达3小时的人数是12030%70%25.2.该学校在线学习党史时长达3小时的人数占总人数的比例为30%90%40%80%30%70%80%,故选项A、B、C错误,选项D正确电力工业是一个国家的经济命脉,它在国民经济和人民生活中占有极其重要的地位目前开发的电力主要是火电、水电、风电、核电、太阳能发电,其中,水电、风电、太阳能发电属于可再生能源发电如图所示的是20
9、22年各电力行业发电量及增幅的统计图,则下列说法错误的是()A其中火电发电量大约占全行业发电量的71%B在火电、水电、风电、核电、太阳能发电量中,比上一年增幅最大的是风电C火电、水电、风电、核电、太阳能发电的发电量的极差是7.28D以上可再生能源发电量的增幅均跑赢全行业整体增幅C解析:对于A,火电发电量大约占全行业发电量的5.287.4271%,故选项A正确;对于B,由折线图可知,风电增幅为10.50%,是增幅最大的,故选项B正确;对于C,火电、水电、风电、核电、太阳能发电的发电量的极差是5.280.145.14,故选项C错误;对于D,由折线图可得,可再生能源发电量的增幅均跑赢全行业整体增幅,
10、故选项D正确故选C统计图表问题的解决方法(1)首先要准确地识图,即要明确统计图表中纵轴、横轴及折线、区域等所表示的意义,尤其注意数字变化的趋势等(2)其次要准确地用图,会根据统计图表中的数字计算样本的数字特征,会用统计图表估计总体1(2022靖远模拟)如图是我国20112020年载货汽车产量及增长趋势统计图针对这10年的数据,下列说法错误的是()A与2019年相比较,2020年我国载货汽车产量同比增速不到15%B这10年中,载货汽车的同比增速有增有减C这10年我国载货汽车产量的极差超过150万辆D这10年我国载货汽车产量的中位数不超过340万辆D解析:对于A,2020年的同比增速为423.93
11、73.9373.9100%13.37%15%,故A正确;对于B,这10年中,载货汽车的同比增速有增有减,故B正确;对于C,由图知极差为423.9273.5150.4(万辆)150(万辆),故C正确;对于D,将这10年载货汽车产量由小到大排列,得:273.5,303.5,312.9,333.8,339.9,344.1,356.7,371.7,373.9,423.9,故中位数为339.9+344.12342(万辆),故D错误2(多选题)在疫情期间某企业对本企业1 644名职工关于复工的态度进行调查,调查结果如图所示下列结论成立的是()Ax0.384B从该企业中任取一名职工,该职工是倾向于在家办公的
12、概率为0.178C不到80名职工倾向于继续申请休假D倾向于复工后在家办公或在公司办公的职工超过986名BD解析:由图表知x%15.1%17.8%42.3%,得x34.8,故A错误由图表知在家办公的人员占17.8%,故B正确由1 6445.1%83.84480,所以超过80名职工倾向于继续申请休假,故C错误又1 644(17.8%42.3%)988.044986,所以超过986名职工倾向于在家办公或在公司办公,D正确综上可知,正确的结论为BD考点2频率分布直方图应用性一家保险公司决定对推销员实行目标管理,即给推销员确定一个具体的销售目标确定的销售目标是否合适,直接影响到公司的经济效益如果目标定得
13、过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力该保险公司随机抽取50名保险推销员,统计了其2022年的月均推销额(单位:万元),将数据按照12,14),14,16),22,24分成6组,制成频率分布直方图如下,其中14,16)组比12,14)组的频数多4.(1)求频率分布直方图中a和b的值;(2)为调动推销员的积极性,公司设计了两种奖励方案方案一:奖励月均推销额进入前60%的员工;方案二:奖励月均推销额达到或超过平均数(同一组中的数据用该组区间中点值为代表)的员工你认为哪种方案更好?解:(1)由频率分布直方图的性质,得图中所有小长方形的面积之和等
14、于1.又因为14,16)组比12,14)组的频数多4,所以a+b+0.04+0.1+0.12+0.142=1,50b250a2=4, 解得a0.03,b0.07.(2)方案一,奖励月均推销额进入前60%的员工,因为样本量为50,所以能获得奖励员工人数为5060%30.方案二,奖励月均推销额达到或超过平均数,根据频率分布直方图,可得月均推销额的平均数为x0.032130.072150.122170.142190.12210.0422318.32.月均推销额低于18万的频率为2(0.030.070.12)0.44.因为本次抽样样本量为50名保险推销员,所以月均推销额低于18万的人数为500.442
15、2,所以月均推销额达到或超过18万的人数为28.综上所述,对比两种奖励方案,应选方案一,更多人员获得奖励1频率分布直方图的性质(1)小长方形的面积组距频率组距频率(2)各小长方形的面积之和等于1.(3)小长方形的高频率组距,所有小长方形的高的和为1组距.2要理解并记准频率分布直方图与众数、中位数、百分位数及平均数的关系1某校高三年级共有600名学生选修地理,某次考试地理成绩均在6090分之间,分数统计后绘成频率分布直方图,如图所示,则成绩在70,85)分的学生人数为()A380 B420 C450 D480C解析:成绩在70,85)分的学生人数为6005(0.040.060.05)450.故选
16、C2从某小区随机抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如图所示,由此可估计该小区居民户月用电量的平均值大约为_度186解析:设用电量在200到250度之间的频率为a,则有50(0.002 40.003 60.006a0.002 40.001 2)1,解得a0.004 4.由频率分布直方图可知,该小区居民户月用电的平均值为:50(750.002 41250.003 61750.00 62250.004 42750.002 43250.001 2)186(度)考点3总体集中趋势的估计综合性考向1百分位数、平均数、中位数及众数已知甲、乙两组按顺序排列的数
17、据,甲组:27,28,37,m,40,50;乙组:24,n,34,43,48,52.若这两组数据的第20百分位数、第50百分数分别对应相等,则mn等于()A127B107C87D67B解析:因为20%61.21,50%63,所以第20百分位数为n28,第50百分位数为37+m234+432,所以m40,所以mn4028107.故选B已知数据x11,x22,x33,x44,x55的平均数是23,则数据3x11,3x21,3x31,3x41,3x51的平均数是()A61B64 C67D70A解析:因为数据x11,x22,x33,x44,x55的平均数是23,所以x1x2x3x4x552315100
18、,所以(3x11)(3x21)(3x31)(3x41)(3x51)3(x1x2x3x4x5)5305,所以数据3x11,3x21,3x31,3x41,3x51的平均数是305561.故选A1求平均数时要注意数据的个数,不要重计或漏计2求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数3若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数4计算一组n个数据的第p百分位数的方法是:先按从小到大排列原始数据,再计算inp%.若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整
19、数,则第p百分位数为第i项与第(i1)项数据的平均数考向2与频率分布直方图有关的数字特征的计算(多选题)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在40,100内现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示观察图形,则下列说法正确的是()A频率分布直方图中第三组的频数为10人B根据频率分布直方图估计样本的众数为75分C根据频率分布直方图估计样本的中位数为75分D根据频率分布直方图估计样本的平均数为75分ABC解析:分数在60,70)内的频
20、率为110(0.0050.0200.0300.0250.010)0.10,所以第三组60,70)的频数为1000.1010(人),故A正确因为众数的估计值是频率分布直方图中最高小长方形的中点,从图中可看出众数的估计值为75分,故B正确因为(0.0050.0200.010)100.350.5,所以中位数位于70,80),设中位数为x,则0.350.03(x70)0.5,解得x75,所以中位数的估计值为75,故C正确样本平均数的估计值为45100.00555100.02065100.01075100.0385100.02595100.0173(分),故D错误用样本估计总体是统计的基本方法:(1)最
21、高的小长方形的中点横坐标即为众数(2)中位数左边和右边的小长方形的面积是相等的(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和1某病患者8人的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为()A4或7B4 C7D5.5D解析:将3,3,8,4,2,7,10,18由小到大排列为2,3,3,4,7,8,10,18,第50百分位数即为中位数,这组数的中位数为12(47)5.5.2某市进行了一次校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在40,90之间,其得分的频率分布直方图如图,
22、则下列结论错误的是()A得分在40,60)之间的共有40人B从这100名参赛者中随机选取1人,其得分在60,80)的概率为0.5C这100名参赛者得分的中位数为65Da0.005C解析:由频率分布直方图,可得A中,得分在40,60)之间共有1(0.030.020.01)1010040(人),所以A正确B中,从100名参赛者中随机选取1人,其得分在60,80)中的概率为(0.030.02)100.5,所以B正确D中,由频率分布直方图的性质,可得(a0.0350.0300.0200.010)101,解得a0.005,所以D正确C中,前2个小长方形面积之和为0.4,前3个小长方形面积之和为0.7,所
23、以中位数在60,70,这100名参赛者得分的中位数为600.50.40.31063.3,所以C不正确考点4总体离散程度的估计基础性考向1方差与标准差的计算(2022溧阳期末)已知数据x1,x2,x10的平均数为2,方差为3,那么数据2x11,2x21,2x101的平均数和方差分别为()A2,3B5,6 C5,12D4,12C解析:因为数据x1,x2,x10的平均数为2,方差为3,所以数据2x11,2x21,2x101的平均数为2215,方差为22312.一组数据由10个数组成,将其中一个数由6改为3,另一个数由2改为5,其余数不变,得到新的10个数,则新数据的方差相比原数据的方差的减小值为()
24、A0.4B0.5C0.6D0.7C解析:一个数由6改为3,另一个数由2改为5,故该数据的平均数x不变,设没有改变的八个数分别为x1,x2,x3,x4,x5,x6,x7,x8.因为原数据的方差s12110(x1x)2(x2x)2(x3x)2(x4x)2(x5x)2(x6x)2(x7x)2(x8x)2(6x)2(2x)2,新数据的方差s22110(x1x)2(x2x)2(x3x)2(x4x)2(x5x)2(x6x)2(x7x)2(x8x)2(3x)2(5x)2,所以s22s12110(3x)2(5x)2(6x)2(2x)2110(6)0.6,所以新数据的方差相比原数据的方差的减少值为0.6.1方差
25、的简化计算公式:s21n(x12+x22+xn2)nx21n(x12+x22+xn2)x2.2方差的运算性质:如果数据x1,x2,xn的方差为s2,则新数据x1b,x2b,xnb的方差仍是s2.新数据ax1,ax2,axn的方差是a2s2.新数据ax1b,ax2b,axnb的方差是a2s2.3标准差(或方差)是用来表示稳定性,标准差(或方差)越大,数据的离散程度就越大,也就是越不稳定;标准差(或方差)越小,数据的离散程度就越小,也就是越稳定考向2分层随机抽样的方差为了解学生的课外阅读情况,某校采用按样本量比例分配的分层随机抽样对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所
26、得样本数据如下:年级抽样人数样本平均数样本方差高一4053.5高二30x22高三303s32已知高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数x2_,高三年级学生的样本方差s32_41.5解析:由高中三个年级学生的总样本平均数为4.1,可得405+30x2+30340+30+304.1,解得x24.因为总样本方差为3.14,所以401003.5+54.12+301002+(44.1)2+30100s32(34.1)23.14,解得s321.5.1设样本中不同层的平均数分别为x1,x2,xn,方差分别为s12,s22,sn2,相应的权重分别为w1,w2,
27、wn,则这个样本的方差为s2i=1nwisi2+(xix)2,其中x为样本平均数2计算分层随机抽样的方差s2的步骤(1)确定x1,x2,xn,s12,s22,sn2 ,w1,w2,wn.(2)确定x.(3)应用公式 s2i=1nwisi2+(xix)2计算s2.(2022肇庆模拟)在对某中学高一学生体重的调查中,采取按样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生30人,其平均数和方差分别为55和15,抽取了女生20人,其平均数和方差分别为45和20.则总样本的平均数为_,方差为_5141解析:总样本的平均数为3030+20552030+204551,总样本的方差为3050
28、15(5551)2205020(4551)241.课时质量评价(五十四)A组全考点巩固练1某市3月1日至3月10日的最低气温(单位:)的情况绘制的折线统计图如图所示由图可知,这10天最低气温的第80百分位数是()A2B0 C1D2D解析:由折线图可知,这10天的最低气温按照从小到大排列为3,2,1,1,0,0,1,2,2,2.因为共有10个数据,所以1080%8,是整数,则这10天最低气温的第80百分位数是2+222.2(2023德州模拟)2022年第24届冬奥会在北京市和张家口市成功举办,出色的赛事组织工作赢得了国际社会的一致称赞,经济效益方面,多项收入也创下历届冬奥会新高某机构对本届冬奥会
29、各项主要收入进行了统计,得到的数据如图所示已知赛事转播的收入比政府补贴和特许商品销售的收入之和多27亿元,则估计2022年冬奥会这几项收入总和约为()A223亿元B218亿元 C143亿元D118亿元B解析:设收入总和为x,则35.4%x(12.2%10.8%)x27,解得x218.故选B3已知一组数据x1,x2,xn的平均数为a,标准差为s.若2x11,2x21,2xn1的平均数与方差相等,则s2a2的最大值为()A1B12C14D316C解析:由已知条件可得,2a14s2,整理可得s212a14,又s20,所以12a140,a12,所以s2a2a212a14a142316,图象开口向下,对
30、称轴为a14,所以函数在12,+上单调递减,故当a12时,s2a2取得最大值为14.4为了解学生的身体状况,某校随机抽取了一批学生测量体重经统计,这批学生的体重数据(单位:千克)全部介于45至70之间将数据分成5组,并得到如图所示的频率分布直方图图中a的值为()A0.04B0.2 C0.03D0.05A解:根据频率分布直方图可得,(0.010.02a0.060.07)51,所以a0.04.故选A5甲组数据为5,12,16,21,25,37,乙组数据为1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是()A极差B平均数C中位数D都不相同B解析:甲的极差为37532,乙的极差为
31、39138,甲的中位数为16+21218.5,乙的中位数为14+18216,x甲5+12+16+21+25+376583,x乙1+6+14+18+38+396583,所以甲、乙的平均数相同故选B6若样本数据x1,x2,x10标准差为8,则数据2x11,2x21,2x101的标准差为()A8B64 C32D16D解析:设样本数据x1,x2,x10标准差为s2,则s28,即方差s264,数据2x11,2x21,2x101的方差为s222s22264256,所以数据2x11,2x21,2x101的标准差为25616.7某校女子篮球队7名运动员身高(单位:cm)的数据分别为171,172,17x,17
32、4,175,180,181.已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰如果把其末位数字记为x,那么x的值为_2解析:17017(12x451011)175,17(33x)5,即33x35,解得x2.8(2023山东省实验中学模拟)第24届冬奥会于2022年在北京和张家口市联合举行,冬奥会志愿者的服务工作是冬奥会成功举办的重要保障在冬奥会志愿者的选拔工作中,某高校承担了志愿者选拔的面试工作,面试成绩满分100分,同学们面试得分的频率分布直方图如图所示,则此次面试中得分的90%分位数是_85解析:由题图知各组的频率为分组40,50) 50,60)60,70)70,8
33、0)80,90)90,100频率0.10.30.410a0.110a所以a0.005,则第四组70,80)的频率为0.05,前四组的频率之和为0.85,所以这次面试得分的90%分位数是在第五组内,且为80100.90.850.950.8585.9某游乐园为了吸引游客,推出了A,B两款不同的年票,游乐园每次进园门票原价为100元A年票前12次进园门票每次费用为原价,从第13次起,每次费用为原价的一半,A年票不需交开卡工本费B年票每次进园门票为原价的9.5折,B年票需交开卡工本费a元(aN)已知某市民每年至少去该游乐园11次,最多不超过14次该市民多年来年进园记录如表:年进园次数11121314频
34、率0.150.400.100.35(1)估计该市民年进园次数的众数;(2)若该市民使用A年票,求该市民在进园门票上年花费的平均数;(3)从该市民在进园门票上年花费的平均数来看,若选择A年票比选择B年票更优惠,求a的最小值解:(1)由频率分布表知,该市民年进园次数的频率最大是0.40,对应的次数是12,所以估计该市民进园次数的众数为12.(2)该市民使用A年票时,在进园门票上年花费的平均数为xA111000.15121000.40(1210050)0.10(12100100)0.351 225.(3)该市民使用B年票时,在进园门票上年花费的平均数为xB(110.15120.40130.10140
35、.35)95a1 201.75a,因为xAxB,所以1 22523.25.又aN,所以a的最小值为24.若选择A年票比选择B年票更优惠,则a的最小值是24.B组新高考培优练10(多选题)在某地区某传染病流行期间,为了建设指标显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各项中,一定符合上述指标的是()A平均数x3B标准差s2C平均数x3且极差小于或等于2D众数等于1且极差小于或等于4CD解析:对于A选项,若平均数x3,不能保证每天新增病例数不超过5人,不符合题意;对于B选项,标准差反映的
36、是数据的波动大小,例如当每天感染的人数均为10,标准差是0,显然不符合题意;对于C选项,若极差等于0或1,在x3的条件下,显然符合指标;若极差等于2,假设最大值为6,最小值为4,则x3,矛盾,故每天新增感染人数不超过5,符合条件,C正确;对于D选项,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标11袁隆平是中国杂交水稻事业的开创者,是“当代神农”,致力于杂交水稻技术的研究、应用与推广,为人类运用科技手段战胜饥饿带来了绿色的希望和金色的收获袁老的科研团队发现“野败”后,将其带回实验,在试验田中随机抽取了100株水稻统计每株水稻的稻穗数(单位:颗)得到如图所示的频率分布直方图(同一组中
37、的数据用该组区间的中点值代表),则下列说法错误的是()Aa0.01B这100株水稻的稻穗数平均值在区间280,300)中C这100株水稻的稻穗数的众数是250D这100株水稻的稻穗数的中位数在区间240,260)中B解析:根据频率分布直方图知:组距为20,所以a1200.01750.007520.0050.00250.01,故A选项正确这100株水稻的稻穗数平均值x20(0.0052100.00752300.01752500.012700.00752900.0025310)256,可知这100株水稻的稻穗数平均值在区间240,260)中,故B选项错误由频率分布直方图知第三个矩形最高,所以这10
38、0株水稻的稻穗数的众数是250,故C选项正确前两个矩形的面积是0.250.5,所以中位数在第三组数据中,即这100株水稻的稻穗数的中位数在区间240,260)中,故D选项正确故选B12(2022邵阳模拟)已知某旅游城市2020年前10个月的游客人数(万人)按从小到大的顺序排列如下:3,5,6,9,x,y,15,17,18,21.若该组数据的中位数为13,则该组数据的平均数为()A12B10.7 C13D15A解析:因为该组数据的中位数为13,所以x+y213,所以xy26,则该组数据的平均数为110(3569xy15171821)12.13如图是某工厂对一批新产品长度(单位:mm)检测结果的频
39、率分布直方图,估计这批产品的平均长度为_ mm.2275解析:由图可知,平均长度为12.50.02517.50.04522.50.08527.50.03532.50.03522.75(mm)14某校从参加高一物理期末考试的学生中随机抽出60名,将其物理成绩(均为整数)分成六组:40,50),50,60),90,100,并绘制成如下的频率分布直方图由此估计此次高一物理期末考试成绩的第75百分位数为_82解析:高一物理期末考试成绩的第75百分位数,即成绩从低到高的第6075%45名同学因为前4组的小长方形的面积和为0.010.01520.030.07,样本量为60,所以前4组的小长方形对应的学生人
40、数为600.071042.因为前5组的小矩形的面积和为0.010.01520.030.0250.095,又因为样本量为60,所以前5组的小矩形对应的学生人数为600.0951057.因为分数在80,90)的人数为0.025106015,所以此次高一物理期末考试成绩的第75百分位数为801045421582.15小刘从事螃蟹养殖和批发多年,有着不少客户小刘把去年采购螃蟹的数量x(单位:箱)在100,200)的客户称为“大客户”,并把他们去年采购的数量制成如表:采购数量x100,120)120,140)140,160)160,180)180,200)客户数10105205已知去年“大客户”们采购的
41、螃蟹数量占小刘去年总销售量的58.(1)根据表中的数据完善频率分布直方图,并估计采购数在168箱以上(含168箱)的“大客户”人数;(2)估算小刘去年总的销售量(同一组中的数据用该组区间的中点值为代表);(3)小刘今年销售方案有两种:不在网上销售螃蟹,则按去年的价格销售,每箱利润为20元,预计销售量与去年持平;在网上销售螃蟹,则需把每箱售价下调m元(2m5),销售量可增加1 000m箱问:哪一种方案利润最大?求出今年利润Y(单位:元)的最大值解:(1)作出频率分布直方图如图,根据上图,可知采购量在168箱以上(含168箱)的“大客户”人数为1801682020517.(2)去年“大客户”所采购的螃蟹总数大约为110101301015051702019057 500(箱),小刘去年总销售量为7 5005812 000(箱)(3)若不在网上销售螃蟹,则今年小刘的利润为Y12 00020240 000(元)若在网上销售螃蟹,则今年的销售量为(12 0001 000m)箱,每箱的利润(20m),则今年小刘的收入为Y(20m)(12 0001 000m)1 000(m28m240)1 000(m4)2256.当m4时,Y取得最大值256 000.因为256 000240 000,所以方案利润最大,且小刘今年利润Y的最大值为256 000元