《高三文科数学二轮专题复习十一 统计与概率讲义.doc》由会员分享,可在线阅读,更多相关《高三文科数学二轮专题复习十一 统计与概率讲义.doc(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、专题十一 统计与概率一、知识结构导图统计抽样方法随机抽样简单随机机抽样系统抽样分层抽样总体分布的估计用样本的频率分布估计总体的频率分布频率分布直方图茎叶图用样本的频率分布估计总体的频率分布众数与中位数平均分方差与标准差变量的相关性确定关系、相关关系正相关、负相关线性回归方程(一)统计考点回顾1、频数、频率:将一批数据按要求分为若干个组,各组内数据的个数,叫该组的频数。每组数除以全体数据的个数的商叫做该组的频率 【 频率 】,频率反映数据在每组中所占比例的大小。2、频率分布直方图:方法与步骤(1)先制作频率分布表,然后作直角坐标系,纵轴为(2)把横轴分成若干段,每一段对应一个组的组距。注意:(1
2、)频率组距×小矩形的面积,各小矩形的面积表示相应各组的频率,频率分布直方图以面积的形式反映了数据落在各小组内的频率大小;(2)在频率分布直方图中,各小矩形的面积之和为1;(3)从频率分布直方图中,可以清楚地看到数据分布的总体态势,但是得不到原始数据,所以把数据表示成频率分布直方图后,原有具体的信息就被抹掉了。3、平均数、中位数和众数(1)、众数:一组数据中出现次数最多的那个数据叫做这个数据的众数。(2)、中位数:将一组数据按从小到大的顺序排列,当数据有奇数个时,处在最中间的一个数或当数据有偶数个时,处在最中间的两个数的平均数是这组数据的中位数。注意:中位数是样本数据所占频率的等分线,
3、即有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积相等。中位数不受几个极端值(即排序靠前或靠后的数据)的影响,仅利用了数据中排在中间数据的信息。(3)、平均数:平均数,平均数是频率分布直方图的“重心”。任何一个数据的改变都会引起平均数的变化,与众数、中位数比较,平均数可以反映出更多的关于样本数据全体的信息,但平均值受极端值的影响较大。用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。(4)、在频率分布直方图中也可以找到众数、中位数。根据众数的意义可知在频率分布直方图中最高小长形的中点所对应的数据即为这
4、组数据的众数。4、方差、标准差(1)、方差:是这组数据的平均数,则定义来衡量这组数据的波动大小,并把它叫做这组数据的方差,一组数据的方差越大,说明这组数据波动越大。(2)、标准差:数据的方差的算术平方根叫做这组数据的标准差。,标准差也是衡量一组数据波动大小的重要的量。(3)、方差与标准差的区别与联系:计算标准差要比计算方差多开一次方,但它的度量单位与原数据一致,有时用它比较方便。(4)、数据的离散程度可以通过极差、方差或标准差来描述,其中极差(全距)是数据组的最大值与最小值的差。5、茎叶图:(1)所有信息都可以从这个茎叶图中得到;(2)茎叶图便于记录和表示,能够展示数据的分布情况。概率随机现象
5、不可能事件随机事件必然事件频率与概率频率概率:0P(A)1概率的加法公式互斥事件P(AB)P(A)P(B)对立事件P(A)P()1古典概型等可能、有限性概率:几何概型等可能、无限性概率:P(A)(二)概率考点回顾1、古典概型(1)、古典概型的定义:试验中所有可能出现的基本事件只有有限个;每个基本事件出现的可能性相等。(2)、古典概型的概率公式:2、几何概型(1)几何概型的定义:如果每个事件发生的概率只与构成该事件区域的长度(面积)成比例,则称这样的概率型为几何概率模型,简称几何概型。(2)几何概型的特点:、无限性,即在一次试验中,基本事件的个数可以无限的;、等可能性,即每一个基本事件发生的可能
6、性是均等。(3)几何概型的概率计算公式:二、典例精析例1:某班有60名同学,其中女同学有25人,现采用分层抽样从这个班抽取容量为12人的样本,其中抽取的男同学应是( )人。 【2020年云南】A:4 B:5 C:6 D:7例2:将编号为001,002,003,004,005,300的300个产品,按编号从小到大的顺序均匀的分成若干组,采用每小组选取的号码间隔一样的系统抽样方法抽取一个样本,若第一组抽取的编号是003,第二组抽取的编号是018,则样本中最大的编号应该是( )A:283 B:288 C:295 D:298 【2020年陕西】例3:某工厂利用随机数表对生产的600个零件进行抽样测试,
7、先将600个零件进行编号,编号分别为001,002,003,004,599,600。从中抽取60个样本下面提供随机数表的第4行到第6行:若从表中第6行第6列开始向右依次读取3个数据,则得到的第5个样本编号是()A:522 B:324 C:535 D:578 【2020年广西】例4:我省高考从2021年开始实行312模式,“3”为全国统考科目语文、数学、外语,所有学生必考;“1”为首选科目,考生必须在物理、历史两科中选择一科;“2”为再选科目,考生可在化学、生物、思想政治、地理4个科目中选择两科, 今年某校高一的学生小霞和小芸在准备进行选科,假如她们首选科目都是历史,再选科目她们选择每个科目的可
8、能性均相等,且她俩的选择互不影响,则她们的选科至少有一科不相同的概率为( )A: B: C: D: 【2020年云南】例5:已知43,直线:,圆:2,则直线与圆相交的概率为( ) 【2020年湖北】A: B: C: D:例6:如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是( )A:甲所得分数的极差为22 B:乙所得分数的中位数为18C:两人所得分数的众数相等 D:甲所得分数的平均数低于乙所得分数的平均数例7:某地在国庆节7天假期中的楼房购量(单位:套)与成交量(单位:套)的折线图如图所示,小明同学根据折线图对这7天的认购量与成交量做出如下判断:(1)成交量的中位数
9、是6;(2)认购量与日期正相关;(3)日成交量超过日平均成交量的有2天,则上述判断中正确的个数为( )【2020年湖南】A:3 B:2 C:1 D:0例8:某保险公司给年龄在20-70岁的民众提供某种疾病的一年期医疗保险,现从10000名参保人员中随机选取100名作为样本进行分析,按年龄段 20,30),30,40),40,50),50,60),60,70 分成五组,其频率分布直方图如下图所示,参保年龄与每人每年应交纳的保费如下表所示: 【2020年四川】(1)求频率分布直方图中实数的值,并求出该样本年龄的中位数;(2)现分别在年龄段20,30),30,40),40,50),50,60),60
10、,70中各选出1人共5人进行回访,若从这5人中随机选出2个,求这2个所交保费之各大于200元的概率。年龄(单位:岁)20,30)30,40)40,50)50,60)50,60)保费(单位:元)306090120150例9:2018年到2020年,第六届全国文明城市创建工作即将开始,在2017年9月7日召开的攀枝花市创文工作推进会上,攀枝花市委明确提出“力保新一轮提名城市资格、确保2020年创建成功”的目标,为了确保创文工作,今年初交警大队在辖区内开展“机动车不礼让行人整治”。下表是我市一主干路口监控设备抓拍的5个月内“驾驶员不礼让斑马线”行为统计数据。【2020年河南】月份12345违章驾驶员
11、人数1201051009085(1)请利用所给数据求违章人数与月份之间的线性回归方程;(2)预测该路口7月份不“礼让斑马线”违章驾驶员的人数;(3)交警从这5个月内通过路口的驾驶员中随机抽查了50人,调查“驾驶员不礼让斑马线”行为与驾龄的关系,得到如下2×2列联表:不礼让斑马线礼让斑马线合计驾龄不超过1年22830驾龄1年以上81220合计302050能否据此判断有97.5%的把握认为“礼让斑马线”行为与驾龄有关?三、课堂练习1、总体由编号为01,02,03,39,40 的40个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第8列和第9列数字开始,由左到右依次
12、选取两个数字,则选出来的第6个个体的编号为( ) 【2020年安徽】A:23 B:15 C:21 D:242、某公司生产甲、乙、丙三种型号的吊车,产量分别为120台、600台和200台,为检验该公司的产品质量,现用分层抽样的方法抽取46台进行检验,则抽到乙种型号的吊车有()A:6台 B:10台 C:20台 D:30台 【2020年江西】3、天气预报说,在今后的三天中,每三天下雨的情况不完全相间,每一天下雨的概率均为40%,现采用随机模拟试验的方法估计这三中恰有两天下雨的概率:用1、2、3、4表示下雨,从下列随机数表的第1行第2列开始读取直到末尾从而获得N个数据,据此估计,这三天中恰有两天下雨的
13、概率近似为( ) 【2020年襄阳】A: B: C: D:以上答案都不对4、高三某班有学生56人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为( )A:13 B:17 C:19 D:21 【2020年眉山】5、某篮球队甲、乙两各运动员练习罚球,每人练习10组,每组罚球40个,命中个数的茎叶图如下图所示,则下列结论错误的是( ) 【2020年黑龙江】A:甲的极差是29 B:甲的中位数是24 C:甲罚球命中率比乙高 D:乙的众数是216、在一个不透明的容器中有6个小球,其中有4个黄球,2个红球,它们除颜色外完全相
14、同,如果一次随机取出2个球,那么至少有1个红球的概率为( ) 【2020年广西】A: B: C: D:7、如图是一组样本数据的频率分布直方图,则依据图形中的数据,可以估计总体的平均数与中位数分别是( ) A:12.5 12.5 B:13 13 C:13.5 12.5 D:13.5 138、在一次200千米的汽车拉力赛中,50名参赛选手的成绩全部介于13分钟到18分钟之间,将比赛成绩分为五组:第一组13,14)、第二组14,15)、第五组17,18),其频率分布直方图如图所示,若成绩在13,15)之间的选手可获奖,则这50名选手中获奖的人数为( ) A:39 B:35 C:15 D:119、“微
15、信抢红包”自2015年以来异常火爆,在某个微信群某次进行的抢红包活动中,若所发红包的总金额为9元,被随机分配为1.49元、1.3元、2.19元、3.40元、0.61元,共5份,供甲、乙等5人抢一次,则甲、乙二个抢到的金额之和不低于4元的概率( )A: B: C: D: 10、某公司的班车在730,800,830发车,小明在750至830之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )A: B: C: D: 【2020年双流】11、在区间 , 上随机取一个数,则的值介于与之间的概率为()A: B: C: D: 【2020年陕西】12、我国三国时期的数学
16、家赵爽为了证明勾股定理创制了一幅“勾股圆方图”,该图是由四个全等的直角三角形组成,它们围成了一个如图所示的大正方形和小正方形,设直角三角形中一个锐角的正切值为3,在大正方形内随机取一点,则此点取自小正方形内的概率是( )A: B: C: D: 【2020年广东】13、从装有4个红球和3个白球的袋中任取2个球,那么下列事件中,是对立事件的是()A:至少有1个白球;都是红球 B:至少有1个白球;至少有1个红球C:恰好有1个白球;恰好有2个白球 D:至少有1个白球;都是白球 【2020年河北】14、古希腊数学家欧多克索斯在深入研究比例理论时,提出了分线段“中末比”问题,将线段MN分为两线段MG、GN
17、,使得其中较长的一段MG是全长MN与另一段GN的比例中项,即满足,后人把这个数称为“黄金分割”数,把点G称为线段MN的“黄金分割”点。在矩形ABCD中,E、F是线段AB的两个“黄金分割”点,在矩形ABCD内任取一点M,则该点落在DEF内的概率为( ) A:B:C:D:【2020年泸州】15、某高中高一、高二、高三年级的学生人数之比为988,教务处为了解学生“停课不停学”期间在家的网络学习情况,现采用分层抽样的方法从三个年级的学生中抽取容量为100的样本进行调查,则应从高三年级抽取_名学生。 【2020年江苏】13、从某小学随机抽取100名学生,将他们的身高(单位:cm)数据绘制成如图所示的频率
18、分布直方图,则身高在 120,130)内的学生人数为_。 【2020年江苏】16、若1,6,则函数在区间 2,) 内单调递增的概率为_。【2020年河南】17、某校2020届高三数学教师为分析本校2019年高考文科数学成绩,从该校文科生中随机抽取400名学生的成绩进行统计,将他们的成绩分成六段 80,90),90,100),100,110),110,120),120,130),130,140 后得到如图所示的频率分布直方图: 【2020年全国】(1)若每组数据以该组的中点值为代表,估计这400个学生数学成绩的众数和和平均数;(2)用分层抽样的方法,从这400名学生中抽取20人,再从所抽取的20
19、人中成绩在 120,140 内的学生中抽取2人,求这2人至少有一人成绩在 130,140 内的概率。课 后 综 合 练 习1、某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001、002、003、699、700。从中抽取70个样本,如下提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )A:623 B:328 C:253 D:0072、某高级中学高一年级、高二年级、高三年级分别有学生1400名、1200名、1000名,为了了解学生的健康状况,用分层抽样的方法从该校学生中抽取一个容量为的样本,若从高三年级抽取25名,则
20、为( )A:75 B:85 C:90 D:1003、为了解某高校高中学生的数学运算能力,从编号为0001、0002、1999、2000的2000名学生中采用系统抽样的方法抽取一个容量为50的样本,并把样本编号从小到大排列,已知抽取的第一个样本编号为0003,则最后一个样本编号是( )A:0047 B:1663 C:1960 D:19634、如图所示的茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:分)。已知甲组数据的中位数为15,乙组数据的平均数为16.8,则茎叶图的、的值分别为( ) A:2 5 B:5 8 C:5 5 D:8 85、某学生本周每日睡眠时间分别是7,6,8,
21、7,5,9,7(单位:小时),则该组数据的方差为( ) A: B: C:7 D:106、下图是500名学生某次数测试成绩(单位:分)的频率分布直方图,则这500名学生中测试成绩在区间90,100)中的学生人数是( )A:60B:55C:45D:507、有长度分别为1,3,5,7,9的五条线段中任取三条,能以它们为边构成三角形的是()A: B: C: D: 8、在5件产品中,有3件一等品和2件二等品,从中任取2件,则下列选项中以为概率的事件为( )A:恰有1件一等品 B:至少有一件一等品 C:至多有一件一等品 D:都不是一等品9、如图,在ABC中,ABBC,若tan,BD是AC边上的高,若从AB
22、C内部随机取一点,则此点取自阴影部分的概率为( ) A: B: C: D:10、若在区间1,12内任取一个实数,则1,2的概率为( )A: B: C: D:11、某班有学生54人,现根据学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号同学在样本中,那么样本中还有一个同学的编号是_。12、已知在一组数据1,2,4,5,5,8,9中,设中位数为,众数为,则_。13、如图是我市某小区100户居民2015年月平均用水量(单位:)的频率分布直方图的一部分,则该小区2015年的月平均用水量的中位数的估计值为_。14、设集合A16,B,从集合A中任取一个元素,则这个元素也是集合B中的
23、元素的概率是_。 15、成都是全国闻名的旅游城市,有许多有特色的旅游景区。某景区为了提升服务品质,对过去100天每天的游客数进行了统计分析,发现这100天每天的游客数都没有超出八千人,统计结果见下面的频率分布直方图:(1)估计该景区每天游客数的中位数和平均数;(2)为了研究每天的游客数是否和当天的最高气温有关,从这一百天中随机抽取了5天,统计出这5天的游客数(千人)分别为0.8、3.7、5.1、5.6、6.8,已知这5天的最高气温(oC)依次为8、18、22、24、28。根据以上数据,求游客数关于当天最高气温的线性回归方程(系数保留一位小数);根据中的回归方程,估计该景区这100天中最高气温在20 oC26 oC内的天数(保留整数)。参考公式:由最小二乘法所得回归直线的方程是;【2020年全国】其中,。本题参考数据:70,232。14