《概率统计大题(理科解析版).docx》由会员分享,可在线阅读,更多相关《概率统计大题(理科解析版).docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率统计大题(理科解析版)概率统计大题(理科) 真题归类 1 1 回来分析1C因为 22.5 x = , 160 y = ,所以 160 4 22.5 70 a = - = , 4 24 70 166 y = + = ,选 C 9(1)利用模型,该地区 2018 年的环境基础设施投资额的预料值为 ˆ 30.4 13.5 19 226.1 y = - + = (亿元) 利用模型,该地区 2018 年的环境基础设施投资额的预料值为 ˆ 99 17.5 9 256.5 y = + = (亿元) (2)利用模型得到的预料值更牢靠 理由如下:()从折线图可以看出,2000 年至 20
2、16 年的数据对应的点没有随机散布在直线 30.4 13.5 y t = - + 上下这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的改变趋势2010年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的旁边,这说明从 2010 年起先环境基础设施投资额的改变规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型 ˆ 99 17.5 y t = + 可以较好地描述 2010 年以后的环境基础设施投资额的改变趋势,因此利用模型得到的预料值更牢靠 ()从计算结果看,相对
3、于 2016 年的环境基础设施投资额 220 亿元,由模型得到的预料值 226.1 亿元的增幅明显偏低,而利用模型得到的预料值的增幅比较合理说明利用模型得到的预料值更牢靠 以上给出了 2 种理由,考生答出其中随意一种或其他合理理由均可得分 1.(2016III.18)下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图(I)由折线图看出,可用线性回来模型拟合 y 与 t 的关系,请用相关系数加以说明; (II)建立 y 关于 t 的回来方程(系数精确到 0.01),预料 2016 年我国生活垃圾无害化处理量。参考数据:, , , 7≈2.646. 71
4、9.32iiy=7140.17i iit y=721( ) 0.55iiy y=- =参考公式:相关系数 回来方程中斜率和截距的最小二乘估计公式分别为: ()由 及()得 , . 所以, 关于 的回来方程为:. 将 2016 年对应的 代入回来方程得:. 所以预料 2016 年我国生活垃圾无害化处理量将约 1.82 亿吨.12 21 1( )( )( ) (y y)ni iin ni ii it t y yrt t= =- -=- - ,y a bt = +121( )( )( )ni iiniit t y ybt t=- -=-, = . a y bt -331 . 1732 . 9 = y
5、 103 . 02889 . 2) () )( (ˆ71271 =- -=iiii it ty y t tb92 . 0 4 103 . 0 331 . 1ˆˆ - - = t b y ay t t y 10 . 0 92 . 0 ˆ + =9 = t 82 . 1 9 10 . 0 92 . 0 ˆ = + = y 𝑦 𝑧 𝜔 81 i=(x I -𝑦)281 i=(w i -𝜔)281 i=(x i -𝑦)(y i -𝑧) 81
6、i=(w i -𝜔)(y i -𝜔) 46.6 563 6.8 289.8 1.6 1469 108.8 表中 w 1 =1x ,𝜔=1881 iw=1 ()依据()的推断结果及表中数据,建立 y 关于 x 的回来方程; ()以知这种产品的年利率 z 与 x、y 的关系为 z=0.2y-x。依据()的结果回答下列问题:(i)(ii)附:对于一组数据(u 1v 1 ),(u 2v 2 ). (u n v n ),其回来线 v= a b + u 的斜率和截距的最小二乘估计分别为: 3.(2014II.19)某地区 2007 年至 2013 年农村居民
7、家庭纯收入 y(单位:千元)的数据如下表:年份 2007 2008 2009 2010 2011 2012 2013 年份代号 t1 2 3 4 5 6 7 人均纯收入 y2.9 3.3 3.6 4.4 4.8 5.2 5.9()求 y 关于 t 的线性回来方程; ()利用()中的回来方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的改变状况,并预料该地区 2015 年农村居民家庭人均纯收入. 附:回来直线的斜率和截距的最小二乘法估计公式分别为:( )( )( )121ni iiniit t y ybt t=- -=-,ˆây bt = -(1)由所得
8、数据计算得 t =17(1+2+3+4+5+6+7)=4, y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3 7211( )it t=-=9+4+1+0+1+4+9=28 71 11( )( )it t y y=- - =(-3) (-1.4)+(-2) (-1)+(-1) (-0.7)+0 0.1+1 0.5+2 0.9+3 1.6=14, b=71 117211( )( )( )iit t y yt t=- -=1428=0.5 a= y -b t =4.3-0.5 4=2.3 所求回来方程为 y =0.5t+2.3 ()由()知,b=0.5gt;0,故 200
9、7 年至 2013 年该地区农村居民家庭人均纯收入逐年增加,平均每年增加 0.5 千元. 将 2015 年的年份代号 t=9 代入(1)中的回来方程,得 y=0.5×9+2.3=6.8故预料该地区 2015 年农村居民家庭人均纯收入为 6.8 千元 真题归类 2 2 独立性检验27(1)记 B 表示事务旧养殖法的箱产量低于 50kg, C 表示事务新养殖法的箱产量不低于 50kg 由题意知 ( ) ( ) ( ) ( ) P A P BC P B P C = = 旧养殖法的箱产量低于 50kg 的频率为 (0.012 0.014 0.024 0.034 0.040) 5 0.62
10、+ + + + =故 ( ) P B 的估计值为 0.62 新养殖法的箱产量不低于 50kg 的频率为 (0.068 0.046 0.010 0.008) 5 0.66 + + + =故 ( ) P C 的估计值为 0.66 因此,事务 A 的概率估计值为 0.62 0.66 0.4092 = (2)依据箱产量的频率分布直方图得列联表箱产量 ,故有 99%的把握认为箱产量与养殖方法有关 (3)因为新养殖法的箱产量频率分布直方图中,箱产量低于 50kg 的直方图面积为 (0.004 0.020 0.044) 5 0.34 0.5 + + = , 故新养殖法箱产量的中位数的估计值为 0.5 0.3
11、450 52.350.068-+ (kg) 1.(2010.19)为调查某地区老年人是否须要志愿者供应帮助,用简洁随机抽样方法从该地区调查了 500 位老年人,结果如下:性别 是否须要志愿男 女 须要 40 30 不须要 160 270 ()估计该地区老年人中,须要志愿者供应帮助的老年人的比例; 0.0500.010 0.001 3.841 6.635 10.828 22( )( )( )( )( )n ad bcKa b c d a c b d-=+ + + + (1)调查的 500 位老年人中有 70 位须要志愿者供应帮助,因此该地区老年人中,须要帮助的老年人的比例的估计值为70500 1
12、4%. (2) K2 500×40×27030×1602200×300×70×430≈9.967. 由于 9.967gt;6.635,所以有 99%的把握认为该地区的老年人是否须要帮助与性别有关 (3) 由(2)的结论知,该地区老年人是否须要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中须要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采纳分层抽样方法,比采纳简洁随机抽样方法更好 13(I)由频率颁布直方图可知,在抽取的 100 人中,体育迷
13、有 25 人,从而 2×2 列联表如下: 非体育迷 体育迷 合计 男 30 15 45 女 45 10 55 合计 75 25 100 由 2×2 列联表中数据代入公式计算,得:2 2211 22 12 211 2 1 2( ) 100(30 10 45 15) 1003.03075 25 45 55 33n n n n nxn n n n+ + + +- - = = 因为 3.030lt;3.841,所以,没有理由认为体育迷与性别有关. (II)由频率分布直方图可知,超级体育迷为 5 人,从而一切可能结果所组成的基本领件空间1 2 1 3 2 3 1 1( , ),(
14、 , ),( , ),( , ) a a a a a a a b W =1 2 2 1 2 2 3 1,( , ),( , ),( , ),( , ), a b a b a b a b3 2 1 2( , ),( , ) a b b b 其中ia 表示男性, 1,2,3 i = jb 表示女性, 1,2 j = W 由 10 个基本领件组成,而且这些事 件 的 出 现 时 等 可 能 的 用 A 表 示 任 选 2 人 中 至 少 有 1 名 是 女 性 这 一 事 件 , 则1 1 1 2 2 1 2 2 3 1 3 2 1 2( , ),( , ),( , ),( , ),( , ),(
15、, ),( , ) A a b a b a b a b a b a b b b =∴7( )10P A = 真题归类 3 3 随机事务的概率1.(2015II.18)某公司为了解用户对其产品的满足度,从 A,B 两地区分别随机调查了 20 个用户,得到用户对产品的满足度评分如下:A 地区:62738192958574645376 2( ) P K k k78869566977888827689B 地区:73836251914653736482 93486581745654766579 ()依据两组数据完成两地区用户满足度评分的茎叶图,并通过茎叶图比较两地区满足度评分的平均值及分散
16、程度(不要求计算出详细值,得出结论即可); ()依据用户满足度评分,将用户的满足度从低到高分为三个不等级:满足度评分 低于 70 分 70 分到 89 分 不低于 90 分 满足度等级 不满足 满足 特别满足 记时间 C:A 地区用户的满足度等级高于 B 地区用户的满足度等级。假设两地区用户的评价结果相互独立。依据所给数据,以事务发生的频率作为相应事务发生的概率,求 C 的概率2.(2016II.18)某险种的基本保费为 (单位:元),接着购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数 0 1 2 3 4 5 保费 0.85 aa 1.25 a
17、1.5 a1.75 a2 aa设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数 0 1 2 3 4 5 概率 0.30 0.15 0.20 0.20 0.10 0. 05 ()求一续保人本年度的保费高于基本保费的概率; ()若一续保人本年度的保费高于基本保费,求其保费比基本保费高出 60%的概率; ()求续保人本年度的平均保费与基本保费的比值真题归类 4 4 频率分布直方图1.(2009.18)某工厂有工人 1 000 名,其中 250 名工人参与过短期培训(称为 A 类工人),另外 750 名工人参与过长期培训(称为 B 类工人).现用分层抽样方法(按 A 类,B 类分二层)从该
18、工厂的工人中共抽查 100 名工人,调查他们的生产实力(此处生产实力指一天加工的零件数). (1)求甲、乙两工人都被抽到的概率,其中甲为 A 类工人,乙为 B 类工人; (2)从 A 类工人中的抽查结果和从 B 类工人中的抽查结果分别如下表 1 和表 2. 表 1: 生产能 力分组 100,110) 110,120) 120,130) 130,140) 140,150) 人数 4 8 x 5 3 表 2: 生产实力分组 110,120) 120,130) 130,140) 140,150) 人数 6 y 36 18 图 1 A 类工人生产实力的频率分布直方图图 2 B 类工人生产实力的频率分布
19、直方图 分别估计 A 类工人和 B 类工人生产实力的平均数,并估计该工厂工人的生产实力的平均数(同一组中的数据用该组区间的中点值作代表) 本小题第(1)问考查分层抽样和相互独立事务同时发生的概率. 第(2)问考查频率分布直方图及期望的求解. 解:(1)甲、乙被抽到的概率均为101,且事务甲工人被抽到与事务乙工人被抽到相互独立,故甲、乙两工人都被抽到的概率为1001101101= = p. (2)由题意知 A 类工人中应抽查 25 名,B 类工人中应抽查 75 名. 故 4+8+x+5+325,得 x5,6+y+36+1875,得 y15. 频率分布直方图如下:图 2 B 类工人生产实力的频率分
20、布直方图 从直方图可以推断:B 类工人中个体间的差异程度更小. 123 145253135255125255115258105254x A = + + + + =, 133.8 145751813575361257515115756x B = + + + =,131.1 133.81007512310025x = + =. A 类工人生产实力的平均数,B 类工人生产实力的平均数以及全厂工人生产实力的平均数的估计值分别为123,133.8 和 131.1. 2.(2017II.18)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单
21、位:kg)其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记 A 表示事务:旧养殖法的箱产量低于 50kg,新养殖法的箱产量不低于 50kg,估计 A 的概率; (2)填写下面列联表,并依据列联表推断是否有 99%的把握认为箱产量与养殖方法有关:箱产量50kg 箱产量≥50kg 旧养殖法 新养殖法 (3)依据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到 0.01) 附:,22( )( )( )( )( )n ad bcKa b c d a c b d-=+ + + +真题归类 5 5 离散型随机变量的分布列( ( 北京海淀一模) )某厂生产的产品在出厂前都
22、要做质量检测,每一件一等品都能通过检测,每一件二等品通过检测的概率为23.现有 10 件产品,其中 6 件是一等品,4 件是二等品. () 随机选取 1 件产品,求能够通过检测的概率; () 随机选取 3 件产品,其中一等品的件数记为 X ,求 X 的分布列; () 随机选取 3 件产品,求这三件产品都不能通过检测的概率. 】()设随机选取一件产品,能够通过检测的事务为 A 1 分 事务 A 等于事务 选取一等品都通过检测或者是选取二等品通过检测 2 分 151332104106) ( = + = A p 4 分 () 由题可知 X 可能取值为 0,1,2,3.3 04 63101( 0)30
23、C CP XC= = = ,2 14 63103( 1)10C CP XC= = = , 1 24 63101( 2)2C CP XC= = = ,0 34 63101( 3)6C CP XC= = = . 8 分 故 X 的分布列为 9 分 X0 1 2 3 P301 103 21 61 ()设随机选取 3 件产品都不能通过检测的事务为 B10 分 事务 B 等于事务随机选取 3 件产品都是二等品且都不能通过检测 所以,31 1 1( ) ( )30 3 810P B = = .13 分 】()依据茎叶图,有高个子12 人,非高个子18 人,1 分 用分层抽样的方法,每个人被抽中的概率是61305= , 2 分 所以选中的高个子有 26112 = 人,非高个子有 36118 = 人.