《统计概率讲义(21页).doc》由会员分享,可在线阅读,更多相关《统计概率讲义(21页).doc(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-统计概率讲义-第 20 页临夏志成中学985班统计概率讲义统计学与概率论的区别与联系区别:统计学反应已经发生的事实的结果,概率论研究未来发生的随机事件的可能性联系:概率论以统计学的研究为基础统计学 普查收集数据 简单随机抽样抽样调查 分层抽样 系统抽样 统 茎叶图 整理数据 频率分布直方图计 集中分析 样本分析 学 分析数据 离散分析 总体估计 线性回归 应用数据 独立性检验一、收集数据 1.普查:需要耗费大量的人力、物力、财力,一般在总体很少时采用 2.抽样调查:从调查的总体中抽取一部分个体组成一个样本进行研究 其中样本中含有的个体数称为该样本的样本容量 简单随机抽样 适用条件:总体数较少
2、,且没有明显的结构差异 常用方法:随机数表法,抽签法,抓阄法 例:用随机数表从300个调查对象中抽出10个个体个体进行研究 随机数表如下:则抽取出的10个个体的编号为 分层抽样 适用条件:总体数较多,且有明显的结构差异 本质:样本中各层次的比例与总体中各层次的比例相同 例:志成中学从小学600,初中300,高中100抽取20人进行校长访谈,则分别抽取的人数为 系统抽样 适用条件:总体数很多,无明显结构差异 操作步骤: 第一步:编号,将总体中所有的个体从1开始编号,一直到N(N为最后一个人编号) 第二步:确定组数,样本容量n即为组数 第三步:确定间隔T(此步较为重要):即T为N除以n的商的整数部
3、分,不管小数部分多大,只取整数 第四步:分组,从编号1开始,每T个个体构成一组,共n组,多余的人省略 第五步:在第一组中抽取:采取随机抽样的方法抽取到编号为的个体 第六步:抽取样本:在剩下的n-1组中每组只抽取一个个体,遵循以下原则: 编号分别为: 例:从320个学生中采用系统抽样的方法抽取10个学生参加篮球赛,请你写出一组满足条件的学生编号: 例2:志成中学840人参加野外宿营,其中编号为1-360的360人在I区宿营,依次下来280人在A区,其余人在B区,先采用系统抽样的方法抽取28位同学作为区安全员,若在第一组中抽到的编号为12,则三区的区安全员人数分别为 最后需要特别强调的是,不管采用
4、哪一种抽样方法,每个个体被抽到的概率始终是相等的。二、整理数据 采用抽样方法收集的数据比较杂乱,需要进行整理,是数据有序,目前比较常用的两种方法:茎叶图,频率分布直方图 1.茎叶图 适用条件:样本容量较少 优势:保留了原始数据;便于比较两个样本 操作:选择合适的数作为茎,茎确定后,将对应的数写到前面或后面作为叶例:(2015年全国卷2)某公司为了解用户对其产品的满意度,从,两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 9
5、1 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79()根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);()根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”假设两地区用户的评价结果相互独立根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率2.频率分布直方图 适用条件:样本容量较大 不足:丢失了原有数据,只能保留数据
6、的大致范围 操作步骤: 第一步:求极差:收集得到的数据中的最大值-最小值=极差L 第二步:确定组距d,根据收集的数据选择合适的数据,以各组中含有的个体数差异不要过大为原则 第三步:确定组数n:与系统抽样不同的是,系统抽样只取商的整数,而在频率分布直方图这儿,不管商的小数部分有多小,我们都要给整数部分+1,为什么呢?例:极差L:,组距d:5则组数n=5() 第四步:列频率分布表(如下)分组频数累计频数频率合计样本容量 1 说明所谓频数累计,在整理数据时,对于某个数据,该数据属于哪一组,则改组的频数增加1频数/样本容量;频数=样本容量*频率 样本容量=频数/频率频数之和为样本容量,频率之和为1 第
7、五步:根据频率分布表做出频率分布直方图频率组距分组说明:标准的频率分布直方图纵坐标应该为频率组距,但需注意高考题目中给出的直方图中纵坐标可能为频率或者频数,一定注意观察纵坐标表示。对于标准的频率分布直方图,每一段直方的面积表示该组的频率频率之和为注意频率分布表与频率分布直方图的区别于联系(2014年广东卷)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:根据上述数据得到样本的频率分布表如下:(1)确定样本频率分布表中和的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,5
8、0的概率。例:某班同学利用国庆节进行社会实践,对岁的人群随机抽取人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:()补全频率分布直方图并求、的值;()从岁年龄段的“低碳族”中采用分层抽样法抽取人参加户外低碳体验活动,其中选取人作为领队,记选取的名领队中年龄在岁的人数为,求的分布列和期望。例(2013年全国2)经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示经销商为下一个销
9、售季度购进了130 t该农产品以X(单位:t,100X150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X100,110),则取X105,且X105的概率等于需求量落入100,110)的频率),求T的数学期望例:(2016年全国卷1)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件
10、作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记表示2台机器三年内共需更换的易损零件数,表示购买2台机器的同时购买的易损零件数.(I)求的分布列;(II)若要求,确定的最小值;(III)以购买易损零件所需费用的期望值为决策依据,在与之中选其一,应选用哪个?三、分析数据对数据进行整理后,我们对样本的数据进行分析,并用对样本数据的分析估计总体的趋势集中分析集中分析反映样本
11、数据的集中程度,主要有以下指标众数:样本数据中最多的数I、对于茎叶图或者保留了原始数据的样本,众数即为最多的数II、对于频率分布直方图,众数为频率最大(直方最高)组的组中点值中位数:样本数据最中间的数I、对于茎叶图或者保留了原始数据的样本,首先将数据按照从小到大或者从大到小的顺序进行排列,当数据共有奇数个时,最中间的那个数为该组数据的中位数;当数据共有偶数个时,最中间两个数之和的一半为该组数据的中位数II、对于频率分布直方图,中位数为使得该数两边的频率分别为的那个数,具体操作见例:临夏志成中学高中生的体重频率分步直方图如左图所示,则该校学生体重的中位数为分析:中位数是中间的数,在频率分布直方图
12、中,中位数两端的频率相等,均为,第一组的频率为第二组的频率为前两组频率和为第三组的频率为前三组频率和为也就是说,中位数应该在第三组之中,且频率应该为即第三组中所占的面积为,令底长为,则,即所以中位数为平均数I、对于茎叶图或者保留了原始数据的样本,平均数为算数平均数,即II、对于频率分布直方图,平均数为加权平均数,为各组数的组中点值与该组的频率(即直方的面积)乘积之和,即例:以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为,乙组数据的平均数为,则的值分别为 离散分析:分析数据的离散程度或者波动程度,主要指标有:极差:极差即样本的最大值与最小值之差方
13、差:方差是反映离散程度最佳指标,方差大,离散程度相对大一些,或者说数据相对不太稳定,波动性较大I、对于茎叶图或者保留了原始数据的样本,方差为:变式:例:(2013年全国卷1)现有个数,其平均数是,且这个数的平方和是,那么这个数组的方差是( )A B C DII、对于频率分布直方图,方差的计算方式较为复杂,但和几乎一样,先按照前面讲的公式计算平均数,在按照下列公式计算方差:(为各组的组中间值)为各组对应的频率标准差:不管哪一种情况,标准差为方差的算术平方根:标准差例(2014年全国1卷)从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:求这500件产
14、品质量指标值的样本平均数和样本方差(同一组数据用该区间的中点值作代表);同时还需要强调的是,希望各位同学会对茎叶图做出相应的分析,具体的可以详见课本必修第页,一般从离散和集中两个角度进行。例:甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( ) 甲的成绩的平均数小于乙的成绩的平均数 甲的成绩的中位数等于乙的成绩的中位数 甲的成绩的方差小于乙的成绩的方差 甲的成绩的极差小于乙的成绩的极差四、运用数据:.线性回归(注意非线性回归的线性转换) 线性回归分析两个变量间的线性关系:一个为自变量,另一个为因变量 线性关系的衡量:(散点图从图像角度,相关系数从代数角度分别进行衡量)1
15、)散点图:以自变量的值为横坐标,对应的因变量的值为纵坐标,在平面直角坐标系标出所有对应的点形成的图像 I.当所有点分布在从左下到右上的区域时,因变量与自变量正相关 即:因变量随着自变量的增大图像趋势上增大 II.当所有点分布在从左上到右下的区域时,因变量与自变量负相关 即:因变量随着自变量的增大图像趋势上减小例:对变量x, y 有观测数据理力争(,)(i=1,2,,10),得散点图1;对变量u ,v 有观测数据(,)(i=1,2,,10),得散点图2. 由这两个散点图可以判断( )(A)变量x 与y 正相关,u 与v 正相关 (B)变量x 与y 正相关,u 与v 负相关(C)变量x 与y 负相
16、关,u 与v 正相关 (D)变量x 与y 负相关,u 与v 负相关例2:变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则 ( ) A. B. C. D. 2)相关系数 相关系数从代数角度衡量因变量与自变量的相关关系,做如下说明: a.相关系数 b.,完全正相关,即:因变量随着自变量的增大一定增大 ,正相关,即:因变量随着自变量的增大趋势上增大 越大,正相关
17、性越强 c. ,完全负相关,即:因变量随着自变量的增大一定减小 ,负相关,即:因变量随着自变量的增大趋势上减小 越小,负相关性越强 d. ,自变量与因变量无线性相关性 注意:“越大,相关性越强”这种说法是错误的。为什么呢?例:已知收集到的数据在散点图中所有的点都在直线上,则两个变量的相关系数 线性回归直线 a.线性回归直线较为准确的给出了因变量与自变量的线性代数关系 b.回归直线使得散点图中的点比较均匀地分布在回归直线两侧,但不意味着直线两端的点个数一定相同 c.线性回归直线的参数的估计值的计算采用最小二乘法,所谓最小二乘法是使得实际值与估计值的差的平方和最小的一种方法,在该种方法下,求得的参
18、数使得回归直线是最佳的一条 d., e.线性回归直线一定经过样本中心点 f.回归直线的斜率与相关系数r符号相同,但是与r数值没有关系,同时表示自变量每变化一个单位,因变量变化个单位 g. 通过回归直线计算出的因变量值是一个预报值,在实际值的上下例:已知变量与正相关,且由观测数据算得样本的平均数,则由观测的数据得线性回归方程可能为( )例2:根据如下样本数据x345678y得到的回归方程为,则( ) A. B. C. D.例3:设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,n),用最小二乘法建立的回归方程为=0.85x-85
19、.71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,) 回归直线的拟合精度衡量:所谓拟合精度就是估计值与实际值的接近程度,拟合精度越高,通过回归直线所得的估计值与实际值越接近需要说明的是,对于一组数据,我们通过最小二乘法得到的回归直线已经是拟合度最高的一条直线,因此拟合精度高低比较一般在不同的两组或多组数据间进行拟合精度的衡量方法主要有两种: 残差图从图像角度进行衡量,相关指数从代数角度进行衡量1)残差图第一步:计算残差()第二步:做平面直角坐标系:对样本个体进行编号,做平面直角坐标系,横坐标为编号,纵坐标为残差 第三步:标出各个个体的残差(残差可能
20、为正也可能为负)(具体步骤可以查看选修2-3第84页)当残差图残差点分布的水平带状区域宽度越窄,拟合精度越高 2)相关指数 当相关指数越大(越接近1但小于1),拟合精度越高 注意:相关系数衡量的是两个变量之间线性相关性强弱 相关指数衡量的回归直线估计值与实际值的拟合程度例:(2014年新课标2)某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y()求y关于t的线性回归方程;()利用()中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地
21、区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:例2:(2016年全国卷3)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(I)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明(II)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。对于非线性相关,通过替换转换成为线性相关问题,记得最后将替换的还原例:(2015年全国卷1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi
22、和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.年销售量/t年宣传费(千元)46.656.36.8289.81.61469108.8表中, ()根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)()根据()的判断结果及表中数据,建立y关于x的回归方程;()以知这种产品的年利率z与x、y的关系为z0.2yx.根据()的结果回答下列问题:(1)年宣传费x49时,年销售量及年利润的预报值是多少?(2)年宣传费x为何值时,年利率的预报值最大?附:对于一组数据(u1 v1),(u2 v2). (un vn
23、),其回归线vu的斜率和截距的最小二乘估计分别为:2、独立性检验 收集数据,填写二联表假设无关,计算统计量对此做出如下说明:(以例子展开) a.假设事件A与事件B无关,根据概率论中的独立事件即 将计算的统计量与标准的无关数值概率分布表比较,得出结论例:通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由算得,附表:参照附表,得到的正确结论是A在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C有99%以上的把握认为“爱好该项运
24、动与性别有关”D有99%以上的把握认为“爱好该项运动与性别无关” 例2:为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:()估计该地区老年人中,需要志愿者提供帮助的老年人的比例;()能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?()根据()的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.来源:Z*xx*k.Com概率论1.相关概念: 随机事件:可能发生也可能不能不发生的事件事件 必然事件:一定发生 确定事件 不可能事件:一定不发生因为随机事件有多种可能,我们需用相关的实
25、验用发现所有的可能,我们把每一种可能称为一个基本事件随机事件可能包含实验发现的多个基本事件概率:1.衡量随机事件发生的可能性的大小 2.对于一个确定的随机事件,概率是其本质属性,不会随外界条件的改变而改变3.为了测量概率,我们用大量实验群的频率来发现概率,实验群的频率总是围绕着概率上下波动1.几何概型:常见的有长度、面积(特别爱和微积分结合考察)、体积三种形式例1:设y=f(x)为区间0,1上的连续函数,且恒有0f(x) 1,可以用随机模拟方法近似计算积分,先产生两组(每组N个)区间0,1上的均匀随机数,和,由此得到N个点(,)(i=1,2,N),在数出其中满足(i=1,2,N)的点数,那么由
26、随机模拟方法可得积分的近似值为 .例2:设不等式组表示的平面区域为,在区域内随机取一个点,则此点到坐标原点的距离大于2的概率是( )A. B. C. D. 2.古典概型:1.每一个基本事件等可能出现,(N为对应实验发现的所有基本事件数,为随机事件A包含的基本事件数) 2.为了计算古典概型,现代数学一般用排列组合知识计算、N 3.对于排列组合知识,需要着重掌握: i、元素不同,元素与位置相等的全排列 注意特殊元素、特殊位置、捆绑法、插空法、排除法等方法 ii、元素不同,元素与位置不相等的全排列问题 iii、元素相同,元素与位置不相等的全排列问题(隔板法) 同时希望大家对错序排列有点印象 例(20
27、10年浙江卷):有4位同学在同一天的上、下午参加“身高与体重”、“立定跳远”、“肺活量”、“握力”、“台阶”五个项目的测试,每位同学上、下午各测试一个项目,且不重复。若上午不测“握力”项目,下午不测“台阶”项目,其余项目上下午都各测试一人,则不同的安排方式共有 种(用数字作答)。4.跟排列组合相对应,二项式定理是一个高考必考考点1)二项展开式 注意:标准的二项展开式是按照括号里后一项进行升幂展开的 因而有第k+1项:2)基本概念项:展开式中的()称为展开式的项二项式系数:称为第k+1项的二项式系数 二项式系数之和:对于,其二项式系数之和为(在二项展开式中令即可证明,赋值法也是我们后面求系数之和
28、的主要方法) 偶数项二项式系数之和=偶数项二项式系数之和=(在二项展开式中先令,再令,两式相加减即可)系数:对于含有变量x的二项展开式我们把每一项的常数部分称为该项的系数 例如:的第四项为 二项式系数 系数 项 系数之和:令即可求得系数之和 偶数项系数之和和奇数项系数之和:令和得到两个式子,加减两式即可得到奇数项和偶数项系数之和。 二项式系数最大值:当n为奇数时,总共有偶数项,中间两项(第项)的二项式系数最大 当n为偶数时,共有奇数项,中间项(第项)的二项式系数最大 系数最大值:需要将第k-1,k,k+1项的系数表示出来,求解不等式 例:(2015年天津卷)在 的展开式中, 的系数为 例2:(
29、2015年湖北卷)已知的展开式中第4项与第8项的二项式系数相等,则奇数项的二项式系数和为( )A B C D例3(2011年新课标卷)的展开式中各项系数的和为2,则该展开式中常数项为( ) (A)-40 (B)-20 (C)20 (D)40(2011年重庆卷)的展开式中的系数相等,则n=(A)6 (B)7 (C)8 (D)9,则= 1、(2012年安徽卷)6位同学在毕业聚会活动中进行纪念品的交换,任意两位同学之间最多交换一次,进行交换的两位同学互赠一份纪念品,已知6位同学之间共进行了13次交换,则收到份纪念品的同学人数为( ) 或 或 或 或2.高三368班5个人排成一排,马秀兰、罗文英不能相
30、邻,且马秀兰必须与马启林相邻,则共有 种排法(用数字表示)3. 设集合,那么集合A中满足条件“”的元素个数为( )A60 B90 C4.(2014年福建卷)用代表红球,代表蓝球,代表黑球,由加法原理及乘法原理,从1个红球和1个篮球中取出若干个球的所有取法可由的展开式表示出来,如:“1”表示一个球都不取、“”表示取出一个红球,面“”用表示把红球和篮球都取出来.以此类推,下列各式中,其展开式可用来表示从5个无区别的红球、5个有区别的黑球中取出若干个球,且所有的篮球都取出或都不取出的所有取法的是A. B.C. D.条件概率:在事件A确定发生的条件下事件B发生的概率 条件概率看似很难,其实比较简单,现
31、有两种计算方法 1.在A发生的基础上直接计算事件B的概率 2.利用(AB代表事件A、B同时发生) 例1:从3本物理书,2本数学书,4本语文书抽出三本,求在先抽出一本物理书的同时再抽出一本数学书的概率为 例2:某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是( ) B. 0.75 C.例2:(2016年全国2) 某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数012345保费aaaaa2a设该险种一续保人
32、一年内出险次数与相应概率如下:一年内出险次数012345概率0. 05(I)求一续保人本年度的保费高于基本保费的概率;(II)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;(III)求续保人本年度的平均保费与基本保费的比值.随机变量与分布列、数学期望 随机变量:找出一个随机事件所对应的实验所有的可能,用数值表示这些可能 (随机事件可能包含了一个或几个随机变量的取值) 分布列:列出随机变量的所有可能取值与对应概率的表格 所有概率取值一定为1数学期望:是随机变量的所有取值的加权平均值() 数学期望是对随机变量的一种预测平均值,不同于统计学的平均数,统计学中的平均数是一系列
33、确定的、已经发生的数据的平均值 例:某游戏的得分为,随机变量表示小白玩该游戏的得分. 若,则小白得分的概率至少为 . 若变量X、Y存在线性关系,即,则常见的随机变量分布: 二项分布:1.在一系列发生的独立重复试验中,每一次试验中事件A发生的概率相同,以n次试验中事件A发生的次数作为随机变量 2.记作随机变量(可以看作随机变量的分布列,不需要额外再写分布列的表格形式) 3., 例1:(2015年广东卷)已知随机变量服从二项分布,若,则 (2009年全国新课标卷)某种种子每粒发芽的概率都为0.9,现播种了1000粒,对于没有发芽的种子,每粒需再补种2粒,补种的种子数记为X,则X的数学期望为()(A
34、)100 (B)200 (C)300 (D)400 例2:投篮测试中,每人投3次,至少投中2次才能通过测试.已知某同学每次投篮投中的概率为0.6,且各次投篮是否投中相互独立,则该同学通过测试的概率为( )(A (B(C (D例3:(2012年天津卷)现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏.()求这4个人中恰有2人去参加甲游戏的概率;()求这4个人中去参加甲游戏的分布列与期望;()用,分别表示这4个人中去参加甲、乙游戏的人数,记,求
35、随机变量的分布列与数学期望.(2012年四川卷)某居民小区有两个相互独立的安全防范系统(简称系统)和,系统和在任意时刻发生故障的概率分别为和。()若在任意时刻至少有一个系统不发生故障的概率为,求的值;()设系统在3次相互独立的检测中不发生故障的次数为随机变量,求的概率分布列及数学期望。根据以往统计资料,某地车主购买甲种保险的概率为0.5,购买乙种保险但不购买甲种保险的概率为0.3.设各车主购买保险相互独立. ()求该地1位车主至少购买甲、乙两种保险中的1种的概率;()表示该地的100位车主中,甲、乙两种保险都不购买的车主数,求的期望. 跟二项分布的变式题型考察的比较多:例1:一款击鼓小游戏的规
36、则如下:每盘游戏都需要击鼓三次,每次击鼓要么出现一次音乐,要么不出现音乐;每盘游戏击鼓三次后,出现一次音乐获得10分,出现两次音乐获得20分,出现三次音乐获得100分,没有出现音乐则扣除200分(即获得分)。设每次击鼓出现音乐的概率为,且各次击鼓出现音乐相互独立。(1)设每盘游戏获得的分数为,求的分布列;(2)玩三盘游戏,至少有一盘出现音乐的概率是多少?(3)玩过这款游戏的许多人都发现,若干盘游戏后,与最初的分数相比,分数没有增加反而减少了。请运用概率统计的相关知识分析分数减少的原因。例2:乒乓球比赛规则规定:一局比赛,双方比分在10平前,一方连续发球2次后,对方再连续发球2次,依次轮换。每次
37、发球,胜方得1分,负方得0分。设在甲、乙的比赛中,每次发球,发球方得1分的概率为0.6,各次发球的胜负结果相互独立。甲、乙的一局比赛中,甲先发球。()求开始第4次发球时,甲、乙的比分为1比2的概率;()表示开始第4次发球时乙的得分,求的期望。例3:(2014年湖南)某企业有甲、乙两个研发小组,他们研发新产品成功的概率分别为现安排甲组研发新产品,乙组研发新产品设甲、乙两组的研发相互独立(1)求至少有一种新产品研发成功的概率;(2)若新产品研发成功,预计企业可获利润120万元;若新产品研发成功,预计企业可获利润100万元求该企业可获利润的分布列和数学期望 几何分布:1.在一些列发生的独立重复实验中
38、,每次实验中事件A发生的概率相同,以事件A第一次发生需要的实验数作为随机变量 2. 因为几何分布的随机变量取值可以无穷大,因此严格意义上的几何分布很少考察到,一般规定在达到一定实验次数后结束,因此需要格外注意最后停止时概率的计算 例1:马福良进入靶场进行射击训练,已知他击中靶的概率为0.6,击中靶游戏立即结束,最多只有五发子弹,求马福良需要击发子弹数的分布列与期望例2:(2014年安徽卷)甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛,假设每局甲获胜的概率为,乙获胜的概率为,各局比赛结果相互独立.(1) 求甲在4局以内(含4局)赢得比赛的
39、概率;(2) 记为比赛决出胜负时的总局数,求的分布列和均值(数学期望)例3:甲、乙两人轮流投篮,每人每次投一票.约定甲先投中者获胜,一直到有人获胜,乙每次投篮投中的概率为,且各次投篮互不影响.1.求甲获胜的概率;2. 求投篮结束时甲的投篮次数的分布列与期望. 注意一种和几何分布相似,但每一次实验(每一步)发生的概率不相同的题目例4:某银行规定,一张银行卡若在一天内出现3次密码尝试错误,该银行卡将被锁定,小王到银行取钱时,发现自己忘记了银行卡的密码,但是可以确定该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定.(1)求当天小王的该银行卡被锁定的概率;(2)设当天小王用该银行卡尝试密码次数为X,求X的分布列和数学期望.超几何分布:从分别含有个元素的n内事物中共选出N个元素,以其中某类事物中选出的元素个数作为随机变量一般来说是从两类事物中选择 例(2015年广东卷) 袋中共有个除了颜色外完全相同的球,其中有个白球,个红球从