《概率统计基础.ppt》由会员分享,可在线阅读,更多相关《概率统计基础.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率统计基础概率统计基础第一节第一节 概率基础知识概率基础知识一、事件与概率(一)随机现象 1、定义:在一定条件下,并不总是出现相同结果的现象称为随机现象。2、随机现象的特点:(1)随机现象的结果至少有两个;(2)至于哪一个出现,事先人们并不知道。认识一个随机现象首要的就是能罗列出它的一切可能发生的基本结果。这里的基本结果称为样本点,随机现象一切可能样本点的全体称为这个随机现象的样本空间,常记为。(二)随机事件定义:随机现象的某些样本点组成的集合称为随机事件,简称事件,常用大写字母A、B、C等表示。1、随机事件的特征任一事件A是相应样本空间中的一个子集;事件A发生当且仅当A中某一样本点发生;事
2、件A的表示可用集合,也可用语言,但所用的语言应是明确无误的;任一样本空间都有一个最大子集,这个最大子集就是,它对应的事件就是必然事件,仍用表示;任一样本空间都有一个最小子集,这个最小子集就是空集,它对应的事件称为不可能事件,记为 2、随机事件之间的关系(1)包含:在一个随机现象中有两个事件A与B,若时间A中任一个样本点必在B中,则称A被包含在B中,或B包含A,记为A B,或 ,这时事件A的发生必导致事件B发生,BA(2)互不相容(互斥):“A,B没有共同的的样本点”,或“A、B”不能同时发生,称为A、B互不相容(互斥);(3)相等:“若事件A包含事件B,事件B也包含事件A,则称事件A和B相等”
3、。(三)事件的运算 (1)对立事件(事件的逆):“样本空间去掉A的样本点”所成的事件称为A的对立事件,记为 。(2)事件的并(和):“A、B的全部样本点”所成的事件或“两个事件 至少有一发生所成的事件”,称为 的并,记为AB;3)事件的交:事件A与事件B都发生的事件称为事件A与事件B的交,记为AB,简记为AB。A(四)事件的概论 概率:在一定条件下,随机事件A发生的可能性大小称为随机事件A的概率,记为P(A)。概率越大,事件发生的可能性就愈大;概率愈小,事件发生的可能性也就愈小。1、概率的统计定义(1)与事件A有关的随机现象是允许大量重复试验的;(2)若在n次重复实验中,事件A发生 次,则事件
4、A发生的频率为(3)频率 会随重复试验次数增加而趋于稳定。2、随机事件概率的性质 性质1:必然事件的概率为1,即 性质6:若事件A与B相互独立(即其中一个事件发生不影响另一个事件发生),则A与B的交事件的概率是:P(AB)=P(A)P(B)。二、二二项分布与正分布与正态分布分布(一)随机变量及其分布1、随机变量定义:用来表示随机现象结果的变量称为随机变量。常用大写字母X、Y、Z等表示随机变量,而随机变量的值用小写字母 x、y、z表示。分类:随机变量 离散型随机变量 连续型随机变量2、随机变量的分布 随机变量的取值是随机的,但其内在还是有规律性的,这个规律可以用分布来描述。认识一个随机变量X的关
5、键就是要知道它的分布。分布包含如下两方面的内容:(1)X可能取哪些值,或在哪个区间上取值。(2)X取这些值的概率各是多少,或X在任一小区间上取值的概率是多少?离散型随机变量的分布 离散型随机变量的分布可用分布列表示,或用一个简明的数学式子表示出来。图表法(分布列):公式法:P(X=xi)=pi i=1,2,n 要使其成为一个分布,应满足下列条件:1)pi0,非负性 2)p1+p2+pn=1 正则性连续型随机变量 连续型随机变量的分布可用概率密度函数p(x)表示 3、随机变量分布的均值、方差与标准差 随机变量X的分布(概率函数或密度函数)有几个很重要的特征数,用来表示分布的集中位置(中心位置)和
6、散布大小。两个最重要的特征数:1)均值:表示分布的中心位置,E(x)2)方差:表示分布的散布大小,Var(x)(二)二项分布1、重复进行 n 次试验;2、n 次试验间相互独立;3、每次试验仅有两个可能结果;4、成功的概率为p,失败的概率为1-p 在上述四个条件下,设x表示n次独立重复试验中成功出现的次数,则有 这个分布称为二项分布,记为b(n,p)。其均值、标准差为:E(x)=np Var(x)=np(1-p)例某批产品批量1000件,不合格品率p=10,从该批产品中抽取10件,其中不合格品数不超过l件的概率为A0.910。B.1.9*0.99 C 0.99 D.1.9*0.910(三)正态分
7、布1、正态分布的概率密度函数 它的图形是对称的钟形曲线,常称为正态曲线。正态分布有两个参数和,常记为N(,2)。2、标准正态分布 =0且=1的分布称为标准正态分布,记为N(0,1),其随机变量记为U。1)标准正态分布表 P(Ua)=P(U a)=1-(a)(-a)=1-(a)P(a U b)=(b)-(a)P(|U|a)=P(-a U a)=(a)-(-a)=2(a)-13、标准正态分布N(0,1)的分位数 分位数是一个基本概念,结合标准正态分布N(0,1)来叙述分位数概念。一般说来,对任意介于0与1之间的实数,标准正态分布N(0,1)的分位数是这样一个数,它的左侧面积恰好为,它的右侧面积恰好
8、为1-,用概率的语言来说,分位数是满足下列等式的实数:P(U u)=关于分位数的正负符号问题:0.5分位数,即50%分位数,也称为中位数。在标准正态分布场合:u 0.5=0 当 0.5时,u 0.5时,u 0(正数)或1-永远为正(概率必为正)u 与-u 对应(下标相同,加负号)u 与 u1-对应(下标不同,不加负号)4、有关正态分布的计算 正态分布计算是基于下面的重要性质:性质1:性质2:设 X N(,2),则对任意实数a、b有:产品质量特性的不合格品率的计算 1、质量特性 X 的分布,在受控的情况下,常为正态分布;2、产品的规范限,常包括上规范限TU和下规范限TL。产品质量特性的不合格品率
9、为:p=pL+pU第二节第二节 统计的基本概念统计的基本概念一、样本与统计量(一)总体与个体一般的,我们把研究对象的全体称为总体;构成总体的每个成员叫个体;每个个体的数量指标的全体有一个分布,称为总体的分布。(二)样本 从总体中抽取部分个体组成的集合称为样本。满足下面两个条件的样本称为简单随机样本,简称随机样本。(1)随机性:总体中每个个体都有相同的机会入样。(2)独立性:从总体中抽取的每个个体对其他个体的抽取无任何影响。(三)统计量与抽样分布统计量:是不包含未知参数的样本函数。一个统计量也是一个随机变量,统计量的分布称为抽样分布(四)常用统计量(五)样本数据的整理从总体X中获得的样本是总体的
10、一个缩影,需要对样本数据进行加工,将有用信息提取出来,以便对总体有所了解。对数据加工有两种方法:一是计算统计量;二是利用图形与表格。三、正态概率纸三、正态概率纸1、用来检验一组数据是否来自正态分布2、在确认样本来自正态分布后,可在正态概率纸上作出正态均值与正态标准差的估计3、在确认样本来自非正态分布后,可对数据作变换后再在正态概率纸上描点,若诸点近似在一条直线附近,则可认为变换后的数据来自某正态总体,常用的变换有如下两个:y=ln x 或 y=1/x第三节第三节 回归分析回归分析一、散布图与相关系数质量管理中经常需要研究两个变量间的相关关系,回归分析是处理变量相关关系的一种统计技术。(一)、散
11、布图作回归分析之初要画散布图,即在xy平面上点出 散布图近似于直线可用回归分析。如(二)、相关系数(1)相关系数就是表示两个变量线性关系的密切程度的统计量。X与Y的相关系数(2)相关系数的含义根据相关系数取值,相应散布图有6种可能性,r=1 完全线性相关。r=0不相关(不存在线性关系,但可能存在特殊的曲线关系);r0正相关(x增大y增大);r6.8)=()A (2)B 1-(3.4)C (3.4)D 1-(2)CD5、一批产品的不合格率为.,现在这批产品中随机取出个,记为这个产品中的不合格品数,则这个产品中没有不合格品的概率为()0.0.85 C 0.2*0.84 D 0.24*0.86、设随
12、机变量X服从正态分布N(100,4),则均值与标准差分别为()A =100,=4 B=10,=2 C=100,=2 D=10,=4 BC7、如果在y关于x的线性回归方程 中,若b0,那么两变量x和y间的相关系数r有()。A.r=0 Br=1 Cr08、10个产品中有3个不合格品,每次从中随机抽取一个(取出后不放回)直到把3个不合格品都取出,至少抽()次才确保抽出所有不合格品。A 13 B 9 C 8 D7BA9、15个产品中有5个不合格品,每次从中随机抽取一个(取出后不放回),直到把5个不合格品都取出,将抽取的次数构成样本空间,则其中包含的样本点共有()个。A 13 B 12 C 11 D 1
13、010、事件AB不发生,意味着事件A与事件B()A 至少有一个发生 B 至少有一个不发生C 两个都不发生 D 互不相容 CB11、从装有2个红球和2个白球的袋内任取2球,那么互不相容的两个事件是()“至少一个白球”与“都是白球”“至少一个白球”与“至少一个红球”“恰有一个白球”与“恰有两个白球”“至多一个白球”与“都是红球”12、现有5件产品,其中1件不合格品。现从中随机抽取2件检查,则其中没有不合格品的概率为()A 0.47 B 0.60 C 0.93 D 0.6713、现有5本不同的文艺书,任取3本共有()种取法。A 5 B 10 C15 DB1、正态标准差 的无偏估计有()/2、设ua是
14、标准正态分布的a分位数,则有()A u0.2 0 B u0.5 0C D多选题3、设随机变量X服从二项分布b(n,p)已知E(X)=2.4,Var(X)=1.44,则两个参数n与p为()A.p=0.4 B.p=0 6 C n=6 D.n=44、正态分布 中 的 含义及性质为()A正态方差 B 愈小,分布愈集中c正态标准差 D 愈大,分布愈分散ACBCD 5、回归方程,表明()。A随着x增加,y有增加趋势 B随着x增加,y有减少趋势 C相关系数r0 D相关系数r0BD6、随机变量X有如下概率分布下列计算中,正确的有()。A P(X3)=0.5 B P(2.7X5.1)=0.7C E(X)=2.9 D E(X)=3.9E BD