《医学医学统计学3.pptx》由会员分享,可在线阅读,更多相关《医学医学统计学3.pptx(43页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一节 概 率医学统计学第1页/共43页一、事件与概率 必然事件()1.事件 不可能事件()随机事件(偶然事件A、B、C等)医学统计学第2页/共43页 2.概率 例 为了调查一批小麦种子的发芽率,分别抽取10粒、50粒、100粒以至500粒,进行发芽试验,现以n代表抽样粒数,以f代表发芽粒数,列出发芽频率于下表。表3-1 小麦种子发芽频率表 调查粒数(n)发芽粒数(f)发芽频率(f/n)10 8 0.8 50 44 0.88 100 92 0.92 200 182 0.91 300 272 0.905 400 359 0.8975 500 451 0.902医学统计学第3页/共43页概率表3-
2、2 掷硬币试验正面向上的频率试验者试验次数n正面向上的次数f频率(f/n)Buffon404020480.5069W.Feller1000049790.4979K.Pearson24000120120.5005Andre Weil30000149940.4998医学统计学第4页/共43页A、概率的统计定义:假定在相似的条件下重复进行同一类试验,事件A发生的次数f与总试验次数n的比数,称为频数(f/n),在试验次数n逐渐增大时,事件A的频率愈来愈稳定地接近定值P,于是定义事件A的概率为P,记为P(A)=p。一般情况下P是不可能准确地获得的,因此,便以n在充分大时事件A的频率作为该事件概率P的近似
3、值,以上定义称为统计概率。医学统计学第5页/共43页B、概率的性质 1、0P(A)1 2、P()=1 3、P()=0 医学统计学第6页/共43页二、小概率事件原理 统计学上,把某事件发生的概率很小,可以认为该事件在一次试验中实际不可能出现,称为“小概率事件实际不可能性原理”。小概率事件实际不可能性原理是统计假设测验或显著性检验的理论基础。医学统计学第7页/共43页第二节第二节 随机变量及其分布医学统计学第8页/共43页一、随机变量及其概率分布随机试验:指做一次试验后试验的结果可能是多种的,简称试验。随机变量:表示随机试验结果的一个变量 随机试验数量化后,随机变量取某一个值或在某一个范围内取值都
4、有一个相应的概率,这就是要研究和掌握的规律,这个规律称为随机变量的概率分布。医学统计学第9页/共43页1.离散型随机变量概念:随机变量的全部可能取到的值是有限个或可列无限个实数值的随机变量,称之为离散型随机变量。医学统计学第10页/共43页1.离散型随机变量概率分布 设x为一离散型随机变量,它的有限个或无限个可列的可能值为 上式表达了X取值的概率,称为概率分布。离散型随机变量的概率分布有下列基本性质:医学统计学第11页/共43页2.连续型随机变量概念 随机变量的取值充满一个区间,无法一一列出其每一个可能值的变量,称为连续型随机变量。医学统计学第12页/共43页2.连续型随机变量概率分布 表3-
5、3 200头母猪的仔猪一月窝重频数与频率分布分组 次数(f)频率(f/n)8-4 0.020 16-6 0.030 24-9 0.045 32-10 0.050 40-13 0.065 48-17 0.085 56-26 0.130 64-35 0.175 72-28 0.140 80-21 0.105 88-16 0.080 96-8 0.040 104-4 0.020 112-3 0.015 合计 200 1.000第13页/共43页医学统计学第14页/共43页2.连续型随机变量概率分布 记变量x的概率分布密度函数为f(x),则x取值于区间a,b的概率为函数f(x)的定积分:医学统计学第1
6、5页/共43页2.连续型随机变量概率分布性质 1、分布密度函数总是大于或等于0,即f(x)0;2、当随机变量x取某一特定值时,其概率等于0;3、在一次试验中随机变量x之取值在-x+范围内,为一必然事件 医学统计学第16页/共43页A、意义 设连续型随机变量x的概率密度函数为 称连续型随机变量x服从正态分布,记为xN(、2)二、正态分布二、正态分布医学统计学第17页/共43页正态分布的分布函数:二、正态分布第18页/共43页B、特性1、正态分布曲线是以直线为对称轴,向左右两侧作对称分布,所以它是一个对称曲线。2、正态分布密度曲线向左、向右无限延伸,以x轴为渐进线,分布从-到+。3、正态分布曲线在
7、 处取最大值,此时,4、正态分布的多数次数集中于算术平均数附近,离平均数越远,其相应的次数越少。5、正态分布曲线在x=处有拐点。6、正态分布曲线的形状完全取决于和两个参数。确定了正态分布在x轴上的中心位置,确定了正态分布的变异度。7、正态分布曲线与x轴之间的面积等于1。医学统计学第19页/共43页医学统计学第20页/共43页三、标准正态分布 将x与其平均数u的差数,以为单位进行转换,即设 ,将u代入正态分布密度函数,则函数式就转换为 现将上式与正态分布密度函数进行比较,该式就可以看成是变量u的正态分布函数,此时=0,2=1。因此,统计学上称当=0,2=1时的正态分布称为标准正态分布或u分布,记
8、作N(0,1)。医学统计学第21页/共43页注意:正态分布的概率密度函数表示为f(x),分布函数表示为F(x);标准正态分布的概率密度函数表示为 ,分布函数表示为医学统计学第22页/共43页四、正态分布的概率计算 若随机变量x服从正态分布N(,2),x落入任意区间(a,b)的概率,记作P(axb),等于由直线x=a、x=b、x轴和正态分布曲线所围成曲边梯形的面积医学统计学第23页/共43页四、正态分布的概率计算 连续型随机变量x在-到+范围内取值的概率等于1:xa的概率:医学统计学第24页/共43页四、正态分布的概率计算 计算任一正态分布的概率时,首先要将正态分布x标准化,将x(axb)取值区
9、间的上下限做 ,即医学统计学第25页/共43页 例3.1.已知u服从正态分布N(0,1),试求(1)P(u -1.64);(2)P(u2.58);(3)。解:查表得:医学统计学第26页/共43页例4.2 有一随机变量x服从正态分布,平均数=30,标准差=5,试计算x小于26,大于40,介于26和40之间的概率。解:查附表,查附表,第27页/共43页例4.2 试计算统计中最常用的几个概率值:(1)P(x+);(2)P(2x+2)(3)P(3x+3);(4)P(1.96x+1.96)(5)P(2.58x+2.58);(6)P(x 1.96)(7)P(x2.58)解:第28页/共43页第29页/共4
10、3页第30页/共43页 左尾概率:右尾概率:一尾概率:两尾概率:医学统计学第31页/共43页标准正态分布的临界值查p=0.01,u=2.5758 p=0.05,u=1.9599可表示为:p(u2.5758)=0.01 p(u1.9599)=0.05第32页/共43页一尾概率的计算 医学统计学第33页/共43页第三节正态分布概率计算的Excel应用医学统计学第34页/共43页一、用Excel计算正态分布NORMDIST函数:正态分布概率NORMSDIST函数:标准正态分布概率NORMSINV函数:标准正态分布临界值医学统计学第35页/共43页NORMDIST函数 计算正态分布N(,2)的分布函数
11、F(x)和概率密度函数f(x)NORMDIST(X,Mean,Standarddev,Cumulative)x:为需要计算其分布的数值x;Mean:正态分布的均值;Standarddev:正态分布的标准差;Cumulative:为一逻辑值。若取1或TRUE,计算分布函数F(x),若取0或FALSE,计算密度函数f(x)。医学统计学第36页/共43页 例3.2 有一随机变量x服从正态分布,平均数=30,标准差=5,试计算x小于26,大于40,介于26和40之间的概率。1、“=NORMDIST(26,30,5,1)”,回车,显示结果;2、菜单法:“插入”“函数”“统计”选择“NORMDIST”确定
12、“NORMDIST”对话框输入x,mean,S,1 显示结果NORMDIST函数医学统计学第37页/共43页NORMSDIST函数计算标准正态分布N(0,1)的分布函数的值。表达格式:NORMSDIST(Z)Z:需要计算其分布的数值。医学统计学第38页/共43页例3.1 已知u服从正态分布N(0,1),试求(1)P(u -1.64);(2)P(u2.58)。1、“=NORMSDIST(-1.64)”,回车,显示结果;2、菜单法:“插入”“函数”“统计”选择“NORMSDIST”确定“NORMSDIST”对话框输入Z(-1.64)显示结果NORMSDIST函数医学统计学第39页/共43页NORM
13、SINV函数 计算标准正态分布N(0,1)的分布函数的临界值;函数使用格式为:NORMSINV(Probability)Probability:标准正态分布的概率值p。医学统计学第40页/共43页例,已知概率为0.05,求解临界u值。1、“=NORMSDIST(0.05)”,回车,显示结果;2、菜单法:“插入”“函数”“统计”选择“NORMSINV”确定“NORMSINV”对话框输入P(0.05)显示结果注意:该函数为已知单侧概率,求解临界值 NORMSINV函数医学统计学第41页/共43页本章小结 本章介绍了统计学检验的理论基础概率及其常见的概率分布。着重讲述了概率、频率、随机事件、随机试验、随机变量的概念以及两种类型随机变量(离散型和连续型)定义及其概率分布特征、差异;介绍了显著性检验常用的概率分布正态分布与标准正态分布,理解两种分布的特性以及概率的计算方法.医学统计学第42页/共43页谢谢您的观看!第43页/共43页