《医药数理统计课件(概率论部分).pptx》由会员分享,可在线阅读,更多相关《医药数理统计课件(概率论部分).pptx(116页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、概率论部分主讲:吕 靖概率概率(或然率或几率或然率或几率)随机事件出现随机事件出现的可能性的量度的可能性的量度 其起源与博弈问题有关其起源与博弈问题有关.16世纪意大利学者开始研究掷骰子等赌博世纪意大利学者开始研究掷骰子等赌博中的一些问题;中的一些问题;17世纪中叶,法国数学家世纪中叶,法国数学家B.帕帕斯卡、荷兰数学家斯卡、荷兰数学家C.惠更斯惠更斯 基于排列组合的方基于排列组合的方法,研究了较复杂法,研究了较复杂 的赌博问题,的赌博问题,解决了解决了“合理合理分配赌注问题分配赌注问题”(即得分问题即得分问题).概率论是一门概率论是一门研究客观世界随机现象数量研究客观世界随机现象数量规律的规
2、律的 数学分支学科数学分支学科.发展则在发展则在17世纪微积分学说建立以后世纪微积分学说建立以后.基人是瑞士数学家基人是瑞士数学家J.伯努利;而概率论的飞速伯努利;而概率论的飞速数理统计学是一门数理统计学是一门研究怎样去有效地收集、研究怎样去有效地收集、整理和分析带有随机性的数据,以对所考察的整理和分析带有随机性的数据,以对所考察的问题作出推断或预测,直至为采取一定的决策问题作出推断或预测,直至为采取一定的决策和行动提供依据和建议的和行动提供依据和建议的 数学分支学科数学分支学科.论;使论;使 概率论概率论 成为成为 数学的一个分支的真正奠数学的一个分支的真正奠 对客观世界中随机现象的分析产生
3、了概率对客观世界中随机现象的分析产生了概率统计方法的数学理论要用到很多近代数学统计方法的数学理论要用到很多近代数学知识,如函数论、拓扑学、矩阵代数、组合数知识,如函数论、拓扑学、矩阵代数、组合数学等等,但关系最密切的是概率论,故可以这学等等,但关系最密切的是概率论,故可以这样说:样说:概率论是数理统计学的基础,数理统计概率论是数理统计学的基础,数理统计学是概率论的一种应用学是概率论的一种应用.但是它们是两个并列但是它们是两个并列的数学分支学科,并无从属关系的数学分支学科,并无从属关系.退 出目 录前一页后一页确定性现象:结果确定不确定性现象:结果不确定确定性现象不确定性现象确定不确定不确定自然
4、界与社会生活中的两类现象例:向上抛出的物体会掉落到地上 明天天气状况 买了彩票会中奖一次抛掷硬币实验(出现正面朝上)多次抛掷硬币实验(出现正面朝上的次数)不确定近半数这种在个别实验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为随机现象。概率论与数理统计是研究和揭示随机现象规律性的一门数学学科。一一 随随 机机 事事 件件(一)随机试验(一)随机试验(二)样本空间(二)样本空间(三)随机事件(三)随机事件二二 事件间的关系与运算事件间的关系与运算(一)事件间的关系(一)事件间的关系(二)随机事件的运算(二)随机事件的运算 1 随随 机机 事事 件件 及及 其其 运运
5、算算第一章 随机事件与概率随机事件与概率退 出目 录前一页后一页一、随机事件E3:记录某城市记录某城市120120急救电话台一昼夜接到的呼叫次数急救电话台一昼夜接到的呼叫次数;E2:抛一颗骰子,观察出现的点数。:抛一颗骰子,观察出现的点数。E4:观察:观察某一电子元件的寿命。某一电子元件的寿命。E5:观察某地区一昼夜的最低温度和最高温度。:观察某地区一昼夜的最低温度和最高温度。E6:将一枚硬币连抛三次,考虑正反面出现的情况;将一枚硬币连抛三次,考虑正反面出现的情况;E7:将一枚硬币连抛三次,考虑正面出现的次数将一枚硬币连抛三次,考虑正面出现的次数;(一)随机试验思考以下案思考以下案例:例:这些
6、事件具有以下共同点:这些事件具有以下共同点:1、可以在相同条件下重复;、可以在相同条件下重复;2、每次试验的结果可能不止一个,、每次试验的结果可能不止一个,并且能事先明确试验的所有可能结并且能事先明确试验的所有可能结果;果;3、进行一次试验之前不能确定哪、进行一次试验之前不能确定哪一个结果会出现。一个结果会出现。称具备上面三个特点的试验为称具备上面三个特点的试验为随机试验随机试验。要求:会写出随机试验的要求:会写出随机试验的 样本空间。样本空间。退 出前一页后一页目 录(二)样本空间一、随机事件E3:记录某城市记录某城市120120急救电话台一昼夜接到的呼叫次数。急救电话台一昼夜接到的呼叫次数
7、。E2:抛一颗骰子,观察出现的点数。:抛一颗骰子,观察出现的点数。E4:观察某一电子元件的寿命。:观察某一电子元件的寿命。E5:观察某地区一昼夜的最低温度和最高温度。:观察某地区一昼夜的最低温度和最高温度。E6:将一枚硬币连抛三次,考虑正反面出现的情况;将一枚硬币连抛三次,考虑正反面出现的情况;E7:将一枚硬币连抛三次,考虑正面出现的次数将一枚硬币连抛三次,考虑正面出现的次数;S1:H,T S2:1,2,3,4,5,6 S3:0,1,2,3S5:(x,y)|T 0 x y T1 S6:HHH,HHT,HTH,THH,HTT,THT,TTH,TTT S7:0,1,2,3 一、随机事件S4:t|t
8、 0 我们称一个我们称一个随机事件发生随机事件发生当且仅当当且仅当它所包它所包含的一个样本点含的一个样本点在试验中在试验中出现。出现。退 出前一页后一页目 录(三)随机事件一、随机事件事件事件 A=2,4,6 表示表示“出现偶数点出现偶数点”;事件事件 B=1,2,3,4 表示表示“出现的点数不超过出现的点数不超过4”.退 出前一页后一页目 录一、随机事件1)包含关系包含关系 二二、事件间的关系与运算事件间的关系与运算SAB如果如果A发生必导致发生必导致B发生,则发生,则2)相等关系)相等关系 退 出前一页后一页目 录(一)事件间的关系(一)事件间的关系SAB3)和(并)事件和(并)事件 事件
9、事件 发生当且仅当发生当且仅当 A,B 至少发生一个至少发生一个.二、事件间的关系退 出前一页后一页目 录4)积(交)事件积(交)事件SAB事件事件 发生当且仅当发生当且仅当 A,B 同时发生同时发生.退 出前一页后一页目 录二、事件间的关系考察下列事件间的包含关系:考察下列事件间的包含关系:退 出前一页后一页目 录二、事件间的关系 5)差事件差事件SABASAB 发生当且仅当发生当且仅当 A 发生发生 B 不发生不发生.退 出前一页后一页目 录二、事件间的关系SASBA请注意互不相容与对立事件的区别!请注意互不相容与对立事件的区别!退 出前一页后一页目 录二、事件间的关系例如,例如,在在S4
10、 中中事件事件 A=t|t 1000 表示表示“产品是次品产品是次品”事件事件 B=t|t 1000 表示表示“产品是合格品产品是合格品”事件事件 C=t|t 1500 表示表示“产品是一级品产品是一级品”则则表示表示“产品是合格品但不是一级品产品是合格品但不是一级品”;表示表示“产品是一级品产品是一级品”;表示表示“产品是合格品产品是合格品”.退 出前一页后一页目 录二、事件间的关系(二)(二)随机事件的运算随机事件的运算幂等律幂等律:交换律交换律:结合律结合律:分配律分配律:De MorganDe Morgan(德摩根)定律(德摩根)定律:退 出前一页后一页目 录二、事件间的关系甲、乙都不
11、来甲、乙至少有一人不来例:设A A=甲来听课,B B=乙来听课 ,则:甲、乙至少有一人来甲、乙都来一一 概率的定义概率的定义(一)概率的统计定义(一)概率的统计定义(二)概率的古典定义(二)概率的古典定义二二 概率的运算概率的运算(一)概率的加法公式(一)概率的加法公式(二)条件概率公式(二)条件概率公式(三)概率的乘法公式(三)概率的乘法公式(四)事件的独立性(四)事件的独立性2 事件的概率及其运算事件的概率及其运算第一章 随机事件与概率随机事件与概率退 出目 录前一页后一页频率 定义:记 其中 A发生的次数(频数);n总试验次数。称 为A在这n次试验中发生的频率。(一)概率的统计定义例:中
12、国国家足球队,“冲击亚洲”共进行了n次,其中成功了一次,则在这n次试验中“冲击亚洲”这事件发生的频率为 =1/n某人一共听了17次“概率统计”课,其中有15次迟到,记A=听课迟到,则#频率 反映了事件A发生的频繁程度。例:抛掷硬币出现的正面的频率历史上抛掷硬币实验的结果历史上抛掷硬币实验的结果*频率的性质:且 随n的增大渐趋稳定,记稳定值为p 定义1-1:在大量重复试验中,如果事件A出现的频率稳定地在某一常数p的附近摆动,则称常数p为事件A的概率,记为P(A)=p 性性 质质 2.必然事件的概率为必然事件的概率为1,不可能事件的概率为,不可能事件的概率为0(二)概率的古典定义若随机试验E满足:
13、1.试验的样本空间只包含有限个元素(有限性)2.试验中每个基本事件发生的可能性相同(等可能性)称这种试验为等可能概型等可能概型(或古典概型或古典概型)。定义1-2 设E是古典概型的随机试验,是它的样本空间,事件A由m(m小于等于n)个不同的基本事件组成,则A的概率为 称上述定义为概率的古典定义古典定义。例:一袋中有8个球,编号为18,其中13号为红球,48号为黄球,设摸到每一球的可能性相等,从中随机摸一球,记A=摸到红球,求P(A)解:=1,2,8 A=1,2,3 例:从上例的袋中不放回的摸两球,记A=恰是一红一黄,求P(A)解:二、概率的运算(一)概率的加法公式1、互斥事件和的概率公式2、对
14、立事件的概率公式3、概率的加法公式设A、B为两个互斥事件,其和的概率公式为P(A+B)=P(A)+P(B)对于两个相互对立事件,则设A、B为两个任意事件,则P(A+B)=P(A)+P(B)-P(AB)案例:某班组织数学和英语两个学习兴趣小组,全班共45人。其中15人参加数学兴趣小组,18人参加英语兴趣小组,而参加两个兴趣小组的有6人,在该班中任意抽查一名学生,求他参加学习兴趣小组的概率有多少?分析:设A=参加数学兴趣小组,B=参加英语兴趣小组,由题意可知,参加学习兴趣小组是参加数学兴趣小组和参加英语兴趣小组两事件之和,即A+B,事件A与B是相容的。P(A)=15/45,P(B)=18/45,P
15、(AB)=6/45,由概率的加法公式得:P(A+B)=P(A)+P(B)-P(AB)=3/5(二)、条二)、条 件件 概概 率率 公公 式式 条件概率是概率论中一个重要而实用的概念。条件概率是概率论中一个重要而实用的概念。它所考虑的是事件它所考虑的是事件 B 已经发生的条件下事件已经发生的条件下事件 A 发生的概率。发生的概率。设设A、B是某随机试验中的两个事件,且是某随机试验中的两个事件,且则称事件则称事件A在在“事件事件B已发生已发生”这一附加条件下的这一附加条件下的概率为在事件概率为在事件B已发生的条件下事件已发生的条件下事件A的条件概率,的条件概率,简称为简称为A在在B之下的条件概率,
16、记为之下的条件概率,记为1)条件概率的定义:)条件概率的定义:退 出前一页后一页目 录例例 一、二制药车间同一天生产同种药品,具体数据如下 ,试求下列事件的概率:(1)抽到一件是次品(2)抽到一件是一车间生产的药品(3)抽到一件是二车间生产的药品(4)在已知抽到1件是一车间药品的条件下,它又是次品。正品数 次品数 总计第一车间 37 3 40第二车间 45 5 50总 计 82 8 90退 出前一页后一页目 录分析:设A=抽到一件是次品,B=抽到一件是一车间生产的药品,C=抽到一件是二车间生产的药品,则(1)P(A)=8/90=4/45;(2)P(B)=40/90=4/9;(3)P(C)=50
17、/90=5/9;(4)所求事件与(3)中的事件是不同的,其样本空间基本事件总数为40,用 P(A|B)表示,有P(A|B)=3/40注:由例题可以看出,事件A在“事件B已发生”这附 加条件的概率与不附加这个条件的概率是不同的 但有但有称为在事件称为在事件B已发生的条件下事件已发生的条件下事件A的条件概率,的条件概率,简称为简称为A在在B之下的之下的条件概率条件概率。设设A、B是某随机试验中的两个事件,且是某随机试验中的两个事件,且则则因此,有下面的因此,有下面的定义:定义:退 出前一页后一页目 录例例 已知某家庭有3个小孩,且至少有一个是女 孩,求该家庭至少有一个男孩的概率 而而 所求概率为所
18、求概率为解:解:设设 A=3个小孩至少有一个女孩个小孩至少有一个女孩 B=3个小孩至少有一个男孩个小孩至少有一个男孩 退 出前一页后一页目 录(三)、概率的乘法公式由条件概率的定义 我们得我们得这就是两个事件的这就是两个事件的乘法公式乘法公式退 出前一页后一页目 录概率乘法公式的含义:概率乘法公式的含义:两事件的积事件概率等两事件的积事件概率等于其中一事件的概率与于其中一事件的概率与另一事件在前一事件出现另一事件在前一事件出现下的条件概率的乘积。下的条件概率的乘积。例例3 袋中有一个白球与一个黑球,现每次从中取出一球,若取出白球,则除把白球放回外再加进一个白球,直至取出黑球为止求取了n 次都未
19、取出黑球的概率解:则则由乘法公式,我们有由乘法公式,我们有退 出前一页后一页目 录退 出前一页后一页目 录 例例 4 设某光学仪器厂制造的透镜,第一次落下时打破的概率为设某光学仪器厂制造的透镜,第一次落下时打破的概率为 1/21/2 ,若第一次落下未打破,第二次落下打破的概率为,若第一次落下未打破,第二次落下打破的概率为 7/107/10,若前两次落若前两次落下未打破,第三次落下打破的概率为下未打破,第三次落下打破的概率为 9/109/10 。求透镜落下三次而未打。求透镜落下三次而未打破的概率。破的概率。解:解:以以 Ai(i=1,2,3)表示事件表示事件“透镜第透镜第 i 次落下打次落下打破
20、破”,以,以 B 表示事件表示事件“透镜落下三次而未打破透镜落下三次而未打破”,有:有:退 出前一页后一页目 录事件独立的定义(四)、事件的独立性说明:1、两个事件总是相互独立的。如果事件A发生与否不影响事件B的发生,即P(B|A)=P(B),P(A)0,则称事件B独立于事件A。2、3、事件独立的充要条件P(AB)=P(A)P(B)案例:根据下表考察色盲与耳聋两种疾病之间是否有联系分析:因为P(A)=0.0050,P(B)=0.0800,P(AB)=0.0004 P(AB)=P(A)P(B)根据事件独立性的充要条件,得耳聋与色盲是相互独立的两种疾病。目标检测P10-11第二章第二章 随机变量随
21、机变量的概率的概率分布分布与数字特征与数字特征第一节第一节 离散型随机变量离散型随机变量及其概率分布及其概率分布 第二节第二节 连续型随机变量连续型随机变量 及其概率分布及其概率分布 第三节第三节 随机变量的随机变量的数字特征数字特征第一节 离散型随机变量及其概率分布一、随机变量二、离散型随机变量三、离散型随机变量的概率分布一、一、随机变量随机变量*常见的两类试验结果:示数的降雨量;候车人数;发生交通事故的次数示性的明天天气(晴,多云);化验结果(阳性,阴性)exX=f(e)为S上的单值函数,X为实数*中心问题:将试验结果数量化定义:设随机试验E,其样本空间=e,若对每一个 有一个实数X(e)
22、与之对应,就得到一个定义在上的实值函数X=X(e),称X(e)为随机变量随机变量随机变量特征:随机变量特征:1、随随机试验结果的不同而取不同的、随随机试验结果的不同而取不同的值,事前不能语言,具有不确定性。值,事前不能语言,具有不确定性。2、取某个值或落在某个范围内的值都、取某个值或落在某个范围内的值都具有一定的概率。具有一定的概率。一、一、随机变量随机变量案例:观察下列随机试验的结果与数值之间的关系:(1)掷一颗骰子出现的点数;(2)一位隐性遗传疾病的携带者有三个女儿,则女儿 中为该疾病携带者的人数;(3)采用某种新药对患者进行治疗,治愈的患者人数;(4)一个肝硬化病人的Hp感染情况;(5)
23、对于某种新药疗效的实验观察结果。1,2,3,4,5,60,1,2,30,1,2,10任何一个随机试验的结果都与任何一个随机试验的结果都与数值存在着联系,形成一种对数值存在着联系,形成一种对应关系,定义了一种实值函数,应关系,定义了一种实值函数,即随机变量。即随机变量。一、一、随机变量随机变量自学案例2-2,完成课堂活动*常见的两类随机变量离散型的连续型的二、二、离散型随机变量离散型随机变量 定义:取值可数(有限个或可列无限个)的随机变量为离散型随机变量离散型随机变量离散型随机变量的案例:离散型随机变量的案例:(1 1)在本拌种任意抽取)在本拌种任意抽取5 5名同学中,可能是女孩子的人数名同学中
24、,可能是女孩子的人数(2 2)某人射击一次可能命中的环数)某人射击一次可能命中的环数(3 3)1 1小时内到达某公共汽车站的人数小时内到达某公共汽车站的人数X=0,1,2,3,4,5X=0,1,2,3,4,5Y=0,1,2,10Y=0,1,2,10Z=0,1,2,Z=0,1,2,怎么对这些随机变量进行研究呢?1、判断它的取值范围以及可能取哪些值、判断它的取值范围以及可能取哪些值2、它取这些值的概率(取值规律)、它取这些值的概率(取值规律)随机变量X的取值规律称为X的概率分布,简称分布概率分布性质概率分布性质三、三、离散型随机变量离散型随机变量的概率分布的概率分布定义2-3:设离散型随机变量X的
25、所有可能取值为xi(i=1,2,),X取各个值xi的相应概率为pi(i=1,2,),则称P(X=xi)=pi(i=1,2,)为离散型随机变量X的概率分布(分布律、概率函数)常用表达方式常用表达方式分布律的判断依据分布律的判断依据三、三、离散型随机变量离散型随机变量的概率分布的概率分布案例2-4 一位隐性遗传疾病的携带者有两个女儿,则每个女儿都有1/2的可能性从母亲那里得到一个致病的X染色体而成为携带者(假设父亲正常),用A,B分别表示大女儿和小女儿是携带者,试求:(1)女儿中携带者人数X的概率分布;(2)至少有一个为携带者的概率。分析:(1)由题意可知X的可能取值为0,1,2,相应的概率分布为
26、三、三、离散型随机变量离散型随机变量的概率分布的概率分布概率分布为(2)至少有一个携带者包括只有一个携带者或两个均为携带者两种情况,即课堂练习第二节 连续型随机变量及其概率分布一、连续型随机变量二、连续型随机变量的概率分布三、随机变量的分布函数四、常见连续型随机变量分布一、一、连续型随机变量连续型随机变量定义:定义:如果一个随机变量可以取得某一区间内的任何数值或在整个数轴上取如果一个随机变量可以取得某一区间内的任何数值或在整个数轴上取值,那么我们便称这个随机变量为值,那么我们便称这个随机变量为连续型随机变量。连续型随机变量。连续型随机变量的案例:连续型随机变量的案例:制药专业所有女孩子的身高制
27、药专业所有女孩子的身高 一批袋装一批袋装50kg50kg的大米实际重量的大米实际重量 一批灯泡的使用寿命一批灯泡的使用寿命 对于随机变量X,存在一个非负的可积函数f(x),(-x),使得对于任意实数a,b(ab),有:则称f(x)为连续型随机变量X的概率密度函数(简称概率密度)二、二、连续型随机变量连续型随机变量的概率分布的概率分布性质性质:非负性:非负性:f(x)0(-xx);归一性:归一性:概率密度函数概率密度函数的判断依据的判断依据二、二、连续型随机变量连续型随机变量的概率分布的概率分布性质性质:(3)连续型随机变量连续型随机变量 X X 取任一常数取任一常数 a a 的概率为的概率为0
28、 0;(4)设连续型随机变量)设连续型随机变量X,对任意的,对任意的a,b(a 0)为常数,则称X服从参数为,2的正态分布,记为XN(,2).非负性:非负性:f(x)0(-xx100)n100)根据专业知识确定单、双侧正常值范围 选择百分界值(95%,99%)选择适当的统计方法(正态分布、百分位 数法)选定同质的正常人作为研究对象 同质 正常“足够数量”例数过少,代表性差;例数过多增加成本,且易导致正常标准把握不严,影响数据的例数过少,代表性差;例数过多增加成本,且易导致正常标准把握不严,影响数据的可靠性。可靠性。一般认为每组一般认为每组100例以上例以上;有人认为确定临床生化指标的正常值应取
29、;有人认为确定临床生化指标的正常值应取300500例。例。单、双侧问题 过大或过小均属异常 :双侧界值 例:白细胞计数例:白细胞计数仅过大或过小为异常:单侧界值 例:肺活量仅过低异常例:肺活量仅过低异常 下限下限 尿铅仅过高为异常尿铅仅过高为异常 上限上限选择百分界值 参考值范围的涵义:绝大多数的正常人在该范围内 习惯上将习惯上将“绝大多数绝大多数”定义为正常人的定义为正常人的80%80%、90%90%、95%95%或或99%99%。应根据研究目的、研究指标的性质、数据分布特征等情况综合考虑百分界值的选择。应根据研究目的、研究指标的性质、数据分布特征等情况综合考虑百分界值的选择。参考值范围的估
30、计方法 正态分布法 百分位数法 对数正态分布法 正态分布法正态分布法v适于正态或近似正态分布的资料适于正态或近似正态分布的资料v公式公式双侧双侧单侧单侧(高侧高侧)(低侧低侧)例:某地调查了例:某地调查了 360 360 名成年男子的平均血红蛋白名成年男子的平均血红蛋白如何估计该地成年男子血红蛋白如何估计该地成年男子血红蛋白 95 95 的参考值范围?的参考值范围?95 95 的参考值范围:的参考值范围:该地成年男子血红蛋白该地成年男子血红蛋白 95 95 的参考值范围:的参考值范围:12.06 12.06 14.84 14.84(g/100ml g/100ml)。)。目标检测目标检测 三三
31、7(2)质量控制质量控制在制药企业,常常应用在制药企业,常常应用控制图控制图来进行某些工艺步骤的中间关键参数的来进行某些工艺步骤的中间关键参数的控制。根据控制。根据3 3原则,控制图以时间为横轴,包括过程均值(原则,控制图以时间为横轴,包括过程均值(CLCL)、)、控制上限(控制上限(UCLUCL)和控制下限()和控制下限(LCLLCL)质量控制图质量控制图(quality control chart)UCL(上控制限)UWL(上警戒限)CL (中心线)LWL(下警戒限)LCL(下控制限)样本编号、取样时间M+3M+2 MM-2M-3质量控制图质量控制图(quality control cha
32、rt)-过程受控 123456789101112131415取样时间M+3M+2 MM-2M-3当观测值随机地在中线附近分布,并且所有的点都在控制限之内,称为过程受控。(2)质量控制下列情形之一称为过程失控:1)有1个以上点在控制线外;2)有8个以上点同向移动;3)有8个以上点同时排列于中线某侧。(2)质量控制案例2-17 在压片工艺的片重控制中,每15分钟取10片药片进行抽检,测得片重(mg)分别为3.9,3.8,4,4.05,4.1,4,4.02,3.95,4.02,3.95,4.02,3.98均数为3.982mg,标准偏差0.0836mg,试计算UCL,LCL,并说明是过程受控还是过程失
33、控?(3)可疑值取舍一组测定值中,常出现个别与其他数据相差很大的可疑值,如果确定知道此数据由实验差错引起,可以舍去,否则可根据一定统计学方法决定其取舍。常用的统计学方法:三倍标准差法、Q检验法、T检验法(3)可疑值取舍不需要查表的三倍标准差法原理:3原则服从正态分布的随机变量,测量值落在(-3,+3)。内的概率为99.73%,出现在此范围之外的概率仅为0.27%,为小概率事件。在实际实验中,出现即认为不可靠,将其舍弃讲解案例2-18(3)可疑值取舍案例2-18 某实验观测20次(其中漏记一次,用M表示),观测数据如下:20,20,21,20,22,20,19,24,20,22,19,21,20
34、,28,21,20,20,22,M,20该组数据是否存在异常值?第三节 随机变量的数字特征 在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么,X的全部概率特征也就知道了.然而,在实际问题中,概率分布一般是较难确定的.而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了.因此,在对随机变量的研究中,确定某些数字特征是重要的.随机变量数字特征,分两类:表示集中程度、平均水平数学期望、分位数、中位数、众数等;表示离散程度、变异大小方差、标准差、变异系数等。一、一、随机变量的数学期望随机变量的数学期望及其性质及其性质以频率为权重的加
35、权平均以频率为权重的加权平均,反映了这,反映了这7位同学高数成位同学高数成绩的平均状态。绩的平均状态。引例引例 某7名学生的高数成绩为90,85,85,80,80,75,60,则他们的平均成绩为u离散型随机变量定义定义2-10 设离散型随机变量的概率分布为 则称 的值为随机变量X的数学期望数学期望(期望、均值)(期望、均值),记做,记做E(X),E(X)=案例2-20 某种按新配方试制的中成药在500多名病人中进行了临床试验,有一半人服用,另一半人未服。一周后,有280人痊愈,其中240人服了新药,试说明新药的疗效。定义定义2-11设连续型随机变量的概率密度为 u连续型随机变量连续型随机变量
36、则则案例2-21 设随机变量X的概率密度函数为求E(X)u随机变量函数的数学期望设是随机变量 X的函数,离散型离散型连续型连续型该公式的重要性在于:当我们求Eg(X)时,不必知道g(X)的分布,而只需知道X的分布就可以了.这给求随机变量函数的期望带来很大方便.数学期望的性质性质:(1)E(c)=c,c为常数 (2)E(cX)=c*E(x)(3)E(XY)=E(X)E(Y)(4)E(XY)=EX*EY,X与Y独立数学期望在医学上的一个应用数学期望在医学上的一个应用 考虑用验血的方法在人群中普查某种疾病。集体做法是每考虑用验血的方法在人群中普查某种疾病。集体做法是每1010个人一个人一组,把这组,
37、把这1010个人的血液样本混合起来进行化验。如果结果为阴性,则个人的血液样本混合起来进行化验。如果结果为阴性,则1010个人只需化验个人只需化验1 1次;若结果为阳性,则需对次;若结果为阳性,则需对1010个人在逐个化验,总计化验个人在逐个化验,总计化验1111次。假定人群中这种病的患病率是次。假定人群中这种病的患病率是10%10%,且每人患病与否是相互独立的,且每人患病与否是相互独立的。试问:这种分组化验的方法与通常的逐一化验方法相比,是否能减少。试问:这种分组化验的方法与通常的逐一化验方法相比,是否能减少化验次数?化验次数?分析:分析:设随机抽取的10人组所需的化验次数为X需要计算X的数学
38、期望,然后与10比较 化验次数X的可能取值为1,11先求出化验次数X的分布律X=1=“10人都是阴性”X=11=“至少1人阳性”结论:结论:分组化验法的次数少于逐一化验法的次数。分组化验法的次数少于逐一化验法的次数。注意求注意求 X期望值期望值的步骤!的步骤!二、方差及其性质定义2-13:设X是一个随机变量,则称E(X-EX)2为X的方差,记作DX,为标准差。记做(X)。E(X-EX)2=DX随机变量的方差反映了它的取值与其数学期望的偏离程度,它是衡量取随机变量的方差反映了它的取值与其数学期望的偏离程度,它是衡量取值离散程度的一个尺度。值离散程度的一个尺度。在医学统计,药物代谢动力学等领域被广泛使在医学统计,药物代谢动力学等领域被广泛使用。用。对于离散型随机变量:对于离散型随机变量:对于连续型随机变量:对于连续型随机变量:常用:常用:D(X)=E(X2)-E(X)2案例2-25 甲乙两台制丸机生产同一种药丸的直径(mm)概率分布如下:试问哪台机器性能更好三、常见连续型随机变量分布的期望与方差1、均匀分布:若XUa,b,则2、正态分布:若XN,,则 祝同学们学习愉快!祝同学们学习愉快!