《统计学第3章概率、概率分布与抽样分布(袁卫).pptx》由会员分享,可在线阅读,更多相关《统计学第3章概率、概率分布与抽样分布(袁卫).pptx(112页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、统计学统计学STATISTICS1统计学统计学STATISTICS学习目标学习目标2统计学统计学STATISTICS3.1.1 试验、事件和样本空间3.1.2 事件的概率3.1.3 概率的性质和运算法则3.1.4 条件概率与事件的独立性3.1.5 全概公式与逆概公式33统计学统计学STATISTICS试验、事件和样本空间试验、事件和样本空间34统计学统计学STATISTICS试试 验验(experiment)1.对试验对象进行一次观察或测量的过程对试验对象进行一次观察或测量的过程 掷一颗骰子,观察其出现的点数掷一颗骰子,观察其出现的点数从一副从一副52张扑克牌中抽取一张,并观察其结果张扑克牌中
2、抽取一张,并观察其结果(纸牌的数字或花色纸牌的数字或花色)2.试验的特点试验的特点可以在相同的条件下重复进行可以在相同的条件下重复进行每次试验的可能结果可能不止一个,但试验的每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的所有可能结果在试验之前是确切知道的在试验结束之前,不能确定该次试验的确切结在试验结束之前,不能确定该次试验的确切结果果5统计学统计学STATISTICS事件事件(event)1.事件:试验的每一个可能结果试验的每一个可能结果(任何样本任何样本点集合点集合)掷一颗骰子出现的点数为掷一颗骰子出现的点数为3用大写字母用大写字母A,B,C,表示表示2.随机事
3、件(random event):每次试验可能出每次试验可能出现也可能不出现的事件现也可能不出现的事件掷一颗骰子可能出现的点数掷一颗骰子可能出现的点数6统计学统计学STATISTICS事件事件(event)1.简单事件(simple event) :不能被分解成其他事不能被分解成其他事件组合的基本事件件组合的基本事件 抛一枚均匀硬币,抛一枚均匀硬币,“出现正面出现正面”和和“出现反面出现反面” 2.必然事件(certain event):每次试验一定出现的事每次试验一定出现的事件,用件,用 表示表示掷一颗骰子出现的点数小于掷一颗骰子出现的点数小于73.不可能事件(impossible event
4、):每次试验一定不每次试验一定不出现的事件,用出现的事件,用 表示表示掷一颗骰子出现的点数大于掷一颗骰子出现的点数大于67统计学统计学STATISTICS样本空间与样本点样本空间与样本点1.样本空间(sample Space)一个试验中所有结果的集合,用一个试验中所有结果的集合,用 表示表示例如:在例如:在掷一颗骰子的试验中,样本空掷一颗骰子的试验中,样本空间表示为:间表示为: 1,2,3,4,5,6在投掷硬币的试验中,在投掷硬币的试验中, 正面,反面正面,反面2.样本点( sample point)样本空间中每一个特定的试验结果样本空间中每一个特定的试验结果用符号用符号 表示表示8统计学统计
5、学STATISTICS事件的概率事件的概率39统计学统计学STATISTICS事件的概率事件的概率(probability)1.事件事件A的概率是一个介于的概率是一个介于0和和1之间的一个值,之间的一个值,用以度量试验完成时事件用以度量试验完成时事件A发生的可能性大小,发生的可能性大小, 记为记为P(A)2.当试验的次数很多时,概率当试验的次数很多时,概率P(A)可以由所观察可以由所观察到的事件到的事件A发生次数发生次数(频数频数)的比例来逼近的比例来逼近在相同条件下,重复进行在相同条件下,重复进行n次试验,事件次试验,事件A发生了发生了m次,则事件次,则事件A发生的概率可以写为发生的概率可以
6、写为 pnmAAP重复试验次数发生的次数事件)(10统计学统计学STATISTICS概率的性质和运算法则概率的性质和运算法则311统计学统计学STATISTICS互斥事件及其概率互斥事件及其概率(mutually exclusive events) 在试验中,两个事件有一个发生时,另在试验中,两个事件有一个发生时,另一个就不能发生,一个就不能发生,则称事件则称事件A与事件与事件B是是互斥事件,(没有公共样本点没有公共样本点)A12统计学统计学STATISTICS互斥事件及其概率互斥事件及其概率(例题分析例题分析)【例】在一所城市中随机抽取在一所城市中随机抽取600个家庭,个家庭,用以确定拥有个
7、人电脑的家庭所占的比例。用以确定拥有个人电脑的家庭所占的比例。定义如下事件:定义如下事件: A:600个家庭中恰好有个家庭中恰好有265个家庭拥有电个家庭拥有电脑脑 B:恰好有恰好有100个家庭拥有电脑个家庭拥有电脑 C:特定户张三家拥有电脑特定户张三家拥有电脑 说明下列各对事件是否为互斥事件,并说明下列各对事件是否为互斥事件,并说明你的理由说明你的理由 (1) A与与B (2) A与与C (3) B与与 C13统计学统计学STATISTICS互斥事件及其概率互斥事件及其概率(例题分析例题分析)解:(1) 事件事件A与与B是互斥事件。因为你观是互斥事件。因为你观察察 到恰好有到恰好有265个家
8、庭拥有电脑,就个家庭拥有电脑,就 不可能恰好有不可能恰好有100个家庭拥有电脑个家庭拥有电脑 (2) 事件事件A与与C不是互斥事件。因为张不是互斥事件。因为张三三 也许正是这也许正是这265个家庭之一,因而个家庭之一,因而事事 件与有可能同时发生件与有可能同时发生 (3) 事件事件B与与C不是互斥事件。理由同不是互斥事件。理由同(2)14统计学统计学STATISTICS互斥事件及其概率互斥事件及其概率(例题分析例题分析)15统计学统计学STATISTICS互斥事件及其概率互斥事件及其概率(例题分析例题分析)解:由于每一枚硬币出现正面或出现反面的概率由于每一枚硬币出现正面或出现反面的概率都是都是
9、1/2,当抛掷的次数逐渐增大时,上面的,当抛掷的次数逐渐增大时,上面的4个个简单事件中每一事件发生的相对频数简单事件中每一事件发生的相对频数(概率概率)将近将近似等于似等于1/4。因为仅当。因为仅当H1T2或或T1H2发生时,才会发生时,才会恰好有一枚硬币朝上的事件发生,而事件恰好有一枚硬币朝上的事件发生,而事件H1T2或或T1H2又为互斥事件,两个事件中一个事件发又为互斥事件,两个事件中一个事件发生或者另一个事件发生的概率便是生或者另一个事件发生的概率便是1/2(1/4+1/4)。因此,抛掷两枚硬币,恰好有一枚出现正面的概因此,抛掷两枚硬币,恰好有一枚出现正面的概率等于率等于H1T2或或T1
10、H2发生的概率,也就是两种事发生的概率,也就是两种事件中每个事件发生的概率之和件中每个事件发生的概率之和 16统计学统计学STATISTICS互斥事件的加法规则互斥事件的加法规则(addition law) 加法规则1.若若两个事件两个事件A与与B互斥,则事件互斥,则事件A发生或事发生或事件件B发生的概率等于这两个事件各自的概发生的概率等于这两个事件各自的概率之和,即率之和,即 P(AB) =P(A)+P(B)2.事事件件A1,A2,An两两互斥,则有两两互斥,则有 P(A1A2 An) =P(A1)+P(A2) +P(An)17统计学统计学STATISTICS互斥事件的加法规则互斥事件的加法
11、规则 (例题分析例题分析) 1616161616161)6()5()4()3()2() 1 ()654321 (PPPPPPP或或或或或18统计学统计学STATISTICS概率的性质概率的性质(小结小结)1.非非负负性性对任意事件对任意事件A,有有 P 12.规范性规范性一个事件的概率是一个介于一个事件的概率是一个介于0与与1之间的值,即对于之间的值,即对于任意事件任意事件 A,有有0 P 13.必然事件的概率为必然事件的概率为1;不可能事件的概率为;不可能事件的概率为0。即即P ( )=1; P( )=04.可加性可加性若若A与与B互斥,则互斥,则P(AB) =P(A)+P(B)推广到多个两
12、两互斥事件推广到多个两两互斥事件A1,A2,An,有有 P( A1A2 An) = P(A1)+P(A2)+P(An)19统计学统计学STATISTICS事件的补及其概率事件的补及其概率 事件的补(complement) 事件事件A A不发生的事件,称为补事件不发生的事件,称为补事件A A的补事的补事件件( (或称逆事件或称逆事件) ),记为记为 A 。它是样本空间中所它是样本空间中所有不属于事件有不属于事件A的样本点的集合的样本点的集合20统计学统计学STATISTICS广义加法公式广义加法公式21统计学统计学STATISTICS广义加法公式广义加法公式(事件的并或和事件的并或和) B22统
13、计学统计学STATISTICS广义加法公式广义加法公式(事件的交或积事件的交或积) A23统计学统计学STATISTICS广义加法公式广义加法公式(例题分析例题分析) 解:设设 A = =员工离职是因为对工资不满意员工离职是因为对工资不满意 B = =员工离职是因为对工作不满意员工离职是因为对工作不满意 依 题 意 有 :依 题 意 有 : P ( A ) = 0 . 4 0 ; P ( B ) = 0 . 3 0 ;P(AB)=0.15 P(AB)= P(A)+ P(B)+ P(AB)=0.40+0.30-0.15=0.5524统计学统计学STATISTICS条件概率与事件的独立性条件概率与
14、事件的独立性325统计学统计学STATISTICS条件概率条件概率(conditional probability) 在事件在事件B已经发生的条件下事件已经发生的条件下事件A发生的概率,发生的概率,称为已知事件称为已知事件B时事件时事件A的条件概率,记为的条件概率,记为P(A|B) 26统计学统计学STATISTICS条件概率条件概率(例题分析例题分析)解:设设 A =顾客购买食品,顾客购买食品, B =顾客购买其他商品顾客购买其他商品 依题意有:依题意有:P(A)=0.80;P(B)=0.60;P(AB)=0.35 4375.080.035.0)()()(APABPABP5833.060.0
15、35.0)()()(BPABPBAP27统计学统计学STATISTICS条件概率条件概率(例题分析例题分析)【例】一家电脑公司从两个供应商处购买了同一种计算一家电脑公司从两个供应商处购买了同一种计算机配件,质量状况如下表所示机配件,质量状况如下表所示 从这从这200个配件中任取一个进行检查,求个配件中任取一个进行检查,求 (1) 取出的一个为正品的概率取出的一个为正品的概率 (2) 取出的一个为供应商甲的配件的概率取出的一个为供应商甲的配件的概率 (3) 取出一个为供应商甲的正品的概率取出一个为供应商甲的正品的概率 (4) 已知取出一个为供应商甲的配件,它是正品的概率已知取出一个为供应商甲的配
16、件,它是正品的概率甲乙两个供应商提供的配件 正品数次品数合计供应商甲 84690供应商乙 1028110合计1861420028统计学统计学STATISTICS条件概率条件概率(例题分析例题分析)解:设设 A = 取出的一个为正品取出的一个为正品 B = 取出的一个为供应商甲供应的配件取出的一个为供应商甲供应的配件 (1) (2) (3) (4)93. 0200186)(AP45. 020090)(BP42. 020084)(ABP9333.045.042.0)()()(BPABPBAP29统计学统计学STATISTICS乘法公式乘法公式(multiplicative law)1.用来计算两事
17、件交的概率用来计算两事件交的概率2.以条件概率的定义为基础以条件概率的定义为基础3.设设A,B为两个事件,若为两个事件,若P(B)0,则则4. P(AB)=P(B)P(A|B)5. 或或6. P(AB)=P(A)P(B|A)30统计学统计学STATISTICS乘法公式乘法公式(例题分析例题分析)31统计学统计学STATISTICS独立事件与乘法公式独立事件与乘法公式(例题分析例题分析)32统计学统计学STATISTICS独立事件与乘法公式独立事件与乘法公式(independent events)1.若若P(A|B)=P(A)或或P(B|A)=P(B) ,则称事则称事件件A与与B事件独立,或称独
18、立事件事件独立,或称独立事件 2.若两个事件相互独立,则这两个事件同若两个事件相互独立,则这两个事件同时发生的概率等于它们各自发生的概率时发生的概率等于它们各自发生的概率之积,即之积,即 P(AB)= P(A) P(B)3.若事件若事件A A1 1, ,A A2 2, , ,A An n相互独立,则相互独立,则 P ( A1, A2, , An) = P(A1) P(A2) P(An) 33统计学统计学STATISTICS独立事件与乘法公式独立事件与乘法公式(例题分析例题分析)34统计学统计学STATISTICS独立事件与乘法公式独立事件与乘法公式(例题分析例题分析)35统计学统计学STATI
19、STICS全概全概公式与逆概公式公式与逆概公式336统计学统计学STATISTICS全概公式全概公式 全概公式niiiniiBAPBPABPAP11)()()()(37统计学统计学STATISTICS全概公式全概公式(例题分析例题分析)nnnnnBAPBPBAPBPAP111101)()()()()(38统计学统计学STATISTICS逆概公式逆概公式 逆概公式(贝叶斯公式 )njBAPBPBAPBPABPniiijjj, 1,)()()()()(139统计学统计学STATISTICS逆概公式逆概公式(例题分析例题分析)8 . 04121121121)()()()()()()(BAPBPBAP
20、BPBAPBPABP40统计学统计学STATISTICS3.2.1 随机变量3.2.2 离散型随机变量的概率分布3.2.3 离散型随机变量的数学期望和方差3.2.4 几种常用的离散型概率分布3.2.5 概率密度函数与连续型随机变量3.2.6 常见的连续型概率分布341统计学统计学STATISTICS随机变量随机变量342统计学统计学STATISTICS随机变量随机变量(random variables)1.一次试验的结果的数值性描述一次试验的结果的数值性描述2.一般一般用用 X,Y,Z 来表示来表示3.例如:例如: 投掷两枚硬币出现正面的数量投掷两枚硬币出现正面的数量4.根据取值情况的不同分为
21、离散型随机变根据取值情况的不同分为离散型随机变量和连续型随机变量量和连续型随机变量43统计学统计学STATISTICS离散型随机变量离散型随机变量1.随机变量随机变量 X 取有限个值或所有取值都可以取有限个值或所有取值都可以逐个列举逐个列举出来出来 x1 , x2,2.以确定的概率取这些不同的值以确定的概率取这些不同的值3.离散离散型随机变量的一些例子型随机变量的一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2, ,1000,1,2, 0,1, 2,男性为0,女性为144统计学统计学STATISTICS连
22、续型随机变量连续型随机变量1.可以取一个或多个区间中任何值可以取一个或多个区间中任何值 2.所有可能取值不可以逐个列举出来,而是取所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点数轴上某一区间内的任意点3.连续型随机变量的一些例子连续型随机变量的一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X 00 X 100X 045统计学统计学STATISTICS离散型随机变量的概率分离散型随机变量的概率分布布346统计学统计学STATISTICS离散型随机变量的概率分布离散型随机变量的概率分布1.列出离散
23、型随机变量列出离散型随机变量X的所有可能取值的所有可能取值2.列出随机变量取这些值的概率列出随机变量取这些值的概率3.通常用下面的表格来表示通常用下面的表格来表示X = xix1 ,x2 , ,xnP(X =xi)=pip1 ,p2 , ,pn11niip47统计学统计学STATISTICS离散型随机变量的概率分布离散型随机变量的概率分布 (例题分析例题分析) 故障次数故障次数X = xi0123概率概率P(X=xi)pi0.100.250.3548统计学统计学STATISTICS离散型随机变量的概率分布离散型随机变量的概率分布 (例题分析例题分析) 49统计学统计学STATISTICS离散型
24、随机变量的数学离散型随机变量的数学期望和方差期望和方差350统计学统计学STATISTICS离散型随机变量的数学期望离散型随机变量的数学期望(expected value)1.离散离散型随机变量型随机变量X的所有可能取值的所有可能取值xi与其与其取相对取相对应的应的概率概率pi乘积之和乘积之和2.描述离散型随机变量取值的集中程度描述离散型随机变量取值的集中程度3.记为记为 或或E(X)4.计算公式为计算公式为取无穷个值)取有限个值)XpxXEXpxXEiiiniii()()(151统计学统计学STATISTICS离散型随机变量的方差离散型随机变量的方差(variance)1.随机变量随机变量X
25、的的每一个取值与期望值的离差平每一个取值与期望值的离差平方和的数学方和的数学期望,记为期望,记为 2 或或D(X)2.描述离散型随机变量取值的分散程度描述离散型随机变量取值的分散程度3.计算公式为计算公式为4.方差的平方根称为标准差,记为方差的平方根称为标准差,记为 或或D(X)iiipxXD22)()(52统计学统计学STATISTICS离散型数学期望和方差离散型数学期望和方差 (例题分析例题分析) 次品数次品数X = xi0123概率概率P(X=xi)pi0.750.120.080.0543. 005. 0308. 0212. 0175. 00iiipx8397. 07051. 0)(22
26、iiipx53统计学统计学STATISTICS几种常用的离散型概率分几种常用的离散型概率分布布354统计学统计学STATISTICS常用离散型概率分布常用离散型概率分布两点分布两点分布二项分布二项分布泊松分布泊松分布超几何分布超几何分布55统计学统计学STATISTICS两点分布两点分布1.一个离散型随机变量一个离散型随机变量X只取只取0和和1两个可能两个可能的值的值2.它们的概率分布为它们的概率分布为3. 4. 或或3.也称也称0-1分布分布) 10()(1pqpxXPxxqpXPpXP1) 0() 1(56统计学统计学STATISTICS两点分布两点分布 (例题分析例题分析) X = xi
27、0 1P(X=xi)=pi0.05 0.9557统计学统计学STATISTICS二项试验二项试验(伯努利试验伯努利试验) 1.二项分布与伯努利试验有关二项分布与伯努利试验有关2.贝努里试验满足下列条件贝努里试验满足下列条件 一次试验只有两个可能结果,即一次试验只有两个可能结果,即“成功成功”和和“失败失败”“成功成功”是指我们感兴趣的某种特征是指我们感兴趣的某种特征一次试验一次试验“成功成功”的概率为的概率为p ,失败的概率为失败的概率为q =1- p,且概率且概率p对每次试验都是相同的对每次试验都是相同的 试验是相互独立的,并试验是相互独立的,并可以重复进行可以重复进行n次次 在在n次试验中
28、,次试验中,“成功成功”的次数对应一个离散型的次数对应一个离散型随机变量随机变量X X 58统计学统计学STATISTICS二项分布二项分布(Binomial distribution)1.重复重复进行进行 n 次试验,出现次试验,出现“成功成功”的次数的次数的概率分布称为二项分布,记为的概率分布称为二项分布,记为XB(n,p)2.设设X为为 n 次重复试验中出现成功的次数,次重复试验中出现成功的次数,X 取取 x 的概率为的概率为)!( !), 2 , 1 , 0(xnxnxnCnxqpCxXPxnxxn式中:59统计学统计学STATISTICS二项分布二项分布1.对对于于P(X=x) 0,
29、 x =1,2,n,有有2.同同样有样有3.当当 n = 1 时时,二项分布化简为,二项分布化简为1)(20qpqpCnxxnxxn1 , 011xqpxXPxx,nmxxnxxnmxxnxxnqpCnXmPqpCmXP0060统计学统计学STATISTICS二项分布二项分布 (例题分析例题分析) 80.81537269)04. 01 ()04. 0()0(05005CXP20.16986931)04. 01 ()04. 0() 1(15115CXP0.999397860.0141557720.1698693180.81537269)2() 1()0()3(XPXPXPXP61统计学统计学ST
30、ATISTICS泊松分布泊松分布(Poisson distribution)1.1837年法国数学家泊松年法国数学家泊松(D.Poisson,17811840)首首次提出次提出 2.用于描述在一指定时间范围内或在一定的长度、用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布面积、体积之内每一事件出现次数的分布3.泊松分布的例子泊松分布的例子 一定时间段内,某航空公司接到的订票电话数一定时间段内,某航空公司接到的订票电话数 一定时间内,到车站等候公共汽车的人数一定时间内,到车站等候公共汽车的人数 一定路段内,路面出现大损坏的次数一定路段内,路面出现大损坏的次数 一定时
31、间段内,放射性物质放射的粒子数一定时间段内,放射性物质放射的粒子数 一匹布上发现的疵点个数一匹布上发现的疵点个数 一定页数的书刊上出现的错别字个数一定页数的书刊上出现的错别字个数 62统计学统计学STATISTICS泊松分布泊松分布(概率分布函数概率分布函数) 给定的时间间隔、长度、面给定的时间间隔、长度、面 积、体积内积、体积内“成功成功”的平均的平均数数e = 2.71828 x 给定的时间间隔、长度、面给定的时间间隔、长度、面 积、体积内积、体积内“成功成功”的次数的次数) 0, 2 , 1 , 0(!exxxXP63统计学统计学STATISTICS泊松分布泊松分布 (例题分析例题分析)
32、7426010149. 06!e7676XP64统计学统计学STATISTICS泊松分布泊松分布(作为二项分布的近似作为二项分布的近似)1.当试验的当试验的次数次数 n 很大,成功的概率很大,成功的概率 p 很小很小时,可用泊松分布来近似地计算二项分布时,可用泊松分布来近似地计算二项分布的概率,即的概率,即!exqpCxnxxn65统计学统计学STATISTICS超几何分布超几何分布1.采用不重复抽样,各次试验并不独立,成功采用不重复抽样,各次试验并不独立,成功的概率也互不相等的概率也互不相等2.总体元素的数目总体元素的数目N很小,或样本量很小,或样本量n相对于相对于N来说较大时,样本中来说较
33、大时,样本中“成功成功”的次数则服从的次数则服从超几何概率分布超几何概率分布3.概率分布函数为概率分布函数为lxCCCxXPnNxnMNxM, 2 , 1)(66统计学统计学STATISTICS超几何分布超几何分布 (例题分析例题分析)30121071) 3(4103431033CCCXP31103301) 3() 2() 2(41024310234103431033CCCCCCXPXPXP67统计学统计学STATISTICS概率密度函数概率密度函数368统计学统计学STATISTICS连续型随机变量的概率分布连续型随机变量的概率分布1.连续型随机变量可以取某一区间或整个连续型随机变量可以取某
34、一区间或整个实数轴上的任意一个值实数轴上的任意一个值2.它取任何一个特定的值的概率都等于它取任何一个特定的值的概率都等于03.不能列出每一个值及其相应的概率不能列出每一个值及其相应的概率4.通常研究它取某一区间值的概率通常研究它取某一区间值的概率5.用概率密度函数的形式和分布函数的形用概率密度函数的形式和分布函数的形式来描述式来描述69统计学统计学STATISTICS概率密度函数概率密度函数1.设设X为一连续型随机变量,为一连续型随机变量,x 为任意实数,为任意实数,X的概率密度函数记为的概率密度函数记为f(x),它满足条件它满足条件1d)()2(0)() 1 (xxfxf70统计学统计学ST
35、ATISTICS连续型随机变量的期望和连续型随机变量的期望和方差方差1.连续型随机变量的数学期望连续型随机变量的数学期望2.方差方差xxxfXEd)()(2d)()()(xxfXExXD71统计学统计学STATISTICS正态分布正态分布372统计学统计学STATISTICS正态分布正态分布(normal distribution)1.由由C.F.高斯高斯(Carl Friedrich Gauss,17771855)作为描述误差相对频数分布的模型而提出作为描述误差相对频数分布的模型而提出2.描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布3.许多现象都可以由正态分布来描述许多现
36、象都可以由正态分布来描述 4.可用于近似离散型随机变量的分布可用于近似离散型随机变量的分布例如:例如: 二项分布二项分布5.经典统计推断的基础经典统计推断的基础73统计学统计学STATISTICS概率密度函数概率密度函数xxfx,e21)(22212f(x) = 随机变量随机变量 X 的频数的频数 = 正态随机变量正态随机变量X的均值的均值 = 正态随机变量正态随机变量X的方差的方差 = 3.1415926; e = 2.71828x = 随机变量的取值随机变量的取值 (- x )74统计学统计学STATISTICS正态分布函数的性质正态分布函数的性质1.图形是关于图形是关于x= 对称钟形曲线
37、,且峰值在对称钟形曲线,且峰值在x= 处处2.均值均值 和标准差和标准差 一旦确定,分布的具体形式也惟一确一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的定,不同参数正态分布构成一个完整的“正态分布族正态分布族” 3.均值均值 可取实数轴上的任意数值,决定正态曲线的具可取实数轴上的任意数值,决定正态曲线的具体位置;标准差决定曲线的体位置;标准差决定曲线的“陡峭陡峭”或或“扁平扁平”程度程度。 越大,正态曲线扁平;越大,正态曲线扁平; 越小,正态曲线越高陡峭越小,正态曲线越高陡峭4.当当X X的取值向横轴左右两个方向无限延伸时,曲线的的取值向横轴左右两个方向无限延伸时,曲线的两
38、个尾端也无限渐近横轴,理论上永远不会与之相交两个尾端也无限渐近横轴,理论上永远不会与之相交5.正态随机变量在特定区间上的取值概率由正态曲线下正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于的面积给出,而且其曲线下的总面积等于1 75统计学统计学STATISTICS标准正态分布标准正态分布(standardize the normal distribution)xxx,e21)(221.随机变量具有均值为随机变量具有均值为0,标准差为,标准差为1的正态分布的正态分布2.任何一个任何一个一般的正态分布,可通过下面的线性一般的正态分布,可通过下面的线性变换转化为标准
39、正态分布变换转化为标准正态分布)1 ,0( NXZxtxttxxde21d)()(2-276统计学统计学STATISTICS正态分布正态分布(例题分析例题分析)02275. 097725. 01)2(1)105070(1)70(1)70(XPXP6826. 018413. 021) 1 (2) 1() 1 ()105040()105060()6040(XP77统计学统计学STATISTICS均匀分布均匀分布378统计学统计学STATISTICS均匀分布均匀分布(uniform distribution)1.若随机若随机变量变量X的概率密的概率密度函数为度函数为2. 称称X在在 a ,b上上服从
40、服从均匀分布,记为均匀分布,记为XUa,b2.数学数学期望和方差期望和方差其他01)(bXaabxf12)()(;2)(2abXDbaXE79统计学统计学STATISTICS均匀分布均匀分布(概率计算概率计算)1.随机随机变量变量X在某取值范围在某取值范围a ,b的任一子区间的任一子区间c ,d上上取值的概率为取值的概率为 2.同样有:同样有:abcddXcP)(abaccXP )(abcbcXP )(80统计学统计学STATISTICS均匀分布均匀分布(例题分析例题分析)其他0150151)(xxf15)0(ddXP81统计学统计学STATISTICS指数分布指数分布382统计学统计学STA
41、TISTICS指数分布指数分布(exponential distribution)1.若随机若随机变量变量X的概率密度函数为的概率密度函数为2. 称称X服从参数为服从参数为 的指的指3. 数数分布,记为分布,记为XE( )2.数学数学期望和方差期望和方差21)(;1)(XDXE其他0) 0( 0e)(xxfx83统计学统计学STATISTICS指数分布指数分布(概率计算概率计算)1.随机随机变量变量X取小于或等于某一特定值取小于或等于某一特定值x的概率为的概率为 2.随机随机变量变量X落入任一区间落入任一区间( (a,b) )的概率为的概率为 xxXPe1)(baaXPbXPbXaPee)()
42、()(84统计学统计学STATISTICS指数分布指数分布(例题分析例题分析)632. 0e1e1)5(1551XP368.0632.01)5(1)5(XPXP233. 0eeee)105(211051551XP85统计学统计学STATISTICS386统计学统计学STATISTICS简单随机抽样简单随机抽样(simple random sampling)1.从总体从总体N个单位中随机地抽取个单位中随机地抽取n个单位作为样本,个单位作为样本,使使得每一个容量为样本都有相同的机会得每一个容量为样本都有相同的机会( (概率概率) )被抽中被抽中 2.抽取元素的具体方法有重复抽样和不重复抽样抽取元素
43、的具体方法有重复抽样和不重复抽样3.特点特点简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便4.局限性局限性当当N很大时,不易构造抽样框很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率87统计学统计学STATISTICS分层抽样分层抽样(stratified sampling)1.将将总体单位按某种特征或某种规则划分为总体单位按某种特征或某种规则划分为不同的层
44、,然后从不同的层中独立、随机不同的层,然后从不同的层中独立、随机地抽取样本地抽取样本2.优点优点保证样本的结构与总体的结构比较相近,从保证样本的结构与总体的结构比较相近,从而提高估计的精度而提高估计的精度组织实施调查方便组织实施调查方便既可以对总体参数进行估计,也可以对各层既可以对总体参数进行估计,也可以对各层的目标量进行估计的目标量进行估计88统计学统计学STATISTICS系统抽样系统抽样(systematic sampling)1.将总体中的所有单位将总体中的所有单位(抽样单位抽样单位)按一定顺按一定顺序排列,在规定的范围内随机地抽取一个序排列,在规定的范围内随机地抽取一个单位作为初始单
45、位,然后按事先规定好的单位作为初始单位,然后按事先规定好的规则确定其他样本单位规则确定其他样本单位先从数字先从数字1到到k之间随机抽取一个数字之间随机抽取一个数字r作为作为初始单位,以后依次取初始单位,以后依次取r+k,r+2k等单位等单位2.优点:操作简便,可提高估计的精度优点:操作简便,可提高估计的精度3.缺点:对估计量方差的估计比较困难缺点:对估计量方差的估计比较困难89统计学统计学STATISTICS整群抽样整群抽样(cluster sampling)1.将总体中若干个单位合并为组将总体中若干个单位合并为组(群群),抽样时抽样时直接抽取群,然后对中选群中的所有单位直接抽取群,然后对中选
46、群中的所有单位全部实施调查全部实施调查2.特点特点抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的地点相对集中,节省调查费用,方便调查的实施调查的实施缺点是估计的精度较差缺点是估计的精度较差90统计学统计学STATISTICS391统计学统计学STATISTICS抽样分布的概念抽样分布的概念392统计学统计学STATISTICS1.样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布 在重复选取容量为在重复选取容量为n的样本时,由该统计量的所有的样本时,由该统计量的所有可能取值形成的相对频数分布可能取值形成的相
47、对频数分布 2.随机变量是随机变量是 样本统计量样本均值样本均值, 样本比例,样本方差等样本比例,样本方差等3.结果来自结果来自容量相同的的所有可能样本可能样本4.提供了样本统计量长远而稳定的信息,是进行提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要推断的理论基础,也是抽样推断科学性的重要依据依据 抽样分布抽样分布 (sampling distribution)93统计学统计学STATISTICS样本均值的抽样分布样本均值的抽样分布394统计学统计学STATISTICS1.在重复选取容量为在重复选取容量为n的样本时,由样本均的样本时,由样本均值的所有可能取值形
48、成的相对频数分布值的所有可能取值形成的相对频数分布2.一种理论概率分布一种理论概率分布3.推断总体均值推断总体均值 的理论基础的理论基础样本均值的抽样分布样本均值的抽样分布95统计学统计学STATISTICS样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)5 . 21NxNii25. 1)(122NxNii96统计学统计学STATISTICS样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)97统计学统计
49、学STATISTICS样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)98统计学统计学STATISTICS1.样本均值的数学期望样本均值的数学期望2.样本均值的方差样本均值的方差重复抽样重复抽样不重复抽样不重复抽样样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)(xEnx22122NnNnx99统计学统计学STATISTICS样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)为样本数目MnM
50、xnixix222122625. 016)5 . 20 . 4()5 . 20 . 1 ()(5 . 2160 . 45 . 10 . 11Mxniix100统计学统计学STATISTICS抽样分布与总体分布的关系抽样分布与总体分布的关系正态分布正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布101统计学统计学STATISTICS样本比例的抽样分布样本比例的抽样分布3102统计学统计学STATISTICS1.总体总体(或样本或样本)中具有某种属性的单位与全部单中具有某种属性的单位与全部单位总数之比位总数之比不同性别的人与全部人数之比不同性别的人与全部人数之比合格