统计学概率与抽样分布.pptx

上传人:修**** 文档编号:12418631 上传时间:2022-04-24 格式:PPTX 页数:88 大小:522.92KB
返回 下载 相关 举报
统计学概率与抽样分布.pptx_第1页
第1页 / 共88页
统计学概率与抽样分布.pptx_第2页
第2页 / 共88页
点击查看更多>>
资源描述

《统计学概率与抽样分布.pptx》由会员分享,可在线阅读,更多相关《统计学概率与抽样分布.pptx(88页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第5章 概率与抽样分布Probability and Sampling Distributionsl 购买一张彩票中奖的可能性有多大?购买一张彩票中奖的可能性有多大?l 购买一只股票明天上涨的可能性有多购买一只股票明天上涨的可能性有多大?大?l 你投资一个餐馆盈利的可能性有多大?你投资一个餐馆盈利的可能性有多大?l 一项工程按期完成的可能性有多大?一项工程按期完成的可能性有多大?l 明天降水的可能性有多大?明天降水的可能性有多大?第 5 章 概率与概率分布 5.1 随机事件及其概率 5.2 概率的性质与运算法则 5.3 离散型随机变量及其分布 5.4 连续型随机变量及其分布学习目标 1.了解随

2、机事件、随机试验、含义、几种概率 2.掌握随机变量的定义、分布特征及数学期望 3.掌握样本均值与成数的抽样分布一.一.事件及其运算事件及其运算二.二.事件的概率事件的概率三.三.概率计算的几个例子概率计算的几个例子事件及其运算事件的概念1.1.事件事件(event)(event):随机试验的每一个可能结果(任何样本点集合)例如:掷一枚骰子出现的点数为32.2.随机事件随机事件(random event)(random event):每次试验可能出现也可能不出现的事件例如:掷一枚骰子可能出现的点数3.3.必然事件必然事件(certain event)(certain event):每次试验一定出

3、现的事件,用表示例如:掷一枚骰子出现的点数小于74.4.不可能事件不可能事件(impossible event)(impossible event):每次试验一定不出现的事件,用表示例如:掷一枚骰子出现的点数大于6 例解随机试验:抛掷两颗骰子,观察出现的点数试验的样本点和基本事件(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),.,(6,1),(6,2),.,(6,6随机事件A=“点数之和等于3” =(1,2),(2,1)B=“点数之和大于11” =6,6C=“点数之和不小于2” =D=“点数之和大于12” = 事件的关系和运算(事件的包含) A事件的关系和运算(事件的并

4、或和) B事件的关系和运算(事件的交或积) A事件的关系和运算(互斥事件) A事件的关系和运算(事件的逆) A事件的关系和运算(事件的差) A1.1. 概率是概率是对事件发生的可能性大小的度量对事件发生的可能性大小的度量你购买一只股票明天上涨的可能性有你购买一只股票明天上涨的可能性有多大多大明天降水的概率是明天降水的概率是80%80%。这里的。这里的80%80%就就是对降水这一事件发生的可能性大小是对降水这一事件发生的可能性大小的一种数值度量的一种数值度量2.2. 一个介于一个介于0 0和和1 1之间的一个值之间的一个值3.3. 事件事件A A的概率记为的概率记为P P( (A A) ) 事件

5、的实际发生率事件的实际发生率称为称为频率频率。设在相同条。设在相同条件下,独立重复进行件下,独立重复进行n n次试验,事件次试验,事件A A出现出现f f 次,则事件次,则事件A A出现的频率为出现的频率为f f/ /n n。 概率概率:随机事件发生的可能性大小随机事件发生的可能性大小,用大,用大写的写的P P 表示;取值表示;取值0 0,1 1。 一一、频率与概率、频率与概率frequency and frequency and probabilityprobability概率 1.古典概率是指在每次试验中事件等可能出现的条件下,于试验前计算的比率。设事件A是样本空间中的一个随机事件,若样本

6、空间中的基本事件数为n,事件A包含m个基本事件,则事件A的概率为: P(A)=m/n 【例】掷一枚的硬币,得到正面的概率为多少? 2. 2.试验概率试验概率是指在确定的条件下,事件是指在确定的条件下,事件A A在大量的在大量的n n次试验中出现次试验中出现m m次,则事件次,则事件A A的的频率频率 m/n m/n 可作为事件可作为事件A A的概率的概率 p p(A A)的近)的近似比率。这种概率是根据统计试验后的大似比率。这种概率是根据统计试验后的大量数据整理所得,故称试验概率,也称后量数据整理所得,故称试验概率,也称后验概率和统计概率。记为:验概率和统计概率。记为:nmAp)(nfPAPA

7、n lim)( 3.主观概率是指人们凭个人经验对某一事件发生的可能性大小作出的估计。 例如,天空看上去阴沉沉的,估计下雨的可能性有多大;股价指数在未来一周内上升的可能性有多大;一种新产品在未来市场上畅销的可能性有多大等。 1. 样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动 2. 样本含量样本含量n越大,波动幅度越小,频率越接近概率。越大,波动幅度越小,频率越接近概率。频率与概率的关系:频率与概率的关系:表表 在相同条件下盲蝽象在某棉田危害程度的调查结果在相同条件下盲蝽象在某棉田危害程度的调查结果一一、频率与概率、频率与概率frequency and frequency and pr

8、obabilityprobability一一、频率与概率、频率与概率frequency and frequency and probabilityprobability 小概率原理小概率原理 若事件若事件A发生的概率较小,如小于发生的概率较小,如小于0.05或或0.01,则认为事件则认为事件A在一次试验中不太可能发生,这称为小在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称概率事件实际不可能性原理,简称小概率原理小概率原理。这。这里的里的0.05或或0.01称为小概率标准,农业试验研究中通称为小概率标准,农业试验研究中通常使用这两个小概率标准。常使用这两个小概率标准。二二、随机

9、变量随机变量离散型和连续型离散型和连续型随机变量随机变量随机变量的可能取值是离散的数字,如计数型或分类随机变量的可能取值是离散的数字,如计数型或分类型等,称为离散型随机变量型等,称为离散型随机变量( (discrete random discrete random variable)variable)。0, 1, 9 0, 1, 9 。2020次实验中成功的次数,次实验中成功的次数, 二项式分布。二项式分布。随机变量的可能取值是某一实数的区间,如随机变量的可能取值是某一实数的区间,如“大于大于0”0”或或“-22“-22之间之间”等,称为连续型随机变量等,称为连续型随机变量( (continu

10、ous random variable)continuous random variable)。正态随机变量正态随机变量三三、随机变量随机变量求该供应商次品数的数学期望和标准差求该供应商次品数的数学期望和标准差 43. 005. 0308. 0212. 0175. 00iiipx8397. 07051. 0)(22iiipx三、离散型随机变量的概率分布三、离散型随机变量的概率分布101iniipp 列出离散型随机变量列出离散型随机变量X X的所有可能取值的所有可能取值 列出随机变量取这些值的概率列出随机变量取这些值的概率 通常用下面的表格来表示通常用下面的表格来表示 P(X =xP(X =xi

11、 i)=p)=pi i称为离散型随机变量的概率函数称为离散型随机变量的概率函数xxxfXEd)()(2d)()()(xxfXExXD四、连续型随机变量的概率四、连续型随机变量的概率密度密度若观察资料数量够大,则直方图若观察资料数量够大,则直方图( (组数组数适当增加适当增加) )的整体的整体形形态可用一近似的平态可用一近似的平滑曲线显示。滑曲线显示。直方图中纵轴改为次数比例,则该平滑直方图中纵轴改为次数比例,则该平滑曲线称为密度曲线曲线称为密度曲线( (density curve)density curve)。概率密度曲线00.020.040.060.080.10.120.1423456789

12、10 11密度曲线的性质密度曲线的性质曲线都在水平线上曲线都在水平线上 ( (密度函数密度函数=0)=0)。曲线下所涵盖的全部面积正好为曲线下所涵盖的全部面积正好为1( 1(所有可能所有可能性为性为1) 1)。曲线下任何范围所涵盖的面积,为观察值曲线下任何范围所涵盖的面积,为观察值落在该范围的比例落在该范围的比例( (概率概率) )。密度曲线可视为是观察变量的理论分密度曲线可视为是观察变量的理论分布布图图形。形。 四、连续型随机变量的概率四、连续型随机变量的概率密度密度()iiE Xx p随机变量随机变量X X的一切可能取值的完备组中,各的一切可能取值的完备组中,各可能取值可能取值xi xi与

13、其相对应的概率与其相对应的概率pi pi乘积之和乘积之和描述随机变量取值的集中程度描述随机变量取值的集中程度计算公式为计算公式为五、随机变量的数学期望五、随机变量的数学期望2( )( )iiD XxE Xp随机变量随机变量X X的每一个取值与期望值的离的每一个取值与期望值的离差平方和的数学期望,记为差平方和的数学期望,记为D(X)D(X)描述离散型随机变量取值的分散程度描述离散型随机变量取值的分散程度计算公式为计算公式为六、随机变量的方差六、随机变量的方差5.2 The Binomial Distributions 二项分布二项分布(了解)(了解)一、一、二项分布设定二项分布设定The Bin

14、omial SettingThe Binomial Setting固定的观察次数固定的观察次数 n n。n n 次的观察都独立,每次的观察都不会对其次的观察都独立,每次的观察都不会对其他观察提供任何他观察提供任何信信息。息。每次的观察都只有两种可能的结果,多假每次的观察都只有两种可能的结果,多假设为设为“成功成功”或或“失败失败”两种。两种。每次的观察每次的观察“成功成功”的概率都一样,设定的概率都一样,设定为为 p p。二、二、二项分布二项分布Binomial DistributionBinomial Distribution满足二项分布设定的试验,以满足二项分布设定的试验,以 X X 记录

15、记录 n n次观察次观察中中“成功成功”的次数,则称的次数,则称 X X 的分布为参数为的分布为参数为 n n 与与 p p 的二项分布的二项分布( (binomial)binomial),记为记为B(n, p)B(n, p)。X X 的的所有可能取值所有可能取值为为0, 1, , 0, 1, , nn。对应的概率函数为对应的概率函数为 P(X = x) = P(x) P(X = x) = P(x)。()(1)for x = 0, 1, &, n xxn xnP XxC pp 例例1 1 某种昆虫在某地区的死亡率为某种昆虫在某地区的死亡率为40%40%,即,即p p=0.4=0.4,现对这种害

16、虫用一种新药进行治疗试验,现对这种害虫用一种新药进行治疗试验,每次抽样每次抽样1010头作为一组治疗。试问如新药无疗效,头作为一组治疗。试问如新药无疗效,则在则在1010头中死头中死3 3头、头、2 2头、头、1 1头,以及全部愈好的概头,以及全部愈好的概率为多少?率为多少?按上述二项分布概率函数式计算按上述二项分布概率函数式计算 7头愈好,头愈好,3头死去概率:头死去概率:8头愈好,头愈好,2头死去概率:头死去概率:9头愈好,头愈好,1头死去概率:头死去概率:10头全部愈好的概率:头全部愈好的概率: 21499. 0)60. 0()40. 0()3(73310 CP12093. 0)60.

17、0()40. 0()2(82210 CP04031. 0)60. 0()40. 0() 1 (91110 CP00605. 0)60. 0()40. 0()0(100010 CP【例】【例】 若若问问10头中不超过头中不超过2头死去的概率为多少?头死去的概率为多少?则应该应用累积函数,即则应该应用累积函数,即16729. 012093. 004031. 000605. 0)2() 1 ()0()()2(20PPPyPF四、四、二项分布的期望值与标准差二项分布的期望值与标准差期望值:期望值: E(X) = np方差:方差: Var(X) = np(1-p)标准差:标准差:)1 (pnp5.3 N

18、ormal Distributions 正态分布正态分布(掌握)(掌握)(连续型变量的概率分布)(连续型变量的概率分布)一、特点一、特点正正态曲线态曲线所有所有正正态曲线都有相同的外型态曲线都有相同的外型具有对称、单峰及钟形的特性。具有对称、单峰及钟形的特性。正正态曲线所代表的分态曲线所代表的分布布即为即为正态正态分分布布( (normal distribution)normal distribution)每一每一正正态分态分布布都有其平均值都有其平均值 与标准与标准差差 一、特点正正态曲线态曲线较大较大 一、特点一、特点正态曲线的拐点拐拐点落在点落在一个处拐拐点落在点落在- -处处一、特点二

19、二、P117P117规则规则正正态分态分布布有其特定的数据分布规则:有其特定的数据分布规则:平均值为平均值为 , , 标准差为标准差为 的的正正态分态分布布68%68%的观察资料落在的观察资料落在 的的 1 1 之内之内95%95%的观察资料落在的观察资料落在 的的 2 2 之内之内99.7%99.7%的观察资料落在的观察资料落在 的的 3 3 之内之内0123-1-2-3232368% 的资料95% 的资料99.7% 的资料三、P117规则四、变量四、变量标准化标准化( (Standardization)Standardization)令观察值令观察值 x x 服从平均值为服从平均值为 ,标

20、准差为,标准差为 的分的分布布,则,则 x x 的标准化的标准化值值(standardized (standardized value)value)定义定义为为标准化标准化值值又称为又称为 z-z-值值( (z-score)z-score)。xz标准化变量标准化变量可以证明可以证明z z的平均值为的平均值为0 0z z的标准差为的标准差为1 1四、变量四、变量标准化标准化( (Standardization)Standardization)xz五、五、标准标准正正态分态分布布变量变量 X X 服从平均值为服从平均值为 ,标准差为,标准差为 的的正正态分态分布布,简记为,简记为 X N(, X

21、N(, 2 2) )。X X 经过标准化后为经过标准化后为 Z Z(=(X-)/ s )(=(X-)/ s ),则则 Z Z 也服从正态分布,并且也服从正态分布,并且平均值为平均值为 0 0 ,标,标准差为准差为 1 1,即,即Z N(0, 1)Z N(0, 1)。我们称我们称 Z Z 服从服从标准标准正正态态( (standard normal)standard normal)。六、六、标准标准正正态表态表z表列数字是表列数字是z左边的面积左边的面积z = 0.44z左边的面积为左边的面积为0.33 0.440.33z表列数字是表列数字是z z左边的面积左边的面积z = 0.44z z左边的

22、面积为左边的面积为0.67六、标准正态表七、双侧七、双侧临界值临界值在标准在标准正正态曲线图下,态曲线图下, 右方右方与与 左方左方的面积的面积和和为为 a a , ,则称则称 为为标准正态分布概标准正态分布概率为率为 a a 的双侧的双侧临界值。可查表。临界值。可查表。 = 0面积为面积为a/2a/2/2zaz面积为面积为a/2a/2/2za/2za/2za/2za八、单侧八、单侧临界值临界值在标准在标准正正态曲线图下,态曲线图下, 右方的面积为右方的面积为 a a , ,则称则称 为为标准正态分布概率为标准正态分布概率为 a a 的单侧的单侧临临界值。可查表界值。可查表。 = 0面积为az

23、azzaza第1步:进入Excel表格界面,将鼠标停留在某一空白单元格第2步:在Excel表格界面中,直接点击【f(x)】(粘贴函数)命令 第3步:在复选框“函数分类”中点击【统计】选项,并在“函数名”中点击【NORMDIST】选项,然后【确定】第4步:在【 】后填入正态分布函数计算的区间点(本例为40) 在【Mean】后填入正态分布的均值 (本例为50) 在【P Standard_dev】后填入标准差 (本例为10) 在【Cumulative】后填入1(或TRUE)表示计算事件出现次数小于或等于指定数值的累积概率值 九、计算九、计算P126,选择题选择题12、13、14题题由正态分布导出的几

24、个重要分布分布由正态分布导出的几个重要分布分布 1.语法: 21nVnUF ),(21nnFF2008年年5月月 l语法:1. FINV(probability,degrees_freedom1,degrees_freedom2) 5.4Sampling Distributions抽样分布抽样分布一、总体与样本 population and sample总体总体:根据研究目的:根据研究目的确定的确定的同质同质研究对象研究对象的的全体全体(集合)。分(集合)。分有限总体与无限总体有限总体与无限总体样本样本:从总体中随机:从总体中随机抽取的部分研究对象抽取的部分研究对象 二、总体容量与样本容量po

25、pulation size and sample size总体容量(总体容量(N):总体:总体中所包含的个体数目中所包含的个体数目。根据。根据N大小,总体大小,总体分分有限总体有限总体和和无限总无限总体体样本样本(n):从总体中随:从总体中随机抽取的部分研究对机抽取的部分研究对象象 三、随机抽样 random sampling为了保证样本的为了保证样本的可靠可靠性性和和代表性代表性,需要采,需要采用随机的方法抽取样用随机的方法抽取样本(在总体中每个个本(在总体中每个个体具有体具有相同的机会相同的机会被被抽到)。抽到)。四、参数与统计量parameter and statistic参数参数:总体

26、总体的统计指标,的统计指标,如总体均数、标准差,采如总体均数、标准差,采用希腊字母分别记为用希腊字母分别记为、。固定的常数固定的常数 样样本本抽取部分观察单位抽取部分观察单位 推断推断inference统计量统计量:样本样本的统计指标,如样本均数、标准差,采用英的统计指标,如样本均数、标准差,采用英文字母分别记为文字母分别记为 。 参数附近波动的随机变量参数附近波动的随机变量 。x、s五、总体均值、方差与标准差 总体均值 总体方差 总体标准差1NiiXN221()NiiXN221()NiiXN六、样本均值、方差与标准差 总体均值 总体方差 总体标准差1niixxn221()1niixxsn21

27、()1niixxsn1. 容量相同的所有可能样本的样本均值的概率分布2. 一种理论概率分布3. 进行推断总体总体均值 的理论基础七七、样本均值的抽样分布、样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)5 . 21NxNii25. 1)(122NxNii样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)样本均值的抽样分布样本均值的抽样分布 (例题分析例题分析)3.53.02.52.033

28、.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)八、样本的概率分布统计量统计量( (为样本的函数为样本的函数) ),亦为随机变量,其概率,亦为随机变量,其概率分布分布称为抽样分布称为抽样分布( (sampling distribution)sampling distribution)。一般统计量的抽样分布,则多根据重复抽样一般统计量的抽样分布,则多根据重复抽样( (实实验验) )结果来了解其概率结果来了解其概率分布分布。 的的抽样抽样分布分布大数法则,中心极限定理大数法则,中心极限定理x样本均值的分布与总体分布的

29、比较样本均值的分布与总体分布的比较 (例题分析例题分析)5 . 2X625. 02X八、大数法则由具有有限由具有有限( (finite)finite)平均数平均数 的总体随机抽的总体随机抽样,随着样本容量的增加,样本平均数样,随着样本容量的增加,样本平均数 越接近总体的均数越接近总体的均数 。样本平均数的这种行为称为大数法则样本平均数的这种行为称为大数法则( (law of law of large numbers)large numbers)。x以以 代表样本容量为代表样本容量为 n n 的资料平均数,逐的资料平均数,逐渐增加样本渐增加样本容量,容量,将将 n n 及对应的及对应的 图示如图

30、示如后。后。nxnx八、大数法则Number of observations, n前 n个样本的均数22232425262728293031323315 1050100500 1000500010000八、大数法则九、九、样本均值的抽样分布与中心极限定理样本均值的抽样分布与中心极限定理X5x50 x5 . 2x中心极限定理中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n 30) ,样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布 xn 一个任意分一个任意分布的总体布的总体 x 例例5 在江苏沛县调查在江苏沛县调查336个个m

31、2小地老虎虫危害情况的结小地老虎虫危害情况的结果,果, =4.73头,头, =2.63,试问样本容量,试问样本容量n=30时,由于随机抽时,由于随机抽样得到样本平均数样得到样本平均数 等于或小于等于或小于4.37的概率为多少?的概率为多少?x中心极限定理(CLT) 查附表查附表,P(u0.36)=0.2266,即概率为,即概率为22.66% (属属一尾概率一尾概率)。因所得概率较大,说明差数。因所得概率较大,说明差数0.36是随机误差是随机误差,从而证明这样本平均数,从而证明这样本平均数4.37是有代表性的,变异系数为是有代表性的,变异系数为:2.630.360.4800.4830 xn(头)

32、(4.374.73)0.360.750.4800.48xun 0 4810011 04 37x.CV%. %x.中心极限定理(CLT)十、样本比例的抽样分布1.总体(或样本)中具有某种属性的单位与全部单位总数之比,也叫成数。不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比2.总体比例可表示为3.样本比例可表示为比例比例(proportion)NNNN101或nnPnnP101或1.样本比例的数学期望2.样本比例的方差重复抽样不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)(PEnP)1 (21)1 (2NnNnP习题 教材后选择题3抽样分布与总体分布的关系

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 其他资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁