《概率与统计基础课件.ppt》由会员分享,可在线阅读,更多相关《概率与统计基础课件.ppt(98页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第1页,此课件共98页哦2 一一 随机变量与分布函数随机变量与分布函数1、随机试验随机试验满足条件满足条件:(1 1)可在相同的条件下可在相同的条件下重复重复进行;进行;(2 2)试验结果不止一个)试验结果不止一个,但事先能明确所有的结果;但事先能明确所有的结果;(3 3)试验前不能预知哪一个结果出现的实验称为随机实验。试验前不能预知哪一个结果出现的实验称为随机实验。用用 E E 表示。表示。2、样本空间样本空间随机试验随机试验E E 所有可能的结果所有可能的结果组成的集合称为样本空间记为组成的集合称为样本空间记为=e试验的每试验的每个可能结果称为样本点。个可能结果称为样本点。3、随机事件随机
2、事件满足某些条件的样本点所组成的集合(为满足某些条件的样本点所组成的集合(为 的子集)的子集),常用大写字母常用大写字母A A、B B、C C表示,表示,组成随机事件的一个样本点发生称为随机事件发生。组成随机事件的一个样本点发生称为随机事件发生。第2页,此课件共98页哦3例例1 1:E E1 1随机试验随机试验:抛一枚硬币,观察正面、反面了出现的情况。抛一枚硬币,观察正面、反面了出现的情况。样本空间样本空间 1 1:HH,TT;E E:将一枚硬币抛掷三次,观察正面将一枚硬币抛掷三次,观察正面H H、反面、反面T T出现的情况。出现的情况。2 2:HHHHHH,HHTHHT,HTHHTH,THH
3、THH,HTTHTT,THTTHT,TTHTTH,TTTTTT;E E:将一枚硬币抛掷三次,观察出现正面的次数。将一枚硬币抛掷三次,观察出现正面的次数。3 3:00,1 1,2 2,33;E E:抛一颗骰子,观察出现的点数。抛一颗骰子,观察出现的点数。4 4:1 1,2 2,3 3,4 4,5 5,66;E E:记录某城市记录某城市120120急救电话台一昼夜接到的呼唤次数。急救电话台一昼夜接到的呼唤次数。5 5:00,l l,2 2,3 3,;E E:在一批灯泡中任意抽取一只,测试它的寿命。在一批灯泡中任意抽取一只,测试它的寿命。6 6:t tt0t0;E E:记录某地一昼夜的最高温度和最低
4、温度。记录某地一昼夜的最高温度和最低温度。7 7:(x,y)T T0 0 xyTT1 1,这里这里x示最低温度,示最低温度,y表示最高温表示最高温度,并设这一地区的温度不会小于度,并设这一地区的温度不会小于T To o,也不会大于,也不会大于T T1 1。第3页,此课件共98页哦4在相同的条件下,进行了在相同的条件下,进行了n n次试验,在这次试验,在这n n次试验中,事件次试验中,事件A A发生的发生的次数次数n nA A称为事件称为事件A A发生的频数。比值发生的频数。比值n nA A n n称为事件称为事件A A发生的频率,并记成发生的频率,并记成n n(A)(A)。4 4 概率概率对于
5、一个随机事件对于一个随机事件A(A(除必然事件和不可能事件外除必然事件和不可能事件外)来说,它在一次试来说,它在一次试验中可能发生,也可能不发生。我们希望知道的是事件在一次试验中验中可能发生,也可能不发生。我们希望知道的是事件在一次试验中发生的可能性。发生的可能性。用一个数用一个数P(A)P(A)来表示该事件发生的可能性大小,这个数来表示该事件发生的可能性大小,这个数P(A)P(A)就称为随就称为随机事件机事件A A的概率。的概率。我们希望找到一个数来表示我们希望找到一个数来表示P(A)P(A)。严格定义应用公理化三条件非负性、归一性和可列可加性。严格定义应用公理化三条件非负性、归一性和可列可
6、加性。频率频率当当n n足够大时,足够大时,n(A)P(A)第4页,此课件共98页哦5 5、随机变量随机变量是定义在样本空间记是定义在样本空间记 上的一个单值上的一个单值函数,用来表示随机现函数,用来表示随机现象的结果的变量象的结果的变量。常用大写字母X、Y表示,随机变量的取值具有随机性,随机变量的取值有一定的概率(按一定的概率取某个值某个值 )。样本空间上可以定义多个随机变量。随机变量分为离散和连续随机变量。用掷硬币用掷硬币10次来说明上述概念次来说明上述概念掷硬币为随机实验,掷硬币为随机实验,=正面,反面正面,反面为样本空间为样本空间.正面朝上的次数可以定义为随机变量。正面朝上的次数可以定
7、义为随机变量。6 6次正面朝上一个随机事件次正面朝上一个随机事件A A。在所有的实验中,出现在所有的实验中,出现6次朝上事件的频率为次朝上事件的频率为A A 的概率的概率也可以将硬币朝向作为随机变量也可以将硬币朝向作为随机变量X:正面朝上:正面朝上X=1=1,否则,否则X=0=0P A第5页,此课件共98页哦6概率的重要性质概率的重要性质 ).(1)(.)()()()()(,2.0)(1)(12111111121nnnkjikjininjijiiininiiininAAAPAAAPAAPAPAPAPAPAAAnPSP 否否则则;互互不不相相容容的的事事件件,则则有有若若他他们们是是两两两两个个
8、事事件件对对任任意意性性质质,性性质质第6页,此课件共98页哦7概率的重要性质概率的重要性质 ).()()()();()()(6.1)(5.1)(4).()()()()(,3ABPBPAPBAPBPAPBAPABAPAPAAAPAAPBPAPBPABPBABA 否否则则,则则若若性性质质的的对对立立事事件件,则则为为若若性性质质,对对于于任任一一事事件件性性质质;,则则是是两两个个事事件件,若若设设性性质质第7页,此课件共98页哦86、条件概率、条件概率 在事件在事件A A 发生的条件下事件发生的条件下事件B B 发生的概率称为发生的概率称为条件概率条件概率,记为记为ABP()()()P AB
9、P B AP A11().iiiiPBAPBA满足可列可加性:设满足可列可加性:设B1,B2,两两互不相容的事件,即对于两两互不相容的事件,即对于ij,BiBj=,i,j=1,2,则有则有第8页,此课件共98页哦9B1BnAB1AB2ABnjiniiBBB1)(1jiniiABABABAniiABPAP1)()()()(1iniiBAPBP全概率公式ABayes公式)(ABPk)()(APABPkniiikkBAPBPBAPBP1)()()()(全概率公式与全概率公式与Bayes 公式公式B2第9页,此课件共98页哦10 6 一维随机变量分布函数一维随机变量分布函数 对于离散的对于离散的 随机
10、变量随机变量X,x1,x2,xk是X的所有取值,则X的概率的概率分布分布列(也称概率分布)为:列(也称概率分布)为:设 X为随机变量,则对于任意实数x称为X 的分布函数,对离散型随机变量,采用累加的方法求其分布函数,有公式:=kkkkxxxxF xP XxP Xxp()()()xxXPxF),()(Xx1x2xkp pp(p(x1)p(p(xk)第10页,此课件共98页哦11 对连续型随机变量,其分布函数公式:d()()xF xfttx 非负可积函数 是它的概率密度函数右图几何意义,F(x)为阴影部分的面积-10-550.020.040.060.08yyxF(x)yf x()x)()(xFxf
11、第11页,此课件共98页哦12分布函数的性质分布函数的性质l F(x)单调不减,即)()(,2121xFxFxxl 1)(0 xF且0)(lim,1)(limxFxFxxl F(x)右连续,即)()(lim)0(0 xFtFxFxt=()P aXbP XbP XaFF a()()-()=(b)-第12页,此课件共98页哦13 7 二维随机变量的分布函数二维随机变量的分布函数设设(X,Y)为二维为二维随机变量,(x,y)为任一对实数,称函数称为二维随机变量称为二维随机变量(X,Y)的分布函数,也称为的分布函数,也称为X X和和Y Y的联合分布函数的联合分布函数,对离散型随机变量,其联合分布函数公
12、式:()(),xyF x yf u vdudv(),F x yP XxYyP Xx Yy(),ijijijijxx yyxx yyF xyPXxYyp 对连续型随机变量,其联合分布函数公式:定义函数:为X关于Y的边缘分布函数,同理(),XFxP XxP Xx y(),YF yP YyP XYy 第13页,此课件共98页哦14对离散型随机变量,称()(),Xfxf x ydy11,iijijjjPXxPXx Yyp对连续型随机变量,关于X和关于Y的边缘概率密度为:8、条件概率函数关于X的边缘分布律为1jijiP Yyp()(),Yfyf x ydx,ijijpP Xx Yy为变量(X,Y)的联合
13、概率分布,也称变量变量(X,Y)的联合分布的联合分布律同样关于Y的的边缘分布律对离散型随机变量(X,Y),称()()=(),ijjiiP Xx YyP Yy XxP Xx为在为在 X=xi 的条件下的条件下,Y 的条件分布律的条件分布律第14页,此课件共98页哦15jYy对连续型随机变量(X,Y),在在X=x的条件下的条件下Y 的条件概率密度为的条件概率密度为(,)()Xfxyfx)(xyfXY在在Y=y的条件下的条件下X的条件概率密度的条件概率密度()()(),XYXfx yfx yfx()()=()(),xxX YX YXf x yFx yfx y dxdxfx在在Y=y的条件下的条件下X
14、的的条件分布函数条件分布函数在在X=x的条件下的条件下Y 的条件分布函数的条件分布函数()()()(),yyY XY XYf x yFy xfy x dydyfy第15页,此课件共98页哦16jYy9、相互独立的随机变量相互独立的随机变量 设设(X,Y)为二维为二维随机变量随机变量,对于任意实数 x,y,有有则称随机变量则称随机变量 X 和和Y 是相互独立的是相互独立的X 和和Y 是相互独立是相互独立随机变量与下列条件等价随机变量与下列条件等价,P Xx YyP Xx P Yy()=()(),XYF xyFx Fy对于连续的随机变量,对于连续的随机变量,X 和和Y 是相互独立是相互独立与下列条
15、件等价与下列条件等价()=()(),XYfx yfx fy如果二维如果二维随机变量随机变量(X,Y)相互独立,则有的相互独立,则有的)0)()()(yfyxfxfYYXX)0)()()(xfxyfyfXXYY第16页,此课件共98页哦17 二二 随机变量的数字特征随机变量的数字特征1.一维随机变量一维随机变量数学期望对连续型随机变量,其数学期望公式:对离散型随机变量,其数学期望公式:,2,1,)(kpxXPkk1()XkkkE Xx p其中()()XE Xxfxdx 2.一维随机变量一维随机变量方差随机变量 X 的方差为方差为Var(X)=D(X)=E X-E(X)22X=()XVar X称为
16、均方差与标准差方差与标准差第17页,此课件共98页哦18对连续型随机变量,其方差公式:对离散型随机变量,其方差公式:22211()XkkkXkkkxE Xpxp222()()()XXxE Xf x dxxf x dx222()()XE XEX有公式2()()varvarabXbX()(+)=()E ccE c XcE X var(c)=0第18页,此课件共98页哦19设设(X,Y)为二维为二维随机变量,对离散型随机变量,其数学期望为:3 3 二维随机变量的数字特征:二维随机变量的数字特征:1111()()iijjijijijE Xx pE Yyp 对连续型随机变量,其数学期望为:()()()(
17、),xyxyE Xxf x yd xdyE Yyf x yd xdy 离散和连续型随机变量的方差为:221111()()()()varvariijiijijijXxE XpYyE Yp 22()()()()()()var,var,xyxyXxE Xf x yd xdyYyE Yf x yd xdy 第19页,此课件共98页哦20数学期望和方差的性质:1212(+)()+()+()nnE XXXE XE XE X()()+()+2(X)(Y)varvarvarXYXYEXEYE如果如果X 和和Y 是相互独立是相互独立随机变量,则有随机变量,则有()()()()()+()varvarvarE XY
18、E X E YXYXY对于对于n n个独立的个独立的随机变量,有随机变量,有1212()()()()nnE X XXE XE XE X1212(+)()+()+()varvarvarvarnnXXXXXX第20页,此课件共98页哦21随机变量随机变量X和和 Y 的协方差为的协方差为:4 4 协方差与相关系数:协方差与相关系数:()()()()cov,xyX YxE XyE Yf x y d xdy 离散和连续型随机变量的协方差表达式为离散和连续型随机变量的协方差表达式为:11()()()cov,ijijijX YxE XyE Yp()()cov,cov,aX bYabX Y协方差性质协方差性质
19、a,b为任意常数任意常数1212()()+()cov,cov,cov,XXYXYXY()()()()cov,X YE XYE X E Y如果如果X 和和Y 是相互独立,则是相互独立,则2()()()|cov,|varvarX YXY()0 cov,X Y()()()cov,X YEXE XYE Y第21页,此课件共98页哦22为为X和和 Y 的相关系数的相关系数相关系数:相关系数:即存在常数a 和b,a0,使得P(Y=aX+b)=1()()()cov,varvarXYX YXY无量纲 的量相关系数的性质相关系数的性质1|XY0XY2)若)若则则X和和Y 不相关不相关(线性线性)1)3)若)若1
20、XY则X和Y完全线性相关,既(X,Y)的协方差矩阵为:)的协方差矩阵为:()()()()()()()()E XE XE XE XE YE YE YE YVar XX YYXVar Ycov,cov,第22页,此课件共98页哦235.偏度与峰度偏度与峰度)(kXE X 的 k 阶原点矩)(kXEXE X 的 k 阶中心矩 公式如下公式如下 33()XXE XS公式如下公式如下 44()XXE XK第23页,此课件共98页哦24三 一些重要的概率分布分布若随机变量X 的 密度函数 为22()21()2xf xex 则称X服从参数为,2 的正态分布,记作 X N(,2)正态分布的分布函数为:,为常数
21、,0 亦称高斯(Gauss)分布1 正态分布正态分布22()21()2txF xedt 正态分布的数学期望和方差为:E(X)=Var(X)=2 第24页,此课件共98页哦25正态分布图形与参数几何意义正态分布图形与参数几何意义x0f(x)0 5.11 5.大小与数据的分散程度成大小与数据的分散程度成正比,与图形的正比,与图形的陡峭程度陡峭程度成反比成反比标准正态分布标准正态分布密度函数密度函数2201()2xf xex分布函数记为2201()2txF xedtx 记作记作 X N(0,1)如果如果 X N(,2),作变量代换作变量代换XY则有则有Y N(0,1),既服从标准正态分布既服从标准正
22、态分布第25页,此课件共98页哦26正态分布的性质正态分布的性质1、E(X)=,var(X)=D(X)=22、F0(x)=1F0(x)P(X x)=P(X x)3、如果如果X N(,2),则有则有Y=aX+b 22(),N ab a4、如果如果随机变量随机变量12,nXXX相互独立相互独立,且,且2()iiiXN,则则其线性组合其线性组合22111()innniiiiiiiiYa XNaa,00()()()baP aXbF bF aFF5、可用标准正态分布分布函数表计算第26页,此课件共98页哦27对于一般的正态分布对于一般的正态分布,2(,)XN 时,时,(|)0.6826PX(|2)0.9
23、544PX(|3)0.9974PX可以认为,可以认为,X的取值几乎全部集中在的取值几乎全部集中在3,3区间内区间内.这在统计学上称作这在统计学上称作“3 3 准则准则”(三倍标准差原则)三倍标准差原则).x0f(x)33第27页,此课件共98页哦28标准正态分布的 分位数若 ,则称z 为标准正态分布的上 分位数.定义定义若 ,则称 为标准正态分布的双侧 分位数P Xz2PXz2z1x2zy1x22zy22z20 050 0250 0051 645 1 962 575.zzz常用数字22(2性质性质2 2:211Y nFX n21(,)F nn的点的点 为为F F分布的上分布的上 分位点分位点.
24、12,()nnFF 分布的分布的 分位点。设分位点。设 称称12(,)FF n n12,12,()()()nnnnFPFFfx dxF F分布的上分布的上 分位点分位点图形如右图形如右图图.可以通过查表得到可以通过查表得到19.51)5,4(1)4,5(05.095.0FF19.5)5,4(05.0F112211()(),Fn nF n n第36页,此课件共98页哦37 在统计学中在统计学中,将我们研究的问题所涉及的对象的全体将我们研究的问题所涉及的对象的全体称为称为总体总体,而把总体中的每个成员称为而把总体中的每个成员称为个体个体.例如例如:我们想要研究一家工厂的某种产品的废品率我们想要研究
25、一家工厂的某种产品的废品率.这种产品的全这种产品的全体就是我们的总体体就是我们的总体,而每件产品则是个体而每件产品则是个体.从总体中抽取的一部分个体,称为总体的从总体中抽取的一部分个体,称为总体的一个样本一个样本;样本;样本中个体的个数称为中个体的个数称为样本的容量样本的容量。X1,X2,Xn 称为从总体称为从总体X X得到的容量为得到的容量为n n的随机样本,简称样本。一的随机样本,简称样本。一次具体的抽取记录次具体的抽取记录 x1,x2,xn是随机变量,是随机变量,X1,X2,Xn的一个观察的一个观察值值,成为样本值成为样本值定义:来自总体定义:来自总体X X的样本的样本X1,X2,Xn的
26、函数的函数g(X1,X2,Xn),若是连续若是连续的且不含任何未知参数,则称为一个统计量的且不含任何未知参数,则称为一个统计量四、样本与抽样四、样本与抽样总体、个体、样本、样本容量、样本值总体、个体、样本、样本容量、样本值第37页,此课件共98页哦38统计量统计量1、常用的统计量、常用的统计量设设X1,X2,Xn是是来自总体来自总体X的一个样本,的一个样本,x1,x2,xn 是这一样本的观测是这一样本的观测值,定义值,定义(1)样本均值样本均值niiXnX11(2)样本方差样本方差niiXXnS122)(11 niniiiXnXXXn1212)2(11)222XnXn 2)nX样本标准差样本标
27、准差 niiXXnS12)(112211()nniiSXXn第38页,此课件共98页哦39常用的统计量常用的统计量(3)(3)样本样本 k k 阶原点矩阶原点矩(4)(4)样本样本 k k 阶中心矩阶中心矩nikikXnA11nikikXXnB1)(1并称他们相应的观测值并称他们相应的观测值 ,11niixnx,)(11122niixxns,11nikikxna,)(11nikikxxnb k=1,2,)(1112niixxns仍分别为仍分别为:样本均值、样本方差、样本标准差、样本样本均值、样本方差、样本标准差、样本 k k 阶原点矩、样本阶原点矩、样本 k k 阶中心矩阶中心矩.第39页,此
28、课件共98页哦402 2、常用统计量的性质、常用统计量的性质2 var()()E XXD Xn设设X1,X2,Xn是是来自总体来自总体X的容量为的容量为n n一个样本,若一个样本,若 X 有期望有期望 EX=和方差和方差var(var(X)=DX=2,如果样本的二阶矩存在,则有如果样本的二阶矩存在,则有2)221()nnE Sn22)(SE1))(12niiXXE)()(2222 nnn,)1(2 n221()()niiinDXE XDXE X)()(212XEnXEnii22122222111 ()()()11()()niinniiiiD XE XEXnEXE Xnnn证明22211=()=
29、1()niiSEXXEn第40页,此课件共98页哦413 3、正态总体的样本均值与样本方差的分布、正态总体的样本均值与样本方差的分布212222222221112()1(3)(1),(,),()(,/);()nniiXXXNX SXSXNnXXnSn 定理设是来自正态总体的样本,分别是样本均值和样本方差,则有()和独立;。2)前面证明的性质)前面证明的性质1 EX=,var(var(X)=DX=2,可得,可得,(1)和()和(3)证明比较复杂,(见浙江大学概率论与数理统计证明比较复杂,(见浙江大学概率论与数理统计P172,通过做正交变化通过做正交变化降阶降阶)2222221111()()(1)
30、nniiiinXXSnXX第41页,此课件共98页哦423 3、正态总体的样本均值与样本方差的分布、正态总体的样本均值与样本方差的分布)1(/,),(,22221 ntnSXSXNXXXn 方方差差,则则有有分分别别是是样样本本均均值值和和样样本本的的样样本本,是是来来自自正正态态总总体体设设定定理理22(1)(1)S1XXnt nSnnn证明:由性质证明:由性质2 ,由性质由性质3 30 1(,)XNn2221(1)nSn根据根据t分布的定义分布的定义第42页,此课件共98页哦43两个正态总体样本的抽样分布两个正态总体样本的抽样分布的相互独立的相互独立的简单随机样本的简单随机样本.设112,
31、nXXX与212,nY YY分别是来分别是来自正态总体自正态总体),(211NX222(,)YN 与12111211nniiiiXXYYnn设分别是两个样本的均值分别是两个样本的均值12222212111211()()11,nniiiiSXXSYYnn是两个样本的方差是两个样本的方差2212122212(1)(11);,SSF nn则有则有222121212122222112212(2()211(1)(1)2)(),wwwwXYt nnSnnnSnSSSSnn)其中当当时时定理定理3 3第43页,此课件共98页哦44总体分布的总体分布的未知参数未知参数的估计的估计总体分布的参数往往是未知总体分
32、布的参数往往是未知的的,需要通过样本来估计需要通过样本来估计.通过样本来估计总体的参数通过样本来估计总体的参数,称为称为参数估计参数估计,它是统计推断的一种重要形式它是统计推断的一种重要形式.参数估计问题的一般提法参数估计问题的一般提法X1,X2,Xn要依据该样本对参数要依据该样本对参数 作出估计,或估计作出估计,或估计 的某个已知函数的某个已知函数 。这类问题称为。这类问题称为参数估计。参数估计。)(g设有一个统计总体,总体的分布函数设有一个统计总体,总体的分布函数为为 F(x,)其中其中 为未知参数为未知参数(可以是向量可以是向量)现从该总体抽样现从该总体抽样,得样本,得样本 第44页,此
33、课件共98页哦4512121212122,(,),(,)(,)(,)(,)nnnnnXXXXXXxxxXXXxxxXN 点 估 计 是 用 一 个 数 值 作 为 未 知 参 数 的 估 计 值。在 统 计 上,点 估 计 就 是 构 造 样 本的 一 个统 计 量用 它 的 观 察 值作 为 未 知 参 数的 近 似 值,我 们 称为的 估 计 量,称为的 估 计 值。如 我 们 用 样 本 均 值作 为 正 态 分 布中指 数 分 布 中的 估 计 量。l矩估计法矩估计法 用样本炬替代总体炬用样本炬替代总体炬l 极大似然法极大似然法l 最小二乘法最小二乘法第45页,此课件共98页哦估计量的
34、评选标准估计量的评选标准12(,),()()nXXXEE设存 在 且则 称是的 无 偏 估 计 量,否 则 称 有 偏 估 计 量(1)无偏性)无偏性(2)有效性)有效性1122121212(,)(,)()()nnXXXXXXDD设和都是 的无偏估计量,若有成立,则称比有效。1212(,),0lim|(,)|1nnnXXXPXXX 设若对任给的,有则称是的一致估计量。(3)一致性)一致性第46页,此课件共98页哦47假设假设检验检验参数假设检验参数假设检验非参数假设检验非参数假设检验总体分布未知时的总体分布未知时的假设检验问题假设检验问题 在本讲中,我们将讨论不同于参数估计的另一类重要的统计推
35、断问在本讲中,我们将讨论不同于参数估计的另一类重要的统计推断问题题.这就是根据样本的信息检验关于总体的某个假设是否正确这就是根据样本的信息检验关于总体的某个假设是否正确.这类问题称这类问题称作假设检验问题作假设检验问题 .五、假设检验五、假设检验总体均值总体均值,均值差的检验均值差的检验总体方差总体方差,方差比的检验方差比的检验分布拟合检验分布拟合检验符号检验符号检验秩和检验秩和检验总体分布已知,总体分布已知,检验关于未知参数检验关于未知参数的某个假设的某个假设1.假设检验的原理第47页,此课件共98页哦48 假设检验的两类错误假设检验的两类错误 P拒绝拒绝H0|H0为真为真=,P接受接受H0
36、|H0不真不真=.犯两类错误的概率犯两类错误的概率:显著性水平显著性水平 为犯第一类错误的概率为犯第一类错误的概率.H0为真为真实际情况实际情况决定决定拒绝拒绝H0接受接受H0H0不真不真第一类错误第一类错误正确正确正确正确第二类错误第二类错误通常控制犯第一类错误的概率通常控制犯第一类错误的概率.一般事先选定一个数一般事先选定一个数,(0,(0 1),1),要求要求犯第犯第一类错误的概率一类错误的概率.,.,为假设检验的显著性水平,为假设检验的显著性水平,通常只讨论犯第通常只讨论犯第一类错误的概率一类错误的概率第48页,此课件共98页哦491.假设检验的步骤(1)提出二择一的假设提出二择一的假
37、设H H0 0(往往与试验目的相反)与(往往与试验目的相反)与H H1 1(往往是欲得到的结往往是欲得到的结论);论);(2 2)给定显著水平(小概率)给定显著水平(小概率 ););(3 3)在)在H H0 0成立下,收集数据,寻找检验统计量(如正态成立下,收集数据,寻找检验统计量(如正态,t,F,t,F),由统计量),由统计量的分布,可计算各种取值的概率;的分布,可计算各种取值的概率;(4 4)找出小概率发生的临界值;给出拒绝域形式)找出小概率发生的临界值;给出拒绝域形式(5 5)将样本值和)将样本值和H H0 0代入检验统计量进行计算;代入检验统计量进行计算;(6 6)将计算结果与临界值比
38、较,若大于临界值,小概率事件发生,根据小概)将计算结果与临界值比较,若大于临界值,小概率事件发生,根据小概率原理,在一次试验中小概率事件是不会发生的。现在,居然发生了。错在率原理,在一次试验中小概率事件是不会发生的。现在,居然发生了。错在哪里?哪里?(7 7)原来是假设)原来是假设H H0 0错了,因为一切都是在错了,因为一切都是在H H0 0成立下推证的。于是拒绝成立下推证的。于是拒绝H H0 0。否。否则,不拒绝则,不拒绝H H0 0。第49页,此课件共98页哦50假设检验(三部曲)其中122()()22P VVP VV)()(221VVVV双双边边检验检验)(1VV左边检验左边检验确定拒
39、绝域.l 计算计算,并作出相应判断并作出相应判断.右边检验右边检验)(VV 0Hl 根据实际问题建立假设 与 .1H0Hl 在在 为真时为真时,选择合适统计量选择合适统计量V ,由由1H称为显著水平称为显著水平2 ,VV为临界值为临界值)(VVP第50页,此课件共98页哦512.正态总体的参数检验正态总体的参数检验一、单个正态总体一、单个正态总体N(,2)均值均值 的检验的检验H0:0 ;H1:01 1)关于)关于 的检验的检验设设X1,X2,Xn为来自总体为来自总体N(N(,2 2)的样本的样本.求求:对以上假设的显著性水平对以上假设的显著性水平=的假设检验的假设检验.在在方差方差 2 2已
40、知的情况已知的情况当原假设当原假设 H0:0 为真时)1,0(0NnXU统计量 第51页,此课件共98页哦52给定小概率给定小概率,查表得:查表得:2zU 检验法002()HXPZn若若小概率发生小概率发生,拒绝原假设拒绝原假设 H0:0,所以原假设的拒绝域为所以原假设的拒绝域为00222 XXUzzznn 既和计算计算 当当2020 +XznXzn 或拒绝假设拒绝假设 H0:0,接受接受H0:0,X第52页,此课件共98页哦53 0 0 0 0 02UzzUzU U 检验法检验法(2 2 已知已知)原假设 H0备择假设 H1检验统计量及其H0为真时的分布拒绝域nXU/0)1,0(N右则检验右
41、则检验左则检验左则检验第53页,此课件共98页哦542.正态总体的参数检验正态总体的参数检验当当方差方差 2 2未未知知时时当假设当假设 H0:0 为真时(1)XTt nSn由样本方差由样本方差S S2 2代替代替 2 2,根据抽样分布性质有根据抽样分布性质有给定小概率给定小概率,查表得:查表得:,当,当2(1)tn小概率发生小概率发生,拒绝原假设拒绝原假设 H0:0,接受假设H10(1)Xt nSn2020(1)(1)XtnSnXtnSn 或 02()HXPtSn2 Tt既既时时第54页,此课件共98页哦55T T 检验法检验法(2 2 未知未知)0 0 0 02(1)Ttn 0(1)Ttn
42、)1(0ntnSXT原假设 H0备择假设 H1检验统计量及其H0为真时的分布拒绝域(1)Ttn第55页,此课件共98页哦56算例 某种元件的寿命X(以小时计)服从正态分布T没有落在拒绝域中,顾接受假设没有落在拒绝域中,顾接受假设 H0,认为认为平均寿命不大于平均寿命不大于225小时小时22(),XN ,根据样本计算和查表得:根据样本计算和查表得:解解 按题意需检验按题意需检验 H0:0225,H1:0 225取 0.05,现现n16,已知 由表知由表知0 05241 98 7259 .,.,XSt(15)=1.7751均未知,现测得均未知,现测得16只元件的寿命如下:只元件的寿命如下:159
43、280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 文师傅有理由认为元件的平均寿命大于文师傅有理由认为元件的平均寿命大于225(小时)(小时)0(1)XTt nSn00 66851 7531.XTSn第56页,此课件共98页哦572 2)关于)关于方差方差 2 2 的检验的检验设设X1,X2,Xn为来自总体为来自总体N(N(,2 2)的样本的样本.求以下假设显著性水平求以下假设显著性水平 的的假假设检验设检验.当原假设当原假设 为真时为真时2检验检验22220010:,HH利用样本方差利用样本方差2211()1niiSXXn
44、是是 2 2的一个无偏估计的一个无偏估计2220(1)(1)nSn2200:H得得2211222(1),(1)knkn220022122200(1)S(1)S()()nnPkPk给定给定,当出现当出现时拒绝假设,为方时拒绝假设,为方便起见,取便起见,取220022122200(1)S(1)S()=()2nnPkPk假设假设 的拒绝域为的拒绝域为2200:H22221222200(1)S(1)S(1),(1)-nnnn第57页,此课件共98页哦58 2 02 2 02)(22n 2 02)1(22n 2 02)1(212n 2 02 2=02 2 02)1()1(2221222nn或原假设 H0
45、备择假设 H1检验统计量及其在H0为真时的分布拒绝域)1()1(22022nSn(未知)(未知情况下未知情况下 2 的检验的检验)第59页,此课件共98页哦60一、两个正态总体一、两个正态总体N(,2)的参数检验的参数检验设 X N(1 1 2),Y N(2 2 2),两样本 X,Y 相互独立,样本 (X1,X2,Xn),(Y1,Y2,Ym)样本值 (x1,x2,xn),(y1,y2,ym)显著性水平 H0:1 2 ;H1:2检验检验假设假设当当H0:1=2为真时为真时 2212(0,1)XYNmn 拒绝域为 /22212XYZmn 第60页,此课件共98页哦611 2=(12,22 已知)1
46、,0(2221NmnYXU2zU zU(1)(1)关于均值差关于均值差 1 1 2 2 的检验的检验zU1 2 1 2 1 2 1 2 原假设 H0备择假设 H1检验统计量及其在H0为真时的分布拒绝域第61页,此课件共98页哦621 2=2tT 1 2 1 2 1 2 1 2 tT tT)2(11mnTSmnYXTw2)1()1(2221mnSmSnSw其中12,22未知12=22原假设 H0备择假设 H1检验统计量及其在H0为真时的分布拒绝域第62页,此课件共98页哦63 12=22 12 22 12 22 12 22 12 22 12 22)1,1(mnFF)1,1(1mnFF(2)(2)
47、关于方差比关于方差比 1 12 2 /2 22 2 的检验的检验)1,1(2mnFF或)1,1(21mnFF1,2)1,1(2221mnFSSF 均未知原假设 H0备择假设 H1检验统计量及其在H0为真时的分布拒绝域第63页,此课件共98页哦64参数的点估计利用给定样本观察值,算出参数的估计值。参数的点估计利用给定样本观察值,算出参数的估计值。但用点估计的方法得到的估计值不一定是参数的真值,即但用点估计的方法得到的估计值不一定是参数的真值,即使与真值相等也无法肯定这种相等(因为总体参数本身是使与真值相等也无法肯定这种相等(因为总体参数本身是未知的),也就是说,由点估计得到的参数估计值没有给未知
48、的),也就是说,由点估计得到的参数估计值没有给出它与真值之间的出它与真值之间的可靠程度可靠程度(精度精度),在实际应用中往往还,在实际应用中往往还需要知道参数的估计值落在其真值附近的一个范围。需要知道参数的估计值落在其真值附近的一个范围。为此我们要求由样本构造一个以为此我们要求由样本构造一个以较大的概率较大的概率包含真实参包含真实参数的一个范围或区间,这种带有概率的区间称为置信区间,数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个置信区间对未知参数进行估计的方法称为区间通过构造一个置信区间对未知参数进行估计的方法称为区间估计。估计。六、区间估计六、区间估计第64页,此课件共98
49、页哦651 1、置信区间定义:、置信区间定义:121P),(2111nXXX ),(2122nXXX )(21 满足满足 设设 是是 一个待估参数,给定一个待估参数,给定 若由样本若由样本X1,X2,Xn确定确定的两的两个统计量个统计量,0 则称区间则称区间 是是 的置信度(置信概率的置信度(置信概率,置信水平置信水平)为)为 的双侧置信区间的双侧置信区间.,21 121 和分别称为置信下限和置信上限分别称为置信下限和置信上限.作区间估计作区间估计,就是要设法找出两个只依赖于样本就是要设法找出两个只依赖于样本置信上下置信上下限限置信区间是以统计量为端点的随机区间,希望置信区间是以统计量为端点的
50、随机区间,希望 区间区间 包含包含参数真值参数真值 的概率达到指定的要求的概率达到指定的要求.,21 第65页,此课件共98页哦662.2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如要求区间12 长度长度 尽可能短,或能体现该要求的其它准则尽可能短,或能体现该要求的其它准则.,21 1.1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间 内,内,就是说,概率就是说,概率 要尽可能大要尽可能大.21 P即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,一般是在保证可靠度的条可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度件下尽可能提高精度.