《应用数理统计第一章.ppt》由会员分享,可在线阅读,更多相关《应用数理统计第一章.ppt(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2023/6/6(C)中国民航大学 理学院 张春晓1 应用应用 数理统计数理统计第一页,编辑于星期五:七点 三十二分。2023/6/62主讲教师主讲教师 张春晓张春晓 理学院理学院 副教授副教授 研究兴趣:统计预测与决策、优化与控制研究兴趣:统计预测与决策、优化与控制办公地点:理学院统计教研室(南办公地点:理学院统计教研室(南1-316)电话:电话:24092054 E-mail: 第二页,编辑于星期五:七点 三十二分。2023/6/63课程成绩课程成绩 考考试试成成绩绩由由期期末末考考试试成成绩绩和和平平时时考考核核成成绩绩两两部部分分组组成成。平平时时成成绩绩占占15%15%;期期末末考考
2、试试采采用用闭闭卷卷(开开卷)笔卷)笔试试方式方式进进行,占行,占85%85%。答疑时间地点答疑时间地点 课后或周五下午统计教研室课后或周五下午统计教研室第三页,编辑于星期五:七点 三十二分。2023/6/64课程说明课程说明 教学目的教学目的 应用数理统计是一门科学,实证的方法,应用数理统计是一门科学,实证的方法,尤其是数量分析方法是统计学研究的基本方尤其是数量分析方法是统计学研究的基本方法论。通过该门课程教学,使学生掌握统计法论。通过该门课程教学,使学生掌握统计学的基本理论与方法,并能够建立实用的应学的基本理论与方法,并能够建立实用的应用统计模型,解决实际问题。用统计模型,解决实际问题。先
3、修课程先修课程 微积分、线性代数、概率论与数理统计、微积分、线性代数、概率论与数理统计、数学软件、统计学原理数学软件、统计学原理 。第四页,编辑于星期五:七点 三十二分。应用数理统计与经济理论、统计学和数学的联应用数理统计与经济理论、统计学和数学的联系系数学数学统计学统计学数理统计数理统计 管理学管理学工学工学其他学科其他学科第五页,编辑于星期五:七点 三十二分。2023/6/66学习方法学习方法 理论与应用并重。既要重视理论方法,也要重视应理论与应用并重。既要重视理论方法,也要重视应用模型和应用中实际问题的解决;用模型和应用中实际问题的解决;以教材中的经典理论方法为主,也要理解适当引入的、以
4、教材中的经典理论方法为主,也要理解适当引入的、教材中没有的非经典理论方法;教材中没有的非经典理论方法;对于理论方法,重点是思路而不是数学过程;对于理论方法,重点是思路而不是数学过程;对于应用模型,重点不是每种模型本身,而是它们演对于应用模型,重点不是每种模型本身,而是它们演变与发展的方法论;变与发展的方法论;必须十分重视综合练习;必须十分重视综合练习;必须掌握一种应用软件,注意课堂的软件应用演示,必须掌握一种应用软件,注意课堂的软件应用演示,“师傅领进门,修行在个人师傅领进门,修行在个人”,多练。,多练。第六页,编辑于星期五:七点 三十二分。2023/6/67n本课程:应用数理统计;本课程:应
5、用数理统计;36学时;学时;n教材:吴翊等应用数理统计,国防科技大学教材:吴翊等应用数理统计,国防科技大学出版社,出版社,2003;n参考书:清华大学编现代应用数学手册(数理参考书:清华大学编现代应用数学手册(数理统计卷),科学出版社,统计卷),科学出版社,2002。n统计软件:统计软件:EXCEL、SPSS、MATLAB(统计分(统计分析工具箱)。析工具箱)。n基础知识见附录基础知识见附录I,(以浙江大学概率论与数理统,(以浙江大学概率论与数理统计为准)。计为准)。第七页,编辑于星期五:七点 三十二分。2023/6/68能力培养能力培养n数据的产生:数据怎么得来,非常重要,这是统数据的产生:
6、数据怎么得来,非常重要,这是统计当中影响最大的概念;计当中影响最大的概念;n资料分析:你会学到,即使用很简单的方法,也能资料分析:你会学到,即使用很简单的方法,也能很睿智地解读数据;很睿智地解读数据;n概率:利用概率进行思考,可以帮你把事实和无关概率:利用概率进行思考,可以帮你把事实和无关紧要的干扰信息分离;紧要的干扰信息分离;n统计推断:让你学会用手中少量的数据,对一个统计推断:让你学会用手中少量的数据,对一个较大的总体做出结论。较大的总体做出结论。第八页,编辑于星期五:七点 三十二分。2023/6/69案例案例 许多统计学家在第二次世界大战中发挥了重大的许多统计学家在第二次世界大战中发挥了
7、重大的作用,沃德是其中之一。他发明的一些统计方法,作用,沃德是其中之一。他发明的一些统计方法,在战时被视为军事机密。沃德在被咨询飞机上什么在战时被视为军事机密。沃德在被咨询飞机上什么部位的钢板需要加强时,画了飞机的轮廓,并且标部位的钢板需要加强时,画了飞机的轮廓,并且标出返航的战斗机上受敌军创伤的弹孔位置。资料积出返航的战斗机上受敌军创伤的弹孔位置。资料积累了一段时间后,机身各部位几乎都被填满了。于累了一段时间后,机身各部位几乎都被填满了。于是沃德建议,把剩下少数几个没有弹孔的位置加强。是沃德建议,把剩下少数几个没有弹孔的位置加强。?因为这些部位被击中的飞机都没有返航因为这些部位被击中的飞机都
8、没有返航。摘自统计学的世界(美)戴维著。摘自统计学的世界(美)戴维著。第九页,编辑于星期五:七点 三十二分。2023/6/610第一章第一章 数理统计的基本概念数理统计的基本概念1.1 导言导言n什么是数理统计?什么是数理统计?统计统计:指数据的收集、整理和分析,由全部信息指数据的收集、整理和分析,由全部信息(数据)得出正确的唯一结果;(数据)得出正确的唯一结果;数理统计数理统计:指有效地收集、整理和分析带有随机指有效地收集、整理和分析带有随机性影响的数据,对所观测的部分信息推断合理的性影响的数据,对所观测的部分信息推断合理的结果即进行结果即进行统计推断统计推断,直到为采取决策提供依直到为采取
9、决策提供依据。据。n为什么要用数理统计?为什么要用数理统计?实际中,数据量大(抽取的数据具有随机性)实际中,数据量大(抽取的数据具有随机性),试验具有破坏性(不可重复)。,试验具有破坏性(不可重复)。第十页,编辑于星期五:七点 三十二分。2023/6/611n数理统计的研究范畴数理统计的研究范畴:应用广泛:应用广泛 传统上,有生物统计(遗传学、医药)、农业统计、工业传统上,有生物统计(遗传学、医药)、农业统计、工业统计(民航统计)等;统计(民航统计)等;现代,多元统计应用领域:通信、质量控制、气象、地质现代,多元统计应用领域:通信、质量控制、气象、地质勘探、市场预测与决策等。勘探、市场预测与决
10、策等。n数理统计的数理统计的基本内容基本内容:数据采集(抽样理论、试验设计等):数据采集(抽样理论、试验设计等)与统计推断(估计、检验等)。与统计推断(估计、检验等)。n统计推断统计推断的结果往往有赖于方法,尽可能采用的结果往往有赖于方法,尽可能采用“有效的有效的”方法。方法。“有效的有效的”标准标准:样本尽可能少,而结果更合理,:样本尽可能少,而结果更合理,“大量重大量重复使用该方法总体效果好复使用该方法总体效果好”基于概率论原理基于概率论原理。第十一页,编辑于星期五:七点 三十二分。2023/6/6121.2 样本与总体样本与总体n样本样本:经观察或试验得到的数据经观察或试验得到的数据样本
11、样本(子样);(子样);观察或试验的过程观察或试验的过程抽样抽样;“抽样调查抽样调查”:是一种观测研究,抽样的精髓是从检查一:是一种观测研究,抽样的精髓是从检查一部分来得知全体。部分来得知全体。“你不必吃完整头牛,才知道肉是老的你不必吃完整头牛,才知道肉是老的”西方谚语。西方谚语。第十二页,编辑于星期五:七点 三十二分。2023/6/613n经经n次试验得到次试验得到n个数据个数据样本容量样本容量为为n;n 一组数据,一个(容量为一组数据,一个(容量为n的)的)样本(子样);样本(子样);n样本所有可能取值的集合样本所有可能取值的集合样本空间样本空间(n维空间的维空间的子集);子集);n数据可
12、以是数据可以是数值数值或或属性属性(但要用数值表示);(但要用数值表示);n以一维数据以一维数据X或或Y为研究对象为研究对象一元统计一元统计;n以多维数据(以多维数据(X,Y)为研究对象为研究对象多元统计多元统计。n随机试验(产生样本)要求在相同条件下能够独立随机试验(产生样本)要求在相同条件下能够独立重复地进行。重复地进行。n样本是随机试验的结果。样本是随机试验的结果。第十三页,编辑于星期五:七点 三十二分。2023/6/614(2)(2)样本样本X1,X2,Xn具有二重性:具有二重性:可看成一个可看成一个n 维随机向量维随机向量,记为记为(X1,X2,Xn);作为样本值记为作为样本值记为(
13、x1 1,x2 2,xn);(1)(1)样本样本X1,X2,Xn 相互独立相互独立,且与总体且与总体X 同分布同分布;(3)若总体若总体X具有分布函数具有分布函数F(x),概率密度概率密度f(x),则样本则样本 (X1,X2,Xn)的分布函数及概率密度为的分布函数及概率密度为:(4)获得简单随机样本的抽样方法称为获得简单随机样本的抽样方法称为简单随机抽样简单随机抽样.第十四页,编辑于星期五:七点 三十二分。2023/6/615【例【例1.3】(P6)设一组抽奖劵共设一组抽奖劵共10000张,其张,其中中5张有奖。问连续抽取张有奖。问连续抽取3张有奖的概率为张有奖的概率为多少?多少?讨论:不放回
14、抽样和放回抽样。讨论:不放回抽样和放回抽样。随机抽样方式:放回抽样随机抽样方式:放回抽样(要求样本独立)(要求样本独立)由由“随机抽样随机抽样”得到得到“简单样本简单样本”。由于由于 独立同分布,设该分布函数为独立同分布,设该分布函数为F(x),则,则样本联合分布函数为样本联合分布函数为:F(X1)F(X2)F(Xn);样本联合密度函数为:样本联合密度函数为:f(X1)f(X2)f(Xn)。第十五页,编辑于星期五:七点 三十二分。2023/6/616 总体总体n一般定义:所研究对象的全体的集合一般定义:所研究对象的全体的集合总体总体。集合的元素集合的元素个体个体。n总体和样本的区别是统计里很基
15、本的概念;总体和样本的区别是统计里很基本的概念;n如,电视收视率调查如,电视收视率调查 总体:所有总体:所有5亿有电视机的中国住户;亿有电视机的中国住户;样本:约样本:约5000个住户,住户同意使用个住户,住户同意使用“个人电视个人电视记录器记录器”来记录该户中每个人收视的节目。所记来记录该户中每个人收视的节目。所记录的变量包括住户中的人数及其年龄、性别、收录的变量包括住户中的人数及其年龄、性别、收视时段、内容等。视时段、内容等。n普查普查:企图把整个总体纳入样本的抽样调查。:企图把整个总体纳入样本的抽样调查。第十六页,编辑于星期五:七点 三十二分。2023/6/617n从数学上也可如此定义:
16、从数学上也可如此定义:总体总体是指某个随机变量所有可能的取值的全体,是指某个随机变量所有可能的取值的全体,或就是一个随机变量或就是一个随机变量X,而,而样本样本即是与即是与X同分布且相同分布且相互独立的一组随机变量互独立的一组随机变量X1,X2,Xn。n【例【例1.4】两台车床,各车出两台车床,各车出m,n件零件,尺寸分件零件,尺寸分别为别为X1,X2,Xm和和Y1,Y2,Yn,视作取自两个总体,视作取自两个总体X,Y的容量分别为的容量分别为m,n的样本。的样本。n统计推断即由样本推断总体的性质,如上例中,统计推断即由样本推断总体的性质,如上例中,推断两台车床总体上是否有差异。推断两台车床总体
17、上是否有差异。n总体的分布总体的分布统计模型,统计建模的目的即确统计模型,统计建模的目的即确定定X的分布、参数等。的分布、参数等。第十七页,编辑于星期五:七点 三十二分。2023/6/6181.2.3 参数与参数空间参数与参数空间一般情况下总体分布未知,需要样本信息去推断。一般情况下总体分布未知,需要样本信息去推断。【例【例1.5】(P8)考虑如何由样本)考虑如何由样本X1,X2,Xn的实际背的实际背景确定统计模型,即总体景确定统计模型,即总体X的分布函数:的分布函数:(1)样本记录随机抽取的)样本记录随机抽取的n件产品的正品、废品情件产品的正品、废品情况。况。(2)样本表示同一批)样本表示同
18、一批n个电子元件的寿命(小时)个电子元件的寿命(小时)(3)样本表示同一批)样本表示同一批n件产品某一尺寸(件产品某一尺寸(mm)第十八页,编辑于星期五:七点 三十二分。2023/6/6191.2.3 参数与参数空间参数与参数空间当分布类型已知,其中参数未知,则由样本推断参数当分布类型已知,其中参数未知,则由样本推断参数(估计、检验)(估计、检验)。参数的所有可能取值的集合参数的所有可能取值的集合参数空间参数空间(视具体问题而定)(视具体问题而定)统计推断:包括统计推断:包括参数推断参数推断(分布类型已知)和(分布类型已知)和非参非参数推断数推断(分布类型未知)两种。(分布类型未知)两种。第十
19、九页,编辑于星期五:七点 三十二分。2023/6/6201.3 直方图与经验分布函数直方图与经验分布函数1.3.1 直方图直方图n依据概率论的大数定理(附录依据概率论的大数定理(附录1 柯尔莫哥洛夫强大数定理)柯尔莫哥洛夫强大数定理):频率近似于概率。:频率近似于概率。n当总体分布未知,要用样本对总体分布进行非参数推断,当总体分布未知,要用样本对总体分布进行非参数推断,n常用方法是直方图和经验分布函数。常用方法是直方图和经验分布函数。第二十页,编辑于星期五:七点 三十二分。21n取取a略小于略小于 X(1),b略大于略大于X(n),将区间分成,将区间分成m个小区间,个小区间,n记记 落入小区间
20、落入小区间 中观察值的个数(频中观察值的个数(频 数),数),n计算频率计算频率 ;n在直角坐标系在直角坐标系xoy中画出以中画出以 为底,为底,为高的矩形,即为高的矩形,即得到直方图,其对应的分段函数得到直方图,其对应的分段函数n 用来近似概率密度函数用来近似概率密度函数f(x)直方图的具体做法直方图的具体做法n将所有样本由小到大排序,记为将所有样本由小到大排序,记为X(1),X(2),X(n)第二十一页,编辑于星期五:七点 三十二分。2023/6/6(C)中国民航学院 理学院 张春晓22【例【例1.6】P10第二十二页,编辑于星期五:七点 三十二分。2023/6/623【例【例1.6】(P
21、10)齿轮的径向综合误差齿轮的径向综合误差 F i的直方图的直方图区间区间 频数频数ni频率频率ni/n区间区间频数频数ni频率频率ni/n7.5-9.550.02521.5-23.5170.0859.5-11.5150.07523.5-25.5170.08511.5-13.5180.09025.5-27.590.04513.5-15.5190.09527.5-29.550.02515.5-17.5240.12029.5-31.530.01517.5-19.5330.16531.5-33.550.02519.5-21.5300.150总计2001.000第二十三页,编辑于星期五:七点 三十二分
22、。2023/6/624直方图直方图第二十四页,编辑于星期五:七点 三十二分。以概率以概率1成立成立.2023/6/6251.3.2 经验分布函数经验分布函数 设总体设总体X的分布函数未知,样本为的分布函数未知,样本为X1,X2,Xnn 将样本从小到大排序(即求顺序统计量)得到将样本从小到大排序(即求顺序统计量)得到n定义:定义:经验分布函数经验分布函数为右连续,间断点处跃度为为右连续,间断点处跃度为1/n。以格里文科定理可以证明以格里文科定理可以证明,第二十五页,编辑于星期五:七点 三十二分。2023/6/6(C)中国民航大学 理学院 张春晓26当当 时时,0 X(1)X(2)X(3)X(n)
23、Fn(x)1xF Fn n(x x)的图形的图形为为第二十六页,编辑于星期五:七点 三十二分。2023/6/6(C)中国民航大学 理学院 张春晓27 1.4 统计量及其分布统计量及其分布n在利用样本推断总体的性质时,往往不能直接利用在利用样本推断总体的性质时,往往不能直接利用样本,而需要对它进行一定的加工,这样才能有效样本,而需要对它进行一定的加工,这样才能有效地利用其中的信息,否则,样本只是呈现为一堆地利用其中的信息,否则,样本只是呈现为一堆“杂乱无章杂乱无章”的数据的数据n【例【例1.7】从某地区随机抽取】从某地区随机抽取50户农民,调查其人均年户农民,调查其人均年收入情况,得到数据(单位
24、收入情况,得到数据(单位:元)如下:元)如下:n试对该地区农民收入的水平和贫富悬殊程度做个大致试对该地区农民收入的水平和贫富悬殊程度做个大致分析分析9249248008009169167047048708701040104082482469069057457449049097297298898812661266684684764764940940408408804804610610852852602602754754788788962962704704712712854854888888768768848848882882119211928208208788786146148468467467
25、4682882879279287287269669664464492692680880810101010728728742742850850864864738738第二十七页,编辑于星期五:七点 三十二分。解解:显然,如果不进行加工,面对这一大堆大小显然,如果不进行加工,面对这一大堆大小参差不齐的数据,很难得出什么印象但是可以参差不齐的数据,很难得出什么印象但是可以对这些数据稍事加工,如记各农户的人均年收入对这些数据稍事加工,如记各农户的人均年收入分别为分别为x1,x2,.,x50,计算得到,计算得到 这样,就可以了解到该地区农民的平均收入和这样,就可以了解到该地区农民的平均收入和该地区农民贫
26、富悬殊的大致情况:农民的年人均该地区农民贫富悬殊的大致情况:农民的年人均平均收入大约为平均收入大约为809.52元,标准差约为元,标准差约为155.85元,元,贫富悬殊不算很大贫富悬殊不算很大1.4 统计量与抽样分布统计量与抽样分布第二十八页,编辑于星期五:七点 三十二分。由此可见对样本的加工是十分重要的对样本由此可见对样本的加工是十分重要的对样本加工,主要就是构造统计量加工,主要就是构造统计量1.4.1 1.4.1 统计量统计量定义定义 设设X1,X2,Xn为来自总体为来自总体X的样本,称的样本,称不含未知参数的样本的函数不含未知参数的样本的函数g(X1,X2,Xn)为为统计量统计量若若x1
27、,x2,.,xn为样本观测值,则称为样本观测值,则称g(x1,x2,.,xn)为统计量为统计量g(X1,X2,Xn)的观的观测值测值.统计量是处理、分析数据的主要工具对统计统计量是处理、分析数据的主要工具对统计量的一个最基本的要求就是可以将样本观测值代量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数入进行计算,因而不能含有任何未知的参数1.4 统计量与抽样分布统计量与抽样分布第二十九页,编辑于星期五:七点 三十二分。2023/6/630几个常用的统计量几个常用的统计量【例例1.8】设设X1,X2,Xn是来自总体是来自总体X 的一个样本的一个样本,(,(x1 1,
28、x2 2,xn)是其观察值是其观察值.样本均值样本均值样本标准差样本标准差样本样本k k阶原点矩阶原点矩样本样本k k阶中心矩阶中心矩样本方差样本方差*第三十页,编辑于星期五:七点 三十二分。2023/6/631其观察值其观察值:样本均值样本均值样本标准差样本标准差样本样本k k阶原点矩阶原点矩样本样本k k阶中心矩阶中心矩样本方差样本方差*第三十一页,编辑于星期五:七点 三十二分。2023/6/632有关二维总体的统计量:协方差有关二维总体的统计量:协方差 相关系数相关系数定义定义1 1 称称EX-E(X)Y-E(Y)为随机变量为随机变量X与与Y的的 协方差协方差,记为记为Cov(X,Y)即
29、即 注注X与与Y的的相关系数相关系数:当当 XY=0时,称随机变量时,称随机变量X与与Y是是不相关的不相关的若若X,Y相互独立,则相互独立,则X与与Y不相关;反之不一定成立不相关;反之不一定成立X和和Y的的k+l 阶混合中心矩阶混合中心矩第三十二页,编辑于星期五:七点 三十二分。设设(X1,Y1),(X2,Y2),(Xn,Yn)为二维为二维总体总体(X,Y)的样本,其观测值为的样本,其观测值为(x1,y1),(x2,y2),(xn,yn),则下列各量为统计量:,则下列各量为统计量:(1)样本协方差样本协方差 (2)样本相关系数样本相关系数其中其中SXY和和RXY常分别用来作为总体常分别用来作为
30、总体X和和Y的协方差的协方差Cov(X,Y)与相关系数与相关系数 XY的估计量的估计量 1.4.11.4.1 统计量统计量第三十三页,编辑于星期五:七点 三十二分。【例【例1.10】设设X1,X2,Xn是来自总体是来自总体X的样本,的样本,XN(,2),其中,其中 、2为未知参数,则为未知参数,则X1,min X1,X2,Xn 均为统计量,均为统计量,但诸如但诸如等均不是统计量,因它含有未知参数等均不是统计量,因它含有未知参数 或或 常用的统计量有如下几种:常用的统计量有如下几种:1.4.1 统计量统计量第三十四页,编辑于星期五:七点 三十二分。2023/6/635n【例【例1.11】(P14
31、)设设是任意给定的样本空间中的区是任意给定的样本空间中的区域,则观察值域,则观察值X1,X2,Xn落在落在中的频数中的频数n,频率频率f=n/n都是统计量。因为对于固定的都是统计量。因为对于固定的x,经验分布函,经验分布函数数Fn(x)也是统计量。也是统计量。n研究方法时,研究方法时,为随机变量,从而为随机变量,从而 也是随机变量,也是随机变量,统计量的分布称为抽样分布为了研究抽样分统计量的分布称为抽样分布为了研究抽样分布,先研究数理统计中三种重要的分布布,先研究数理统计中三种重要的分布第三十五页,编辑于星期五:七点 三十二分。2023/6/636 设设X1,X2,Xn是来自总体是来自总体 N
32、(0,1)的样本的样本,则称统计量则称统计量 的概率密度为的概率密度为1.4.2 分布分布 服从自由度服从自由度n为的为的 分布分布,记为记为 这里自由度这里自由度n表示相互独立的随机变量的个数表示相互独立的随机变量的个数.分布分布来自正态总体的几个常用统计量的分布来自正态总体的几个常用统计量的分布第三十六页,编辑于星期五:七点 三十二分。2023/6/637Ff(y)的图形的图形 (与与n有关有关):):0 0yFf(y)的推导的推导:由前例知由前例知,而而Xi N(0,1),(0,1),由定义由定义Xi 2 2(1),再由再由X1,X2,Xn的独立性及的独立性及 分布的可加性分布的可加性即
33、即f(y)第三十七页,编辑于星期五:七点 三十二分。2023/6/638 分布的可加性分布的可加性 【定理定理1.11.1】且且Y1,Y2,Yk相互独立相互独立,则有则有 分布的分位点分布的分位点对于给定的正数对于给定的正数 (0(0 1)45)(45)时时,有有标准正态分布的上标准正态分布的上 分位点分位点 设设第三十八页,编辑于星期五:七点 三十二分。由于由于Xi独立,且注意到独立,且注意到N(0,1)的四阶矩为的四阶矩为3,可得,可得 英国统计学家费歇(英国统计学家费歇(R.A.Fisher)曾证明:)曾证明:当当n较大时,较大时,近似服从近似服从【定理定理1.2】卡方分布的期望与方差卡
34、方分布的期望与方差第三十九页,编辑于星期五:七点 三十二分。2023/6/640 定义定义1.2 1.2 设设XN(0,1),Y 2(n),且且X与与Y相互独立相互独立,则称随机变量则称随机变量 FP(x)图形图形:(:(关于关于x=0=0 对称对称,其形状与其形状与n n有关有关)t(n)分布分布的概率密度函数为的概率密度函数为:1.4.3 t 分布分布服从自由度是服从自由度是n 的的t 分布分布(StudentStudent分布分布),),记作记作 T t(n).图图第四十页,编辑于星期五:七点 三十二分。2023/6/641f(t)n=(正态)n=10n=10tFt 分布的分位点分布的分
35、位点:注意:注意:注意:注意:若对给定若对给定 (0(0 1)30,就可认为,就可认为t(n)基本与基本与N(0,1)相相差无几了差无几了1.4.3 t分布分布第四十二页,编辑于星期五:七点 三十二分。2023/6/6431.4.3 1.4.3 F分布分布FF(n1,n2)分布的概率密度函数为:分布的概率密度函数为:服从自由度为服从自由度为(n1,n2)的的F F分布分布分布分布,记为记为 FF(n1,n2).设设X 2(n1),Y 2(n2),且且X 与与Y相互独立相互独立,则称随机变量则称随机变量若若FF(n1,n2),则则 1/FF(n2,n1).第四十三页,编辑于星期五:七点 三十二分
36、。2023/6/6(C)中国民航学院 理学院 张春晓440p(x)的图形的图形F分布的分位点分布的分位点对给定对给定 (0(0 1)1),称满足称满足的点的点F (n1,n2)为为F(n1,n2)分布的分布的 分位点分位点.F (n1,n2)第四十四页,编辑于星期五:七点 三十二分。1.4.4 1.4.4 分位数分位数 设设X为一随机变量,我们知道对于给定的实数为一随机变量,我们知道对于给定的实数x,PX x是事件是事件X x的概率在统计中,我们常常需的概率在统计中,我们常常需要对给定事件要对给定事件X x的概率,由此确定的的概率,由此确定的x取是一个取是一个临界点临界点,称为分位数称为分位数
37、(点点),有如下定义:有如下定义:定义定义6.6 设设X为随机变量,若对给定的为随机变量,若对给定的 (0,1),存在,存在x 满足满足 PX x =,则称则称x 为为X的的上上 分位数分位数(点点)1.4 统计量与抽样分布统计量与抽样分布第四十五页,编辑于星期五:七点 三十二分。若若X具有密度具有密度f(x),PX x =1-说明分位数说明分位数x 右边的一块阴影面积为右边的一块阴影面积为,即即 容易看出,容易看出,X的的 分位数分位数x 是是关于关于 的增函数,的增函数,即即 增大时增大时x 减少减少.1.4.4 分位数分位数1-第四十六页,编辑于星期五:七点 三十二分。1.设设Z N(0
38、,1),记,记N(0,1)的上的上 分位数为分位数为z,即有,即有PZ z =.由由N(0,1)的概率密度的对称性可知的概率密度的对称性可知所以所以 z1-=z 2.设设 2 2(n),记,记 2(n)的上的上 分位数为分位数为 2(n),即有,即有P 2 2(n)=.附表中给出了时附表中给出了时 2(n)的值,当的值,当n40时,由时,由 2(n)的的渐近性质,有渐近性质,有 1.4.4 分位数分位数第四十七页,编辑于星期五:七点 三十二分。【例【例1.13】求下列分位数求下列分位数 (1)z0.975;z0.9 (2)t0.25(4);t0.9(25);t0.05(55);(3)20.5(
39、20);20.025(50).(4)F0.05(10,15);F0.1(14,10);解:解:(1)可由标准正态分布函数表(附表可由标准正态分布函数表(附表2,P399),),对函数值对函数值(z0.975)反查表得反查表得z0.,975=1.96z0.9=(1.28+1.29)/2=1.285.(2)t0.25(4)=-t0.75(4)=-0.7407;t0.9(25)=1.3163t0.95(55)z0.95=1.6451.4.4 分位数分位数第四十八页,编辑于星期五:七点 三十二分。(3)查附表查附表4得:得:20.5(20)=31.4104。在附表。在附表3表中查不到表中查不到 20.
40、025(200),先查出,先查出z0.025=1.96,再作如下近似计算再作如下近似计算(4)附表附表5得到得到F0.05(10,15)=2.54;在附表在附表5中,查不到中,查不到F0.1(14,10),但可查出,但可查出F0.9(10,14)=2.10,故故1.4.4 分位数分位数第四十九页,编辑于星期五:七点 三十二分。2023/6/6(C)中国民航大學 理学院 张春晓501.4.5 正态总体的抽样分布正态总体的抽样分布【定理【定理1.3】设总体设总体 样本样本(1);(2);(3)与与 相互独立。相互独立。*在数理统计问题中,正态分布占据着十分重要的位置,一方面因为在在数理统计问题中,
41、正态分布占据着十分重要的位置,一方面因为在应用中,许多随机变量的分布或者是正态分布,或者接近于正态分布;应用中,许多随机变量的分布或者是正态分布,或者接近于正态分布;另一方面,正态分布有许多优良性质,便于进行较深入的理论研究另一方面,正态分布有许多优良性质,便于进行较深入的理论研究因此,我们着重讨论正态总体下的抽样分布,给出有关最重要的统计因此,我们着重讨论正态总体下的抽样分布,给出有关最重要的统计量样本均值和样本方差量样本均值和样本方差S2的抽样分布定理的抽样分布定理第五十页,编辑于星期五:七点 三十二分。2023/6/6(C)中国民航学院 理学院 张春晓51=推导推导()所以所以*第五十一
42、页,编辑于星期五:七点 三十二分。2023/6/6(C)中国民航学院 理学院 张春晓52预备知识预备知识 n 相互独立的标准正态随机变量,则n元正态分布向量为 ,其中 为n阶单位矩阵,而 ,其中 。n性质:如果 ,则线性函数 仍为正态随机向量,且 。n(,)证明可以用随机向量方法。证明可以用随机向量方法。第五十二页,编辑于星期五:七点 三十二分。(2)证明证明:令令T为正交矩阵为正交矩阵所以:所以:第五十三页,编辑于星期五:七点 三十二分。2023/6/654例例例例1.141.141.141.14设设X1,X2,Xn是来自正态总体是来自正态总体N(,2)的的样本样本,X,S2分别分别是样本均
43、值和样本方差是样本均值和样本方差,则有则有证证证证 由定理由定理1,1,定理定理2 2且两者独立且两者独立.由由t t分布的定义知分布的定义知化简即得结论化简即得结论.*第五十四页,编辑于星期五:七点 三十二分。2023/6/655例例1.151.151.151.15 设设X1,X2,Xn1与与Y1,Y2,Yn2分别是来自正态总体分别是来自正态总体N(1,2)和和N(2,2)的的样本样本,且这两个样本相互独立且这两个样本相互独立.两个样本的两个样本的均值和方差均值和方差分别为分别为 X,Y,S12,S22,则有则有*第五十五页,编辑于星期五:七点 三十二分。2023/6/656证明证明证明证明
44、1 1o o 由定理由定理2 2 知知两者相互独立,由两者相互独立,由F F 分布定义可知分布定义可知化简后即得化简后即得1 1o o 。证证2 2o o 由由的可加性:的可加性:t t分布的定义分布的定义化简后即得化简后即得2 2o o 。第五十六页,编辑于星期五:七点 三十二分。2023/6/657例例1 设总体设总体XN(0,1),X1,X2,Xn 为为X的样本的样本,以以上上列列举举的的几几个个重重要要统统计计量量的的分分布布是是数数理理统统计计中中常常用用的的,它它们们的的密密度度函函数数形形式式都都较较复复杂杂,对对于于应应用用者者来来说说,不不要要求求一一一一推推导导,但但是是查
45、查表表求求上上 分分位位点点是是统统计计中中经经常常遇遇到到的的,必必须须熟熟练练掌掌握握本本节节中中的的四四个个定定理理是是统统计计推推断断的的理理论论依依据据,要要逐逐步步熟熟悉悉定定理理的的条件与结论条件与结论例例2 已知已知Xt(n),求证求证服从服从_?_分布。分布。则则F(1,1)第五十七页,编辑于星期五:七点 三十二分。2023/6/658例例3 设总体设总体XN(,2),X,S2分别是容量为分别是容量为n的样本的样本均值与样本方差均值与样本方差,则则服从服从_ 分布分布;答答:第五十八页,编辑于星期五:七点 三十二分。2023/6/659样本的性质:样本的性质:1.1.X1,X2,Xn都与总体都与总体X同分布;同分布;2.2.X1,X2,Xn相互独立相互独立.样本均值样本均值样本方差样本方差本节小结本节小结常用的统计量常用的统计量*第五十九页,编辑于星期五:七点 三十二分。2023/6/660 分布分布 常用抽样分布常用抽样分布 t 分布分布F分布分布关于关于X,S2 2 的结果的结果:来自正态总体来自正态总体XN(,2):*第六十页,编辑于星期五:七点 三十二分。2023/6/6(C)中国民航学院 理学院 张春晓61n作业:作业:1.1,1.4,1.7,1.11第六十一页,编辑于星期五:七点 三十二分。