《概率论与数理统计教师用教案概率统计教案7章第1-2节.pdf》由会员分享,可在线阅读,更多相关《概率论与数理统计教师用教案概率统计教案7章第1-2节.pdf(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 224 页页 题目 与 课时题目 与 课时 第一节 点估计 第二节 估计量的评判标准 课时:2 教学目的 教学目的 (1) 理解点估计的概念;理解点估计的概念; (2) 了解矩估计法与极大似然估计法; (3) 了解无偏性、有效性、一致性等估计量的评判标准. 内容 内容 矩估计法和极大似然估计法的应用. 教学重点 教学重点 解决办法 解决办法 加强矩估计法和极大似然估计法的讲解与讲评,加大例题
2、讲解力度,配备习题课相关知识的例题,留作业训练巩固. 内容 内容 极大似然估计法的基本原理. 教学难点 教学难点 解决办法 解决办法 加大难点知识的分析,加大例题讲解力度. 教学辅助 教学辅助 利用多媒体课件,板书配合分析. 习题布置 习题布置 P174: 2、3、5、. P180: 3、4、8、9. 参考文献 参考文献 1 郑一,王玉敏,冯宝成. 概率论与数理统计. 大连理工大学出版社, 2015 年 8 月. 2 郑一,戚云松,王玉敏. 概率论与数理统计学习指导书. 大连理工大 学出版社,2015 年 8 月. 3 郑一,戚云松,陈倩华,陈健. 光盘:概率论与数理统计教案 作业册 与试卷考
3、题及答案、数学实验视频. 大连理工大学出版社,2015 年 8 月. 4 王玉敏,郑一,林强. 概率论与数理统计教学实验教材. 中国科学技术 出版社, 2007 年 7 月. 联系方式: 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 225 页页 教 学 内 容 教 学 内 容 内容简介内容简介 在实际中有些总体含有未知参数, 我们怎样求出未知参数的变换范范围呢? 我们可以从总体中抽出样本, 然后利用样本提供的信息对总体的未知参数做出某种
4、估计. 我们学习两种求点估计的方法矩估计法和极大似然估计法. 不同的估计方法可能得到不同的估计量及其估计值, 所以我们给出了估计量的评判标准. 预备知识 预备知识 样本的各阶矩,总体的各阶矩,函数最值求法,样本概率密度和样本分布率,数学期望及性质,方差及性质,依概率收敛. 第七章 参数估计 第七章 参数估计 参数估计是统计推断的基本问题之一. 在许多实际问题中, 根据实践经验,已经知道数据来自某类分布总体, 但总体中有些参数是未知的. 这类已知其分布类型(包含未知参数), 通过样本对总体中的未知参数进行估计的问题就是参数估计参数估计问题. 本章将介绍参数的点估计(点估计(point estim
5、ation) )方法矩估计法和最大似然估计法,重点介绍正态总体的数学期望与方差的区间估计(区间估计(interval estimation) )方法,提出估计量优劣的评判标准,将参数估计方法应用到实际问题中. 第一节 点估计 第一节 点估计 教师教学建议: (1)利用样本来研究总体的信息或特征是解决问题的一个方向.问题是:怎样做才能合理呢,才算科学呢?这是第七章开始的学习内容. (2)教学问题引入: 1)在一定时间内某信息台接到的呼叫次数 X 是一个随机变量,由实践经验知道它服从泊松分布,而其中参数数学期望或方差是多少呢? 2) 调查男学生的身高,根据以往经验这些数据应该来自正态总体,我们怎样
6、才能得到这个正态总体的两个特征参数数学期望、方差呢? 一、估计问题一、估计问题 总体X的分布函数的形式已知, 在分布函数中有一个或多个未知参数, 借助其样本来估计总体的分布函数中所含未知参数的值. 这类问题称为参数的点估计问题点估计问题. 点估计问题的一般提法如下: 定义定义 1 设总体 设总体X的分布函数的分布函数F(; x)的形式已知, 其中的形式已知, 其中是未知参数, 是未知参数, 12,nXXX是来自是来自 X 的一组样本, 的一组样本, 12,nx xx是相应的样本值. 我们构是相应的样本值. 我们构 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理
7、工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 226 页页 造一个适当的统计量造一个适当的统计量),(21nXXX, 用它的观察值, 用它的观察值),(21nxxx作为 未 知 参 数作为 未 知 参 数的 近 似 值 . 称的 近 似 值 . 称),(21nXXX为为的 一 个 估 计 量的 一 个 估 计 量( (estimator), ), ),(21nxxx为为的一个估计值的一个估计值( (estimate value). ). 下面介绍两种常用的构造估计量的方法: 矩估计法和最大似然估计法. 二、 矩估计法
8、 二、 矩估计法 由第六章第二节定理 1, 我们知道: 样本的 l 阶矩依概率收敛于总体的 l 阶矩, 并且样本 l 阶矩的连续函数依概率收敛于总体 l 阶矩的对应的函数,这就是矩估计法的理论依据. 由此得到了矩估计法. 定义定义 2 用样本的 用样本的 l 阶矩(或其连续函数)作为总体的相应的阶矩(或其连续函数)作为总体的相应的 l 阶矩(或对应的函数)的估计量,这种估计方法称为矩估计法阶矩(或对应的函数)的估计量,这种估计方法称为矩估计法. . 设 X 为连续型随机变量, 其概率密度为12(, ,)kf x , 或 X 为离散型随机变量, 其分布律为xXP=12(, , )kp x , 其
9、中k,21为待估参数, 12,nXXX是来自 X 的样本. 假设总体 X 的前k阶矩 l=)(lXE=12(,)dlkx f xx (X为连续型) 或 l=)(lXE=12(,)Xlkx Rx p x (X为离散型) (kl, 2 , 1,XR是X可能取值的范围)存在. 矩估计法的具体步骤是: (1) 写出总体的 k 阶矩: 设 1112221212( ,),( ,),( ,).kkkkk 这是包含k个未知参数k,21的方程组. (2) 写出样本的 k 阶矩: 11,1,2, .nlliiAXlkn (3) 令总体矩等于同阶的样本矩: ,1,2, .llAlk (4) 解由(3)确定的方程组:
10、 得到 1112221212(,),(,),(,).nnkknXXXXXXXXX (5) 确定矩估计量和矩估计值: 以 12(,)inXXX 作为i的估计量, 并记为 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 227 页页 12(,)iiniXXX,ki, 2 , 1. 这种估计量称为矩估计量矩估计量, 该矩估计量的实现值称为矩估计值矩估计值. 例例 7.1.1 设总体X(不论服从什么分布)的均值及方差2都存在, 且有02, 但,2均
11、未知. 又设12,nXXX是来自X的样本. 试求和2的矩估计量. 教学建议: (1)这 2 个未知参数的据估计法问题,用一、二阶矩关系式建立方程组. (2)若是 1 个未知参数的据估计法问题,用一阶或二阶矩关系式建立一个方程即可. (3)所得结论也应该熟记. 解解 总体一阶矩和二阶矩等于 122222(),()() ().E XE XD XE X 样本一阶矩和二阶矩等于 1221,1.niiAXAXn 令 1122,.AA 得关系式 2221,1.niiXXn 解之,得到总体参数的矩估计量为 22221,11().niiXnXXBSnn 讲评讲评 (1) 此例的求解方法和所得结论值得读者充分重
12、视. 此题不需要指明总体分布类型. 当总体中有两个未知参数时,我们就用样本的1阶和2阶矩分别代替总体的1 阶和 2 阶矩,这是求未知参数矩估计的基本方法. 由本题的结果还可以看出,总体均值与方差的矩估计量和2由样本均值X和样本方差21nSn确定,不因总体分布不同而有差异. (2) 对于正态分布: 如果XN(2, ), ,2未知, 即得,2的矩估计量为 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 228 页页 221,1() .niiXX
13、Xn (3) 对于均匀分布:设总体X在(ba,)上服从均匀分布,ba,未知. 由于22(),212abba, 利用例 3 结果, 得到 a, b 的矩估计量分别为 a =X-213()niiXXn23XB, b=X+213()niiXXn23XB. 三、 最大似然估计法 三、 最大似然估计法 1. 最大似然原理 . 最大似然原理 因此, 最大似然估计值是满足 L()=maxL() 的解. 所以, 最大似然估计法的直观想法是: 实际发生的事件应该是概率最大的事件, 此即为最大似然原理最大似然原理. 2似然函数 似然函数 我们总是假设12,nXXX是来自总体X的样本, nxxx,21是相应于样本1
14、2,nXXX的一个样本观察值. 若X是离散型总体, 其分布律);(xpxXP()的形式为已知, 为待估参数,则12,nXXX的联合分布律为 1( ; )niip x. 我们得到事件1122,nnXx XxXx发生的概率为 121( )( ,; )( ; )nniiLL x xxp x. (1.1) 这一概率随的取值而变化, 它是的函数, 称)(L为离散型总体离散型总体 X 的的的似然函数的似然函数( likelihood function). 若X是连续型总体, 其概率密度);(xf的形式已知, 为未知参数.考虑函数 121( )( ,; )( ; )nniiLL x xxf x. (1.3)
15、 同样它是的函数, 称)(L为连续型总体连续型总体 X 的的的似然函数的似然函数( likelihood function). 定义 3 固定样本观察值定义 3 固定样本观察值nxxx,21, 在, 在取值的可能范围取值的可能范围内挑选使似然函数 内挑选使似然函数 ( Lnxxx,21; ;) 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 229 页页 达到最大值的参数达到最大值的参数, 把, 把作为未知参数作为未知参数的估计值. 即取的
16、估计值. 即取使 使 (Lnxxx,21; ;)=)=max(Lnxxx,21; ;). . (1.4) 这样得到的这样得到的与样本值与样本值nxxx,21有关,有关,( (nxxx,21)称为参数)称为参数 的最大似的最大似然估计值然估计值, 而相应的统计量, 而相应的统计量( (1X, ,nXX,2)称为参数)称为参数 的最大似然估计的最大似然估计量量(maximum likelihood estimator). .习惯上,也称为极大似然估计量极大似然估计量. 3. 最大似然估计值求解步骤 . 最大似然估计值求解步骤 ( )L是的函数, 当它对可微时, 我们可以用求导的方法求出的最大似然估
17、计值. 所以,我们得到最大似然估计法的步骤: (1) 由总体分布写出样本的似然函数)(L,参见(1.1)式和(1.3)式; (2) 建立似然方程似然方程, 即令 d( )0dL, (1.5) 或 dln ( )0dL, (1.6) 这个方程也称为对数似然方程对数似然方程; (3) 解上面的似然方程或对数似然方程求得. 在第二步中我们的目的是求)(L的最大值点, 而ln ( )L的最大值点与)(L的最大值点是相同的. 若似然函数)(L或对数似然函数ln ( )L对不可微, 就只能通过求解max ( )L得到最大似然估计值与估计量. 例例 7.1.2 设总体 X 的概率分布为 X 0 1 2 3
18、P 2 2 (1) 2 12 其中 00 存在但未知, E(X)已知, 12,nX XX是来自 X 的样本. 试证明: (1) 样本二阶中心矩2211()niiBXXn不是总体方差2的无偏估计量; (2) 样本方差2211()1niiSXXn是总体方差2的无偏估计量; (3) 样本标准差 S 不是总体标准差 的无偏估计量; (4) 统计量211()niiXE Xn是总体方差2的无偏估计. 教学建议: 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版
19、第 第 235 页页 设计此例的目的在于: (1)联系与对比“形式相近”统计量的无偏性问题. (2)嘱咐学生, “联系与对比”是开展创新科研思想的基本方法. 证证 设总体 X 的数学期望()E X. (1) 由第六章第二节定理 1 的结论(1)知 ()E X,2()D Xn, 2()(1,2,)iD Xin. 所以 222112212222111()()() ()1()( )111()( ).nniiiiniiiniiE BEXXEXXnnEXE XEXE XnnD XD Xnnnnn 这说明, 样本二阶中心矩2211()niiBXXn不是总体方差2的无偏估计量. (2) 因为221nSBn,
20、 所以 22221()()11nnnE SE Bnnn. 这说明,样本方差2211()1niiSXXn是总体方差2的无偏估计量. (3) 在方差2()D X0 的题设下,用反证法可知( )0D S . E(S)=22()( )( ).E SD SD S 这说明,样本标准差 S 不是总体标准差 的无偏估计量. (4) E211()niiXE Xn=211()niiiEXE Xn=11()niiD Xn=2. 这说明,统计量211()niiXE Xn是总体方差2的无偏估计量. 讲评 讲评 (1)可见, 样本二阶中心矩 B2不是总体方差2的无偏估计量, 但是样本方差 S2的确是总体方差2的无偏估计量
21、. 这就是人们常用样本方差 2211()1niiSXXn估计总体方差2的根本原因. (2)由结论(2),(3)可见,无偏性不具有单调函数保持的不变性. 即若是 的无偏估计,一般而言,函数( )g不是 g()的无偏估计,除非 g()是 的线 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 236 页页 性函数. 例如在上例中,S2是 2的无偏估计,但 S 却不是 的无偏估计. 例例 7.2.3 设总体X服从参数为的指数分布, 其概率密度为 (
22、f x;)= e,0,0,.xx其它 其中参数0为未知, 又设12,nXXX是来自总体X的一组样本. 试证明: 样本均值X和nnZ (min1X, nXX,2)都是总体均值的无偏估计量. 教学建议: (1)此例说明无偏估计量可以不唯一. (2)“唯一性”和“存在性”是数学, 乃至科研问题必须解决的问题, 重点讲解无偏估计不唯一,哪一个更优呢?这就进入了“有效性”或“最小方差性”评判标准. 证证 已知总体 X 均值 E(X)=1. 因为 11111()()()niiE XEXnE Xnn , 所以X是总体均值E X的无偏估计量. 参见第三章第四节例 3.4.5 可以得到Z服从参数为 n 的指数分
23、布, 所以 )(ZE=1n. 于是成立 )(nZE=1()E X. 即nZ也是总体均值的无偏估计量. 由此可见, 一个总体未知参数可以有不同的无偏估计量. 讲评 讲评 本例告诉我们,一个未知参数的无偏估计量不一定是唯一的, 它可以有许多无偏估计量. 事实上, 在本例中,12,nXXX中的每一个都可以作为的无偏估计量. 二、 有效性 二、 有效性 定义定义2 设 设1),(211nXXX与与2),(212nXXX都是都是的无偏估计量, 若对于任意的无偏估计量, 若对于任意, 有 , 有 12( )()DD, (2.2) 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大
24、连理工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 237 页页 且至少存在某一个且至少存在某一个0使上式中的不等号成立, 则称估计量使上式中的不等号成立, 则称估计量1比比2有效有效. 讲评 讲评 (1) 一定要注意,在“无偏”的前提下,再深入研究“有效性”,这样做才符合实际问题的要求. (2) “有效性”的实际意义是:方差越小的估计量, 它的取值越集中, 从而它的取值越接近于总体参数真值. 例例 7.2.4 已知条件如例 7.2.3. 试证明: 当1n时, 总体均值的无偏估计量X比另一个无偏估计量nZ有效. 教学建
25、议: (1)无偏估计不唯一,哪一个更优呢?用“有效性”或“最小方差性”评判标准. 证证 由于21()D X, 故由第六章第二节定理 1 的结论(1)有 21()D Xn. 又因为 Z 服从参数为 n 的指数分布,所以 221( )D Zn, 故有 21()D nZ. 可见, 当1n时, ()()D XD nZ, 也就是说, 无偏估计量X比nZ有效. 讲评 讲评 “无偏估计量X较另一个无偏估计量nZ有效”也说明,包含样本12,nXXX的更多分量的统计量更优,因为它可以反映出总体的更多信息. 三、 相合性 三、 相合性 定义定义 3 设 设),(21nXXX为参数为参数的估计量, 若对于任意的估计
26、量, 若对于任意, 当, 当n时时),(21nXXX依概率收敛于依概率收敛于, 则称, 则称是是的相合估计量的相合估计量. 也就是,对于任意的对于任意的, 若对于任意的正数若对于任意的正数, 有有 lim1nP, (2.3) 则称则称是是的相合估计量的相合估计量(consistent estimator). 相合估计量也称为一致估计量一致估计量. 例例 7.2.5 设12, ,nX XX是 来 自 总 体X的 样 本 , 总 体X的 方 差2()D X存在. 试证明 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第
27、一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 238 页页 2211()1niiSXXn与2211()niiXXBn 都是2的相合估计量. 教学建议: (1)相合估计量不唯一, 哪一个更优呢?用“无偏性”和“有效性”综合考察评判标准. (2)例 7.2.2 可知,S2是总体方差的无偏估计量,B2不是总体方差的无偏估计量. (3)结合这里的相合性,得到 S2是总体方差的相合无偏估计量,比 B2要优. 证证 由第六章第二节定理 1 的结论(4)知, 2222,().PPSBn 所以, 我们证得2S和2B都是2的相合估计量. 由此可见,一个总体未知参数可以有不同的相合估
28、计量. 讲评 讲评 一致(相合)性也是对一个估计量的最基本要求. 若估计量不具有一致(相合)性, 那么不论将样本容量 n 取得多么大, 都不能将总体参数估计得足够准确, 这样的估计量是不可取的. 但是,在实际应用上,人们很少考虑“一致性”,因为它要求“试验次数 n 要充分地大”,这是很难达到的. 思考题思考题 1. 为什么要提出估计量的评判标准问题? 2. 考虑估计量的有效性,为什么首先要保证估计量的无偏性? 解题参考解题参考 1. 提出估计量的评判标准问题, 是因为: 对于总体的同一个未知参数, 用不同的方法所求得的估计量往往是不一样的, 导致了矩估计量或最大似然估计量在一般情况下不是唯一的
29、. 因此,就一定要考查估计量的“好坏或优劣”问题. 2. 只有在“无偏”(即同样的平均水平)的前提下,再深入研究“有效性”(方差或标准差大小),这样做才符合实际问题的要求.否则,即使某射手的击中环数的方差较小(此时只能说明射手射击水平稳定), 然而该射手的击中环数的均值较小(此时能说明射手射击水平较差), 综合比较说明不了两个射手之间的射击技术水平的高低.只有在同等的平均技术水平(看均值,看无偏性)下再考虑技术稳定性(看方差或标准差,看有效性)才有实际意义. 矩法估计的优点是理论与操作简单,并且总体服从什么分布可以不必知道. 但我们在选用哪些样本矩来代替总体矩时有一定的随意性,导 概率论与数理
30、统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 概率论与数理统计教案 第七章第一、二节 郑一,戚云松,陈倩华,陈健 编著 大连理工大学出版社出版 第 第 239 页页 小 结 与 思 考 小 结 与 思 考 致了矩估计量在一般情况下是不唯一的. 总体未知参数的点估计(值)都是用一个确定的值去估计未知的参数,看起来好用,实际上非常地不精确. 另外,极大似然估计的似然方程或者似然方程组除了一些简单情况外,往往没有有限函数形式的解,这时就需要用数值算法求近似解,常用的有牛顿拉弗森(Newton-Raphson)算法或者拟牛顿算法等迭代算法. 思考题 思考题 一个总体未知参数的无偏估计一定唯一吗? 答答 不一定. 例如: 设12,nXXX是一个来自均值为 (未知参数)的总体X的样本, 则niEXXEi, 2 , 1,)(. 令iniinXaY1, 其中ia是满足 11niia 的常数. 则 1()()nniiiE YEa X. 可见,), 2 , 1( ,niXXi,nY都是 的无偏估计量.