《数理统计教材建设刍议.pdf》由会员分享,可在线阅读,更多相关《数理统计教材建设刍议.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数理统计教材建设刍议陈乃辉(中央财经大学数学教学部北京100081)摘要本文指出数理统计教材尚未脱离经验状态而形成演绎结构系统,在检列出教材于逻辑上的诸多缺空与不足之后,作出了如下相应的建设与弥补。首先,对诸种形式的统计推断给出系统的定义;其次,理清统计推断的要素,进而确立其于正确性上的最优性标准;然后建立区间估计的最优性概念,并梳理假设检验的相应概念;再次疏通区间估计与假设检验的关系;最后将假设检验的既有研究成果推演到区间估计上。关键词经验状态演绎结构统计推断最优性中图分类号G642文献标识码A“概率论与数理统计”与另两门“微积分”、“线性代数”都是大学生必修的主要数学课程,而相比之下,前者
2、教材的数理统计部分,却远未臻至完善、成熟的地步。所谓完善的数学教材,其基本特征是已成就完整的公理化演绎结构,而“欧氏几何”即为如是之典范。“概率论与数理统计”的演绎结构,于其数理统计部分尚未成就与贯行,其主要表现为:其一,统计推断的诸概念,尚未界定周全,致使其逻辑的确定性本质,未至完全揭示;其二,统计推断的诸概念之间、诸命题之间,尚多支离隔绝。可以说,数理统计尚未从数据统计的经验性阶段脱离出来。譬如,在假设检验中的所谓小概率原理的思想方法,即是这种经验性状态的典型表现。数理统计教材滞留于这种状况的原因,大致有二。一者,该领域的纯理论研究尚有阙如;二者,未能将已有的零散的理论成果,创造性地化为教
3、材。本文正是根据作者在这两方面多年的研究与教学改进所得,集汇而成,或许对数理统计教材的改革与建设,有所裨益。一、缺空与不足数理统计教材于逻辑结构上的具体缺空与不足,兹检列于下。(1)对各种统计推断形式没有统一的、系统的定义,而是各谈各的。(2)对统计推断的逻辑要素,认识不清。(3)对统计推断的正确性的内涵,未能充分揭示。(4)对区间估计最优性的因素知之未全,一般只知可靠度(真确度)因素,有些教材虽略知另一个因素区间长度的概念,但并未至于能使之加入到逻辑演绎结构之中。因而,没有建立起最优性的概念。如是,所导致的逻辑演绎的结果必为:所有问题的区间估计都应取(-,+),即于区间估计的选择上,无理可循
4、。96高等理科教育数理统计教材建设刍议收稿日期20020702作者简介陈乃辉(1959-)男,北京人,讲师,主要从事数学、文化研究.1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.(5)对假设检验的最优性的因素知之虽全,而行之未全,一般第二类错误因素并未加入到演绎结构中。如是,同样使对假设检验的选择上,无则可依。(6)区间估计与假设检验的最优性因素的选择相互间不一致或不匹配。(7)假设检验与区间估计之间的逻辑联系未能疏通,致使假设检验上的丰富研究成果不能推演到区间估计上,亦使假设检验与区间估计于编排次序上
5、出现悖逆。二、建设与弥补针对上目所示之缺空与不足,本目作出如下之建设与弥补。(1)统计推断的系统定义统计推断可统一定义如下。定义111称从样本(X1,X2,Xn)的值域W到参数空间(的对应(可以一对多)为对参数 的统计推断。由这个一般定义可推绎出点估计、区间估计、假设检验的特殊定义。定义112称由W到(的如下形式的对应(x1,x2,xn)G(x1,x2,xn)(其中G(X1,X2,Xn)为统计量)为对参数 的点估计。定义113称由W到(的如下形式的对应(x1,x2,xn)G1(x1,x2,xn),G2(x1,x2,xn)(其中G1(X1,X2,Xn),G2(X1,X2,Xn)为统计量)为对参数
6、 的区间估计。定义114称由W到(的如下形式的对应(x1,x2,xn)(0当(x1,x2,xn)W0(-(0当(x1,x2,xn)W0(其中W0W,(0()为对参数 假设检验,简记为(0,W0)。(2)统计推断要素的认知统计推断的要素包括两个:样本映集A(x1,x2,xn)的集合 。所谓统计推断的样本映集是指:W中的样本(x1,x2,xn)所对应到的(的子集。在 上的概率分布(或概率密度分布)P.前者表示统计推断的取值,后者表示统计推断取值的相应概率。统计推断是取值与概率的统一体。因而,统计推断应完整地表示为(,P)。(3)统计推断正确性的界定若只从取值方面观之,属于随机性数学的统计推断对被推
7、断的参数而言,除极端情况(独点分布)外,不可能完全符合或完全不符合,故用决定性数学的非对即错的观点去衡量统计推断的正确性是毫无意义的,统计推断是即对即错的,这是说,其既推断到了真值,也推断到了假值。但当全面看待统计推断,即视之为取值与概率的统一体时,其逻辑上的确定性的本质就显现出来了,换而言之,就是统计推断是非对即错的。据上述分析,可引出衡量统计推断的正确性的两个因素:真确度,即推断到真值的概率;虚假度,即推断到假值的概率。而由此二因素,可确立统计推断于正确性上的最优性标准:先设定真确度的下限,再于其中取虚假度最小的。(4)区间估计最优性的建立最优性的真确度因素界定如下。07高等理科教育200
8、2年第6期(总第46期)1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.定义411称区间估计G1,G2的真确度为,若0 1,且满足inf(PG1 G2 虚假度因素界定如下。定义412区间估计的虚假度为PG1 3G2(3(-(,()此处定义取虚假度的概念,而不取区间长度E(G2-G1)的概念,是为与假设检验对应的最优性因素的定义相一致。另外,可考虑界定如下的区间估计的无偏类,因为,于其中会有更好的最优元素的存在性。定义413称区间估计G1,G2是真确度为 的无偏的,如果G1,G2的真确度为,且PG1 3G2
9、 (对一切 3(-(及一切 ()(对一切及一切)至此,可建立起区间估计的最优性概念。定义414称区间估计G1,G2是真确度为 的(无偏的)虚假度一致最小的,如果G1,G2是真确度为 的(无偏的),且对任何真确度为 的(无偏的)区间估计G31,G32,都有PG1 3G2PG31 3G32(对一切 3(-(及一切 ()(5)假设检验最优性的梳理此处的梳理包括因素形式的选择与名词的选取,其依据是假设检验与区间估计之间的内在一致性的联系,其目的是为了表现这种内在的一致性。假设检验的最优性因素,表面上看真确度有两个:P(X1,X2,Xn)W0(0)(1)P(X1,X2,Xn)W0(-(0)(2)虚假度有
10、两个:P(X1,X2,Xn)W0()(3)P(X1,X2,Xn)W0(-(0)(4)但注意到P(X1,X2,Xn)W0+P(X1,X2,Xn)W0=1可知假设检验的最优性亦只取决于一个真确度因素和一个虚假度因素。选择形式(3)、(4)是一种取法,此即所谓第一类错误、第二类错误的概率。为与区间估计的最优性因素的形式相匹配,以取形式(1)、(4)为宜。最优性的真确度与虚假度因素以及无偏类的界定分别如下。定义511称假设检验(0,W0)的真确度为,若0 1,且满足inf(0P(X1,X2,Xn)W0 定义512假设检验(0,W0)的虚假度为P(X1,X2,Xn)W0(-(0)定义513称假设检验(0
11、,W0)是真确度为 的无偏的,如果(0,W0)的真确度为,且P(X1,X2,Xn)W0 (对一切 (-(0)因而,假设检验的最优性概念取如下形式。定义514称假设检验(0,W0)是真确度为 的(无偏的)虚假度一致最小的,如果(0,W0)是真确度为 的(无偏的),且对任何真确度为 的(无偏的)假设检验(0,W30),都有P(X1,X2,Xn)W0P(X1,X2,Xn)W30(对一切 (-(0)17高等理科教育数理统计教材建设刍议 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.(6)区间估计与假设检验之间关
12、系的疏通事实上,任意一个区间估计G1(X1,X2,Xn),G2(X1,X2,Xn)皆可自然地联系到一族假设检验(0,W(0)=G1(X1,X2,Xn)0G2(X1,X2,Xn)(0()而此两者的最优性,可以证明其间有如下关系。定理611区间估计G1,G2是真确度为 的(无偏的)充分必要条件是假设检验(0,W(0)(0()都是真确度为的(无偏的)。定理612若假设检验(0,W(0)(0()都是真确度为 的(无偏的)虚假度一致最小的,则区间估计G1,G2是真确度为 的(无偏的)虚假度一致最小的。(定理611、612的证明见文献4 P6162。)(7)区间估计最优性的推演基于上目(6)所述的逻辑关系
13、,可知道在教材的编排次序上,应该是假设检验在前,区间估计在后。其次,可将假设检验上的既有成果(参考文献1 P116119)推演到区间估计上。其中最基本的就是,可推演出下面三个教材上熟见的而实未甚知的区间估计,都具有最优性。推论711设XN(,20)(20已知,推断),则其 的区间估计X-u?20n,X+u?20n是真确度为=1-的无偏的虚假度一致最小的。推论712设XN(,2)(2未知,推断),则其 的区间估计X-t?2(n-1)Sn,X+t?2(n-1)Sn是真确度为=1-的无偏的虚假度一致最小的。推论713设XN(,2)(未知,推断 2),则其 2的区间估计(n-1)S2x2?2(n-1)
14、,(n-1)S2x21-?2(n-1)是真确度为=1-的无偏的虚假度一致最小的。(推论711、712、713的证明见文献3 P157159、文献4 P6263)。陈希孺先生曾教诫:“实际上,这种(统计)推断的意义正如在欧氏几何公理体系下所推演出的任何一个命题那样明确。”(见文献2 P44)作者同感,这种欧氏几何意义上的数理统计教材之建设及行世,是学术之必须与必然,亦是学者之幸焉,也是教者之幸焉。参考文献1陈家鼎.数理统计学讲义M.高等教育出版社,1993年.2陈希孺.数理统计引论M.科学出版社,1997年.3许承德.概率论与数理统计M.科学出版社,2001年.4陈乃辉.关于区间估计与假设检验的最优性J.工科数学,2002.2.5姜启源.数学模型M.高等教育出版社,1993年.6 M.克莱因.古今数学思想M.上海科学技术出版社,1981年.7王宪钧.数理逻辑引论M.北京大学出版社,1998年.8维特根斯坦.逻辑哲学论M.商务印书馆,2002年.27高等理科教育2002年第6期(总第46期)1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.