《数理统计学习感想(4页).doc》由会员分享,可在线阅读,更多相关《数理统计学习感想(4页).doc(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-数理统计学习感想 学习了一学期的数理统计,我学会了如何在生活中运用所学的知识去解决一些问题。 现实中常常存在这种情况,我们所掌握的数据只是部分单位的数据或有限单位的数据,而我们所关心的却是整个总体甚至是无限总体的数量特征。例如,民意测验谁会当选主席?体育锻炼对增强心脏功能是否有益?某种新药是否提高疗效?全国婴儿性别比例如何?等等。这时只靠部分数据的描述是无法获得总体特征的知识。我们利用统计推断的方法来解决。所谓统计推断就是以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理的方法。统计推断是逻辑归纳法在统计推理的应用,所以称为归纳推理的方法。统计推断可以用于总体数量特征的估计,也可
2、以用于对总体某些假设的检验,所以又有不同的推断方法。下面就参数估计和假设检验的基本概念及原理简单谈谈。 参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。 参数估计包括点估计和区间估计两种方法。 点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。构造点估计常用的方法是:矩估计法。用样本矩估计总体矩,如用样本均值估计总体均值。最大似然估计法。于19
3、12年由英国统计学家R.A.费希尔提出,利用样本分布密度构造似然函数来求出参数的最大似然估计。最小二乘法。主要用于线性统计模型中的参数估计问题。贝叶斯估计法。基于贝叶斯学派(见贝叶斯统计)的观点而提出的估计法。区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。1934年统计学家J.奈曼创立了一种严格的区间估计理论。求置信区间常用的三种方法:利用已知的抽样分布。利用区间估计与假设检验的联系。利用大样本理论。 假设检验是抽样推断中的一项
4、重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。 假设检验的一般步骤 1、提出检验假设(又称无效假设,符号是H0)和备择假设(符号是H1)。H0:样本与总体或样本与样本间的差异是由抽样误差引起的; H1:样本与总体或样本与样本间存在本质差异; 预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作,通常取=0.05或=0.01。 2
5、、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。 3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P,结论为按所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P,结论为按所取水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。 假设检验应注意的问题 1、做假设检验之前,应注意资料本身是否有可比性。 2、当差别有统计学意义时应注意这样
6、的差别在实际应用中有无意义。 3、根据资料类型和特点选用正确的假设检验方法。 4、根据专业及经验确定是选用单侧检验还是双侧检验。 5、当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。 6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。 区间估计与假设检验有区别也有联系。 (一)主要区别: 1、参数估计是
7、以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立; 2、区间估计求得的是求以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验; 3、区间估计 立足于大概率,假设检验立足于小概率。 (二)主要联系: 1、都是根据样本信息推断总体参数; 2、都以抽样分布为理论依据,建立在概率论基础之上的推断; 3、二者可相互转换,形成对偶性。 另外,在统计推断中,我们是利用样本统计量估计和推测总体参数的。那么,很重要的一点就是要保证样本的代表性。因为如果从总体中抽取出来的样本缺乏代表性,那么利用这个样本提供的信息是难以准确有效地推测总体的某些分布特征的。因此,搞
8、好统计推断的前提条件就是要利用随机抽样,尽量减小抽样误差。有关抽样的方法主要有以下几种: 1 简单随机抽样 如果总体中每个个体被抽到的机会是均等的(即抽样的随机性),并且在抽取一个个体之后总体内成分不变(抽样的独立性),这种抽样方法称为简单随机抽样。简单随机抽样是最简单的抽样方法,它简便易行,使用范围广。常用的方式有:抽签法、随机数字表法等。 抽签法:先将总体中每个个体编上号码,再将每个号码写在签上,将签充分混合后,从中抽取n个(即样本的容量)签,与被抽到的签号相应的个体就进入样本。 随机数字表法:利用随机数字表抽样是简单随机抽样中常用的一种方法。随机数字表是用电子随机编号器编成的,由许多随机
9、数排列起来的数字表。例如,要从30人的班级中抽选出5个学生作为样本,先把这30个学生编号,然后任意从表中的一个数字作为起点,或向上、向下、向左、向右的数字,选用其头两位按顺序选取5个。凡是编号与选取的数字相同者,定为被选对象,构成样本。 除利用随机数字表产生随机数字外,还可以利用计算机编制程序,或在计算机上产生随机数,这样抽样也很方便。 2. 机械随机抽样 机械随机抽样要先将总体中的所有个体按一定顺序编号,然后按确定的相等距离抽取个体(间隔距离的大小依据所需样本与总体中个体数目的比率而定)。例如,要从1000个学生中抽取10名学生作为样本,可将这1000名学生从11000编号后,先从1100编
10、号中随机抽出一个号码,假定是39,以下从39号开始,每隔100个号码抽取一个,抽到39,139,239,939共10个编号,这些编号对应的学生就构成容量为10的样本。 3. 分层随机抽样 分层随机抽样也称类型随机抽样。先把总体按一定标准分为同质的若干层或类型,然后在每层或类型中随机抽样。采用分层随机抽样时应遵循一个基本原则,即所分的各层内的差异要尽量小,二层与层之间的差异要尽量大。对一个总体来说,怎样分层要视具体情况而定,分层的标准可以是一个,也可以是多个。例如,研究某校高三毕业生的数学推理能力,可按文、理分层,各自取样。而要调查某省高中二年级学生的实验能力,在抽样时就应考虑性别、城乡、学校是
11、否重点、家庭等等各种因素,以这几个标准作为分层标准,依次分层,再抽取样本。 在把总体分好层次后,如何将样本容量n合理地分到各层中去,常用的方法是根据各层人数的多少按比例抽取。 4. 整群随机抽样 从总体中抽取出来的研究对象,不是以个体为单位,而是以整群作为单位的抽样方法,称为整群随机抽样。例如,要了解某市某年化学学科高考的成绩,可以以学校为单位进行随机抽样。 为了增强样本对总体的代表性,弥补整群抽样的不均匀性,可以采用整群随机抽样内部再进行分层随机抽样的两阶段随机抽样法。例如,要调查某省小学二年级学生的身体情况,抽样就可以分为两步。先将全省分为若干部分,从中随机抽取几个部分作为全省小学二年级学生的代表。接着在抽取的各部分中,再按性别、家庭、民族、学校等标准,以此进行分层抽样。在这种做法中,第一阶段中的样本,对于第二阶段来说又是总体。所以,在比较大的调查研究中,采用整群随机抽样与分层随机抽样相结合的做法是比较恰当的。现实生活中概率问题随处可见,学好概率论和数理统计知识十分必要,我们学到的概率统计知识仅仅是一点点皮毛,如有必要我们还需深入学习它,达到学以致用的目的,在今后的学习生活中顺利解决遇到的此类问题。-第 4 页-