《t检验的资料与习题(17页).doc》由会员分享,可在线阅读,更多相关《t检验的资料与习题(17页).doc(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-t检验的资料与习题-第 17 页第四章:定量资料的参数估计与假设检验基础1抽样与抽样误差抽样方法本身所引起的误差。当由总体中随机地抽取样本时,哪个样本被抽到是随机的,由所抽到的样本得到的样本指标x与总体指标之间偏差,称为实际抽样误差。当总体相当大时,可能被抽取的样本非常多,不可能列出所有的实际抽样误差,而用平均抽样误差来表征各样本实际抽样误差的平均水平。 x=/S x=S/2 t分布t分布曲线形态与n(确切地说与自由度v)大小有关。与标准正态分布曲线相比,自由度v越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v愈大,t分布曲线愈接近正态分布曲线,当自由度v=时,t分布曲线
2、为标准正态分布曲线。t = X-u/Sx=X-u/(S/),V=N-1正态分布(normal distribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础。正态分布有两个参数,和,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换(X-)/转化成标准正态变量u,以使原来各种形态的正态分布都转换为=0,=1的标准正态分布(standard normal distribution),亦称u分布。根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以固定n,抽取若干个样本时,样本均数的分布仍服从正态分布,即N(,)。所以,对样本均数的分布进行u
3、变换,也可变换为标准正态分布N (0,1)由于在实际工作中,往往是未知的,常用s作为的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。假设X服从标准正态分布N(0,1),Y服从2(n)分布,那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Zt(n)。 特征:1以0为中心,左右对称的单峰分布;2t分布是一簇曲线,其形态变化与n(确切地说与自由度)大小有关。自由度越小,t分布曲线越低平;自由度越大,t分布曲线越接近标准正态分布(u分布)曲线,如图.t(n)分布与标准正态N(0,1)的密度函数对应于每一个自由度,就有一条t分布曲线,每条曲线都有其曲线下统计量t的
4、分布规律,计算较复杂。学生的t分布(或也t分布) ,在概率统计中,在置信区间估计、显著性检验等问题的计算中发挥重要作用。t分布情况出现时(如在几乎所有实际的统计工作)的总体标准偏差是未知的,并要从数据估算。教科书问题的处理标准偏差,因为如果它被称为是两类:( 1 )那些在该样本规模是如此之大的一个可处理的数据为基础估计的差异,就好像它是一定的( 2 )这些说明数学推理,在其中的问题,估计标准偏差是暂时忽略的,因为这不是一点,这是作者或导师当时的解释。可信区间按一定的概率或可信度 (1-)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间,预先给定的概率(1-)称为可信
5、度或者置信度,常取95%或99%。1. 点估计 用样本统计量直接作为总体参数的估计值。其方法简单,易于理解,但为考虑抽样误差的大小。2. 区间估计 既按照预先给定的概率(1-a),确定的包含总体参数的可能范围。该范围被称为总体参数的可信区间或置信区间。假设检验基础假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P0.01或P,结论为按所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P,结论为按所取水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值
6、表得到。t检验 若总体服从正态分布N(,),但未知,记,则t=遵从自由度为n-1的t分布,可对有以下的水平为的检验,其中t为自由度为n-1的t分布的上分位数。这些检验称为t检验。 第五章:定量资料的t检验前言:T检验 主要用于样本含量较小(例如n30),总体标准差未知的正态分布资料。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。一、t检验分为单总体检验和双总体检验。1.单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。单总体t检验统计量为:
7、t:为样本平均数与总体平均数的离差统计量:为样本平均数:为总体平均数x:为样本标准差n:为样本容量2.双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况,一是独立样本t检验,一是配对样本t检验。独立样本t检验统计量为:S1 和 S2 为两、样本方差;n1 和n2 为两样本容量。(上面的公式是1/n1 + 1/n2 不是减!)1/n1 -1/n2的话无法计算相同的样本空间 配对样本t检验统计量为:二、适用条件(1) 已知一个总体均数;(2) 可得到一个样本均数及该样本标准差;(3) 样本来自正态或近似正态总体。三、t检验步骤以单总体t检验为例说明:问题
8、:难产儿出生体重n=35,=3.42,S =0.40,一般婴儿出生体重0=3.30(大规模调查获得),问相同否?解:1.建立假设、确定检验水准H0: = 0 (零假设,null hypothesis)H1: 0(备择假设, alternative hypothesis,)3.查相应界值表,确定P值,下结论查附表1,t0.05 / 2.34 = 2.032,t 0.05,按=0.05水准,不拒绝H0,两者的差别无统计学意义当总体呈正态分布,如果总体标准差未知,而且样本容量 50(n60),故采用样本均数与总体均数比较的u检验。(1)建立检验假设, 确定检验水平,该厂成年男子血红蛋白均值与一般成年
9、男子相同,该厂成年男子血红蛋白均值与一般成年男子不同(2) 计算检验统计量(3) 确定P值,做出推断结论,故P5,拒绝,接受,可以认为该厂成年男子血红蛋白均值与一般成年男子不同,该厂成年男子血红蛋白均值低于一般成年男子。2. 某研究者为比较耳垂血和手指血的白细胞数,调查12名成年人,同时采取耳垂血和手指血见下表,试比较两者的白细胞数有无不同。 表 成人耳垂血和手指血白细胞数(10g/L)编号耳垂血手指血123456789101112参考答案 本题为配对设计资料,采用配对检验进行分析(1)建立检验假设, 确定检验水平H0:md=0,成人耳垂血和手指血白细胞数差异为零H1:md0,成人耳垂血和手指
10、血白细胞数差异不为零(2) 计算检验统计量,P 5,拒绝H0,接受H1,差别有统计学意义,可以认为两者的白细胞数不同。3. 分别测得15名健康人和13名度肺气肿病人痰中抗胰蛋白酶含量(g/L)如下表,问健康人与度肺气肿病人抗胰蛋白酶含量是否不同?表 健康人与度肺气肿患者1抗胰蛋白酶含量(g/L) 健康人 度肺气肿患者 1.9 参考答案 由题意得,本题是两个小样本均数比较,可用成组设计t检验,首先检验两总体方差是否相等。H0:s12s22,即两总体方差相等 H1:s12s22,即两总体方差不等F =,F,按0.05水准,不拒绝H0,差别无统计学意义。故认为健康人与度肺气肿病人1抗胰蛋白酶含量总体
11、方差相等,可直接用两独立样本均数比较的t检验。(1)建立检验假设, 确定检验水平,健康人与度肺气肿病人抗胰蛋白酶含量相同,健康人与度肺气肿病人抗胰蛋白酶含量不同(2) 计算检验统计量(3) 确定P值,做出推断结论t ,P 0.001,拒绝H0,接受H1,差别有统计学意义,可认为健康人与度肺气肿病人1抗胰蛋白酶含量不同。4.某地对241例正常成年男性面部上颌间隙进行了测定,得其结果如下表,问不同身高正常男性其上颌间隙是否不同?表 某地241名正常男性上颌间隙(cm)身高 (cm)例数均数标准差161116172125参考答案本题属于大样本均数比较,采用两独立样本均数比较的u检验。由上表可知,=1
12、16 , =0.2189 , =125 , =0.2280 , (1)建立检验假设, 确定检验水平,不同身高正常男性其上颌间隙均值相同,不同身高正常男性其上颌间隙均值不同(2) 计算检验统计量(3) 确定P值,做出推断结论ut5/2,22,P,故P,差别有统计学意义,按a0.05水准,拒绝H0,接受H1,故认为男、女大学生的血清谷胱甘肽过氧化物酶的活力总体方差不等,不能直接用两独立样本均数比较的t检验,而应用两独立样本均数比较的t检验。=1.53, t2.009,t0.05,按,不拒绝H0, 差别无统计学意义,尚不能认为男性与女性的GSH-Px有差别。分工: 第四章的资料:段磊 第五章的资料:张天翼 第六章的资料:陈菲 t检验练习题:杨吉程 整理资料与查缺补漏:董永涛