《医学统计学抽样误差与统计推断.ppt》由会员分享,可在线阅读,更多相关《医学统计学抽样误差与统计推断.ppt(51页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、抽样误差与统计推断抽样误差与统计推断一、抽样误差抽样误差的评价 为均数的标准差,称之为标准误。其大小就反映了抽样误差的大小。二、统计推断参数估计参数估计假设检验假设检验参数估计参数估计点估计-区间估计区间估计 两个问题:1.样本的性质特征(统计量)与总体的性质特征(参数)是否一致?2.一致时,如何用样本(统计量)去估计总体(参数)?一致问题(检验统计量t值)抽样误差 本质差异消除影响影响估计问题(解下面的不等式)总体均数的总体均数的(1-a)可信区间)可信区间假设检验(一)检验的基本原理及步骤(一)检验的基本原理及步骤1.建立无效假设 H0:无 H1:有2.选择判别水平(或)3.计算检验统计量
2、:评价H0是否成立?4.作出判别结论:实际结果与理论假设H0矛 盾,则拒绝H0,接受H1;否则(即实际结果与理论假设H0不矛盾),接受H0(严格 讲应是“尚不能拒绝H0”)(二)类错误与类错误类错误:H0本质上是成立的,但下结 论时却拒绝了H0,即“弃真”的错误,概率水平为。类错误:H0本质上是不成立的,但下 结论时却接受了H0,即“取 伪”的错误,概率水平为。*拒绝H0 时,往往犯类错误;接受H0 时,往往犯类错误。*增大,则变小;降低,则变大。只 有通过增大样本含量n才能同时降低 和。t t检验检验一、一、样本均数与总体均数的比较?总 体样本该样本是否来自已知总体?样本均数与总体均数的比较
3、检验的基本步骤1.建立无效假设 H0:H1:2.选择判别水平a(或)3.计算检验统计量:t=4.作出判别结论:若tta,则拒绝H0,(即 );否则,不拒绝H0(即 )。两样本是否来自同一总体?二、两样本均数的比较总体样本样本两样本均数的t-检验1.两样本方差相等或近似相等(即所谓的 “方差齐”)2.两样本方差不相等(即所谓的 “方差不齐”)两样本均数的t-检验四、方差齐性检验三、配对资料的t-检验(同源配对或1:1异源配对)i 甲方法 乙方法 d=-1 1 1 d1 2 2 2 d2 n n n dn 方方 差差 分分 析析解决多个均数的比较问题 完全随机设计 随机区组设计 的方差分析 的方差
4、分析 正交、交叉、拉丁方、析因设计等 方差分析方差分析方差分析方差分析一、方差分析的基本思想?k个样本是否个样本是否 来自同一总体?来自同一总体?总 体 1 2k k个样本是否来自同一总体个样本是否来自同一总体?是是 否否 k个样本均数本 k个样本均数本 质上是相等的 质上是不相等的 干预措施干预措施 的作用相同的作用相同 干预措施的干预措施的 作用作用不不相同相同 计算出的均数不相等不相等主 计算出的均数不相等不相等则主 要是由抽样误差抽样误差造成的 要不是不是由抽样误差抽样误差造成的 造成样本间均数不相等的原因有两类:1.抽样误差 2.干预措施(药物及 混杂因素)若变异主要在抽样误差,则S
5、S误差若变异主要在干预措施,则SS误差均数不等体现在个体间的变异上。若将k个样本可合并为一整体,则总的变异SS总可分为两部分:1.由抽样误差造成的部分SS误差2.由干预措施造成的部分SS干预 SS总=SS干预+SS误差二、方差分析的基本原理二、方差分析的基本原理1.完全随机设计 的方差分析 不考虑混杂因素的作用,即干预措施仅为试验因素(如药物)SS总=SS组间+SS误差完全随机设计完全随机设计方差分析的数据格式 组 别 编 号 123k X11X 21 X 31X k1 X 12X 22X 32X k2 X 1jX 2jX 3jX kj X1n1X2n2X 3n3X knk X 1j X 2j
6、 X 3j X kj 完全随机设计方差分析表变异来源 离均差平方和(SS)自由度v 均方MS F总变异 SS总 N1组 间 SS组间 k1SS组间/(k-1)MS组间MS组内组内(误差)SS总SS组间 Nk SS组内/(N-k)完全随机设计基本步骤基本步骤1.作出无效假设H0:.;H1:.2.确定判别水平a=0.05(或)3.计算检验统计量:F=MS组间MS组内4.作出判别结论 :若FFa,则拒绝H0,接受H1;否则,接受H0,拒绝H1。完全随机设计2.随机区组设计的方差分析随机区组设计的方差分析 既考虑试验因素(如药物)的作用,同时,又考虑混杂因素的作用,即干预措施为试验因素+混杂因素。SS
7、总=SS处理+SS配伍+SS误差随机区组设计方差分析随机区组设计方差分析的数据格随机区组设计方差分析的数据格 组 别 编 号 i 1 2 3 k 1 X11 X 21 X 31X k1 2 X 12 X 22X 32X k2 b X1b X2bX 3bX kb X 1j X 2j X 3j X kj 随机区组设计方差分析表变异来源 离均差平方和(SS)自由度v 均方MSF总变异 SS总 N1处理间 SS处理 k1 SS处理/v处理 MS处理/MS误差配伍间 SS配伍 b1 SS配伍/v配伍 MS配伍/MS误差误差 SS总SS处理SS配伍N-k-b+1 SS误差/(N-k-b+1)随机区组设计方
8、差分析随机区组设计方差分析基本步骤基本步骤(1).作出无效假设H0:.;H1:.(2).确定判别水平a=0.05(或)(3).计算检验统计量:F处=MS处MS误差 F配=MS配MS误差(4).作出判别结论:若FFa,则拒绝H0,接 受H1;否则,接受H0,拒绝H1。3.多重比较问题(1)其他各组均与对照组比较:)其他各组均与对照组比较:复新极差法(Dunnett-t检验)或LSD法(2)两两比较:)两两比较:q检验(SNK法)一、一、常用统计量常用统计量相对比相对比、率率与与构成比构成比的定义的定义计数资料的统计描述计数资料的统计描述不同特征的计数之比在一定时间及范围内某事件发生的频率(强度)
9、事物的内部各部分所占比重 1.直条图(bar chart)2.百分比构成图(1)直条百分构成图直条百分构成图(percent bar chart)(2)(2)圆图圆图(pie chart)(3)饼图饼图(cake chart)二、检验问题二、检验问题1.样本率与总体率比较?总体率样本率p 2.两样本率的比较(1)p1 与 p2 直接比较 两样本率的比较(2)四格表资料的卡方(2)检验 阳性 阴性 合计 甲样本 a(T1)b(T2)a+b 乙样本 c(T3)d(T4)c+d 合 计 a+c b+d N基本思想基本思想:在H0成立的假设下,理论数实际数相等。两样本率的比较基本原理基本原理:理论阳性
10、率=(a+c)/N理论阴性率=(b+d)/N Ti=?服从自由度为1的2分布两样本率的比较 四格表资料的专用公式:四格表资料的专用公式:条件:T T 5 5,且 n401T40时,有:两样本率的比较T1,或n40时,须使用精确概率法精确概率法。3.配对四格表资料的2检验 乙方法 甲方法 +-+a b -c d 自由度自由度=1B+c40,有:C行列表的2检验三、二项分布二项分布二项分布的条件二项分布的条件(1)每次试验只有两种对立的可能结果 (如“阳性或阴性”);(2)每次试验具备独立性;(3)每次试验产生一种结果(如“阳性”)的概率不变。二项分布二项分布的概率二项分布的概率 记发生某一结果(
11、如“阳性”,下同)的概率为,则有:1.在n次独立试验中,阳性结果恰好出 现k次的概率为 p(x=k)=Cnk k(1-)n-k 其中,Cnk=n!/k!(n-k)!二项分布 2.在n次独立试验中,阳性结果至少出现k次的概率为 =p(x=k)+p(x=k+1)+p(n)=二项分布 3.在n次独立试验中,阳性结果至多出 现k次的概率为 =p(x=0)+p(x=1)+p(k)=二项分布二项分布的应用二项分布的应用1.多用于单侧检验2.可用于研究疾病的集聚性问题 时,二项分布近似正态分布四、Poisson分布Poisson分布的条件分布的条件 主要用于研究小概率事件(即结果)发生次数的分布问题,如在一定人群中某种患病(或死亡)率很低的非传染性疾病的患病(或死亡)人数x的分布等。Poisson分布的条件同二项分布。当n很大,很小,n =为一常数时,二项分布近似Poisson分布。Poisson分布的概率分布的概率 记发生某一结果(如“阳性”,下同)的概率为,则有:1.在n次独立试验中,阳性结果恰好出现k次的概率为 x=0,1,2,.Poisson分布 2.在n次独立试验中,阳性结果至少出现k次的概率为 =p(x=k)+p(x=k+1)+p(n)=Poisson分布 3.在n次独立试验中,阳性结果至多出 现k次的概率为 =p(x=0)+p(x=1)+p(k)=Poisson分布