2022年医学统计学知识点汇总.docx

上传人:Che****ry 文档编号:27293176 上传时间:2022-07-23 格式:DOCX 页数:28 大小:331.44KB
返回 下载 相关 举报
2022年医学统计学知识点汇总.docx_第1页
第1页 / 共28页
2022年医学统计学知识点汇总.docx_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《2022年医学统计学知识点汇总.docx》由会员分享,可在线阅读,更多相关《2022年医学统计学知识点汇总.docx(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精选学习资料 - - - - - - - - - 医学统计学总结绪论 1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在肯定数量的重复试验之 后出现统计规律的现象;2、同质:统计学中对讨论指标影响较大的,可以掌握的主要因素;3、变异:同质基础上各观看单位某变量值的差异;数值变量:变量值是定量的, 由此而构成的资料称为数值变量资料或计量资料,其数 值是连续性的,称之为连续型变量;变量分类变量:定性变量无序分类变量:所分类别或属性之间无次序和程度上的差异有序分类变量:有次序和程度上的差异 4、总体:依据讨论目的确定的同质讨论对象中全部观看单位某变量值的集合;可以分为有限 总体和无限总体

2、;5、样本:是按随机化原就从同质总体中随机抽取的部分观看单位某变量值的集合;样本代表 性的前提:同质总体,足够的观看单位数,随机抽样;统计学中,描述 样本特点的指标称为统计量,描述总体 特点的指标称为参数;6、概率:描述随机大事发生的可能性大小的一个度量;如 P(A)=1,就称 A为必定大事;如P(A)=0,就称 A 为不行能大事;随机大事A 的概率为 0P1. 小概率大事:如随机大事 A 的概率 P ,就称随机大事 A为小概率大事,其统计学意义为:小概率大事在一次随机试验中认为是不行能发生的;统计描述1、频数分布有两个重要的特点: 集中趋势和离散程度; 频数分布有对称分布和偏态分布之分;后者

3、是指频数分布不对称, 集中趋势偏向一侧, 如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布;2、常用的集中趋势的描述指标有:均数,几何均数,中位数等;均数 : 适用于正态或近似正态的分布的数值变量资料;样本均数用 x 表示,总体均数用 表示;几何均数:适用 于等比级数 资料和对数呈正态分布的资料;观看值中不能同时有正值和负值;留意观看值中不能有零, 一组中位数:适用于偏态分布资料以及频数分布的一端或两端无准确数据的资料;3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数;全距:任何资料,一组中最大值与最小值的差;四分位数间距:适用于偏态分布以及分布的一端或

4、两端无准确数据资料;方差和标准差:正态分布资料;标准差表示观看值的变异度的大小;变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度;4、标准正态分布:对正态分布的(X- )/ 进行 u 的变换, u=(X- )/ , 就正态分布变换为 =0, =1 的标准正态分布,亦称 u 分布; u 被称为标准正态变量或标准正态离差;两个参数: 是位置参数, 是外形参数; 用 N(0,1 )表示标准正态分布;名师归纳总结 - - - - - - -第 1 页,共 17 页精选学习资料 - - - - - - - - - 常用估量医学参考值范畴的方法有:(1) 正态分布方法:适用于正态或近似正态分布的

5、资料;双侧界值: X u /2S 单侧上界: X+u S,或单侧下界: X-u S (2) 对数正态分布方法:适用于对数正态分布资料;双侧界值: Lg-1(X lgx u /2S lgx )单侧上界: Lg-1(X lgx +u S lgx),或单侧下界: Lg-1(X lgx -u S lgx )(3)百分位数法:用于偏态分布资料以及资料中一端或两端无准确数值的资料;双侧上界: P2.5 和 P97.5;单侧上界: P95,或单侧下界: P5常用的 u 值表参考值范畴( %)单侧双侧80 0.842 1.282 90 1.282 1.645 95 1.645 1.96 99 2.326 2.

6、576 5、分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相对比;率:说明某现象发生的频率或强度; (病死率不等于死亡率)构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示;相对比:亦称比,是A、B 2 个有关指标之比,说明A 为 B 的如干倍或百分之几;两个指标可以性质相同,也可以性质不同;应用相对数时的留意事项: 1、运算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观看单位数不等的几个率,不能直接相加求其平均率;4、比较相对数时应留意其可比性;5、对样本率(或构成比)的比较应遵循随机抽样,并做假设检验;6、标准化法:标准化的目的在于排除混杂因素对结

7、果的影响,使资料更具有可比性;其基本思想是:将所比较的两组或多组资料的构成按统一的“ 标准” 调整后,运算标化率,使其更具有可比性;标准化率的运算方法: 亦称标化率, 直接法用于已知被标化组的年龄别率,以及已知标准组的年龄别人口数或年龄别人口构成比时; 间接法用于已知被标化组的年龄别人口数与发病(死亡)总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡)率时;通常可从以下 3 种方法选用标准组:以两组资料中任一组的年龄别人口数或构成比作为标准组;以两组资料合并的各年龄组的人口数或构成比作为标准组;料比较的标准作为标准组;7、统计表:结构:由标题、标目、线条和数字构成;编制统

8、计表的要求:以公认的或便于与他人资标题:概括表的内容,列于表的上方居中,应注明时间和地点;标目:主语和谓语分别列于横、纵标目,文字简明,层次清晰;横标目列于表的左侧,通常 为被讨论的事物,纵标目列于表的上端,为说明横标目的统计指标;线条:通常,除表的顶线、底线、纵标目下以及合计上的横线外,其余线条均省去,顶线和 底线应略粗些,表的左上角不宜用斜线;数字:用阿拉伯数字表示, 同一指标的小数位数要一样并对齐,数字暂缺或很多字者分别用名师归纳总结 “ ” 或“- ” 表示,数字为 0 者要记作“0” ,不应空项,为便利核实和分析,应有合计;第 2 页,共 17 页- - - - - - -精选学习资

9、料 - - - - - - - - - 备注:一般不列入表内,必要时可用“8、统计图:条图:用于相互对比关系的资料;* ” 标出,列于表下;圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成;线图:用于连续性资料, 用于说明事物在时间上的进展变化,情形;直方图:表示连续性资料的频数分布;或某现象随另一现象而变动的散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势;抽样分布与参数估量抽样讨论的目的是用样本信息来推断总体特点,估量,二是假设检验;即统计推断, 包括两个内容: 一是总体参数的1、抽样误差:由于变异的存在,抽样讨论所造成的样本统计量与总体参数之间的差异

10、或各样本统计量之间的差异称为抽样误差;常用标准误 x反映均数抽样误差的大小;用率的标准误 p 反映率的抽样误差的大小;用Possion 计数的标准误 反映其抽样误差的大小;2、中心极限定理和正态分布推理:从正态分布 N( , 2)总体中以固定 n 随机抽取样本,样本均数 x 的分布仍听从正态分布,即使是从偏态分布总体中随机抽样,只要 n 足够大, x 的分布也近似正态分布;样本均数的均数仍为 ,样本均数的标准差为 x;样本均数的抽样误差 x(简称标准误)是反映均数抽样误差大小的指标;x= 用样本均数 S 作为 的估量值,就 xs = Sn n3、t 分布:将 x 看成变量值,那么可将正态变量进

11、行u 变换(u= x - / )后,也可将 N( ,2x)变换成标准正态分布 N(0,1);常用 s 作为 的估量值,统计量为 t ,此分布为 t 分布;统计量 t= x t 曲线的外形变化与自由度 v 的大小有关; v 越小, t 值越分散,曲线越低xs平, v 逐步增大时,就 t 分布逐步靠近正态分布,当 v=无穷大时, t 分布即为 u 分布;4、总体均数的估量有两种方法:一种是点估量,即用统计量 x 估量总体均数;二是区间估计,亦称可信区间;(1) 未知且 n 小: x -t /2 ,v s x x +t /2 ,v s x (2) 未知,但 n 足够大, t 分布靠近 u 分布: x

12、 -u /2sx x +u /2sx 名师归纳总结 (3) 已知: x -u /2x x +u /2x 第 3 页,共 17 页- - - - - - -精选学习资料 - - - - - - - - - 标准差和标准误的比较S=标准差s = x标准误xx2sn1n表示观看值的变异程度大小估量均数的抽样误差大小运算变异系数 CV= sx100% 估量总体均数可信区间确定医学参考值的范畴x -t /2 ,v s x x +t /2 ,v s x 进行假设检验运算标准误数值变量资料的假设检验1、假设检验的原理:假设在一次抽样讨论中得出了u1.96 ,就 P0.05 ,此为小概率大事,依据“ 小概率大

13、事在一次随机试验中认为是不行能发生的”的定理, 可认为此样本不是来自该总体;2、步骤:建立假设和确定检验水准;假设有两种,一种是检验假设,常称 无效假设或零假设,记为 H0,假设样本所代表的总体参数与已知总体参数相等;另一种是 备择假设 ,记为 H1,是与 H0 相联系且对立的假设;检验水准,亦称显著性水准,是判定拒绝或不拒绝 H0,也是 允许犯型错误的概率 ,通常用 0.05 ;选定检验方法和运算统计量确定P 值,做出推断结论; P值是指从 H0 所规定的总体中随机抽样时,获得等于及大于现有样本统计量的概率;3、t 检验:适用于:样本均数与总体均数比较( 未知且 n50 或 n30);成组设

14、计的两小样本均数的比较( n1,n2 均小于 30 或 50);配对设计的两样本均数比较;应用条件:当样本含量较小(n50 或 n30)时,要求样原来自正态分布总体;用于成组设计的两样本均数比较时,要求两样原来自总体方差相等的总体;4、单样本 t 检验:用于样本均数与已知总体均数的比较,讨论目的是推断样本所代表的总体均数 与已知总体均数 0有无差别;统计量t= x/0 v=n-1 sn5、配对 t 检验:用于配对设计资料的两均数的 比较;其讨论目的是推断某种处理有无作用,或两种处理的成效有无差别;2配对设计类型有3 种:先将受试对象按配比条件配对,然后用随机分组方法将各对中的个受试对象分别安排

15、到不同的处理组;同一对象分别接受2 种不同处理; 同一对象处理前后; t=s ddn( d 是差值的样本均数) v=n-1 /6、两样本 t 检验:用于 完全随机设计的两样本均数的 目的是推断两样本所分别代表的总体均数是否相等;比较,两个样原来自两个总体,其讨论名师归纳总结 - - - - - - -第 4 页,共 17 页精选学习资料 - - - - - - - - - t=x 1x2=x 1x21=2 s 1n 1n11 nx1x 2111 v=n1+n2-2 S x 1x22 s c12 s 2n2n 1n 222n 1n27、单样本 u 检验:用于样本均数与已知总体均数比较,其讨论目的

16、同 t 检验;讨论目的是推断样本所代表的总体均数 与已知总体均数 0有无差别;其统计量 u= x 0s / n8、两样本的 u 检验:用于完全随机设计的两样本均数的比较,两个样原来自两个总体,其研究目的是推断两样本所分别代表的总体均数是否相等;其统计量为:u=x 1x 1x2=2 s 1x 1x2/n2sx 2/n 1s2 29、正态性检验和方差齐性检验: 资料在做假设检验之前第一应当检验资料是否来自正态总体,并且它们的方差是否齐;10、两类错误:型错误: 拒绝了实际上成立的 H0, 即样原来自 = 0 的总体, 由于抽样的偶然性, 按 =0.05检验水准拒绝了 H0, 接受 H1;这类在假设

17、检验中拒绝了原本正确的 H0 的错误称为型错误; ,理论上犯型错误的概率为 , 值得大小视讨论目的而定;通常设 =0.05;型错误:不拒绝了实际上不成立的 H0, 即样原来自 0的总体,由于抽样的偶然性,按 =0.05 检验水准不拒绝 H0,这类在假设检验中不拒绝原本不正确的 H0的错误称为型错误;犯型错误的概率为 ,它只有与特定的 H1结合起来才有意义;同时削减 和 的方法是 增加样本含量 ;1- 称为检验效能或把握度 ,即两总体确有差别时,按 水准能识别该差别的才能; 如 1- =0.95 表示:如两总体确有差别, 理论上平均 100 次抽样中,有 95 次能得出两总体有差别的结论;11、

18、假设检验时应留意的事项 : 要有严密的抽样讨论设计- 假设检验的前提正确选用检验方法: 完全随机的设计的两数值变量资料比较时,如 n 小且方差齐, 就选用两样本 t 检验;如方差不齐,就选用 t 检验或成组设计的两样本比较的秩和检验;如 n1,n2 均大于 50,就选用两样本 u 检验;正确懂得“ 显著性” 的含义对差别有无统计学意义的判定 不能肯定化 ;方差分析1、基本思想:按讨论目的和设计类型,将总变异的离均差平方和SS和自由度 v 分别分解成如干部分,并求得各相应部分的变异;其中的组内变异或误差主要反映个体差异或抽样误差,其它部分的变异与之比较得出统计量F 值,由 F 值的大小确定P 值

19、,并作出推断,从而明白该因素对观测指标有无影响;组内变异主要由个体差异所致,组间变异可能由两种缘由所致:一是抽样误差,二是由于接受的处理不同;名师归纳总结 2、总离均差平方和2SS和自由度 v /n第 5 页,共 17 页SS总=knix ijx =x2x 2i1j1- - - - - - -精选学习资料 - - - - - - - - - v总=n-1 3、组间离均差平方和SS组间,自由度 v 组间和均方 MS组间SS组间=ikn ixij2x2 v组间=k-1 MS组间=SS 组间各样原来自正态j11n inv组间4、组内离均差平方和SS组内,自由度 v 组内和均方 MS组内SS组内=SS

20、总-SS 组间 v组内=n-k MS组内=SS组内/v组内多样本均数比较的方差分析的应用条件:各样本是相互独立的随机样本;分布总体;各总体方差相等,即方差齐;5、完全随机设计资料的方差分析:亦称单因素的方差分析,可用于完全随机设计的多个样本 均数比较的资料,讨论目的是推断各个样本所代表的总体均数是否相等;单因素方差分析的运算公式 变异来源 SS v MS F 总变异x2C/C n-1 SS 组间组内MS 组间组间变异iknix ij2j1 k-1 1n iv组间MS 组内组内变异 SS总-SS组间n n-k SS组内/v*C 为校正系数 C=x 26、配伍组设计资料的方差分析:亦称两因素的方差

21、分析,用于配伍组设计的多个样本均数比较的资料,其讨论目的是推断各样本所代表的总体均数是否相等,应的影响;两因素方差分析的运算公式变异来源 SS v MS F 总变异x2C n-1 但考虑了个体差异对试验 效名师归纳总结 处理组kjb1x ij2C k-1 SS处理/v处理MS处理/MS误差第 6 页,共 17 页i1b配伍组bikx ij2C b-1 SS 配伍/v 配伍MS配伍/MS误差1j1k误差SS总-SS处理-SS配伍(k-1)(b-1)SS误差/v误差- - - - - - -精选学习资料 - - - - - - - - - *C 为校正系数 C=x 2/n b 为配伍组数分类资料的

22、假设检验1、二项分布: 应用条件:各观看单位只能具有两种相互对立的结果已知发生某结果的概率为 ,其对立结果的概率为1- n 次试验是在相同的条件下进行的;性质: =n = n (1 )如均数和标准差用率表示,就 p= p= (1 )/ n 未知时,用样本率 P 作为 的估量值,就 Sp= p 1 p / n总体率的估量:正态近似法:当样本含量 n 足够大,且样本率 p 或 1-p 均不太小,如 np 与 n(1-p )均大于 5 时样本率 p 的抽样误差分布近似正态分布, 可信区间为:(p-u /2Sp,p+u /2Sp)2、Poisson分布:对于二项分类变量,如某结果发生的概率很小,如 0

23、.05 时,单位时间、人群、空间内“ 阳性” 发生次数PX=e(x/x!)x(x=0,1,2, )的概率可用 Poisson分布概率函数来描述:递推公式: P(0)=eP(x)=P(xx1) 应用条件: 0.05 外,其余同二项分布;分布的性质:(1)、Poisson 分布式一种单参数的离散型分布,其参数为 某大事平均发生的次数;(2)、Poisson分布的方差 2 与均数相等; ,表示单位时间、人群、空间内(3)、Poisson分布可以看成是二项分布的极限形式;n20 时,可按正态分布处理,当 (4)、Poisson分布的极限形式也是二项分布,一般当0.01 时,二项分布可以当作Poisso

24、n 分布来处理;(5)、Poisson 分布具有 可加性 ;总体均数的估量:(正态近似法)x u /2x,x u /2x3、听从二项分布资料的假设检验:(1)样本率和总体率的估量:kx x=1-k1Px 直接运算法:最多有k 例阳性的概率: Pxk=P0n最少有 k 例阳性的概率: P(xk)=P0k正态近似法: 当 0不太靠近 0 或 1,且样本含量 n 足够大;或 n 0 5 且 n(1- 0) 5 时,名师归纳总结 - - - - - - -第 7 页,共 17 页精选学习资料 - - - - - - - - - 二项分布接近正态分布;u=P0=x0n 00(0 10)nn 1(2)两样

25、本率的比较:目的是推断两个样本各自代表的两总体率是否相等,当两个样本率均满意正态近似条件时,可用u 检验;1其公式为: u=p 1p 1p 2=p cp 1p 2sp 2 1p c1n 1n2pc为合并阳性率,pc=( x1+x2)/n1+n2 x1,x2 为两个样本的阳性例数;4、听从 Poisson分布的假设检验:对于Poisson分布的假设检验,对于总体均数可以用乘法将小单位化大, 也可以用除法将大单位化小,对于样本均数, 只能用除法将大单位化小, 而不能用乘法将小单位化大;(1)样本均数与总体均数的比较:适用于 020,且样本阳性数 X 较小作单侧检验时;kk1Px 0直接运算法:最多

26、有k 例阳性的概率: Pxk=Px 0n最少有 k 例阳性的概率: P(xk)=Px=1-k00正态近似法:当 20 时,Poisson分布靠近正态分布; u=x(2)两样本阳性数的比较:目的是推断两样本各自代表的两总体平均数是否相等;当两样本阳性数 X 1,X 2 均大于 20 时,可用 u 检验;其运算用两种情形:两样本观看单位(时间、面积、容积等)相同时:u= x 1 x 2 = x 1 x 2x 1 x 2 x 1 x 2两样本观看单位(时间、面积、容积等)不同时:u= x 1 x 2x 1 n 1 x 2 n 25、2检验:是一种 连续型 分布,u 分布的平方即为 2分布;对于同一份

27、资料,u 2 2;2检验的检验统计量为 2,其基本公式为:2 A T 2,自由度 v=(行数 -1)(列数 -1)T式中 A 为实际频数, T 为理论频数;理论频数 T 的运算公式为:T RC n R *n n C TRC为第 R行第 C 列的理论频数, nR 为相应行的合计, nC为相应列的合计, n 为总例数;自由度 v=(R-1)(C-1). 2反映了实际频数与理论频数的吻合程度;只有考虑了自由度v 的影响,2值才能正确地反应实际频数 A 和理论频数 T 的吻合程度;名师归纳总结 - - - - - - -第 8 页,共 17 页精选学习资料 - - - - - - - - - 6、四格

28、表资料的2检验:最小理论频数 T RC 的判定, R 行与 C 列中,行合计数中的最小值与列合计数中的最小值所对应的理论频数最小;(1)四个表资料02检验的专用公式:2adbc2nbdabcdac (2)四个表资料2检验的校正公式:bcn2 2n5.2AT22adTc ab cdacbd在实际工作中,对于四个表资料,通常规定为:2 2(1)当 n40 且全部的 T5 时,用 检验的基本公式或四个表资料 检验的专用公式;当 P 时,改用四个表资料的 Fisher准确概率法;2(2)当 n40,但 1T5 时,用四格表资料的 检验的校正公式;或改用四个表资料的Fisher 准确概率运算法;(3)当

29、 n40,或 T1 时,用四个表资料的Fisher准确概率法;2(4)连续性校正仅用于 v=1 的四格表资料,特别是 n 小时;当 v2 时一般不做校正;27、配对四个表资料的 检验:由于在抽样讨论中,抽样误差是不行防止的,样本中的 b 和 c2往往不相等(即 b c),为此,需进行假设检验,其检验统计量为:2 b c v=1 (条b c件为: b+c40)2bbcc1 2v=1 (条件为: b+c40)而未考本方法只适用于样本含量不太大的资料,它仅考虑了两种方法结果不一样的情形,虑样本含量 n 和两种方法一样的两种情形,所以当n 很大且 a 与 d 的数值也很大, 而 b 与 c的数值相对较

30、小时 ,即使检验统计结果有统计学意义,其实际意义也不大;8、行*列表资料的2检验:只适用于多个样本率的比较,两个或多个构成比的比较以及双向无序分类资料的关联性检验;其基本数据由三种情形:多个样本率的比较时,有R 行 2 列,称为 R*2 表R 行 C 列,称为 R*C 表;两个样本的构成比比较时,有2 列 C 列,称为 2*C 表多个样本的构成比比较以及双向无序分类资料关联性检验时,有以上三种可统称为行 * 列表资料名师归纳总结 基本公式:基本公式为:2ATT2第 9 页,共 17 页- - - - - - -精选学习资料 - - - - - - - - - 专用公式:2n A21 自由度v=

31、(行数 -1)(列数 -1)n Rn C留意事项:一般人行 * 列表资料中各格的理论频数不能小于1,且 1T5 格子数不能超过总数的1/5;假如显现以上情形, 可通过以下方法解决: 最好是增加样本含量, 使得理论频数增大; 依据专业学问,考虑能否删去理论频数太小的行和列,能否将理论频数太小的行和列于性质相近的邻行或邻列合并;改用双向无序 R*C 的 Fisher 准确概率运算法;当多个样本率比较时,所得统计推断为拒绝H0,接受 H1 时,只能认为各样本率间总的来说有差别,但不能说明任两个样本率间均有差别,需要做多个样本率的多重比较;对于 有序的 R*C 表资料 不宜用 用恰当的检验方法;9、双

32、向无序分类资料的关联性检验:2检验;对于 R*C 表的资料要依据分类类型和讨论目的选对于此资料, 经常需要分析两个分类变量之间有无关系,2关系的亲密程度如何,进一步分析亲密程度时,可以用 Pearson 列联系数 r p ,rp n 2rp 取值在 01 之间, 0 表示完全不相关, 1 表示完全相关,愈接近于 0,关系愈不亲密,愈接近 1,关系愈亲密;11、R*C 表的分类及检验方法的挑选:分类:双向无序、单向有序、双向有序属性相同和双向有序但属性不同四种;双向无序 R*C 表:两个分类变量皆为无序分类变量,对于该资料:假如讨论目的为两个2样本率(或构成比)的比较,可用行 *列资料的 检验;

33、假如讨论目的是分析两个分类变2量之间有无关联性以及关系的亲密程度时,可用行 *列表资料的 检验以及 Pearson列联系数进行分析;单向有序 R*C 表:有两种形式: 一种是 R*C 表的分组变量是有序的, 而指标变量是无序的;讨论的目的通常是多个构成比的比较,可用行 *列表资料的 2 检验进行分析;另一种是 R*C表中的分组变量是无序的, 而指标变量是有序的, 讨论目的通常是多个 等级资料的比较, 可用秩和检验或 Ridit 分析;双向有序属性形同的 R*C 表:两个分类变量皆为有序且属性相同,讨论目的通常是分析两种检测方法的一样性,此时宜用 一样性检验(或称 Kappa检验);也可用特别模

34、型分析方法;双向有序属性不同的 R*C 表:两分类变量皆为有序的,但属性不同,对于该资料:假如讨论目的是分析不同年龄组患者疗效见有无差别,可把它视为单向有序的 R*C 表资料,选用秩和检验;假如讨论目的是分析两个有序分类变量间是否存在相关关系,可以用等级相关分析或 Pearson积矩相关分析;假如讨论目的是分析两个有序分类变量是否存在线性变化趋势,可以用有序分组资料的线性趋势检验;非参数检验非参数检验的统计推断基础是比较分布而不是比较参数,所以不必考虑被讨论对象的为何名师归纳总结 种分布以及分布是否已知; 在实际工作中, 对符合参数检验应用条件的资料,或经变量变换后第 10 页,共 17 页-

35、 - - - - - -精选学习资料 - - - - - - - - - 符合参数检验应用条件的资料应首选参数检验;而不能满意参数检验应用条件的资料,应选用非参数检验;主要挑选编秩的方法,比较统计变量T,而做出统计推断;直线回来与相关分析1、直线相关:假如两个随机变量中,当其中的一个变量由大到小的变化时,另一个变量也相应的由大到小(后由小到大)的变化,并且相应变化的散点图在直角坐标系出现直线趋势,就称这两个随机变量存在直线相关;相关分析是讨论变量和变量集合之间数量协同变化关系的亲密程度和方向的统计方法;要求:两个变量 X 和 Y 都听从正态分布,严格说应听从双变量正态分布;直线相关系数:用于说

36、明具有直线相关关系的两个变量间的相关关系的亲密程度和相关方向;亦称积差相关系数,总体的为 ,样本的为 ;yyy y 2llxyx 和y 的协方差xx (x 的方差)(y 的方差)xx 2xxlyy的取值在 -1,1之间;其意义如下:如 0 就 X 与 Y 存在直线相关关系;0为正相关;0 为负相关; 越大,说明两变量间的相关关系越亲密; 越小,说明两变量间的相关关系越不亲密;如 1为完全相关;如 0,就 X 和 Y 不存在相关关系; 0 1 表示存在不同程度的线性相关关系:0 .0 4 为低度线性相关;.0 4 0 . 7 为显著线性相关;.0 7 1 为高度显著线性相关;相关分析的步骤 :(

37、在 X 与 Y 均听从双变量正态分布的情形下)绘制散点图 :呈线性趋势,运算相关性;呈曲线趋势,进行曲线拟合;无任何趋势,不必分析;依据上述公式运算 的值;相关系数的假设检验,由于抽样误差的存在,判定 是否来自 0 的总体,常用 t 检验 ,公式:t s 01 2 n 2 n 2(或直接查 t 界值表)总体相关系数的区间估量:名师归纳总结 当0 时,从这样的总体中抽样,运算出的1 不听从正态分布,而进行反正切变换后,n 较大时, Z 近似听从均数为Z,方差为2n3的正态分布;第 11 页,共 17 页- - - - - - -精选学习资料 - - - - - - - - - 1ln 1就 Z

38、的可信区间为(un3,un3 ),对其进行2 e 2 ez1z121的变换,可以得出 的可信区间;直线相关分析的留意事项: 算相关系数时第一绘制散点图,判定两变量是否存在线性趋势;相关分析时要求X、Y 均为随机变量,而不能用于事先界定X、Y 的资料;相关分析时必需剔除反常点;相关分析要有实际意义,两变量相关,并不肯定存在联系,可能是另外一种因素引起的;分层资料不宜盲目的合并, 进行相关分析; 同时进行相关分析时, 假如不能确定各层讨论对 象具有同质基础,不宜盲目合并;不能将假设检验中 显著性大小 懂得为两变量 相关程度的 大小,后者是由相关系数的大小打算 的;2、等级相关:适用于不听从双变量正

39、态分布或总体分布未知的资料,仍可用于等级资料的相关分析;等级相关系数 s表示两个变量间相关系数的亲密程度与相关方向;基本思想:对于不符合正态分布的资料或等级资料,秩,然后利用量变量的秩次运算相关系数;将两个变量的原始观看值分别由小到大编3、直线回来:处理两个变量间线性数量依存关系的一种统计分析方法;回来方程为:y. a bx y.为应变量, 给定 x 的 y 的条件均数的估量值; b 为回来斜率, 表示当自变量 x 每变化 1 个单位时,应变量 y 平均变化 b 个单位; a 为截距,表示没有自变量 x 时其他因素对 y 的平均影响;线性回来模型的前提条件:线性:应变量 y 的总体均数与自变量x 呈线性关系;因此进行回来分析前应先绘制散点图;独立:任意两个观看单位之间相互独立;正态性:对任意给定x 的值, y 均听从正态分布;该分布的均数是回来直线上与x

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁