2022年医学统计学复习要点.docx

上传人:Che****ry 文档编号:27234463 上传时间:2022-07-23 格式:DOCX 页数:19 大小:191.88KB
返回 下载 相关 举报
2022年医学统计学复习要点.docx_第1页
第1页 / 共19页
2022年医学统计学复习要点.docx_第2页
第2页 / 共19页
点击查看更多>>
资源描述

《2022年医学统计学复习要点.docx》由会员分享,可在线阅读,更多相关《2022年医学统计学复习要点.docx(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精选学习资料 - - - - - - - - - . 第一章绪论、确定组段数和组距,组段数通常取10-15 组;、依据组距写出组段,每个组段的下限为L,上限为 U,变量 X 值得归组统肯定1、数据 /资料的分类:、计量资料,又称定量资料或者数值变量;为观测每个观看单位某项治疗的大小 而获得的资料;、计数资料,又称定性资料或者无序分类变量;为将观看单位依据某种属性或者 类别分组计数,分组汇总各组观看单位数后而得到的资料;、等级资料,又称半定量资料或者有序分类变量;为将观看单位按某种属性的不 同程度分成等级后分组计数,分类汇总各组观看单位数后而得到的资料;2、统计学常用基本概念:为 LXU,最终一

2、组包括下限;、分组划记并统计频数;频数分布的类型包括对称分布和偏态分布;偏态分布主要分为右偏态分布(也称正偏态分布) 和左偏态分布 (也称负偏态分布) ;频数表的用途包括以下几个方面:、描述频数分布的类型;、描述频数分布的特点;、便于发觉一些特大或特小的离群值;、 统计学( statistics )是关于数据的科学与艺术,包括设计、搜集、整理、分析、便于进一步做统计分析和处理;和表达等步骤,从数据中提炼新的有科学价值的信息;2. 集中趋势指标的适用条件、运算方法和意义;2-3 )、 总体( population)指的是依据讨论目的而确定的同质观看单位的全体;统计学用平均数(average )这

3、一指标体系来描述一组变量值的几种位置或者平均、医学统计学 (medical statistics):用统计学的原理和方法处理医学资料中的同水平;质性和变异性的科学和艺术,通过肯定数量的观看、对比、分析,揭示那些困惑费常用的平均数有算术均数、几何均数和中位数;解的医学问题背后的规律性;、算数均数,简称均数(mean ),可用于反映一组呈对称分布的变量值在数量上、 样本( sample ):指的是从总体中随机抽取的部分观看单位;的平均水平;运算方法包括直接运算法和频数表法(公式见2-2 );、变量(variable ):对观看单位某项特点进行测量或者观看,这种特点称为变量;、几何均数( geome

4、tric mean),可用于反映一组经对数转换后呈对称分布的变、 频率( frequency ):指的是样本的实际发生率;、 概率( probability):指的是随机大事发生的可能性大小;用大写的P 表示;量值在数量上的平均水平,在医学讨论中常用于免疫学的指标;( 运算公式见于3、统计工作的基本步骤:、统计设计:包括对资料的收集、整理和分析全过程的设想与支配;、中位数( median ),适用于各种分布类型的资料,特别是偏态分布资料和一端、收集资料:实行措施取得精确牢靠的原始数据;R;或者两端无准确数值的资料;、整理资料:将原始数据净化、系统化和条理化;、百分位数(percentile )

5、是一种位置指标,是一个界值,其重要用途是确定医、分析资料:包括统计描述和统计推断两个方面;学参考值范畴(reference range );其次章计量资料的统计描述直接运算法(公式见于2-7 、2-8 )1. 频数表的编制方法,频数分布的类型及频数表的用途频数表法( 2-9 、2-10 )、求极差( range ):也称全距,即最大值和最小值之差,记作. 名师归纳总结 - - - - - - -第 1 页,共 13 页精选学习资料 - - - - - - - - - . 区间 2.58 的面积为 99.00%;3、离散趋势指标的适用条件、运算方法和意义;5. 医学参考值范畴的意义和估量方法;描

6、述数据变异大小的常用统计指标有 极差 、四分位数间距 、方差 、标准差 和变异系 医学参考值( reference value)是指包括绝大多数正常人的人体外形、机能和代谢数;产物等各种生理及生化指标常数,也称正常值;、极差 ,一组变量值的最大值与最小值之差;由于存在个体差异,生物医学数据并特别数 ,而是在肯定范畴内波动,故采纳医学参、四分位数间距 (quartile range,QR)是把全部变量值分为四部分的分位数后,考值范畴( medical reference range )作为判定正常和反常的参考标准;通常使用由第 3 四分位数和第 1 四分位数相减而得; 它一般和中位数一起描述偏态

7、分布资料 的医学参考值范畴有 90%、 95%、99% 的分布特点; QR=P75-P25;、正态分布法:数据听从或者近似听从正态分布,或者通过适当的变换转换为正、方差( variance )也称均方差( mean square deviation)离均差平方和与样本态分布, 采纳此方法之前一般要对资料进行正态性检验且要求样本含量足够大(如含量的比值;运算公式为2-11 n100)运算公式为2-23 、 2-24 :双侧:、标准差( standard deviation )是方差的正平方根,其单位与原变量值得单位相同;运算公式为 2-13 、2-14 单侧:、百分位数法:适用于偏态分布资料医学

8、参考值范畴的制定,所要求的样本含量、变异系数(coefficient of variation)记作 CV,多用于观看指标单位不同时,比正态分布要多(不低于 100);或者均数相差较大时两者变异程度的比较;运算公式为 2-16 运算公式为 2-25 、 2-26 :双侧:4. 正态分布的图形,正态分布的特点,正态曲线下面积的分布规律;正态分布的特点:两端与 X 轴永不相交, 且以 X= 为对称轴,单侧:、在直角坐标的横轴上方呈钟形曲线,左右完全对称;、在 X= 处,f(X)取最大值,远离 ,其值越小;1 或第三章总体均数的估量与假设检验、正态分布有两个参数,位置参数 和外形参数 , 打算正态分

9、布的曲线在坐标轴上的左右移动,越大越右移; 打算曲线的弓背程度,越小峰值越高;1、基本概念:正态分布曲线下的面积分布有肯定的规律;X 轴与正态曲线所夹面积恒等于抽样误差 (sampling error):指的是由于个体变异产生、随机抽样造成的样本统者 100%;计量与总体参数的差异;区间 的面积为68.27%;标准误( standard error,SE):指的是样本统计量的标准差;区间 1.96 的面积为 95.00%,均数的标准误(standard error of mean,SEM ):指的是样本均数的标准差;. 名师归纳总结 - - - - - - -第 2 页,共 13 页精选学习资

10、料 - - - - - - - - - . SEM 反映样本均数之间的离散程度,也反映样本均数与相应总体均数间的差异;均数的标准误的运算公式为 3-1 、3-2 统计推断 (statistical inference):通过抽样讨论的方法从总体中随机抽取一个样本,用样本的信息来推断总体的特点的统计学方法,包括参数估量和假设检验;2、标准差的用途:、反映资料的离散趋势;标准差越小,说明变异程度越小,均数的代表性越好;用于运算变异系数;0,总体标准差为1 的标准正态分布N0,17、总体均数可信区间的运算:n 的大小而异,通常有t 分布和 u 分布两类方法;用于运算标准误; 依据总体标准差 是否已知

11、以及样本含量结合均数和正态分布规律估量参考值范畴;A、单一总体均数的可信区间:3、u 分布与 t 分布:a、总体标准差 已未知:按t 分布u 分布(也称 Z 分布):指的是总体均数为双侧和单侧公式见3-5 、3-6 、3-7 2;t 分布: 随机变量 X 听从总体均数为 ,总体标准差为 的正态分布N( ,就可以通过 u 变换将一般的正态分布转化为标准正态分布; 但是通常获得的资料为样本的均数标准误,因此经过转换后并不是完全意义上的 b、 已知或者未知,但 n 足够大(如 60)时:按 u 分布标准正态分布,而是听从 t 分布;(运算公式为 3-3 )双侧和单侧公式见 3、8、3-9 、3-10

12、 t 分布主要用于总体均数的区间估量和 t 检验;4、可信区间: 从固定样本含量的已知总体总进行重复随机抽样试验,依据每个样 B、两总体均数之差的可信区间:本可算得一个可信区间,就平均有 1- (如 95%)的可信区间包含了总体参数,而 前提:两总体方差相等,但均数不等不是总体参数落在该范畴的可能性为 1- ;运算公式见于 3-12 、3-13 、3-14 5、参考值范畴和总体均数可信区间的区分见课本表 3-2 6、标准差与标准误的区分和联系:. 意均数的标准误标准差28、t 分布图的特点:第 3 页,共 13 页反映X的抽样误反映一组数据的离散情、单峰分布,以0 为中心,左右对称;义差大小况

13、XSX记S法名师归纳总结 计XnXN- - - - - - -精选学习资料 - - - - - - - - - . 、 t 分布的曲线外形取决于自由度v 的大小,自由度越小,就t 值越分散,曲线量,然后依据获得的P 值来判定;的峰部越矮而尾部翘得越高;B、假设检验的基本步骤:建立检验假设,确定检验水准;、当自由度靠近无穷的时候,样本标准误接近总体标准误,t 分布靠近标准正态 运算检验统计量;分布;(标准正态分布是 t 分布的特例)确定 P 值,做出推断结论;9、t 检验的适用条件 C、假设检验的错误t 检验( t test/Student t-test)当 未知且样本含量较小时(如 n60),

14、理论上要求 型错误:拒绝了实际上成立的 H0,这类“ 弃真” 的错误;( )t 检验的样本随机地取自正态分布的总体,两小样本均数比较式仍要求两样本所对 型错误:“ 接受” 了实际上不成立的 H0,这类“ 取伪” 的错误;( )应的两总体方差相等,即 方差齐性 ;在实际应用中,如与上述条件略有偏离,对结 留意: 越小, 越大;反之 越大, 越小;果影响也不大;如重点是削减 型错误,一般取 =0.05 ;如重点是削减型错误,一般10、假设检验 取=0.10 或者 0.20 甚至更高;A、 假设检验的基本思想:利用小概率反证法的思想,从问题的对立面(H0)动身 如要同时减小 型和型错误,唯独的方法就

15、是增加样本含量 n ;简介判定要解决的问题(H1)是否成立;即在假设 H0 成立的条件下运算检验统计 拒绝 H0,只可能犯 I 型错误;接受 H0 ,只可能犯型错误;两 样 单样本 t 检验 适用于已知样本均数和已知总体均 t 分布 对方差齐与否无要求 t 值本 数的比较(v=n-1 )正态分布( 样配对样本 t 检 适用于配对设计的计量资料 t 分布 对方差齐与否无要求 t 值本 含验(v=n-1 )正态分布量 较两样本 t 检验 / 方差齐 适用于任意两计量资料 t 分布 方差齐 t 值小 ,成组 t 检验 的比较( v=n1+n2-2 正态分布)60)方差不齐 Cochran&Cox 近

16、似 t 检 t 分布 方差不齐 t 值(校正 t 值)验 正态分布资 计 量 资 Satterthwaite 近似 t 检 t 分布 方差不齐 t 值(校正自由度)验 正态分布料 ( 已料 知 均 数 两样本的方差比较时,可以使用 F 检验,分子为较大的样本方差(自由度为 n1-1 );分母为较小的样本方差(自由度为 n2-1 );F 值满意 F 分和 /或标 布,统计值为 F 值;或 准差)多 样 完全随机设计 完全随机化分组方法将试验对象分 F 分布 方差齐 F值 与成组 t 检验 意义相同数 本 资料的方差分 配到 g 个处理组中去, 试验后比较各 正态分布析 组均数之间的差别. 名师归

17、纳总结 - - - - - - -第 4 页,共 13 页精选学习资料 - - - - - - - - - . 据随机区组设计随机安排的次数要重复多次,且各个F 分布方差齐F值与配对 t 检验 意义相同资料的方差分处理组试验对象数量相同,区组内均F 分布正态分布F值析衡方差齐拉丁方设计资可多支配一个已知的对试验结果有料的方差分析影响的非处理因素,增加了均衡性,正态分布削减了误差,提高了效率 多样本的多重比较两阶段交叉设两种处理在全部试验过程中交叉进F 分布方差齐F值t 值两个阶段之间肯定要经计资料的方差行正态分布过一段洗脱阶段以排除分析残留效应LSD-t 检验 /最小显著差异t 检验,适用于一

18、对或者几对在专业上有特别意义的样本均数间的比较,统计量为 多样本的方差比较Dunnett-t检验适用于g-1 个试验组与一个对比组均数差别的多重比较,统计量为Dunnett-t值H0: 与两样本的 u 检验等SNK-q 检验适用于多个样本均数两两之间的全面比较,统计量为q 值Bartlett 检验,要求资料具有正态性,统计量为卡方;Levene 检验,比 Bartlett 检验要求低,不需要资料具有正态性,统计量为F 值;分类资料四格表资料通过两个样本的样本率来反映总体卡方分布无方差齐性要求卡方值率有无差异无正态分布要求价:u2=卡方值配 对 四 格 表 资强调配对:即针对同一样本实行不卡方分

19、布无方差齐性要求卡方值料同的试验或者处理方法;无正态分布要求 可用来分析两个分类行 列表资料用于多个样本率的比较、两个或多卡方分布无方差齐性要求卡方值个构成比的比较以及双向无序分类无正态分布要求变量之间有无关系或者资料的关联性检验关联多 样 本 率 的 多适用于多样本率两两之间的多重比卡方分布无方差齐性要求卡方值重比较较(基本思想: 对卡方值进行校正)无正态分布要求H1 推断某现象的频数分布频 数 分 布 的 拟推断频数分布的拟合优度适用于正卡方分布无方差齐性要求卡方值合优度态分布、 二项分布、 poisson 分布和无正态分布要求是否符合某一理论分布负二项分布. 名师归纳总结 - - - -

20、 - - -第 5 页,共 13 页精选学习资料 - - - - - - - - - . 其他不 满 足 上 述 统配 对 样 本 的 检适用于配对样本差值的中位数和0无方差齐性要求秩和(正秩样本量 n50 时可用正计方法的资料、验比较;仍可用于单个样本中位数和无正态分布要求和 或 负 秩态分布近似法类型等 级 资 料 两 独 立 样 本 比总体中位数比较方差不齐和) T 值n1 10 或 n2-n1 10资料秩检验适用于推断 计量资料 或 等级资料 的秩和(正秩较两个独立样本所来自的两个总体分正态分布和 或 负 秩可用正态分布近似法作完 全 随 机 多 样布是否有差别无方差齐性要求和) T

21、值u 检验用于推断 计量资料 或者 等级资料 的H 检验 H 值g=3 且最小样本的例数本比较多个独立样本所来自的多个总体分无正态分布要求大于 5 或 g3,H 近似布是否有差别听从 g-1 的正态分布,可用卡方分布法多 变 量 资 料 的双 变 量 直 线 回用于对两变量总体 间线性关系的估线性、独立、方差回 归 方 程相关系数求出后应做假处 理 回 归归计齐性、 误差听从均( 回 归 系与相关双 变 量 直 线 相用于判定 两个数值变量之间有无线数为 0 的正态分布数)正态分布相关系数r 关性关系,双变量正态分布资料正态分布多 元 回 归设检验多元线性回来用于分析 一个应变量 与 多个自变

22、量回来方程求出后应做整之间的线性关系方程体假设检验以及各自变量的假设检验第四章多样本均数比较的方差分析平的干预;方差分析的目的就是在H0: 1=2= =g 成立的条件下,通过分析各处理均数之间的差别大小,推断g 各总体均数间有无差别;3、方差分析的应用条件为:各个样本是 相互独立 的随机样本 ,均 来自于正态分布总体 ;相互比较的各个样本的总体方差相等,即具有方差齐性 ;1、概念:4、方差分析的变异分析:离均差平方和 (sum of squares of deviation from mean,SS)指的是各个观测值与总变异的大小SS总:各个观测值与总均数差值的平方和;总均数差值的平方;组间变

23、异的大小SS组间:各组均数与总均数的离均差平方和;均方差 ,简称均方(mean square,MS )指的是离均差平方和与自由度之间的比组内变异的大小SS组内:组内个观测值与其所在组的均数的差值的平方和;值;并有 SS总=SS组间+SS组内 由于组间与组内的离均差平方和的自由度不同,因此单纯的比较并无实际意义;MS组间=SS组间/v组间;MS组内=SS组内 /v组内2、方差分析的基本思想:设处理因素有g( g2)个不同的水平,试验对象随机分为g 组,分别接受不同水. 名师归纳总结 - - - - - - -第 6 页,共 13 页精选学习资料 - - - - - - - - - . 5、完全随

24、机设计资料的方差分析:F 组内总变异N-1 变异来源自由度MS 处理组g -1 MS处理MS处理/ MS误差总变异N-1 MS组间/MS行区组g -1 MS行MS行/ MS误差组间g-1 MS组间列区组g -1 MS列MS列/ MS误差组内N-g MS组内误差g -1g -2 MS误差完全随机设计资料:8、两阶段交叉设计资料的方差分析正态分布且方差齐:单因素方差分析该设计不仅平稳了处理次序的影响,而且能把处理方法间的差别、时间先后之间的成组 t 检验(意义相同t2 =F)差别和试验对象之间的差别分开来分析;非正态分布或 /和方差不齐:变量转换单因素方差分析9、多样本均数间的多重比较方法:LSD

25、-t 检验、Dunnett-t检验、 SNK-q 检验三种;秩和检验10、多样本方差比较:Bartlett 检验、 Levene 检验6、随机区组设计资料的方差分析:变异来源自由度MS F 误差第五章计数资料的统计描述总变异N-1 MS处理MS处理/ MS处理间g -1 区组间n -1 MS区组MS区组/ MS误差1、基本概念:误差n -1g -1 MS误差、 相对数( Relative number):是两个有关联的数据之比,用以说明事物的相对随机区组设计资料:关系,便于对比分析;正态分布且方差齐:双向分类的方差分析配对 t 检验(意义相同t2 =F)非正态分布或 /和方差不齐:变量转换双向

26、分类的方差分析常用的相对数指标许多,按联系的性质和说明的问题不同,主要分为:率、构成、相对比三类;、强度相对数 - 频率( frequency ):是最常见的一种相对数,频率在实践中又称Friedman M 检验 为比率( proportion );它表示事物内部某个组成部分所占的相对多少;初衷:考虑环境因素对试验结果的影响;7、拉丁方设计资料的方差分析:、 结构相对数构成比 constituent ratio:说明某事物内部各组成部分所占的比重或分布,又称构成比;构成比可相加,和等于 100%;可多支配一个已知的对试验结果有影响的非处理因素,增加了均衡性, 削减了误差,、 优势相对数-比(r

27、atio ):是指两个有关联的指标A 和 B 之比,简称比; A提高了效率;完全随机设计只涉及一个处理因素;随机区组设计涉及一个处理因素、一个区组因素;假如试验讨论涉及一个处理因素和两个掌握因素,每个因素的类别数或水平数相 等,此时可采纳拉丁方设计;和 B 可以是性质相同,也可以是性质不相同;通常以倍数或百分数(%)表示;、率的标准化法: 指的是排除内部构成差别,使总体率能够直接进行比较的方法;采纳统一标准调整后的率为标准化率,简称为标化率(standardized rate );标准化的基本思想:采纳统一的 “ 标准人口构成 ”,以排除人口构成不同对各组总率的影响,使算得的标准化率具有可比性

28、;、动态数列 dynamic series:是按时间次序排列的统计指标(可以为肯定数,变异来源自由度MS F . 名师归纳总结 - - - - - - -第 7 页,共 13 页精选学习资料 - - - - - - - - - . 相对数或平均数) ,用以观看和比较该事物在时间上的变化和进展趋势;3、二项分布的性质分析动态数列常用的指标有:肯定增长量、进展速度与增长速度、平均进展速度与 、样本率的标准差也称为率的标准误,可以用来描述样本率的抽样误差,率的标平均增长速度;准误越小,就率的抽样误差就越小;、进展速度: 表示报告期指标的水平相当于基线期(或前一期)指标的百分之 、当 =0.5 时,二

29、项分布图形是对称的,当 0.5 时,图形是偏态的,随着 n 增多少或如干倍;大,图形趋于对称; 当 n无穷时, 只要 不太靠近 0 或 1,二项分布就近似正态分、 增长速度: 表示的是 净增加速度 ,增长速度 =进展速度 1(100%);布;2、率的标准化的留意事项:、利用二项分布的性质,可进行总体率的区间估量和差异推断;(当 n50 时可.标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较 查表得到可信区间,50 是可采纳近似正态分布法)的资料间的相对水平;4、Poisson 分布的适用条件:.两样本标准化率是 样本值 ,存在抽样误差; 当样本含量较小时,比较两样本的标

30、一般性:才充分小的观测单位上 X 的取值最多为 1;准化率,需要作假设检验; (但假如比较的两者是总体的参数,就可进行直接比较,无需进行 t 、F 检验)独立增量性:重复试验室相互独立的,不相互影响;平稳性:每次试验阳性时间发生的概率都应相同;5、Poisson 分布的性质:、总体均数 与总体方差 2相等时Poisson 分布的重要特点;第六章几种离散型变量的分布及其应用n 次、当 n 很大,而 很小时,且n= 为常数时,二项分布近似Poisson 分布;、当 增大时, Poisson 分布逐步近似正态分布;一般而言, 20 时, Poisson连续型分布举例:u 分布、 t 分布和 F 分布

31、;分布资料可作为正态分布处理;常用离散型分布:二项分布、Poisson 分布、负二项分布;、 Poisson 分布具备可加性;1、基本概念6、Poisson 分布的图形特点:、二项分布( binomial distribution):是指在只会产生两种可能结果之一的当 越小,分布就越偏态; 当 越大时,Poisson 分布就越渐近正态分布;当 1 时,独立重复试验中,当每次试验的“ 阳性” 的概率 保持不变时,显现“ 阳性” 次数随 X 取值的变大, P(X)值反而会变小;当 1 时,随 X 取值的变大, P(X)值X=0,1,2 n 的一种概率分布;先增大后变小;、 Poisson 分布(

32、Poisson distribution ):是二项分布的一种极端形式,指的是每次试验的“ 阳性” 概率比较低的时候,显现阳性次数的相应概率满意以 为参数的XP;即分别发生两种结果的概率之第七章卡方检验 22 时,2、二项分布的适用条件:、每次试验只会发生两种队里的额可能结果之一,1、 2分布曲线的特点:2分布曲线的外形依靠于自由度的大小当自由度和很等于 1;曲线呈 L 形;随着自由度的增加,曲线逐步趋于对称;当自由度无穷时,2分布、每次试验产生某种结果的概率固定不变;趋近正态分布;、重复试验是相互独立的,不相互影响;2、 2分布的基本性质:可加性;. 名师归纳总结 - - - - - - -

33、第 8 页,共 13 页精选学习资料 - - - - - - - - - . 3、 2检验的原理:通过实际频数和理论频数满意f 2,来推断实际频数与理论频2、主要数据资料类型:u 检验)数的差异大小及有无统计学意义;配对样本比较: (样本量 50 时可以采纳近似正态法作4、几种常见的资料类型:H0:样本总体中位数=人群总体中位数;、一般四格表:自由度= (行数 -1 )(列数 -1 )H1:样本总体中位数 人群总体中位数; 2可使用四格表专用公式;两独立样本的比较: (n110 或 n2-n1 10 时,令 n1+n2=N ,作近似正态分布 :n40 且全部的 T 5 使用基本公式;检验)使用

34、完全随机多个样本的检验方法求P 时,改用 Fisher 准确概率法;H0:两样本总体分布位置相同;n40 但有 1T5 四格表校正公式或者Fisher 准确概率法H1:两样本总体分布位置不同;n40 或 T 1 Fisher 准确概率法完全随机多个样本:配对四格表资料:b+c 40 且 1T5 要校正;H0:多个样本总体分布位置相同;5、Fisher 准确概率法思想:H1:多个样本总体分布位置不全相同;四格表资料周边合计数不变的条件下,运算表内 4 个实际频数变动时的各种组合之留意: 当完全随机的多个样本为两个样本时,概率;再依据假设检验用单侧或双侧的累计概率依据所取得检验水准 做出推断;得的

35、统计值H(或 HC)与使用两独立样本的u 检验求得的u 值等价; H=u 2;6、行 列表资料使用范畴:多个样本率的比较;样本构成比的比较;双向无序分类资料的关联性检验;7、多个样本率的多重比较:多个试验组间的两两比较与试验组与同一对比组的比较均应对 进行校准,且方法第九章:双变量回来与相关相同;比较实际频数与理论1、直线回来( linear regression):因变量 Y 随着自变量X 的变化而变化呈直线趋X8、拟合优度检验:势,但并非全部的对应点恰好全都在一条直线上,称为直线回来或者简洁回来;适用范畴: 推断某一现象的频数分布是否符合某一理论分布;注: a 为常数项,是回来直线在Y 轴

36、上的截距;频数的差异大小;b 为回来系数 (coefficient of regression ),为直线的斜率;其统计意义是当变化一个单位时Y 的平均转变的估量值;直线回来方程的求法第八章非参数检验基本原就: 最小二乘( least sum of squares)residual )或剩余值;为将实测值与假定回来线上的估量值的纵向距离称为残差(1、非参数检验的适用范畴:了使各点残差尽可能的小,考虑到全部点之残差有正有负,所以通常取各点残差平不满意正态分布和方差齐性条件的计量资料;方和最小的直线即为所求,如此得到的回来系数最抱负;对于分布不知道是否正态的小样本资料;统计推断的检验:方差分析F

37、检验或者 t 检验对于一端或两端是不确定值得资料;两者等价: t=F 2推断等级资料的等级强度差别;. b 离 0 越远, Y 受 X 的影响越大, SS回就越大,回来成效越好;名师归纳总结 - - - - - - -第 9 页,共 13 页精选学习资料 - - - - - - - - - . SS残越小,估量误差越小,回来作用越明显;、未设立平行对比的前后测量设计:(重复测量资料最常见的情形是前后测量设2、直线相关( linear correlation):两个数值变量进行比较时,一个变量在增加或 计)者削减时, 另一个变量也表现为增加或者削减,这两个变量之间的关系即为直线相 前后测量设计与

38、配对设计 t 检验的区分:关;a、配对设计中同一对子的两个试验单位可以随机安排处理,两个试验单位 同期 观相关系数( correlation coefficient)又称为 pearson 积差相关系数,以符号 r 表示 察试验结果,可以比较处理组间差别;前后测量设计不能同期观看试验结果,虽然样本相关系数,符号 表示其总体相关系数;用来说明具有直线关系的两变量间相 可以在前后测量之间支配处理,但本质上比较的是前后差别,推论处理是否有效是关的亲密程度与相关方向;有条件的,即假定测量时间对观看结果没有影响;相关系数的统计推断:t 检验 b、配对 t 检验要求同一对子的两个试验单位的观看结果分别是差

39、值相互独立,差打算系数( coefficient of determination ):为回来平方和与总平方和之比;其数值 值听从正态分布;而前后测量设计前后两次观看结果通常与差值不独立,大多数情大小反映了回来奉献的相对程度,也就是在 Y 的总变异中回来关系所能说明的百分 况第一次观看结果与差值存在负相关的关系;比;c、配对设计用平均差值推论处理的作用,前后测量设计出了分析平均差值外,仍3、残差图考察数据是否符合模型假设的基本要求:可进行相关分析;、应变量与自变量关系为线性;、设立平行对比的前后测量设计:、误差听从均数为 0 的正态分布;虽然分为处理组和对比组,但是不能进行差值均数 t 检验,

40、由于通常两组差值的方、方差相等;差不会相等;、各观测对象独立;、重复测量设计:4、直线回来与直线相关的区分和共同点 区分:相关系数无单位,回来系数有单位;重复测量数据与随机区组设计数据相像,两者的差别是:a、重复测量设计中处理是在区组间随机安排,区组内的各时间点是固定的,不能相关表示相互关系,没有依存关系,回来有依存关系;随机安排; 随机区组设计就要求每个区组内试验单位彼此独立,处理只能在区组内两者对资料的要求不同:当 X 和 Y 都是随机的, 可以进行相关和回来分析;随机安排,每个试验单位接受的处理是不相同的;当 Y 是随机变量, X 是掌握变量时,理论上只能做回来分析;b、重复测量设计区组

41、内试验单位彼此不独立,而随机区组内试验单位彼此独立,联系:均表示线性关系;假如依据随机区组进行t 检验就要求进行统计值的校正;符号相同,共变方向一样;假设检验结果相同; (tr=tb )可以相互换算(数值的相同不代表意义的相同)第十五章多元线性回来资料的分析适用范畴:分析一个应变量与多个自变量之间的线性关系;第十二章重复测量设计资料的方差分析1、多元线性回来模型的一般形式:Y=0+ 1X1+ 2X2+ + mXm+e a、偏回来系数 j 的意义 :表示在其他自变量保持不变的时候,Xj 增加或削减1、重复测量设计资料的数据特点:一个单位时Y 的平均变化量;. 名师归纳总结 - - - - - - -第 10 页,共 13 页精选学习资料 - - - - - - - - - . b、偏回来分布的应用条件:X1、 Cp 挑选法:应挑选Cp 最接近 p+1 的回来方程为最优方程;、 Y 与各个变量之间有线性关系;B、逐步挑选法:、各例观测值Yi 相互独立;、前进法: (只选不剔)在有统计学意义的前提下,选取偏回来平方和最大的一、残差 e 听从均数为0,方差为2的正态分布;(等价于对任意一组自变量个自变量做F 检验以打算是否选入;X2 Xm 值,应变量Y 具有相同方差,并

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁