《医学统计学复习大纲(共6页).doc》由会员分享,可在线阅读,更多相关《医学统计学复习大纲(共6页).doc(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上医学统计学复习大纲(一)绪论1)总体与样本总体:根据研究目的确定的同质研究对象的全体。分为有限总体与无限总体。样本:从总体中随机抽取的部分观察单位。2)参数与统计量参数:总体的统计指标,用希腊字母表示。如总体均数、标准差,分别记为、。固定的常数。统计量:样本的统计指标,用拉丁字母表示。如样本均数、标准差,为X(拔)、S。 在参数附近波动的随机变量 。3)抽样误差误差:实际观察值与客观真实值之差 a.系统误差在实际观测过程中,由研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。 特点:观察值有方向性、周期性。可以通过严格的实验设计和技术措
2、施消除b.非系统误差由研究者的偶然失误而造成。c.随机误差排除上述误差后尚存的误差,受多种无法控制的因素的影响。特点:大小和方向不固定。随机测量误差提高操作者熟练程度可以减少这种误差。 随机抽样误差(由抽样造成的样本统计量和总体参数间的差异。)不可避免,但有一定的分布规律,可估计。4) 四种随机抽样方法a.单纯随机抽样将观察单位逐一编号,然后用随机数字表、抽签或电脑等方法随机抽取部分观察单位组成样本。为最基本的抽样方法。b.系统抽样按一定顺序机械地每隔若干个观察单位抽取一个观察单位以组成样本。又称间隔抽样、机械抽样、等距抽样。c.整群抽样从总体中随机抽取若干个“群体”以组成样本。这个群体可以是
3、班级、街道社区等。d.分层抽样先按影响观察值变异较大的某种特征,将总体分为若干类型或组别(统计上叫“层”),再从每一层内随机抽取一定数量的观察单位,以组成样本。也即分类抽样。误差大小排序:整群抽样单纯随机抽样系统抽样分层抽样5)P 0.05(5)或P 0.01(1)称为: 小概率事件,即某事件发生的可能性很小。6)变量的分类a.数值变量其变量值是定量的,表现为数值的大小,一般有度量衡单位。计量(定量)资料 b.分类变量其变量值是定性的,表现为互不相容的类别或属性。有两种:1.无序分类:各类间无程度上的差异。计数(定性)资料2.有序分类:各类之间有程度上的差别,有“半定量”特性。等级资料7)统计
4、工作的基本步骤a.设计 b.搜集资料c.整理资料 d.分析资料(二)统计图表1)概念统计表是将整理好的资料利用表格的形式表达。用数据代替文字描述,便于统计结果的精确、简洁的表达和对比分析。统计图用点的位置、线段的升降、直条的长短以及面积的大小等形式表达统计资料。用图形代替数据,获得直观、形象的效果。 2)统计表基本结构要求、种类统计表由以下几个部分组成:表号和标题、标目、线条、数字、备注 简单表:只按一个特征或标志分组。复合表:按两个以上特征或标志分组。3)统计图基本结构要求、种类组成: 标题和图号 标目 点线条面 尺度 图例纵横轴比例图形资料性质分 析 目 的直条图相互独立直条长短表达数值大
5、小圆图构成比圆的扇行面积表达内部构成比百分条图构成比长条各段的长度(面积)表达内部构成比普通线图连续性资料线段的升降表达事物的动态(差值)变化半对数线图连续性资料线段的升降表达事物的发展速度直方图数值变量的频数表资料直方面积表达各组段的频数或频率散点图双变量资料用点的密集程度或趋势表达两变量间相关关系统计地图地区性资料不同线条或颜色代表指标高低,说明地域分布(三)数值变量资料的统计指标1)均数、几何均数、中位数的适用范围和计算方法a.均数:用于说明一组观察值的平均水平或集中趋势,是描述计量资料的一种最常用的方法。用X(拔)表示b.几何均数:数据特点是观察值间按倍数关系变化,对此可以计算几何均数
6、以描述其平均水平。用G表示。c.中位数:是一组由小到大排列的观察值中位次居中的数值,用M表示。反映一组观察值在位次上的平均水平。适用范围:平均数适用范围算术均数对称分布,尤其是正态分布或近似正态分布资料几何均数(1)等比数列资料(2)频数分布呈正偏态分布,经对数变化后服从正态分布(称对数正态分布)中位数1)资料分布呈明显偏态(2)分布的一端或两端无确定数值(称无界资料或开口资料)(3)资料类型分布不明2)四分位数间距、方差、标准差、变异系数的适用范围和计算方法指标意义应用场合全距最大值与最小值之差大多数资料(除开口资料)四分位数间距P75与P25之差大多数资料(含开口资料)方差和标准差变量值与
7、均数的平均离差正态和近似正态分布变异系数相对变异度度量衡单位不同或均数相差悬殊的多组资料比较3)频数表的用途(1)描述资料的频数分布特征和分布类型。(2)进一步进行统计分析。(3)发现特大、特小的可疑值。(4)绘制频数分布图。4)频数分布类型a.对称分布(正态分布、t分布)b.偏态分布(正偏态:高峰偏向左侧、负偏态:高峰偏向右侧)(四)正态分布、标准误、参数估计1)正态分布和 t分布的特征正态分布特征:a.单峰性,横轴上方均数处最高 b.左右对称 c.由均数和标准差两个参数决定其位置和形状 d.曲线下面积为1,曲线下面积分布有一定规律T分布特征:以t0为中心的单峰、对称分布与正态分布相比,曲线
8、最高处较矮,两尾部翘得高t分布的曲线形状仅受自由度 的影响。 t分布不是一条曲线,而是一簇曲线。当 n=时,t分布即为标准正态分布。2)医学参考值范围的估计(书P22)3)标准误的概念及计算a.标准误的概念(书P27)b.计算(书P27)4)参数估计的概念、种类及计算 参数估计概念:指由样本统计量估计总体参数,是统计推断的重要内容之一。种类:a.点估计 b.区间估计计算:区间估计计算可信区间(CI)(五)假设检验基本步骤、t检验1)假设检验的概念假设检验亦称显著性检验,是判断样本指标与总体指标或样本指标与样本指标之间的差异有无统计学意义的一种统计方法。2)假设检验的基本步骤a.建立假设,确定检
9、验水准b.确定检验方法,计算检验统计量c.确定P值,作出统计推断结论3)三种形式资料的t检验(书P35)(六)方差分析1)方差分析应用条件a. 独立性:各样本是相互独立随机的样本b. 正态性:各样本都来自正态分布总体c. 方差齐性:各样本的总体方差相等 2)完全随机设计、随机区组设计、多个样本均数两两比较(书P46)3)两类错误和检验效能的概念(书P42)I型错误(弃真):拒绝实际正确的H0, I型错误的概率记为。(1)即可信度:重复抽样时,样本区间包含总体参数的百分数。II型错误(纳伪): 不拒绝实际不正确的H0, II型错误的概率记为。(1)即检验效能(或把握度):两总体确有差别,按检验水
10、准被检出有差别的能力。(七)相对数1)三种相对数的概念和计算(书P58)a. 构成比概念:也叫构成指标,是指事物内部某一组成部分的例数与该事物各组成部分的总例数之比,用以说明事物内部各组成部分所占的比重或分布。b.率概念:又称频率指标,指实际发生数与可能发生该现象的总观察单位数之比,用以说明某种现象发生的频率或强度。c.相对比概念:又称对比指标,是指两个有联系的指标之比。说明一个指标是另一个指标的几倍或百分之几。2)率的标准化法的概念、目的和直接计算法(书P60)概念:在两组率(或多组率)比较时,内部各小组率有明显差别,且内部构成( 如年龄、性别、工龄、病情轻重、病程长短等)明显不同时,则不能
11、直接比较两组或多组的总率,此时采用统一的“标准”对内部构成进行调整,使之具备可比性的方法。 用标准化法加以校正后的率称为标准化率,简称标化率(standardized rate)或调整率(adjusted rate) 。未标化的率称粗率。目的:消除资料内部构成不同,使资料具有可比性。3)率的标准误概念、计算概念:率的抽样误差大小用率的标准误表示。计算:(书P63)4)总体率的可信区间的估计a.大样本(n大,p或(1-p)0.01) 正态近似法b.小样本(n50)查表法(八)卡方检验1)三种形式的资料X2检验的应用条件a.四格表资料:(书P69)b.配对四格表资料:(书P71)c.行列表资料:(
12、书P76)(九)非参数检验(秩和检验)1)非参数统计概念、适用资料、优缺点概念:非参数统计不必依赖总体分布的具体形式和总体参数,而是对总体的分布或分布位置进行估计或检验称为非参数统计。适用资料:1、分布型未知2、分布极度偏态3、方差不齐时4 、以严重程度、优劣等级、效果大小和名次先后等等级资料5.筛选或只需获得初步分析=优点:对资料的没有特殊要求 不受分布的影响(偏态、分布不明的资料) 不受方差齐性的限制 不受变量类型的影响 不受样本量的影响=缺点: 检验效率低(易犯型错误) 对信息的利用不充分2)配对、两样本和多个样本秩和检验方法a.配对:正负秩次之和绝对值较小这作为统计量T值。n25,查T
13、界值表。n25,近似正态分布,用u检验。(书P79)b.两样本:取样本含量小的n1的秩和T1为统计量T值。查T界值表。(书P82)c.多个样本:分别计算各组秩和Ti。计算H值。(书P84)(十)直线相关与回归1)r和b的概念、计算和假设检验a.概念直线相关: 又称简单相关或积差相关,用于研究两个来自正态分布总体的连续性随机变量X和Y之间的线性关系。相关系数r:又称积差相关系数,是反映两个变量线性关系的方向 和密切程度的指标,用符号r(样本),(总体) 表示。直线回归: 又称简单回归,是研究两个连续性变量X和Y之间的数量依存关系。回归系数b:直线的斜率。意义:X每改变一个单位,Y 平均改变b个单位。b(样本), (总体)b.计算r(书P91)b(书P93)c.假设检验r:t检验、查表法b:方差分析、t检验2)直线相关与直线回归的区别与联系(书P97)3)秩相关的适用资料a.不服从双变量正态分布不宜作积差相关b.总体分布型未知c.用等级表示的原始资料专心-专注-专业