《SPSS统计分析基础(2).ppt》由会员分享,可在线阅读,更多相关《SPSS统计分析基础(2).ppt(29页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、SPSSSPSS统计分析基础统计分析基础授课内容授课内容一一 统计学基本概念统计学基本概念二二 SPSS主要窗口与功能主要窗口与功能三三 计量资料常用统计分析计量资料常用统计分析 (一)计量资料的参数检验(一)计量资料的参数检验 (二)计量资料的非参数检验(二)计量资料的非参数检验四四 计数资料常用统计分析计数资料常用统计分析五五 等级资料常用统计分析等级资料常用统计分析六六 诊断试验评价指标及诊断试验评价指标及ROC曲线曲线七七 常用统计图形常用统计图形 学习重点学习重点 针对资料的性质及分析目的,选用针对资料的性质及分析目的,选用正确的检验方法。注意应用条件,正正确的检验方法。注意应用条件
2、,正确解释结论。不必深究其公式推导。确解释结论。不必深究其公式推导。至于各种具体检验方法,只需严格至于各种具体检验方法,只需严格按规定步骤进行即可。按规定步骤进行即可。一、统计学基本概念一、统计学基本概念1 总体总体:研究对象的全体。调查总体有无限性、巨大型、破:研究对象的全体。调查总体有无限性、巨大型、破 坏性、不必要性等。总体的统计指标,如总体均数坏性、不必要性等。总体的统计指标,如总体均数,采用采用希腊字母希腊字母记为记为。制定纳入、剔除标准。制定纳入、剔除标准。2 样本样本:从总体中抽取的代表总体的一部分个体,用于推断:从总体中抽取的代表总体的一部分个体,用于推断 总体。样本中所包含的
3、个体数目称为样本含量总体。样本中所包含的个体数目称为样本含量 (样本例数,(样本例数,n)。样本的统计指标,如样本均数,)。样本的统计指标,如样本均数,采用采用拉丁字母拉丁字母 X。3 实验设计三原则实验设计三原则:随机:不等于随便。常采用摸球法或统计表法。随机:不等于随便。常采用摸球法或统计表法。重复:样本足够大,一般以重复:样本足够大,一般以n30作为大样本。作为大样本。动物实验能严格控制实验条件,样本例数动物实验能严格控制实验条件,样本例数 可少些,临床试验较难控制试验条件,样可少些,临床试验较难控制试验条件,样 本例数需多些。本例数需多些。对照:相互比较的组间具有可比性。对照:相互比较
4、的组间具有可比性。总体均数总体均数 样本均数样本均数 X总体标准差总体标准差 样本标准差样本标准差S总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 统计推断统计推断一、基本概念一、基本概念一、基本概念一、基本概念4计量资料计量资料 所观测到的是数值。一般均带有度量衡单所观测到的是数值。一般均带有度量衡单 位,可以带小数。如身高、位,可以带小数。如身高、体重、血压等。体重、血压等。SPSSSPSS称为称为“定量资料定量资料”、“尺度变量尺度变量”、“连续变量连续变量”。5计数资料计数资料:将观察对象按属性或类别分组,然后清点将观察对象按属性或类别分
5、组,然后清点 各组观察个数所得资料。如性别、民族、职各组观察个数所得资料。如性别、民族、职 业、血型、生与死等。业、血型、生与死等。SPSSSPSS称为称为“定性资定性资 料料”、“名义变量名义变量”、“无序分类变量无序分类变量”。6等级资料等级资料:将观察对象按等级顺序分组,然后清点各将观察对象按等级顺序分组,然后清点各 组观察个数所得资料。如治愈、好转、无效组观察个数所得资料。如治愈、好转、无效 的人数,检查结果的人数,检查结果 “-、+、+、+”的人的人 数等。数等。SPSSSPSS称为称为“有序分类变量有序分类变量”。误差误差 统计上所说的误差泛指测量值与真值之差,样本指标统计上所说的
6、误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:与总体指标之差。主要有以下二种:(1 1)系统误差系统误差:在数据搜集和测量过程中由于仪器不准:在数据搜集和测量过程中由于仪器不准 确、标准不规范等原因,造成观察结果确、标准不规范等原因,造成观察结果 呈倾向性的偏大或偏小,这种误差称为呈倾向性的偏大或偏小,这种误差称为 系统误差。系统误差。(2 2)随机误差随机误差:由于一些非人为的偶然因素使得结果或:由于一些非人为的偶然因素使得结果或 大或小,是不确定、不可预知的。随机大或小,是不确定、不可预知的。随机 误差随测量次数增加而减小。误差随测量次数增加而减小。A图 B图 A 由于
7、枪支准星未校好,弹着点规律地偏向一方:由于枪支准星未校好,弹着点规律地偏向一方:系系 统误差统误差。B 由于尚不能控制的许多因素(弹头重量、形状、风由于尚不能控制的许多因素(弹头重量、形状、风力、肌肉抖动、紧张等)造成的弹着点差异:力、肌肉抖动、紧张等)造成的弹着点差异:随机随机 误差误差。一、基本概念一、基本概念一、基本概念一、基本概念7 均数(均数(X):即算术平均数。描述数据):即算术平均数。描述数据集中趋势集中趋势的主要指标。的主要指标。8 标准差(标准差(S):各观察值距离其平均值远近的平均水平,描述数据:各观察值距离其平均值远近的平均水平,描述数据 离散趋势离散趋势的主要指标。的主
8、要指标。S=(X-X)2/(n-1)9 标准误(标准误(SX):由于每次随机抽样的样本仅包含总体中的一小部:由于每次随机抽样的样本仅包含总体中的一小部 分个体,而个体之间又存在差异,从而造成样本指标与总体指标分个体,而个体之间又存在差异,从而造成样本指标与总体指标 之间存在误差。故由样本计算出的统计指标与总体的指标的大小之间存在误差。故由样本计算出的统计指标与总体的指标的大小 不一致。由于总体的指标通常是不知道的,故用直接比较样本统不一致。由于总体的指标通常是不知道的,故用直接比较样本统 计指标与总体统计指标的接近程度来比较抽样误差的大小是行不计指标与总体统计指标的接近程度来比较抽样误差的大小
9、是行不 通的。通常用通的。通常用“标准误标准误”表达。表达。首先计算各样本的均数,将样本的均数看成是新的观察值,首先计算各样本的均数,将样本的均数看成是新的观察值,样本均数的频数分布也符合正态分布。样本均数的频数分布也符合正态分布。样本均数的均数反映这些样本的平均水平或集中趋势,而这样本均数的均数反映这些样本的平均水平或集中趋势,而这 些样本均数的标准差则反映这些样本的变异程度或离散趋势,些样本均数的标准差则反映这些样本的变异程度或离散趋势,各各 样本均数的标准差就称样本均数的标准差就称“标准误标准误”。各样本均数的均数各样本均数的均数 各样本均数的标准差各样本均数的标准差=标准误标准误总体样
10、本样本1样本样本2样本样本3一、基本概念一、基本概念一、基本概念一、基本概念标准误的计算标准误的计算 单纯随机抽样时,可按单纯随机抽样时,可按 X=/n 为总为总体体标标准差准差 n 为样为样本例数本例数 由于由于总总体体标标准差准差是无法知道的,故可用一个是无法知道的,故可用一个样样 本的本的标标准差准差S代替,于是代替,于是标准误标准误SX:SX=S/n 该样本例数越大,总体标准误越小该样本例数越大,总体标准误越小 一、基本概念一、基本概念一、基本概念一、基本概念10 正态分布正态分布 符合正态曲线的频数分布,即符合正态曲线的频数分布,即中间高、两侧完全对称并逐渐中间高、两侧完全对称并逐渐
11、 下降、永远不与横轴相交的钟型曲线下降、永远不与横轴相交的钟型曲线。例如:以各直方条面积大。例如:以各直方条面积大 小代表各组段的频数多少,当观察人数逐渐增多,组距不断缩小小代表各组段的频数多少,当观察人数逐渐增多,组距不断缩小 时其顶端连线趋向于正态分布时其顶端连线趋向于正态分布,横轴表示身高,纵轴表示频数。横轴表示身高,纵轴表示频数。根据根据“中心极限中心极限”定理,定理,对于对于“计量资料计量资料”而言,当样本资而言,当样本资料足料足 够大(例如够大(例如N30)时,无论总体属于何种类型分布,随机抽样的)时,无论总体属于何种类型分布,随机抽样的 样本均数分布都服从正态分布。样本均数分布都
12、服从正态分布。只有符合正态分布时,才能用只有符合正态分布时,才能用 XS表示资料的特征表示资料的特征。正态分布估测方法:正态分布估测方法:X 2S时,一般均可用时,一般均可用 XS法。法。X 2S时,仍可用时,仍可用 XS法。法。X 2S 时,改用其他描述方法,如时,改用其他描述方法,如中位数中位数。一、基本概念一、基本概念一、基本概念一、基本概念X Xf f(X X)m m 临床上常用的参考值是指包括绝大多数正常人的临床上常用的参考值是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标,人体形态、机能和代谢产物等各种生理及生化指标,过去称正常值。过去称正常值。步骤:步骤:1.
13、从从“正常人正常人”总体中抽样。总体中抽样。2.统一测定方法以控制系统误差。统一测定方法以控制系统误差。3.根据专业知识决定单侧还是双侧取值。根据专业知识决定单侧还是双侧取值。单侧下限单侧下限-过低异常过低异常 单侧上限单侧上限-过高异常过高异常 双侧双侧-过高、过低均异过高、过低均异常常 单侧下限单侧下限异常异常正常正常单侧上限单侧上限异常异常正常正常异常异常正常正常双侧下限双侧下限双侧上限双侧上限异常异常一、基本概念一、基本概念一、基本概念一、基本概念 11 计量资料常用统计分析方法计量资料常用统计分析方法 计量资料计量资料是否符合正态分布是否符合正态分布参数检验参数检验(如(如t检验)检
14、验)非参数检验非参数检验(如(如Mann-Whitney)DescriptionYesNo计量资料参数检验方法计量资料参数检验方法(1)描述性分析:描述性分析:均数均数(X)标准差标准差(S)置信区间置信区间 (CL):一般取):一般取95%CL。(2)均数比较:均数比较:样本均数与已知总体均数比较:样本均数与已知总体均数比较:单个总体均数的单个总体均数的 t检验检验 两个独立样本均数比较:两个独立样本均数比较:独立样本独立样本 t检验检验(包括方差齐性检验)(包括方差齐性检验)两个与多个配对样本均数比较:两个与多个配对样本均数比较:配对样本配对样本 t检验检验 两个以上样本的均数比较:两个以
15、上样本的均数比较:单向方差分析单向方差分析 两个以上样本的均数间两两比较:两个以上样本的均数间两两比较:Q检验检验(事后检验,(事后检验,Post-Hoc)随机区组设计的两个以上样本的均数比较:随机区组设计的两个以上样本的均数比较:双向方差分析双向方差分析 (3)符合正态分布的两个连续变量之间的关系:符合正态分布的两个连续变量之间的关系:简单线性相关与回归简单线性相关与回归分析分析 曲线回归曲线回归 计量资料非参数检验方法计量资料非参数检验方法 (1)两个独立样本检验)两个独立样本检验 (2)多个独立样本检验)多个独立样本检验 (3)两个相关样本检验)两个相关样本检验 (4)多个相关样本检验)
16、多个相关样本检验一、基本概念一、基本概念一、基本概念一、基本概念12 计数资料常用统计分析方法计数资料常用统计分析方法(1)描述性分析:描述性分析:率率,相对比相对比,构成比构成比(2)比较分析:比较分析:样本率与已知总体率的比较:样本率与已知总体率的比较:二项分布检验二项分布检验 一个样本内各计量值之间的比较:一个样本内各计量值之间的比较:非参数检验中的卡方检验非参数检验中的卡方检验 两个样本率的比较:两个样本率的比较:四联表卡方检验四联表卡方检验 多个样本率或构成比的比较:多个样本率或构成比的比较:RC无序列联表的卡方检验无序列联表的卡方检验一、基本概念一、基本概念一、基本概念一、基本概念
17、13 等级资料常用统计分析方法等级资料常用统计分析方法(1)描述性分析:描述性分析:相对比相对比,构成比构成比(2)比较分析:比较分析:两个独立样本单向有序两个独立样本单向有序RC表资料表资料:非参数检验中的:非参数检验中的 2 independent samplesMann-Whimey U检验检验。多个独立样本单向有序多个独立样本单向有序RC表资料表资料:非参数检验中的:非参数检验中的 K independent samplesKruskal-Wallis H检验检验。双向有序双向有序RC表资料表资料:Spearman等级检验等级检验 Jonckheere-Terpstra检验检验 Cochran-Mantel-Haenszel检验检验 14 诊断试验评价指标与诊断试验评价指标与ROC曲线曲线 诊断试验评价指标诊断试验评价指标 灵敏度灵敏度(Sen)特异度特异度(Spe)阳性预测价值阳性预测价值(PV+)阴性预测价值阴性预测价值(PV-)优势比优势比(OR)Kappa ROC曲线曲线一、基本概念一、基本概念一、基本概念一、基本概念