卫生统计学卫生统计学 (11).ppt

上传人:奉*** 文档编号:91003129 上传时间:2023-05-19 格式:PPT 页数:26 大小:630.88KB
返回 下载 相关 举报
卫生统计学卫生统计学 (11).ppt_第1页
第1页 / 共26页
卫生统计学卫生统计学 (11).ppt_第2页
第2页 / 共26页
点击查看更多>>
资源描述

《卫生统计学卫生统计学 (11).ppt》由会员分享,可在线阅读,更多相关《卫生统计学卫生统计学 (11).ppt(26页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第十一章 聚类分析和判别分析 本章目录第十一章聚类分析和判别分析 11.1 聚类分析概念与方法11.2 聚类分析的应用11.3 判别分析概念与方法11.4 判别分析的应用11.5本章练习题11.6微课:聚类分析11.7软件操作录屏:医学统计学实战指导P49L4-2K-均值聚类11.8软件操作录屏:医学统计学实战指导P49L4-2系统聚类11.1 聚类分析概念与方法概念:将没有分类信息的资料按距离最近或最相似的聚为一类的原则进行探索性分类的方法。缩类 类中的个体相似,类间的个体差异大。样品聚类(Q型聚类):对n个观测对象(观察单位)进行聚类。变量聚类(R型聚类):对m个观测指标(变量)聚类。基本

2、思想:定义样品距离、类与类之间的距离将N个样品各成一类将具有最小距离的两类合并重新计算类与类之间的距离直到所有样品归为一类为止。聚类图或树状图分类展示各类包含的样品数。聚类分析(Cluster Analysis):方法方法 1.有序样品聚类:大小顺序,同类样品必须相邻。Hb2.模糊聚类:属性模糊矩阵分类。三好、优干.图论聚类:男子短跑运动员的形态特征差异明显作用于运动员的技术表现形式,而髋、膝两大关节运动幅度在动作周期中的不同时相和全程跑的不同阶段的对比关系又是反映不同技术特征的最明显因素。3.快速聚类(Quick cluster,K-均值聚类K-Means Cluster,逐步聚类):大nk

3、类k个中心(均值)归类(最小距离原则)。4.系统聚类:n类缩类(相近原则)k类(目标)。常用的系统聚类方法有8种:最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法等。聚类统计量:相似性系数相似性系数(similarity coefficient)样品聚类(Q型)计量:明氏、兰氏、马氏距离 等级:Spearman rs 计数:列联系数 c 变量聚类(R型)计量:Pearson r,欧氏、马氏距离 等级:数量化欧氏、马氏 计数:列联系数 c11.2 聚类分析的应用例11-1 聚类分析。软件操作录屏:L11-1聚类分析样品聚类:Cases变量聚类:Variab

4、les 11.3 判别分析概念与方法聚类:要划分的类型事先不知,确定类型。无类分类判别:已知变量值及其分类,建立判别式,对未知类型的样品进行判别分类。有类归类判别分析和聚类分析往往联合起来使用。判别分析(discriminant analysis):是一种进行判别和分组的技术手段,用于判别任意一个已知特定测量指标取值,但分类未知的个体应归属于哪一类。判别值Ya1X1+a2 X2+amXm (a l、a2、am为判别系数)1.最大似然法:建立在概率论中独立事件乘法定律的基础上,适用于各指标是定性或半定量的情况。2.Fisher判别(典则判别canonical discriminant):用于两类

5、或多类间判别,但常用于两类间判别。金标准 A、B两类:m个观测指标判别界值Yc(YA+YB)/2判别规则:个体 YiYc A类;YiYc B类;YiYc 任一类。3.Bayes判别:用于两类或多类间判别,要求各类别内指标服从多元正态分布。4.Logistic回归:用于两类或多类间判别,但常用于两类间判别。它不要求多元正态分布的假设,故可用于各指标为两分类变量或半定量的情况。判别分析方法11.4 判别分析的应用判别效果验证:判别函数必须通过验证才能应用。1.训练样本回代法(自身验证)训练样本回代法(自身验证):用建立判别函数的训练样本回代用建立判别函数的训练样本回代错判概率。错判概率。偏低偏低。

6、2.外部数据验证外部数据验证:重新再收集一部分数据,用判别函数进行判别,以考察错判是否严重。:重新再收集一部分数据,用判别函数进行判别,以考察错判是否严重。理论上较好,但是实际上再收集数据较困难,而且再收集的样本同质性难以保证。理论上较好,但是实际上再收集数据较困难,而且再收集的样本同质性难以保证。.样本二分法样本二分法:将已知类别的大将已知类别的大n随机随机分成大小两部分分成大小两部分大的部分大的部分(85)建立判别函建立判别函数,小数,小的用于验证的用于验证错判概率。错判概率。4.刀切法刀切法(jackknife交互验证交互验证):n个个逐个搁置逐个搁置对其余的对其余的n-1个个体进行判别

7、分析,个个体进行判别分析,求出判别规则,求出判别规则,对搁置的个体进行考核,共对搁置的个体进行考核,共n次,次,假阳性率、假阴性率、总错误率假阳性率、假阴性率、总错误率和和ROC曲线等。曲线等。1.训练样本是关键:代表性,原始分类必须正确无误。2.判别指标要适当:筛选。3.样本含量足够大:n为自变量个数的1020倍以上。4.类别数多效果差:进行多个两两判别。5.判别规则要合格:前瞻性考核合格才能应用于实践。6.判别函数要修正。注意事项例11-2 判别分析。软件操作录屏:L11-2判别分析统计描述统计描述推断推断3类人群类人群5项指标差异项指标差异2个非标准化典则判别函数式计算分类值,最接近哪类人的中心便判为该类。Fisher线性判别函数计算出哪类人的阳光灿烂的函数值大便判为该类。判别效果的验证

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁