生物医学科研资料XVI工IR×C列联表资料的统计分析.pdf

上传人:qwe****56 文档编号:74693234 上传时间:2023-02-27 格式:PDF 页数:3 大小:164.57KB
返回 下载 相关 举报
生物医学科研资料XVI工IR×C列联表资料的统计分析.pdf_第1页
第1页 / 共3页
生物医学科研资料XVI工IR×C列联表资料的统计分析.pdf_第2页
第2页 / 共3页
点击查看更多>>
资源描述

《生物医学科研资料XVI工IR×C列联表资料的统计分析.pdf》由会员分享,可在线阅读,更多相关《生物医学科研资料XVI工IR×C列联表资料的统计分析.pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、中国医药生物技术2 0 1 2年 8月第 7卷第 4期 C h i n Me dB i o t e c h n o l,Au g u s t 2 0 1 2,V o 1 7,No 4 D OI:1 0 3 9 6 9 c mb a j i s s n 1 6 7 3 7 1 3 X2 0 1 2 0 4 O 1 5 如何用 S AS软件正确分析 生物医学科研 资料 X V I 工 I RC 列联表 资料 的统计分析与 S AS软件实现(一)王琪,胡良平,关雪,柳伟伟 讲 座 编者按 生物统计学是生物学领域科学研究和实际工作 中必不可少的工具,在分子生物学迅速发展的今天,生物统计 学更显示出了它

2、的重要性。实验设计与数据统计分析是现代生物学的基石,是生物学研究者检验假说、寻找模式、建立生物学理论的有利工具,也是生物学研究者探索微观和宏观生物世界的必备基础知识。对于每天甚至是每时 每刻涌现的大量的、以天文数字计量的分子遗传数据,必须借助统计学知识加以分析处理,才能从中获得有意义 的信息。“生物多样性数据分析”是开展生物多样性研究的一个重要方面,数据分析能力的高低极 大地影响着我 们对各种生态学现象认识的深度和广度。现在,电子计算机的普及使得生物统计分析过程大大简化,生物统计分 析软件包的普及将生物统计学从统计学家的书本里解放了出来,简化了生物统计分析过程,使之成为生物学研究 者的常用工具

3、。本-T 1 特邀军事医学科学院生物医学统计学咨询中心主任胡良平教授,以“如何用 S AS软件正确 分析生物医学科研资料”为题,撰写系列统计学讲座,希望该系列讲座能对生物医学科研3-作者有所帮助。RC 列联表资料可 以分为双 向无序的 R C 列联表 资料、结果变量 为有序变量 的单 向有 序 RC 列联表资料、双向有 序且属性相 同的 R C 列联 表资料和双向有序且属 性 不同的 RC 列联表 资料等 4类。本 文将 详细介绍前两 类 RC表资料及其用 S AS软件实现统计分析的全部内 容。1 双 向无序R C 列联表资料 的统计 分析与 S A S 实现 双 向无序 的 RC 列联表资料

4、是指在二维列联表 中,两个定 性变量都 是名义 变量,并 且这两个 名义变量分 别有 R 个和 C 个(R 和 C 分别代表列联表 的行数和列数,它 们均为大于 2的整数)取值,由此排列而成的 RC 表称 为双 向无序 的 RC 列联表资料。当理论频数小于 5的格 子数 未超过 总格 子数 的 1 5时,用一般 卡方检验;否 则,用 F i s h e r精确检验处 理该类资料口 。以下将通过实例 向读 者介绍 如何 用 S AS软件处 理双 向无序 的 R C 列联表资 料。表 1 不 同恶性血液病 患者 真菌 感染发生的部位【例 1】目前恶性 血液病 患者 的主要治疗方法 包括放化 疗、免

5、疫抑制剂 治疗等,这 些治疗 方式会 导致 患者发生真菌 感染。某 临床 医生对此做 了回顾性调查研究,以分析不 同血 液病患者真菌感染部位是否相同,调查结果见表 1,试对 表 1进 行合 理的统计 分析。分析与解答:本例是一个单因素多水平设 计定性 资料,原因变量“疾病种类”有 4个水平,结果变量“感染部位”有 3个 水平,两个变量都是多值名义变量,此时可采用卡 方检验或 F i s h e r精确检验对 该资料进行 统计分析,以分析 不同疾 病的患者感染部位 分布情况 是否相 同。以下介绍如何 用 S AS程序 的 F R E Q 过程分析双 向无序 R C 列联表 资料。S AS程序如下

6、,设程序名为 l i l s a s。d a t a a l:o d s h t ml;d o a=l t o 4:p r o cf r e q;d ob=l t o 3:we i g h t f;i n p u t f;t a b l e s a b c h i s q;O Ut put;r u n;e n d;e n d;o d sh t ml c l o s e;c ar dS:8 5 8 3 8 6 6 44 4 6 8 作者单位:1 0 0 8 5 0北京,军事医学科学院生物医学统计学咨询 中心 通讯作者:胡良平,E ma i l:l p h u 8 1 2 s i n a c o

7、rn 3 1 6 中国医药生物技术2 0 1 2年 8月第 7 卷第 4期 C h i n Me dB i o t e c h n o l,A u g u s t 2 0 1 2,V o 1 7,N o 4 程序说明:程序 中第一步建立名 为 a 1的数据集,a表 示疾病种类,分为 4个水平,b表示感染部位,分为 3个 水平,f表示频数。第 二步 是过程步,调用 F R E Q 过程进 行卡方检验,w e i g h t语句指定频数变量为 f,t a b l e s语句指 定用于生成二维列联表,“”后的选项 c h i s q表示进 行卡方 检验。S AS程序运行结果:a b 表的统计量 以上

8、是卡方检验 分析 的结果,由于=4 6 6 0 1,双侧 P=0 5 8 8 10 0 5,说 明不 同恶性血液病患者发生真菌感染 的部位之间 的差异无统计学意义。【例 2】沿用例1的背景资料,该医生统计 了不 同恶性 血液病 患者真菌感染种类情况,结果见表 2,试对该资料进 行 统计分析。表 2 不同恶性血液病 患者真菌感染 的类型 分析与解答:与例 1类似,当理论频数小于 5 的格子 数未超 过总格子数 的 1 5时,用一般卡 方检 验;否则,用 F i s h e r精 确检验处理该类 资料。本例超过1 5的单元格 的 期望计数 比 5小,因此选用 F i s h e r精确检验。S A

9、S程序 如下,设程序名为 l i 2 s a s。d a t a a 2;o d s h t ml;d o a=l t O 4:p r o cf r e q;d o b=1 t o 3:we i g h t f;i n p u t f;t a b l e s a b e x a c t;OUt put;r un:e n d;e n d;o d s h t m1 c l o s e;C ar QS:5 1 0 6 3 2 1 2 4 1 9 1 0 2 6 程序 说明:本程序与例 1的不同之处在于 t a b l e s语句“”后面 的选项是 e x a c t,表示进行精确检验。S AS程序运

10、行结果:a b 表的统计量 WA R N I NG:4 2 的单元格的期望计数比 5小。方可能不是有效检验。F i s h e r精确检验 表概率(P)第一部 分是一股卡方 检验分析 的结果,结 果下方 显示“WAR NI NG:4 2 的单元格的期望计数 比 5小。卡方可能 不是有效检验。”,因此应选择 F i s h e r精确检验,结果 示 P=0 0 0 7 60 0 5,说 明不 同恶性血液病患者发生真菌感染 的类 型不同。2 结果变量为有序变量的单向有序R c列联 表资料的统计分析与 S A S实现 结果变量为有序变量的单 向有序 R C 列联表资料是 指表 中仪结果变量 的取值为

11、有序,而原 因变量为l死序,如某 资料 中原因变量是药物种类,结 果变量是治愈、显效、好转、无效。如果仅原因变 量为有序 的而结果变量是无序 的,则仍 将其视为双向无序的 RC 列联表资料。结果变量为有序变量的单向有序 R C 列联表资料的 统 计 分 析可 选 用 秩 和 检 验、R i d i t分 析 以及 仃 序 变 量 的 l o g i s t i c 回归分析(此法较 复杂,一般情 况下不选用,在处 理高维列联表 时常用)_ l j。【例 3】用混合核苷 片、西药及 中草药 治疗 急性黄疸 犁肝 炎,治疗 效果见表 3,试分析 3种药物 治疗效果之 间的差 异是否有 统计 学意

12、义。表 3 不 同药物 治疗急性黄疸型肝炎 的效果 中草药 西 药 混 合核 苷片 合 计 1 4 6 3 6 8 1 3 0 2 8 6 7 2 分析与解答:这是一个单因素多水平设计定性资料,结 果变量“疗效”是有序变量,可选择秩和检验进行统 计分 析。5 3 4 9 3 9 中国医药生物技术2 0 1 2年 8月第 7卷第 4期 C h i n Me dB i o t e c h n o l,Au g u s t 2 0 1 2,V o 1 7,No 4 3 l 7 S AS程序 的 N P A R1 WA Y 过程 或 F R E Q 过程可 以进行分 析,以下介绍相应 的 S AS程序

13、。用 NP AR1 WA Y 过程进行 秩和检验 的 S AS 程序如下,设程序名为 1 i 31 s a s。d a t a a 3:o d s h t ml;d o a=1 t o 3:p r o c n p a r 1 wa y wi l c o x o n;d o b=l t 0 4:ffe qt i n p u t f;c l a s s a:O U tpu t;v a r b:e n d;e n d;r H n;c a r d s;o d s h t ml c l o s e;6 1 1 3 O 4 2 l 2 7 6 1 8 7 6 7 3 9 51 2 1 1 3 程序说 明:

14、第一步是数据步,建立名 为 a 3 的数据集,a表示药物种类,b表示疗效,f表示频数。第二步是过程 步,调用 N P AR1 WA Y 过程进行秩 和检验,f r e q语 句指定 频数 变量 f,c l a s s语句指定分组变量 a,v a r语句用于指定 结果变量 b。S AS程 序运行结果:Wi l c o x o n s c o r e s(r a n k s u ms)f o r v a r i a b l e b c l a s s i fie d b y v a r i a b l e a 第一部分是 3个组 的打分结果,其 中第一组平均秩是 3 2 5 2 6 3 2,第 二

15、 组 平 均 秩 是 3 2 4 8 9 9 4,第 三 组 平 均 秩 是 40 6 88 30。第二部分是 K r u s k a l wa l l i s秩和检验的结果,:=1 7 5 5 7,双侧 P=0 0 0 0 2 0 0 5,说明 3种药物治疗效果 之 间的差异 有统 计学意义。因第三组平均秩最 高,因此混合 核苷片 的疗效最好。本例 也可以通过 F R E Q 过程 实现秩和检验,程序如下,设程序名为 l i 3 2 s a s。od s h t ml;pr o cf r e q;we i g h tt t a b l e s a b c mh s c o r e s=r a

16、 n k;l U l l;o ds h t ml c l o s e;程序 说明:数据步与 l i 31 s a s相 同,此处省略。过程 步,调用F R E Q 过程,we i g h t语句 用于指 定频数 变量,t a b l e s语 句中“”后面 的选 项 c m h 表示 进行秩和 检验,s c o r e s选项指 定打分方法。S AS程序运行结果:a b 的汇总统计量 C o c h r a n Ma n t e 1 Ha e n s z e l统计量(基于秩得 分)第二行“行均值得分差值”对应的结果即为秩和检验 结 果,=1 7 5 5 7,P=0 0 0 0 2 与 l i

17、 31 s a s得到 的结果相 同。参考文献 1 H u L P Me d i c a l s t a t i s t i c s a n a l y s i s o f q u a n t i t a t i v e a n d q u a l it a t i v e d a t a a p p l y i n g t h e t r i p l e t y p e t h e o r y,B e i j i n g:P e o p l e S Mi l i t a r y Me d i c a l P r e s s,2 0 0 9:2 9 2 3 0 2 (i n C h in e s e)胡良平医学统计学 运用三型理论分析定量与定性资料北京:人民军医出版社,2 0 0 9:2 9 2 3 0 2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁