讲稿1统计概述MBA.pdf

上传人:qwe****56 文档编号:74691070 上传时间:2023-02-27 格式:PDF 页数:7 大小:312.13KB
返回 下载 相关 举报
讲稿1统计概述MBA.pdf_第1页
第1页 / 共7页
讲稿1统计概述MBA.pdf_第2页
第2页 / 共7页
点击查看更多>>
资源描述

《讲稿1统计概述MBA.pdf》由会员分享,可在线阅读,更多相关《讲稿1统计概述MBA.pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、1临床统计学Clinical Statistics四川大学华西临床医学院循证医学与临床流行病学教研室刘关键一、统计学及相关学科的定义?统计学统计学(statistics)是研究数据的搜集、整理、分析和推断的学科。是运用数理统计和概率论的理论知识,面对不确定性数据作出科学分析与推断的普遍原理和方法。是研究数据的搜集、整理、分析和推断的学科。是运用数理统计和概率论的理论知识,面对不确定性数据作出科学分析与推断的普遍原理和方法。?与医学相关的统计学名称:与医学相关的统计学名称:?生物统计生物统计(biostatistics)是运用统计学原理和方法研究生物科学中的问题。是运用统计学原理和方法研究生物科

2、学中的问题。?医学统计学医学统计学(medical statistics)?卫生统计学卫生统计学(health statistics)?临床统计学临床统计学(clinical statistics)?随着计算机和统计软件的飞速发展,医学资料的统计分析已从繁琐的数字计算中解脱出来。因此:随着计算机和统计软件的飞速发展,医学资料的统计分析已从繁琐的数字计算中解脱出来。因此:?“医学资料的统计分析已不再是数据的罗列和公式的堆砌,而是一门医学科研设计的艺术和信息表达的艺术医学资料的统计分析已不再是数据的罗列和公式的堆砌,而是一门医学科研设计的艺术和信息表达的艺术”统计学的主要研究内容?1.研究医学科研

3、数据的正确收集方法,使数据能反映医学科研结果的规律。如实验设计、调查设计等内容。研究医学科研数据的正确收集方法,使数据能反映医学科研结果的规律。如实验设计、调查设计等内容。?2.研究医学科研数据的统计描述方法,如均数、中位数、标准差、率等指标的正确应用。研究医学科研数据的统计描述方法,如均数、中位数、标准差、率等指标的正确应用。?3.研究医学科研数据的统计推断方法,如各种假设检验方法。研究医学科研数据的统计推断方法,如各种假设检验方法。2二、统计学中的基本术语误 差?1.系统误差系统误差(systematic error)由于仪器未校正、测量者感官等原因所致的,具有方向性、系统性或周期性地偏差

4、。由于仪器未校正、测量者感官等原因所致的,具有方向性、系统性或周期性地偏差。?2.随机误差随机误差(random error)由当前科学技术无法解释的原因所致的误差。无方向性、系统性或周期性而随机变化的误差,随机变量一般服从正态分布。由当前科学技术无法解释的原因所致的误差。无方向性、系统性或周期性而随机变化的误差,随机变量一般服从正态分布。?3.抽样误差抽样误差(sampling error)由于从总体中抽取样本所致的样本指标与总体参数间的差异。由于从总体中抽取样本所致的样本指标与总体参数间的差异。总体与样本?1.总体总体(population):是根据研究目的确定的同质观察单位的全体:是根据

5、研究目的确定的同质观察单位的全体,更确切地说更确切地说,是同质的所有观察单位某种变量值的集合。是同质的所有观察单位某种变量值的集合。?2.样本样本(sample):从根据研究目的确定的总体中抽取的,对总体具有良好有代表性的一个部分。:从根据研究目的确定的总体中抽取的,对总体具有良好有代表性的一个部分。参数与统计量?1.参数参数(parameter):统计学中,将总体的统计指标称为参数,如总体均数、总体率等,统计学中的参数往往用希腊字母表达,如、。:统计学中,将总体的统计指标称为参数,如总体均数、总体率等,统计学中的参数往往用希腊字母表达,如、。?2.统计量统计量(statistic):统计学中

6、,将样本的统计指标称为统计量,如样本均数、样本率等。统计量常用英文字母表达,如:统计学中,将样本的统计指标称为统计量,如样本均数、样本率等。统计量常用英文字母表达,如p、s。概 率概 率?概率概率(probability)是描述随机事件发生的可能性大小的数值是描述随机事件发生的可能性大小的数值,常用常用P表示,其取值范围为表示,其取值范围为01。?A事件发生的概率可记为事件发生的概率可记为P(A),其值越接近于,其值越接近于1,A 事件发生的可能性就越大,反之,就越小。事件发生的可能性就越大,反之,就越小。?P(A)=1,A为必然事件为必然事件?P(A)=0,A为不可能事件为不可能事件三、数据

7、资料的类型三、数据资料的类型3变量与资料类型?变量变量(variable)是指某事件的观察结果是变化的、不确定的,不能用常数是指某事件的观察结果是变化的、不确定的,不能用常数(constant)表示的量。变量的取值可分为两种基本类型:表示的量。变量的取值可分为两种基本类型:?(1)离散型变量离散型变量(discrete variable)在某区间内变量取值为间断的,取值为有限个,如死亡数、有效数。在某区间内变量取值为间断的,取值为有限个,如死亡数、有效数。?(2)连续型变量连续型变量(continuous variable)在某区间内变量取值为连续的,取值为无限个,如身高、体重等。在某区间内变

8、量取值为连续的,取值为无限个,如身高、体重等。?(1)数值变量)数值变量(numerical variable):是指其值是可以定量或准确测量的变量,其表现为数值大小的不同。:是指其值是可以定量或准确测量的变量,其表现为数值大小的不同。?(2)分类变量)分类变量(categorical variable):是指其值是无法定量或不能测量的变量,其表现没有数值的大小而只有互不相容的类别或属性。:是指其值是无法定量或不能测量的变量,其表现没有数值的大小而只有互不相容的类别或属性。?(3)分类变量又可分为无序分类变量和有序分类变量两小类,无序分类变量表现为没有大小之分的属性或类别。)分类变量又可分为无

9、序分类变量和有序分类变量两小类,无序分类变量表现为没有大小之分的属性或类别。资料类型资料类型资料类型表资料类型表疗效疗效:治愈、显效、好转、无效治愈、显效、好转、无效类间有程度差别有序分类类间有程度差别有序分类(等级等级)疗效疗效:治愈、未愈血型治愈、未愈血型:A、B、O、AB对立的两类不相容的多类无序分类对立的两类不相容的多类无序分类:二项多项定性二项多项定性(不相容的类别不相容的类别)分类变量分类变量身高身高(cm)、体重、体重(Kg)定量定量(数值的大小数值的大小)数值变量数值变量例 子变量值表现变量分类例 子变量值表现变量分类 数值变量(计量资料)数值变量(计量资料)资料类型资料类型

10、无序分类变量(计数资料)无序分类变量(计数资料)分类变量分类变量 有序分类变量(等级资料)有序分类变量(等级资料)?尽量选择客观指标尽量选择客观指标(变量变量);多用计量指标少用或不用计数指标。;多用计量指标少用或不用计数指标。?尽量选择精确性高的指标尽量选择精确性高的指标(变量变量);应选择准确度与精密度都要好的指标,若两者不能同时俱全时,则以准确度高的指标为好。;应选择准确度与精密度都要好的指标,若两者不能同时俱全时,则以准确度高的指标为好。?尽量选择敏感性高的指标尽量选择敏感性高的指标(变量变量);使实验效应能更好地表现出来。;使实验效应能更好地表现出来。效应指标的选择原则?多数情况下,

11、数值变量资料提供的信息量最为完整和充分,可进行统计分析的手段也较为丰富、经典和可靠,与之相比,分类变量在这些方面都不如数值变量资料。多数情况下,数值变量资料提供的信息量最为完整和充分,可进行统计分析的手段也较为丰富、经典和可靠,与之相比,分类变量在这些方面都不如数值变量资料。?因此,在临床实验设计时,应尽可能地选择量化指标反映其效应,尽可能少用分类变量,一般不宜将数值变量的指标转变为分类变量后再做统计分析。因此,在临床实验设计时,应尽可能地选择量化指标反映其效应,尽可能少用分类变量,一般不宜将数值变量的指标转变为分类变量后再做统计分析。效应指标与统计方法4四、科研设计方案四、科研设计方案?根据

12、不同的研究目的,采用不同的统计设计方案,既可较好的控制研究的偏倚,又可达到事半功倍的效果。根据不同的研究目的,采用不同的统计设计方案,既可较好的控制研究的偏倚,又可达到事半功倍的效果。?统计方法中的公式和定理,在其建立和推导过程中,涉及到科研设计的方案。不同的设计方案,数据的统计分析方法也不尽相同。统计方法中的公式和定理,在其建立和推导过程中,涉及到科研设计的方案。不同的设计方案,数据的统计分析方法也不尽相同。?一个质量良好的医学研究,必须要有良好的科研设计为前提,而质量较差的科研设计无论使用何种统计方法,也无法改变其研究的质量。一个质量良好的医学研究,必须要有良好的科研设计为前提,而质量较差

13、的科研设计无论使用何种统计方法,也无法改变其研究的质量。设计方案与统计分析?以时间来划分设计方案:横断面前瞻回顾将来现在过去以时间来划分设计方案:横断面前瞻回顾将来现在过去?以统计模型来划分:完全随机设计(成组)、配对(伍)设计(随机区组)、交叉、析因设计等。以统计模型来划分:完全随机设计(成组)、配对(伍)设计(随机区组)、交叉、析因设计等。设计方案常见统计设计方案?完全随机设计完全随机设计(complete randomized design)又叫成组设计又叫成组设计?配对配对(paired design)与随机区组设计与随机区组设计(randomized block design)?交叉

14、设计交叉设计(cross-over design)?析因、正交和拉丁方设计析因、正交和拉丁方设计?多因素设计多因素设计(multifactor design)五、数据的分布特征及数理统计条件五、数据的分布特征及数理统计条件?统计方法中的公式和定理,在其建立和推导过程中,涉及最多的是数据的分布统计方法中的公式和定理,在其建立和推导过程中,涉及最多的是数据的分布(distribution)特征。特征。?数据的分布特征是指数据的数理统计规律。若实际资料服从某个分布,我们就可以使用该分布所具有的数理统计规律来分析和处理实际资料,反之则不能。数据的分布特征是指数据的数理统计规律。若实际资料服从某个分布,

15、我们就可以使用该分布所具有的数理统计规律来分析和处理实际资料,反之则不能。5?在众多数理统计分布中,最起码的要求是熟悉正态分布与偏态分布。在众多数理统计分布中,最起码的要求是熟悉正态分布与偏态分布。?分布特征的判断方法,常用的方法是分布的假设检验,如正态性检验。分布特征的判断方法,常用的方法是分布的假设检验,如正态性检验。?正态分布的判断还可以根据统计图表、均数与中位数的差值大小和医学知识来进行粗略估计。正态分布的判断还可以根据统计图表、均数与中位数的差值大小和医学知识来进行粗略估计。分布特征的判断数据分布的检验指标名 例数 均数 标准差 偏度系数 P 值 峰度系数P 值 指标名 例数 均数

16、标准差 偏度系数 P 值 峰度系数P 值 血红蛋白(g/L)血红蛋白(g/L)98 111.9918.82 0.180 0.459 0.0250.958血小板(10血小板(109 9/L)/L)98 173.5887.11 1.353 0.000 1.8430.000白细胞(10白细胞(109 9/L)/L)98 6.79302.767 1.207 0.000 1.2020.013Mean=121.718Median=121.90数据的分布图示一Mean=101.5441Median=75.000数据的分布图示二?多数情况下,正常人群的生长发育指标、生理生化指标服从正态分布;而正常人群体内的微

17、量元素、有毒有害物质都服从偏态分布。多数情况下,正常人群的生长发育指标、生理生化指标服从正态分布;而正常人群体内的微量元素、有毒有害物质都服从偏态分布。?在临床工作中,与病人所患疾病相关的指标,其分布特征往往已发生改变,许多指标已不再服从正态分布。在临床工作中,与病人所患疾病相关的指标,其分布特征往往已发生改变,许多指标已不再服从正态分布。?如,正常人的血液指标服从正态分布,而血液病患者的血液指标却很少服从正态分布。如,正常人的血液指标服从正态分布,而血液病患者的血液指标却很少服从正态分布。医学知识的应用小结小结?在临床科研工作中,统计方法的正确应用与临床医生选用药物相似。医生在处方时,必须熟

18、悉药物适应症和禁忌症,并针对患者的具体病情选用药物。而统计方法的正确应用,也必须熟悉统计方法的应用条件,以保证统计分析结果可靠和真实。在临床科研工作中,统计方法的正确应用与临床医生选用药物相似。医生在处方时,必须熟悉药物适应症和禁忌症,并针对患者的具体病情选用药物。而统计方法的正确应用,也必须熟悉统计方法的应用条件,以保证统计分析结果可靠和真实。?因此,分析目的、数据的资料类型、数据的分布特征、临床科研设计方法与所涉及的数理统计条件等,是科研工作者在做统计分析前必须要考虑的问题。因此,分析目的、数据的资料类型、数据的分布特征、临床科研设计方法与所涉及的数理统计条件等,是科研工作者在做统计分析前

19、必须要考虑的问题。6?统计分析方法的正确应用与评价要点:统计分析方法的正确应用与评价要点:?(1)统计分析目的;统计分析目的;?(2)数据资料类型;数据资料类型;?(3)科研设计方案;科研设计方案;?(4)数据的分布特征与数理统计条件。数据的分布特征与数理统计条件。统计方法的正确应用与评价要点统计方法的正确应用与评价要点四、学习方法?1.掌握医学统计学的基本知识、基本概念、基本原理和基本方法掌握医学统计学的基本知识、基本概念、基本原理和基本方法,培养统计思维方法和能力。培养统计思维方法和能力。?2.掌握在临床科研工作中,各种统计学方法的正确应用,包括每种统计方法的适用范围、应用条件、结果解释和

20、临床意义。掌握在临床科研工作中,各种统计学方法的正确应用,包括每种统计方法的适用范围、应用条件、结果解释和临床意义。(一)学习方法?3.对数学公式及其推导过程不要求掌握和记忆,只需要理解其在适用范围、应用条件和临床结果解释中的作用。对数学公式及其推导过程不要求掌握和记忆,只需要理解其在适用范围、应用条件和临床结果解释中的作用。?4.熟悉常用统计软件的操作和使用,不要求具有较强的统计计算能力。熟悉常用统计软件的操作和使用,不要求具有较强的统计计算能力。(一)学习方法1.孙振球主编,徐勇勇副主编孙振球主编,徐勇勇副主编.医学统计学医学统计学(供研究生用供研究生用).人民卫生出版社人民卫生出版社20

21、02.82.王家良主编王家良主编.临床流行病学临床流行病学(第二版第二版).上海科学技术出版社上海科学技术出版社.2001(二)教学参考书3.杨树勤主编杨树勤主编.卫生统计学卫生统计学(第三版第三版).人民卫生出版社人民卫生出版社.19934.陈 峰编著陈 峰编著.医用多元统计分析方法医用多元统计分析方法.中国统计出版社中国统计出版社.20015.方积乾主编方积乾主编.医学统计学与电脑实验医学统计学与电脑实验(第二版第二版).上海科学技术出版社上海科学技术出版社.2001 6.陆守曾主编陆守曾主编.医学统计学医学统计学.中国统计出版社中国统计出版社.20017.徐勇勇主编徐勇勇主编.医学统计学医学统计学.高等教育出版社高等教育出版社.20018.王家良主编王家良主编.循证医学循证医学.人民卫生出版社人民卫生出版社.2001(二)教学参考书7Welcome to join us!Tel:028-

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁