统计学CH统计学绪论.pptx

上传人:莉*** 文档编号:90013681 上传时间:2023-05-13 格式:PPTX 页数:61 大小:209.22KB
返回 下载 相关 举报
统计学CH统计学绪论.pptx_第1页
第1页 / 共61页
统计学CH统计学绪论.pptx_第2页
第2页 / 共61页
点击查看更多>>
资源描述

《统计学CH统计学绪论.pptx》由会员分享,可在线阅读,更多相关《统计学CH统计学绪论.pptx(61页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、会计学1统计学统计学CH统计学绪论统计学绪论第十一章第十一章多因素试验资料的方差分析多因素试验资料的方差分析第十二章第十二章重复测量设计资料的方差分析重复测量设计资料的方差分析第十三章第十三章协方差分析协方差分析第十四章第十四章多变量数据的统计描述与统计推断多变量数据的统计描述与统计推断第十五章第十五章多元线性回归分析多元线性回归分析第十六章第十六章logistic回归分析回归分析第十七章第十七章生存分析生存分析第十八章第十八章判别分析判别分析第十九章第十九章聚类分析聚类分析第二十章第二十章主成分分析与因子分析主成分分析与因子分析第二十一章第二十一章典型相关分析典型相关分析第二十二章第二十二章

2、常用统计预测方法常用统计预测方法第二十三章第二十三章常用综合评价方法常用综合评价方法第二十四章第二十四章量表研制与量表资料的统计分析方法量表研制与量表资料的统计分析方法第二篇第二篇 高级统计方法高级统计方法第1页/共61页第三篇第三篇 医学科学研究设计医学科学研究设计第二十五章第二十五章医学科学研究设计概述医学科学研究设计概述第二十六章第二十六章观察性研究设计观察性研究设计第二十七章第二十七章实验研究设计实验研究设计第二十八章第二十八章临床试验研究设计临床试验研究设计第四篇第四篇 数据处理与统计软件应用数据处理与统计软件应用第二十九章第二十九章数据处理的一般原则与方法数据处理的一般原则与方法第

3、三十章第三十章SPSS统计软件统计软件第三十一章第三十一章SAS统计软件统计软件第三十二章第三十二章Stata统计软件统计软件第三十三章第三十三章数据处理的其他统计方法数据处理的其他统计方法附录一附录一医学人口统计与疾病统计常用指标医学人口统计与疾病统计常用指标附录二附录二统计用表统计用表附录三附录三英汉名词对照英汉名词对照第2页/共61页4(1)(1)具有继承性和创新性(2)具有针对性和实用性教材特点:第3页/共61页51。自备作业本,考试卷面成绩。自备作业本,考试卷面成绩90分,课外分,课外作业作业10分,考试前交作业,不交作业者分,考试前交作业,不交作业者不准参加考试。不准参加考试。2。

4、自备计算器,如有兴趣,可自学。自备计算器,如有兴趣,可自学SPSS11.5。学 习 要 求第4页/共61页6 第一章第一章 绪论绪论 第一节第一节 统计学的几个基本概念统计学的几个基本概念 第二节第二节 医学统计工作的基本步骤医学统计工作的基本步骤 第三节第三节 统计学发展简史统计学发展简史第5页/共61页7统计学(Statistics)是一门研究数据的搜集、整理、分析是一门研究数据的搜集、整理、分析是一门研究数据的搜集、整理、分析是一门研究数据的搜集、整理、分析的科学的科学的科学的科学。第6页/共61页8 定义:定义:是研究医学数据的搜集、整理、分析是研究医学数据的搜集、整理、分析的科学的科

5、学。特点:特点:1、资料的数字化,数量反映质量、资料的数字化,数量反映质量2、由偶然性(不确定性)的剖析、由偶然性(不确定性)的剖析中,发现事物的必然性(确定中,发现事物的必然性(确定性)性)医学统计学(medical statistics)第7页/共61页9医学统计学医学统计学学习内容:学习内容:1、统计学的基本原理、方法、统计学的基本原理、方法基础基础(学(学习重点)习重点)2、业务统计、业务统计应用应用(如:临床医学、预(如:临床医学、预防医学、卫生事业管理)防医学、卫生事业管理)第8页/共61页10医学统计学医学统计学目的:目的:医学科研的数学工具医学科研的数学工具核心:核心:计算和比

6、较反映群体综合数量特征的计算和比较反映群体综合数量特征的统计指标。统计指标。例如:期望寿命例如:期望寿命反映人群健康状况的指标反映人群健康状况的指标婴儿死亡率婴儿死亡率反映卫生服务质量的指标反映卫生服务质量的指标第9页/共61页11第一节第一节 统计学的几个统计学的几个基本概念基本概念第10页/共61页12一、个体与变量、总体与样本第11页/共61页13个体个体(观察单位等):统计研究(观察单位等):统计研究中的基本中的基本 单位单位据研究目的而定据研究目的而定变量变量(观察指标等):要研究的(观察指标等):要研究的个体特征个体特征 例如:身高、体重、性别、例如:身高、体重、性别、血型、反血型

7、、反 应、疗效等应、疗效等第12页/共61页14变量值:变量值:变量值:变量值:变量的取值变量的取值变量的取值变量的取值例如:身高例如:身高例如:身高例如:身高 1.651.65米米米米 体重体重体重体重 5252公斤公斤公斤公斤性别性别性别性别 女女女女血型血型血型血型“O”O”型型型型反应反应反应反应 阴性阴性阴性阴性疗效疗效疗效疗效 好转好转好转好转资料:资料:资料:资料:由多个变量值构成由多个变量值构成由多个变量值构成由多个变量值构成例如:血糖的样本资料例如:血糖的样本资料例如:血糖的样本资料例如:血糖的样本资料第13页/共61页15同质:同质:同质:同质:给个体规律的一些相同性质(使

8、研究变量的给个体规律的一些相同性质(使研究变量的给个体规律的一些相同性质(使研究变量的给个体规律的一些相同性质(使研究变量的 已知影响因素齐同)已知影响因素齐同)已知影响因素齐同)已知影响因素齐同)如:如:如:如:变量为身高,长沙市变量为身高,长沙市变量为身高,长沙市变量为身高,长沙市20042004年年年年7 7岁正常男童即为同质岁正常男童即为同质岁正常男童即为同质岁正常男童即为同质变异:变异:变异:变异:同质个体的变量值的差异同质个体的变量值的差异同质个体的变量值的差异同质个体的变量值的差异如:长沙市如:长沙市如:长沙市如:长沙市20042004年年年年7 7岁正常男童的身高值各不相同岁正

9、常男童的身高值各不相同岁正常男童的身高值各不相同岁正常男童的身高值各不相同特点:特点:特点:特点:生物个体变异较大(原因:难于掌握的因素生物个体变异较大(原因:难于掌握的因素生物个体变异较大(原因:难于掌握的因素生物个体变异较大(原因:难于掌握的因素 造成。如:影响身高的有遗传、营养等因素)造成。如:影响身高的有遗传、营养等因素)造成。如:影响身高的有遗传、营养等因素)造成。如:影响身高的有遗传、营养等因素)第14页/共61页16定义:定义:根据研究目的确定的同质个根据研究目的确定的同质个体(变量体(变量 值)的全体。值)的全体。例如:长沙市例如:长沙市例如:长沙市例如:长沙市20042004

10、年年年年7 7岁正常男童(身高值)的全体岁正常男童(身高值)的全体岁正常男童(身高值)的全体岁正常男童(身高值)的全体 有限总体(有限总体(有限总体(有限总体(finite populationfinite populationfinite populationfinite population):):):):明确规定了空明确规定了空明确规定了空明确规定了空间、时间、人群范围内有限个观察单位的总体。间、时间、人群范围内有限个观察单位的总体。间、时间、人群范围内有限个观察单位的总体。间、时间、人群范围内有限个观察单位的总体。无限总体(无限总体(无限总体(无限总体(infinite populat

11、ioninfinite populationinfinite populationinfinite population):):):):没有时间没有时间没有时间没有时间和空间范围的限制,其观察单位的全体数只是理和空间范围的限制,其观察单位的全体数只是理和空间范围的限制,其观察单位的全体数只是理和空间范围的限制,其观察单位的全体数只是理论上存在,因而可视为论上存在,因而可视为论上存在,因而可视为论上存在,因而可视为“无限无限无限无限”的总体。的总体。的总体。的总体。总体总体(population):第15页/共61页17定义:定义:从总体中随机抽得的部分观察单位,从总体中随机抽得的部分观察单位,

12、其实测值的集合其实测值的集合例如:长沙市例如:长沙市2002年年7岁正常男童中随机岁正常男童中随机抽取抽取200名,其身高值构成一个样本名,其身高值构成一个样本样本样本(sample)第16页/共61页18抽样研究抽样研究样本信息样本信息(样本统计指标、统计量样本统计指标、统计量)总体特征总体特征(总体统计指标、参数)(总体统计指标、参数)推推断断注意:获取样本信息是注意:获取样本信息是手段手段,推断总体,推断总体 特征是特征是目的。目的。第17页/共61页19二、二、变量与资料 变量分类是资料分类的基变量分类是资料分类的基础础 第18页/共61页20计量资料:计量资料:(measuremen

13、t measurement datadata)又称定量资料或数值变)又称定量资料或数值变量资料。为测定每个观察单位量资料。为测定每个观察单位某项指标的大小而获得的资料。某项指标的大小而获得的资料。其变量值是定量的,表现为数其变量值是定量的,表现为数值大小,一般有度量衡单位。值大小,一般有度量衡单位。例如:身高资料、体重资料例如:身高资料、体重资料 第19页/共61页21 计计计计数数数数资资资资料料料料(enumeration enumeration enumeration enumeration datadatadatadata)又又又又称称称称定定定定性性性性资资资资料料料料或或或或无无无

14、无序序序序分分分分类类类类变变变变量量量量资资资资料料料料。为为为为将将将将观观观观察察察察单单单单位位位位按按按按某某某某种种种种属属属属性性性性或或或或类类类类别别别别分分分分组组组组计计计计数数数数,分分分分组组组组汇汇汇汇总总总总各各各各组组组组观观观观察察察察单单单单位位位位数数数数后后后后而而而而得得得得到到到到的的的的资资资资料料料料。其其其其变变变变量量量量值值值值是是是是定定定定性性性性的的的的,表表表表现现现现为为为为互不相容的属性或类别。互不相容的属性或类别。互不相容的属性或类别。互不相容的属性或类别。二分类:如性别、生死、疾病有无;二分类:如性别、生死、疾病有无;多分类

15、:多分类:如如A、B、O、AB血型血型。第20页/共61页22等等等等级级级级资资资资料料料料(ranked ranked ranked ranked datadatadatadata)又又又又称称称称半半半半定定定定量量量量资资资资料料料料或或或或有有有有序序序序分分分分类类类类变变变变量量量量资资资资料料料料。为为为为将将将将观观观观察察察察单单单单位位位位按按按按某某某某种种种种属属属属性性性性的的的的不不不不同同同同程程程程度度度度分分分分成成成成等等等等级级级级后后后后分分分分组组组组计计计计数数数数,分分分分类类类类汇汇汇汇总总总总各各各各组组组组观观观观察察察察单单单单位位位位数

16、数数数后后后后而而而而得得得得到到到到的的的的资资资资料料料料。其其其其变变变变量量量量值值值值具具具具有有有有半半半半定定定定量量量量性性性性质质质质,表表表表现现现现为等级大小或属性程度。为等级大小或属性程度。为等级大小或属性程度。为等级大小或属性程度。例例例例如如如如:观观观观察察察察用用用用某某某某药药药药治治治治疗疗疗疗某某某某病病病病患患患患者者者者的的的的疗疗疗疗效效效效,以以以以每每每每名名名名患患患患者者者者为为为为观观观观察察察察单位,结果可分为治愈、显效、好转、无效四级。单位,结果可分为治愈、显效、好转、无效四级。单位,结果可分为治愈、显效、好转、无效四级。单位,结果可分

17、为治愈、显效、好转、无效四级。统计分析方法的选用,是与资料类型密切联系的。统计分析方法的选用,是与资料类型密切联系的。统计分析方法的选用,是与资料类型密切联系的。统计分析方法的选用,是与资料类型密切联系的。第21页/共61页23资料分类可互相转换资料分类可互相转换定定 量量 半定量(多分类)半定量(多分类)二二 分分 类类第22页/共61页24 例例如如:测测得得5人人的的WBC(个个/m3)数如下)数如下:3000 6000 5000 8000 12000 3000 6000 5000 8000 12000 数值变量数值变量 过低过低 正常正常 正常正常 正常正常 异常异常 分类变量分类变量

18、 若按正常若按正常若按正常若按正常3 3 3 3人,异常人,异常人,异常人,异常2 2 2 2人分组人分组人分组人分组二分类变量二分类变量二分类变量二分类变量 若按过低若按过低若按过低若按过低1 1 1 1人,正常人,正常人,正常人,正常3 3 3 3人,过高人,过高人,过高人,过高1 1 1 1人分组人分组人分组人分组等级资料等级资料等级资料等级资料第23页/共61页25三、误三、误 差差第24页/共61页26定义:定义:实测值与真值之差。实测值与真值之差。1、随机误差:随机误差:不恒定的、随机变化的误差,由多不恒定的、随机变化的误差,由多种尚无法控制的因素引起。无方向性。种尚无法控制的因素

19、引起。无方向性。主要指重复测量产生的测量误差和抽样过程主要指重复测量产生的测量误差和抽样过程产生的抽样误差。产生的抽样误差。通常,测量误差远小于抽样误差,因此统计通常,测量误差远小于抽样误差,因此统计学主要考虑学主要考虑抽样误差抽样误差。第25页/共61页27非随机误差又可分为系统误差和非系统误差两类:非随机误差又可分为系统误差和非系统误差两类:2、系统误差系统误差:实验过程中产生的误差,它的值或实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可能掌握的,大小变化有方向性。往往是可知的或可能掌握的,大小变化有方向性

20、。3、非系统误差(过失误差)非系统误差(过失误差):研究者偶然失误而研究者偶然失误而造成的误差。造成的误差。第26页/共61页28四、频率与概率四、频率与概率第27页/共61页29 1 1频率(frequencyfrequency),假假假假设设设设在在在在相相相相同同同同条条条条件件件件下下下下,独独独独立立立立地地地地重重重重复复复复做做做做n n次次次次试试试试验验验验,A A在在在在n n次次次次试试试试验验验验中中中中出出出出现现现现了了了了mm次次次次,则则则则比比比比值值值值mm/n n称称称称为为为为随随随随机机机机事事事事件件件件A A在在在在n n次次次次试试试试验验验验中

21、中中中出出出出现现现现的的的的频频频频率率率率。当试验重复很多次时,有当试验重复很多次时,有当试验重复很多次时,有当试验重复很多次时,有 第28页/共61页30 2概概率率(probability):概概率率是是度度量量随随机机事件发生可能性大小的一个数值。事件发生可能性大小的一个数值。设在相同条件下,独立地重复设在相同条件下,独立地重复n次试验,随机次试验,随机事件事件A出现出现 次,则称次,则称为随机事件为随机事件A出现的频出现的频率。当率。当n逐渐增大时,频率逐渐增大时,频率 趋向于一个常数,则趋向于一个常数,则称该常数为随机事件称该常数为随机事件A的概率,可记为的概率,可记为,简记,简

22、记为为。第29页/共61页31取值:第30页/共61页32 频频率率是就样本而言的,而概率从总体的意义上说的,m/n是概率 的估计值。试验次数越多,估计越可靠。第31页/共61页33小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将 称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为很可能不发生。第32页/共61页34第二节第二节医学统计工医学统计工作的基本步骤作的基本步骤第33页/共61页35主要指统计设计,是影响研究能否成主要指统计设计,是影响研究能否成主要指统计设计,是影响研究能否成主要指统计设计,是影响研究能否成功的最关键环节,是提高观察或实验质

23、量功的最关键环节,是提高观察或实验质量功的最关键环节,是提高观察或实验质量功的最关键环节,是提高观察或实验质量的重要保证。的重要保证。的重要保证。的重要保证。内容:内容:内容:内容:包括对资料搜集、整理和分析包括对资料搜集、整理和分析包括对资料搜集、整理和分析包括对资料搜集、整理和分析全过程的设想与安排全过程的设想与安排全过程的设想与安排全过程的设想与安排。一、一、设计设计 第34页/共61页36 3对照(对照(control)实验设计的三个基本原则的三个基本原则1随机化(随机化(randomizedsampling)2.重复(重复(repleation)第35页/共61页37目的:目的:目的

24、:目的:指应采取措施使能取得准确可靠的原始指应采取措施使能取得准确可靠的原始指应采取措施使能取得准确可靠的原始指应采取措施使能取得准确可靠的原始 数据。数据。数据。数据。资料来源:资料来源:资料来源:资料来源:统计报表。统计报表。统计报表。统计报表。经常性工作记录。经常性工作记录。经常性工作记录。经常性工作记录。专题调查或实验研究。专题调查或实验研究。专题调查或实验研究。专题调查或实验研究。统计年鉴和统计数据专辑。统计年鉴和统计数据专辑。统计年鉴和统计数据专辑。统计年鉴和统计数据专辑。要求:要求:要求:要求:1 1、随机性、随机性、随机性、随机性2 2、样本含量足够大、样本含量足够大、样本含量

25、足够大、样本含量足够大二、搜集资料二、搜集资料第36页/共61页38三整理资三整理资料料是将原始数据净化,系统化和条理化,是将原始数据净化,系统化和条理化,以便为下一步计算和分析打好基础的过程。以便为下一步计算和分析打好基础的过程。第37页/共61页39四分析资料(统计分析)四分析资料(统计分析)四分析资料(统计分析)四分析资料(统计分析)目目的的 :在在表表达达数数据据特特征征的的基基础础上上,阐阐明明事事物物的的内内在在联联系系和和规规律律性性。包括两方面:包括两方面:1.统统计计描描述述:用用统统计计指指标标、统统计计图图表表对对资资料料的的数数量量特特征征及及分分布布规规律律进行测定和

26、描述。进行测定和描述。2.统统计计推推断断:用用样样本本信信息息推推断断总总体体特征:特征:参数估计,参数估计,假设检验。假设检验。第38页/共61页40统计描述统计描述统计推断统计推断指标描述指标描述图表描述图表描述参数估计参数估计假设检验假设检验统计分析统计分析第39页/共61页41第三节统计学发展简史第三节统计学发展简史第40页/共61页42 1.早期 公元前3050年古埃及人为修建金字塔筹集建筑费,对全国的人口和财产进行了普查。第41页/共61页43 19世纪,应用数学家为解决赌徒们在博彩中出现的输赢概率问题逐渐形成和发展了概率论,从而为统计学的发展奠定了坚实的基础。2.近代第42页/

27、共61页44 计计算算机机和和统统计计软软件件如如SASSAS、SPSSSPSS的的出出现现 使使统统计计学学得得到到了了突突飞飞猛猛进的发展。进的发展。3.现代第43页/共61页45生物统计学生物统计学著名著名 历史人物历史人物其人其事其人其事第44页/共61页461.数学神童 Gauss(17771855)第45页/共61页47 德国数学神童高斯 在孩童时就能够快速计算出“1+2+3+100=5050”的答案。他对统计的主要贡献除了正态分布(normal distribution)外,还有算术均数、几何均数、二项分布理论和最小二乘法等。第46页/共61页48 其实,在Gauss 之前就有人

28、发现了正态分布,但只有他很快将之应用于天文学研究,并使其应用价值广为人知,故正态分布又称高斯分布(Gaussian distribution)。第47页/共61页492.从酿酒师到统计 主管的Gosset(1876-1937)第48页/共61页50 1899年Gosset在英国都柏林一酿酒公司做酿酒师,在对小样本进行质量控制的研究中发现了t 分布,其论文1908年以Student为笔名发表。自此开创了小样本统计的新纪元。第49页/共61页51 非常有趣的现象是,Gosset的数学欠佳,因而不能自己解决 t 检验的理论和应用问题,其最后的完善,是由Fisher,Neyman 和E Pearson

29、 先后完成的。正如后人评价 的 那 样:“Gosset提出实际问题,Fisher 和 E Pearson 将其转成统计问题,Neyman用数学解决问题”。第50页/共61页52 实实际际上上是是1925年年Fisher在在t分分布布的的应应用用一文中定义的。一文中定义的。大家熟知的公式:第51页/共61页53 3.医院统计与卫生管理统计的先驱F.Nightingale(1820-1910)第52页/共61页54 1854年9月南丁格尔出任土耳其英国总医院的女护士总管。鉴于医院没有任何医疗统计,登记也十分简单,仅仅记载下某年某日一个人死亡了。因而,她紧急提议建立医院的医疗统计室。她认为图表是她发

30、明的一种表达形式。第53页/共61页55 1857年底,按照南丁格尔的建议在陆军部建立了四个下属委员会,陆军部统计委员会是其中之一。1858年她当选英国皇家统计学会会员,是该学会最早的女会员。1860年,第四届国际统计大会议题之一就是“南丁格尔小姐的医院统计标准化计划”,南丁格尔在会上报告了她的论文“医院统计学”。1862年,维多利亚出版社出版了她的著作医院统计与医院规划。第54页/共61页564.把统计作为“披荆斩棘”工具的人类学家Galton第55页/共61页57 “回归”一词来源于Galton的自然遗传。他是达尔文的表兄弟,人类学家,早年学医,曾在剑桥大学念书。尽管他的数学不是很好,但在人类学和优生学研究中萌发的统计学思想,对生物统计的发展产生了深远影响,如“回归”、双变量正态分布的概念等。第56页/共61页58 当人类科学的探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计学工具可以为其开辟一条前进的通道。F Galton(1822-1911)第57页/共61页59学习方法学习方法n n掌握基本概念掌握基本概念n n重在正确应用重在正确应用n n 选择恰当方法选择恰当方法n n 满足应用条件满足应用条件n n 善于解释结果善于解释结果第58页/共61页60教学目的教学目的培养统计思维培养统计思维用于医学科研用于医学科研第59页/共61页61第60页/共61页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁