分类资料的统计分析课件.ppt

上传人:石*** 文档编号:46612258 上传时间:2022-09-27 格式:PPT 页数:28 大小:484.50KB
返回 下载 相关 举报
分类资料的统计分析课件.ppt_第1页
第1页 / 共28页
分类资料的统计分析课件.ppt_第2页
第2页 / 共28页
点击查看更多>>
资源描述

《分类资料的统计分析课件.ppt》由会员分享,可在线阅读,更多相关《分类资料的统计分析课件.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、关于分类资料的统计分析现在学习的是第1页,共28页情景资料情景资料1、调查了我班视力情况,近视者、调查了我班视力情况,近视者30人,计算近视率?人,计算近视率?2、计算我班的血型构成。、计算我班的血型构成。3、研究某药效果,治疗了、研究某药效果,治疗了5人,治愈人,治愈3人,如何描述其有效水平?人,如何描述其有效水平?4、某慢性病在深圳的死亡率为、某慢性病在深圳的死亡率为1.2%,在上海为,在上海为3.1%,如何比较该,如何比较该病在两地的死亡水平。病在两地的死亡水平。现在学习的是第2页,共28页(一)常用的相对数(一)常用的相对数1 1、率:说明某现象发生的频率或强度。、率:说明某现象发生的

2、频率或强度。率率 =l K K 常有百分率、千分率、万分率、十万分率等。常有百分率、千分率、万分率、十万分率等。l 选择原则:选择原则:习惯用法习惯用法 使得到的数字一般保留使得到的数字一般保留1-21-2位整数,以便阅读。位整数,以便阅读。现在学习的是第3页,共28页2、构成比、构成比 说明某一事物内部各组成部分所占的比重。说明某一事物内部各组成部分所占的比重。构成比构成比 =现在学习的是第4页,共28页3、相对比、相对比 说明两事物之间的对比关系说明两事物之间的对比关系。相对比相对比 =A=A事物事物 /B/B事物事物 A A、B B可以是绝对数,也可是相对数;可以是绝对数,也可是相对数;

3、计算结果可是小数,也可是倍数。计算结果可是小数,也可是倍数。l 常用的有三种:常用的有三种:(1 1)对比指标:同类事物指标的比值。如性别比。)对比指标:同类事物指标的比值。如性别比。(2 2)关系指标:非同类事物指标的比值。)关系指标:非同类事物指标的比值。如医护人员与病床数之比。如医护人员与病床数之比。(3 3)计划完成指标)计划完成指标现在学习的是第5页,共28页4、注意事项、注意事项 1 1、分母不可过小。、分母不可过小。2 2、不能以比代率、不能以比代率 3 3、如何计算合计率(总率)。、如何计算合计率(总率)。4 4、比较相对数时,注意资料的可比性。、比较相对数时,注意资料的可比性

4、。5 5、样本率的比较要进行假设检验。、样本率的比较要进行假设检验。某化工厂慢支患病与工龄的关系某化工厂慢支患病与工龄的关系 工龄工龄 检查人数检查人数 患者数患者数 百分比(百分比(%)患病率(患病率(%)1 340 17 11.56 5.00 5 254 30 20.41 11.81 10 432 73 49.66 16.90 15 136 27 18.37 19.85 合计合计 1162 147 100.00 12.65现在学习的是第6页,共28页(二)标准化法(二)标准化法 甲乙两医院某传染病各型治愈率比较甲乙两医院某传染病各型治愈率比较 病型病型 甲院甲院 乙院乙院 病人数病人数 治

5、愈数治愈数 治愈率(治愈率(%)病人数病人数 治愈数治愈数 治愈率(治愈率(%)普通型普通型 300 180 60.0 100 65 65.5300 180 60.0 100 65 65.5 重型重型 100 40 40.0 300 135 45.0100 40 40.0 300 135 45.0 爆发型爆发型 100 20 20.0 100 25 25.0100 20 20.0 100 25 25.0 合计合计 500 240 48.0 500 225 45.0500 240 48.0 500 225 45.0 要比较甲乙两医院某传染病治愈率,要先消除病情构成的影响,即选取要比较甲乙两医院某

6、传染病治愈率,要先消除病情构成的影响,即选取一种共同内部构成作为计算总率的基础,这种方法称为率的一种共同内部构成作为计算总率的基础,这种方法称为率的标准化法标准化法,这这样计算得到的率称为样计算得到的率称为标准化率(标化率、调整率)。标准化率(标化率、调整率)。现在学习的是第7页,共28页根据资料不同,有直接法和间接法两种。根据资料不同,有直接法和间接法两种。直接法直接法步骤:步骤:1 1、选取一个标准的内部构成选取一个标准的内部构成,可以是标准人口数,也可是标准人,可以是标准人口数,也可是标准人口构成比,还可以用标准阳性率(间接法口构成比,还可以用标准阳性率(间接法)。标准来源:。标准来源:

7、A A 具有代表性的、较稳定的、数量较大的人群作标准。时具有代表性的、较稳定的、数量较大的人群作标准。时 间最好与被标化资料一致或较接近。间最好与被标化资料一致或较接近。B B 以相比资料本身数据为标准,如甲院或乙院的数据、以相比资料本身数据为标准,如甲院或乙院的数据、或两院合并的数据。或两院合并的数据。2 2、计算标化率。计算标化率。直接法现在学习的是第8页,共28页续续 例:以甲院数据为标准计算乙院治愈率的标化率(直接法)例:以甲院数据为标准计算乙院治愈率的标化率(直接法)乙院某传染病标化治愈率计算乙院某传染病标化治愈率计算 病型病型 标准病人数标准病人数 原治愈率(原治愈率(%)预期治愈

8、人数预期治愈人数 普通型普通型 300 65.0 195 300 65.0 195 重型重型 100 45.0 45100 45.0 45 爆发型爆发型 100 25.0 25 100 25.0 25 合计合计 500 -265500 -265 乙院某传染病标化治愈率乙院某传染病标化治愈率=265/500=0.53=53.0%265/500=0.53=53.0%所以在共同的构成下,甲院治愈率为所以在共同的构成下,甲院治愈率为48%48%,乙院治愈率为,乙院治愈率为53%53%,因此对该种传染病的治疗,因此对该种传染病的治疗率是乙院较高率是乙院较高.现在学习的是第9页,共28页 间接法:间接法:

9、间接法是在不知道被比较两者的分率,或某些组的调查人数太少,间接法是在不知道被比较两者的分率,或某些组的调查人数太少,分率不可靠时采用的方法。分率不可靠时采用的方法。如下例:已知甲地死亡总数为如下例:已知甲地死亡总数为845845人,乙地为人,乙地为679679人,以及两地各人,以及两地各 年龄组人口数,比较两地死亡水平。年龄组人口数,比较两地死亡水平。甲乙两地死亡标化率计算甲乙两地死亡标化率计算年龄组年龄组 标准死亡率标准死亡率 甲地甲地 乙地乙地 (%)人数人数 预期死亡数预期死亡数 人数人数 预期死亡数预期死亡数 0 62.6 9300 582 4800 300 0 62.6 9300 5

10、82 4800 300 5 3.9 12200 48 6600 26 5 3.9 12200 48 6600 26 20 6.5 19000 124 35300 230 20 6.5 19000 124 35300 230 40 12.7 7600 97 2800 36 40 12.7 7600 97 2800 36 60 41.3 1900 78 500 21 60 41.3 1900 78 500 21 合计合计 15.4 50000 929 50000 61315.4 50000 929 50000 613 现在学习的是第10页,共28页计算标化死亡比(计算标化死亡比(SMRSMR):)

11、:SMR=SMR=实际死亡数实际死亡数 /预期死亡数预期死亡数 SMRSMR1 1,说明标化率大于标准组,说明标化率大于标准组 SMRSMR1 1,说明标化率小于标准组,说明标化率小于标准组 甲地甲地SMR=845 929=0.91SMR=845 929=0.91 甲地标化死亡率甲地标化死亡率 =15.4%0.91=14.03%=15.4%0.91=14.03%乙地乙地SMR=679 613=1.14SMR=679 613=1.14 乙地标化死亡率乙地标化死亡率 =15.4%1.14=17.58%=15.4%1.14=17.58%现在学习的是第11页,共28页1 1、根据资料选用相应的方法。、

12、根据资料选用相应的方法。2 2、标化率的大小随选定的标准的不同而不同。、标化率的大小随选定的标准的不同而不同。3 3、率的标化的目的在比较,标化率的差别,只反映资料、率的标化的目的在比较,标化率的差别,只反映资料 间率的高低、大小的相对关系,并不反映资料间率的间率的高低、大小的相对关系,并不反映资料间率的 实际水平。实际水平。4 4、如不计算标化率,而分别比较各组的分率,也可得到、如不计算标化率,而分别比较各组的分率,也可得到 正确结论,但不能比较总率的大小。正确结论,但不能比较总率的大小。5 5、被标化的样本率若要进一步推断总体结果,还需对标、被标化的样本率若要进一步推断总体结果,还需对标

13、化后的样本率作假设检验。化后的样本率作假设检验。注意事项注意事项现在学习的是第12页,共28页练习练习 1 1、描述计数资料的统计指标是;、描述计数资料的统计指标是;A.平均数平均数 B.相对数相对数 C.标准差标准差 D标准误标准误 E.变异系数变异系数 2 2、某一事件发生强度的指标应选、某一事件发生强度的指标应选 A A 率率 B B 构成比构成比 C C 相对比相对比 D D 绝对数绝对数 E E 以上都不对以上都不对 3 3、某病发病率的分子是、某病发病率的分子是 A A 是指一定时间内该病发生的新病例是指一定时间内该病发生的新病例 B B 是指该病发生的新、老病例是指该病发生的新、

14、老病例 C C 是指该病的老病例是指该病的老病例 D D 是指现患病例是指现患病例 E E 是指现患病例和老病例是指现患病例和老病例 现在学习的是第13页,共28页练习4 4、下列下列说说法哪个是法哪个是错误错误的的 A A 四个分率的四个分率的总总率率为为四个分率之和除以四个分率之和除以4 4 B B 假假设检验设检验的的结结果不可能性果不可能性100%100%的正确的正确 C C 率和比不能混用率和比不能混用 D D 当当n n较较少少时时,最好用最好用绝对绝对数和相数和相对对数一起表示相数一起表示相应应的的计计数数资资料料 E E 标标准准误误的本的本质质是是标标准差准差5、欲欲比比较较

15、甲甲,乙乙两两矿矿工工人人矽矽肺肺患患病病的的严严重重程程度度,但但甲甲,乙乙两两矿矿工工人人的的工工龄龄分分布布不不同同,此时适当的比较方法是此时适当的比较方法是:A.分工龄进行比较分工龄进行比较 B.用两个率比较的用两个率比较的X2检验检验 C.不具可比性不具可比性,不能比较不能比较 D.对工龄进行标化后再比较对工龄进行标化后再比较现在学习的是第14页,共28页练习练习 6、关于相对数,下列那项不正确、关于相对数,下列那项不正确 A 是分类变量资料的统计描述指标是分类变量资料的统计描述指标 B 各部分的构成比总和为各部分的构成比总和为100%C 计算相对数的分母不宜过小计算相对数的分母不宜

16、过小 D 率可表示事物内部某一部分所占的比重率可表示事物内部某一部分所占的比重 7 7、相对比是、相对比是A.BA.B两个有关指标之比,两个指标要求两个有关指标之比,两个指标要求 A A 性质必须相同性质必须相同 B B 性质必须不同性质必须不同 C C 性质可以相同也可以不同性质可以相同也可以不同 D D 性质最好相同性质最好相同 E E 以上都不是以上都不是现在学习的是第15页,共28页8 8、经调查得甲乙两地的冠心病粗死亡率都为、经调查得甲乙两地的冠心病粗死亡率都为40/40/万万,按年龄构成标化后按年龄构成标化后,甲地甲地冠心病标化死亡率为冠心病标化死亡率为45/45/万万,乙地为乙地

17、为31/31/万,因此可以认为万,因此可以认为 A.A.甲地年龄别人口构成较乙地年轻甲地年龄别人口构成较乙地年轻 B.B.乙地年龄别人口构成较甲地年轻乙地年龄别人口构成较甲地年轻 C.C.甲地冠心病的诊断较乙地准确甲地冠心病的诊断较乙地准确 D.D.乙地冠心病的诊断较甲地准确乙地冠心病的诊断较甲地准确 E.E.甲地年轻人患冠心病较乙地多甲地年轻人患冠心病较乙地多9、是非题:、是非题:用某药治疗某病用某药治疗某病,治了治了5例例,治愈治愈4例例,则该药的治愈率为则该药的治愈率为80%.现在学习的是第16页,共28页一、率的抽样误差一、率的抽样误差 一般地,从一个阳性率一般地,从一个阳性率为的总体

18、中随机抽取含量为为的总体中随机抽取含量为n n的样本,的样本,则样本中的阳性数则样本中的阳性数X X服从二项分布服从二项分布B B(n n,),样本阳性率),样本阳性率p p与总与总体率体率之间也存在抽样误差,其大小用样本率的标准差来表示,之间也存在抽样误差,其大小用样本率的标准差来表示,即率的标准误。即率的标准误。总体标准误总体标准误 s=(1)/n 样本标准误样本标准误 Sp=p(1p)/n 总体率的估计和卡方检验总体率的估计和卡方检验现在学习的是第17页,共28页1 1、查表法、查表法 适用:适用:n50n50时时 2 2、近似正态法、近似正态法 适用条件:适用条件:npnp和和n(1-

19、p)5 n(1-p)5 时,样本率的分布近似正时,样本率的分布近似正态分布,可按正态分布原理估计总体率的可信区间。态分布,可按正态分布原理估计总体率的可信区间。95%CI95%CI:p 1.96 Spp 1.96 Sp 99%CI 99%CI:p 2.58 Spp 2.58 Sp二、总体率的估计二、总体率的估计现在学习的是第18页,共28页 1 1、直接计算概率进行比较、直接计算概率进行比较 2 2、u u检验适用条件:检验适用条件:npnp和和n(1-p)5n(1-p)5时,样本率的分布近似正态分时,样本率的分布近似正态分布。布。3 3、2 2检验:用于检验:用于v检验某个连续变量的分布是否

20、与某种理论分布一致,如是否符合正态检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布等分布等 推断多个样本率或构成比之间又无差别推断多个样本率或构成比之间又无差别 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检检验验两两种种方方法法的的结结果果是是否否一一致致,如如两两种种诊诊断断方方法法对对同同一一批批人人进进行诊断,其诊断结果是否一致行诊断,其诊断结果是否一致 三、率的假设检验三、率的假设检验现在学习的是第19页,共28页基本思想基本思想吸烟者与不吸烟者的慢性支气管炎患病率比较吸烟者与不吸烟者的慢性支气管炎患

21、病率比较 分组分组 患病人数患病人数 未患病人数未患病人数 合计合计 患病率(患病率(%)吸烟者吸烟者 4343(33.8633.86)162162(171.14171.14)205 205(n1n1)21.021.0 不吸烟者不吸烟者 1313(22.1422.14)121121(111.86111.86)134 134(n2n2)9.7 9.7 合计合计 5656(m1m1)283 283(m2m2)339339(N N)16.516.5 红色为实际数(红色为实际数(A A),蓝色为理论数(),蓝色为理论数(T T)。)。假设吸烟与慢支之间无关,则两者总体的的患病率相同,暂时按假设吸烟与慢

22、支之间无关,则两者总体的的患病率相同,暂时按合计率推算,即为合计率推算,即为1616。5%5%。那么。那么 T T 11 11=n1m1/N=20556339=33.86 =n1m1/N=20556339=33.86 T T 1212=n1m2/N=205283339=171.14=n1m2/N=205283339=171.14 T T 2121=n2m1/N=13456339=22.14=n2m1/N=13456339=22.14 T T 2222=n2m2/N=134283339=111.86=n2m2/N=134283339=111.86 (1 1)四格表资料的)四格表资料的2 2检验检

23、验现在学习的是第20页,共28页 如果假设成立,那么,实际值和理论值的差值为如果假设成立,那么,实际值和理论值的差值为0 0,否则它们相,否则它们相差很大。实际值和理论值之间的差距用差很大。实际值和理论值之间的差距用2 2值表示。值表示。2 2=(A AT T)2 2/T ./T .基本公式基本公式 2 2=(adbcadbc)2 2N/N/(a+ba+b)()(a+ca+c)()(b+cb+c)()(b+db+d).四个表专用公式四个表专用公式 2 2 反映了实际数和理论数的吻合程度。若假设成立,出现大的反映了实际数和理论数的吻合程度。若假设成立,出现大的2 2值的可能性很小,若值的可能性很

24、小,若PP,就拒绝假设;若,就拒绝假设;若P P,则尚无理由,则尚无理由拒绝它。拒绝它。现在学习的是第21页,共28页 A A 四格表资料指的是哪四个格子的数字(见有颜色部分)四格表资料指的是哪四个格子的数字(见有颜色部分)B B 2 2检验的自由度检验的自由度V V的计算的计算 V=V=(R1R1)()(C1C1)四格表资料的自由度恒定为四格表资料的自由度恒定为1 1。C C 四格表资料四格表资料2 2 检验的条件:检验的条件:第一种情况:第一种情况:N40N40,且,且T T均均5 5,用普通,用普通2 2检验检验 第二种情况:第二种情况:N40N40,但有,但有1T1T5 5时,用矫正时

25、,用矫正2 2检验检验 第三种情况:第三种情况:N N4040,或,或T T1 1 时,用确切概率法时,用确切概率法 D D 当当P P接近检验水准时,不要轻易下结论。接近检验水准时,不要轻易下结论。E E 在满足各自条件的前提下,在满足各自条件的前提下,2 2检验与检验与U U检验等价,检验等价,2 2 值值 =U=U 2 2注意:注意:现在学习的是第22页,共28页 例:例:荧光抗体法与常规培养法检验结果荧光抗体法与常规培养法检验结果 荧光抗体法荧光抗体法 常规培养法常规培养法 合计合计 +-+160(a)26(b)186 -5(c)48(d)53 合计合计 165 74 239 若两种检

26、验方法效果相同,那么,理论上若两种检验方法效果相同,那么,理论上c=b c=b,但由于抽样误差的存,但由于抽样误差的存在,对于样本在,对于样本b b不等于不等于c c的情况,需进行假设检验。的情况,需进行假设检验。v=1v=1 普通公式普通公式 矫正公式矫正公式 b+c 40b+c 40时可不矫正,时可不矫正,b+cb+c4040时必须矫正。时必须矫正。(2)配对四个表资料)配对四个表资料2检验检验现在学习的是第23页,共28页适用于适用于 A A 多个率的比较多个率的比较 B B 多个构成比的比较多个构成比的比较 C C 双向有序分类资料的关联性检验,如双向有序分类资料的关联性检验,如 不同

27、期次矽肺患者肺门密度级别分布不同期次矽肺患者肺门密度级别分布 矽肺期次矽肺期次 肺门密度级别肺门密度级别 合计合计 +4343 188 14 245 188 14 245 1 1 9696 72 169 72 169 6 17 6 17 5555 78 78 合计合计 50 301 141 49250 301 141 492 (3)RC表的表的2检验检验现在学习的是第24页,共28页注意:注意:A:A:RCRC表的表的2 2检验适用于以下条件检验适用于以下条件 T1T1;并且;并且1T51T5的格子数不超过总格子数的的格子数不超过总格子数的1/51/5。若条件不满足,可有三种方法处理:若条件不

28、满足,可有三种方法处理:a a 增加样本数增加样本数 b b 删除理论数太小的行或列删除理论数太小的行或列 c c 将性质相近的行或列合并将性质相近的行或列合并 B:B:若结论是若结论是“差异具有统计学意义差异具有统计学意义”,仅说明其中至少有一,仅说明其中至少有一 组与其他组存在差异,是否各组两两之间均存在差异,还需组与其他组存在差异,是否各组两两之间均存在差异,还需进一步作进一步作2 2 黄金分割检验。黄金分割检验。C:C:等级资料不适宜用等级资料不适宜用2 2检验。检验。现在学习的是第25页,共28页练习1、从甲乙两文中查到同类研究的两个率比较的四个表资料,其卡方、从甲乙两文中查到同类研

29、究的两个率比较的四个表资料,其卡方检验,甲文检验,甲文2 22 20.01(1)0.01(1),乙文,乙文2 22 20.05(1)0.05(1),可认为,可认为 A A 两文结果有矛盾两文结果有矛盾 B B 两文结果基本一致两文结果基本一致 C C 甲文结果更可靠甲文结果更可靠 D D 乙文结果更可靠乙文结果更可靠2、R RC C表的卡方检验中,表的卡方检验中,P0.05P0.05说明说明 A A 被比较的任何两个率之间差别均有显著性被比较的任何两个率之间差别均有显著性 B B 样本率之间没有显著性差别样本率之间没有显著性差别 C C 至少某两个率之间有显著性差别至少某两个率之间有显著性差别

30、 D D 只有两个率之间有显著性差别只有两个率之间有显著性差别 E E 大多数样本率之间有显著性差别大多数样本率之间有显著性差别现在学习的是第26页,共28页3、下列哪项检验不适用卡方检验、下列哪项检验不适用卡方检验 A.两样本均数的比较两样本均数的比较 B.两样本率比较两样本率比较 C.多个样本构成比的比较多个样本构成比的比较 D.拟合优度检验拟合优度检验4、假设对两个率差别的假设检验分用假设对两个率差别的假设检验分用u检验和检验和X检验检验,则算得的则算得的u值和值和X值的关系有值的关系有 A.u检验比检验比X检验准确检验准确 B.X检验比检验比u检验准确检验准确 C.u=X2 D.u=E.X2=5 5、卡方检验中、卡方检验中,四格表资料的自由度一定为四格表资料的自由度一定为1.现在学习的是第27页,共28页感谢大家观看2022/9/26现在学习的是第28页,共28页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁