《分类资料的统计分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《分类资料的统计分析精选PPT.ppt(28页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于分类资料的统计分析第1页,讲稿共28张,创作于星期日情景资料情景资料1、调查了我班视力情况,近视者、调查了我班视力情况,近视者30人,计算近视率?人,计算近视率?2、计算我班的血型构成。、计算我班的血型构成。3、研究某药效果,治疗了、研究某药效果,治疗了5人,治愈人,治愈3人,如何描述其有效水平?人,如何描述其有效水平?4、某慢性病在深圳的死亡率为、某慢性病在深圳的死亡率为1.2%,在上海为,在上海为3.1%,如何比较该,如何比较该病在两地的死亡水平。病在两地的死亡水平。第2页,讲稿共28张,创作于星期日(一)常用的相对数(一)常用的相对数1 1、率:说明某现象发生的频率或强度。、率:说明
2、某现象发生的频率或强度。率率 =l K K 常有百分率、千分率、万分率、十万分率等。常有百分率、千分率、万分率、十万分率等。l 选择原则:选择原则:习惯用法习惯用法 使得到的数字一般保留使得到的数字一般保留1-21-2位整数,以便阅读。位整数,以便阅读。第3页,讲稿共28张,创作于星期日2、构成比、构成比 说明某一事物内部各组成部分所占的比重。说明某一事物内部各组成部分所占的比重。构成比构成比 =第4页,讲稿共28张,创作于星期日3、相对比、相对比 说明两事物之间的对比关系说明两事物之间的对比关系。相对比相对比 =A=A事物事物 /B/B事物事物 A A、B B可以是绝对数,也可是相对数;可以
3、是绝对数,也可是相对数;计算结果可是小数,也可是倍数。计算结果可是小数,也可是倍数。l 常用的有三种:常用的有三种:(1 1)对比指标:同类事物指标的比值。如性别比。)对比指标:同类事物指标的比值。如性别比。(2 2)关系指标:非同类事物指标的比值。)关系指标:非同类事物指标的比值。如医护人员与病床数之比。如医护人员与病床数之比。(3 3)计划完成指标)计划完成指标第5页,讲稿共28张,创作于星期日4、注意事项、注意事项 1 1、分母不可过小。、分母不可过小。2 2、不能以比代率、不能以比代率 3 3、如何计算合计率(总率)。、如何计算合计率(总率)。4 4、比较相对数时,注意资料的可比性。、
4、比较相对数时,注意资料的可比性。5 5、样本率的比较要进行假设检验。、样本率的比较要进行假设检验。某化工厂慢支患病与工龄的关系某化工厂慢支患病与工龄的关系 工龄工龄 检查人数检查人数 患者数患者数 百分比(百分比(%)患病率(患病率(%)1 340 17 11.56 5.00 5 254 30 20.41 11.81 10 432 73 49.66 16.90 15 136 27 18.37 19.85 合计合计 1162 147 100.00 12.65第6页,讲稿共28张,创作于星期日(二)标准化法(二)标准化法 甲乙两医院某传染病各型治愈率比较甲乙两医院某传染病各型治愈率比较 病型病型
5、甲院甲院 乙院乙院 病人数病人数 治愈数治愈数 治愈率(治愈率(%)病人数病人数 治愈数治愈数 治愈率(治愈率(%)普通型普通型 300 180 60.0 100 65 65.5300 180 60.0 100 65 65.5 重型重型 100 40 40.0 300 135 45.0100 40 40.0 300 135 45.0 爆发型爆发型 100 20 20.0 100 25 25.0100 20 20.0 100 25 25.0 合计合计 500 240 48.0 500 225 45.0500 240 48.0 500 225 45.0 要比较甲乙两医院某传染病治愈率,要先消除病情
6、构成的影响,即要比较甲乙两医院某传染病治愈率,要先消除病情构成的影响,即选取一种共同内部构成作为计算总率的基础,这种方法称为率的选取一种共同内部构成作为计算总率的基础,这种方法称为率的标准标准化法化法,这样计算得到的率称为这样计算得到的率称为标准化率(标化率、调整率)。标准化率(标化率、调整率)。第7页,讲稿共28张,创作于星期日根据资料不同,有直接法和间接法两种。根据资料不同,有直接法和间接法两种。直接法直接法步骤:步骤:1 1、选取一个标准的内部构成选取一个标准的内部构成,可以是标准人口数,也可是标准可以是标准人口数,也可是标准人口构成比,还可以用标准阳性率(间接法人口构成比,还可以用标准
7、阳性率(间接法)。标准来源:。标准来源:A A 具有代表性的、较稳定的、数量较大的人群作标准。时具有代表性的、较稳定的、数量较大的人群作标准。时 间最好与被标化资料一致或较接近。间最好与被标化资料一致或较接近。B B 以相比资料本身数据为标准,如甲院或乙院的数据、以相比资料本身数据为标准,如甲院或乙院的数据、或两院合并的数据。或两院合并的数据。2 2、计算标化率。计算标化率。直接法第8页,讲稿共28张,创作于星期日续续 例:以甲院数据为标准计算乙院治愈率的标化率(直接法)例:以甲院数据为标准计算乙院治愈率的标化率(直接法)乙院某传染病标化治愈率计算乙院某传染病标化治愈率计算 病型病型 标准病人
8、数标准病人数 原治愈率(原治愈率(%)预期治愈人数预期治愈人数 普通型普通型 300 65.0 195 300 65.0 195 重型重型 100 45.0 45100 45.0 45 爆发型爆发型 100 25.0 25 100 25.0 25 合计合计 500 -265500 -265 乙院某传染病标化治愈率乙院某传染病标化治愈率=265/500=0.53=53.0%265/500=0.53=53.0%所以在共同的构成下,甲院治愈率为所以在共同的构成下,甲院治愈率为48%48%,乙院治愈率为,乙院治愈率为53%53%,因此对该种传染病的,因此对该种传染病的治疗率是乙院较高治疗率是乙院较高.
9、第9页,讲稿共28张,创作于星期日 间接法:间接法:间接法是在不知道被比较两者的分率,或某些组的调查人数太少,间接法是在不知道被比较两者的分率,或某些组的调查人数太少,分率不可靠时采用的方法。分率不可靠时采用的方法。如下例:已知甲地死亡总数为如下例:已知甲地死亡总数为845845人,乙地为人,乙地为679679人,以及两地各人,以及两地各 年龄组人口数,比较两地死亡水平。年龄组人口数,比较两地死亡水平。甲乙两地死亡标化率计算甲乙两地死亡标化率计算年龄组年龄组 标准死亡率标准死亡率 甲地甲地 乙地乙地 (%)人数人数 预期死亡数预期死亡数 人数人数 预期死亡数预期死亡数 0 62.6 9300
10、582 4800 300 0 62.6 9300 582 4800 300 5 3.9 12200 48 6600 26 5 3.9 12200 48 6600 26 20 6.5 19000 124 35300 230 20 6.5 19000 124 35300 230 40 12.7 7600 97 2800 36 40 12.7 7600 97 2800 36 60 41.3 1900 78 500 21 60 41.3 1900 78 500 21 合计合计 15.4 50000 929 50000 61315.4 50000 929 50000 613 第10页,讲稿共28张,创作
11、于星期日计算标化死亡比(计算标化死亡比(SMRSMR):):SMR=SMR=实际死亡数实际死亡数 /预期死亡数预期死亡数 SMRSMR1 1,说明标化率大于标准组,说明标化率大于标准组 SMRSMR1 1,说明标化率小于标准组,说明标化率小于标准组 甲地甲地SMR=845 929=0.91SMR=845 929=0.91 甲地标化死亡率甲地标化死亡率 =15.4%0.91=14.03%=15.4%0.91=14.03%乙地乙地SMR=679 613=1.14SMR=679 613=1.14 乙地标化死亡率乙地标化死亡率 =15.4%1.14=17.58%=15.4%1.14=17.58%第11
12、页,讲稿共28张,创作于星期日1 1、根据资料选用相应的方法。、根据资料选用相应的方法。2 2、标化率的大小随选定的标准的不同而不同。、标化率的大小随选定的标准的不同而不同。3 3、率的标化的目的在比较,标化率的差别,只反映资料、率的标化的目的在比较,标化率的差别,只反映资料 间率的高低、大小的相对关系,并不反映资料间率的间率的高低、大小的相对关系,并不反映资料间率的 实际水平。实际水平。4 4、如不计算标化率,而分别比较各组的分率,也可得到、如不计算标化率,而分别比较各组的分率,也可得到 正确结论,但不能比较总率的大小。正确结论,但不能比较总率的大小。5 5、被标化的样本率若要进一步推断总体
13、结果,还需对标、被标化的样本率若要进一步推断总体结果,还需对标 化后的样本率作假设检验。化后的样本率作假设检验。注意事项注意事项第12页,讲稿共28张,创作于星期日练习练习 1 1、描述计数资料的统计指标是;、描述计数资料的统计指标是;A.平均数平均数 B.相对数相对数 C.标准差标准差 D标准误标准误 E.变异系数变异系数 2 2、某一事件发生强度的指标应选、某一事件发生强度的指标应选 A A 率率 B B 构成比构成比 C C 相对比相对比 D D 绝对数绝对数 E E 以上都不对以上都不对 3 3、某病发病率的分子是、某病发病率的分子是 A A 是指一定时间内该病发生的新病例是指一定时间
14、内该病发生的新病例 B B 是指该病发生的新、老病例是指该病发生的新、老病例 C C 是指该病的老病例是指该病的老病例 D D 是指现患病例是指现患病例 E E 是指现患病例和老病例是指现患病例和老病例 第13页,讲稿共28张,创作于星期日练习4 4、下列下列说说法哪个是法哪个是错误错误的的 A A 四个分率的四个分率的总总率率为为四个分率之和除以四个分率之和除以4 4 B B 假假设检验设检验的的结结果不可能性果不可能性100%100%的正确的正确 C C 率和比不能混用率和比不能混用 D D 当当n n较较少少时时,最好用最好用绝对绝对数和相数和相对对数一起表示相数一起表示相应应的的计计数
15、数资资料料 E E 标标准准误误的本的本质质是是标标准差准差5、欲欲比比较较甲甲,乙乙两两矿矿工工人人矽矽肺肺患患病病的的严严重重程程度度,但但甲甲,乙乙两两矿矿工工人人的的工工龄龄分分布布不不同同,此时适当的比较方法是此时适当的比较方法是:A.分工龄进行比较分工龄进行比较 B.用两个率比较的用两个率比较的X2检验检验 C.不具可比性不具可比性,不能比较不能比较 D.对工龄进行标化后再比较对工龄进行标化后再比较第14页,讲稿共28张,创作于星期日练习练习 6、关于相对数,下列那项不正确、关于相对数,下列那项不正确 A 是分类变量资料的统计描述指标是分类变量资料的统计描述指标 B 各部分的构成比
16、总和为各部分的构成比总和为100%C 计算相对数的分母不宜过小计算相对数的分母不宜过小 D 率可表示事物内部某一部分所占的比重率可表示事物内部某一部分所占的比重 7 7、相对比是、相对比是A.BA.B两个有关指标之比,两个指标要求两个有关指标之比,两个指标要求 A A 性质必须相同性质必须相同 B B 性质必须不同性质必须不同 C C 性质可以相同也可以不同性质可以相同也可以不同 D D 性质最好相同性质最好相同 E E 以上都不是以上都不是第15页,讲稿共28张,创作于星期日8 8、经调查得甲乙两地的冠心病粗死亡率都为、经调查得甲乙两地的冠心病粗死亡率都为40/40/万万,按年龄构成标化按年
17、龄构成标化后后,甲地冠心病标化死亡率为甲地冠心病标化死亡率为45/45/万万,乙地为乙地为31/31/万,因此可以认为万,因此可以认为 A.A.甲地年龄别人口构成较乙地年轻甲地年龄别人口构成较乙地年轻 B.B.乙地年龄别人口构成较甲地年轻乙地年龄别人口构成较甲地年轻 C.C.甲地冠心病的诊断较乙地准确甲地冠心病的诊断较乙地准确 D.D.乙地冠心病的诊断较甲地准确乙地冠心病的诊断较甲地准确 E.E.甲地年轻人患冠心病较乙地多甲地年轻人患冠心病较乙地多9、是非题:、是非题:用某药治疗某病用某药治疗某病,治了治了5例例,治愈治愈4例例,则该药的治愈率为则该药的治愈率为80%.第16页,讲稿共28张,
18、创作于星期日一、率的抽样误差一、率的抽样误差 一般地,从一个阳性率一般地,从一个阳性率为的总体中随机抽取含量为为的总体中随机抽取含量为n n的样本,则的样本,则样本中的阳性数样本中的阳性数X X服从二项分布服从二项分布B B(n n,),样本阳性率),样本阳性率p p与总体率与总体率之间也存在抽样误差,其大小用样本率的标准差来表示,即率的标之间也存在抽样误差,其大小用样本率的标准差来表示,即率的标准误。准误。总体标准误总体标准误 s=(1)/n 样本标准误样本标准误 Sp=p(1p)/n 总体率的估计和卡方检验总体率的估计和卡方检验第17页,讲稿共28张,创作于星期日1 1、查表法、查表法 适
19、用:适用:n50n50时时 2 2、近似正态法、近似正态法 适用条件:适用条件:npnp和和n(1-p)5 n(1-p)5 时,样本率的分布近似正态分时,样本率的分布近似正态分布,可按正态分布原理估计总体率的可信区间。布,可按正态分布原理估计总体率的可信区间。95%CI95%CI:p 1.96 Spp 1.96 Sp 99%CI 99%CI:p 2.58 Spp 2.58 Sp二、总体率的估计二、总体率的估计第18页,讲稿共28张,创作于星期日 1 1、直接计算概率进行比较、直接计算概率进行比较 2 2、u u检验适用条件:检验适用条件:npnp和和n(1-p)5n(1-p)5时,样本率的分布
20、近似正态时,样本率的分布近似正态分布。分布。3 3、2 2检验:用于检验:用于v检验某个连续变量的分布是否与某种理论分布一致,如是否符合检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布等正态分布等 推断多个样本率或构成比之间又无差别推断多个样本率或构成比之间又无差别 检检验验两两个个分分类类变变量量是是否否相相互互独独立立,如如吸吸烟烟是是否否与与呼呼吸吸道道疾疾病病有关有关检检验验两两种种方方法法的的结结果果是是否否一一致致,如如两两种种诊诊断断方方法法对对同同一一批批人人进行诊断,其诊断结果是否一致进行诊断,其诊断结果是否一致 三、率的假设检验三、率的假设检验第19页,讲稿
21、共28张,创作于星期日基本思想基本思想吸烟者与不吸烟者的慢性支气管炎患病率比较吸烟者与不吸烟者的慢性支气管炎患病率比较 分组分组 患病人数患病人数 未患病人数未患病人数 合计合计 患病率(患病率(%)吸烟者吸烟者 4343(33.8633.86)162162(171.14171.14)205 205(n1n1)21.021.0 不吸烟者不吸烟者 1313(22.1422.14)121121(111.86111.86)134 134(n2n2)9.7 9.7 合计合计 5656(m1m1)283 283(m2m2)339339(N N)16.516.5 红色为实际数(红色为实际数(A A),蓝色
22、为理论数(),蓝色为理论数(T T)。)。假设吸烟与慢支之间无关,则两者总体的的患病率相同,暂时按假设吸烟与慢支之间无关,则两者总体的的患病率相同,暂时按合计率推算,即为合计率推算,即为1616。5%5%。那么。那么 T T 11 11=n1m1/N=20556339=33.86 =n1m1/N=20556339=33.86 T T 1212=n1m2/N=205283339=171.14=n1m2/N=205283339=171.14 T T 2121=n2m1/N=13456339=22.14=n2m1/N=13456339=22.14 T T 2222=n2m2/N=134283339=
23、111.86=n2m2/N=134283339=111.86 (1 1)四格表资料的)四格表资料的2 2检验检验第20页,讲稿共28张,创作于星期日 如果假设成立,那么,实际值和理论值的差值为如果假设成立,那么,实际值和理论值的差值为0 0,否则它们相差很,否则它们相差很大。实际值和理论值之间的差距用大。实际值和理论值之间的差距用2 2值表示。值表示。2 2=(A AT T)2 2/T ./T .基本公式基本公式 2 2=(adbcadbc)2 2N/N/(a+ba+b)()(a+ca+c)()(b+cb+c)()(b+db+d).四个表专用公式四个表专用公式 2 2 反映了实际数和理论数的吻
24、合程度。若假设成立,出现大反映了实际数和理论数的吻合程度。若假设成立,出现大的的2 2值的可能性很小,若值的可能性很小,若PP,就拒绝假设;若,就拒绝假设;若P P,则尚无,则尚无理由拒绝它。理由拒绝它。第21页,讲稿共28张,创作于星期日 A A 四格表资料指的是哪四个格子的数字(见有颜色部分)四格表资料指的是哪四个格子的数字(见有颜色部分)B B 2 2检验的自由度检验的自由度V V的计算的计算 V=V=(R1R1)()(C1C1)四格表资料的自由度恒定为四格表资料的自由度恒定为1 1。C C 四格表资料四格表资料2 2 检验的条件:检验的条件:第一种情况:第一种情况:N40N40,且,且
25、T T均均5 5,用普通,用普通2 2检验检验 第二种情况:第二种情况:N40N40,但有,但有1T1T5 5时,用矫正时,用矫正2 2检验检验 第三种情况:第三种情况:N N4040,或,或T T1 1 时,用确切概率法时,用确切概率法 D D 当当P P接近检验水准时,不要轻易下结论。接近检验水准时,不要轻易下结论。E E 在满足各自条件的前提下,在满足各自条件的前提下,2 2检验与检验与U U检验等价,检验等价,2 2 值值 =U=U 2 2注意:注意:第22页,讲稿共28张,创作于星期日 例:例:荧光抗体法与常规培养法检验结果荧光抗体法与常规培养法检验结果 荧光抗体法荧光抗体法 常规培
26、养法常规培养法 合计合计 +-+160(a)26(b)186 -5(c)48(d)53 合计合计 165 74 239 若两种检验方法效果相同,那么,理论上若两种检验方法效果相同,那么,理论上c=b c=b,但由于抽样误差的存,但由于抽样误差的存在,对于样本在,对于样本b b不等于不等于c c的情况,需进行假设检验。的情况,需进行假设检验。v=1v=1 普通公式普通公式 矫正公式矫正公式 b+c 40b+c 40时可不矫正,时可不矫正,b+cb+c4040时必须矫正。时必须矫正。(2)配对四个表资料)配对四个表资料2检验检验第23页,讲稿共28张,创作于星期日适用于适用于 A A 多个率的比较
27、多个率的比较 B B 多个构成比的比较多个构成比的比较 C C 双向有序分类资料的关联性检验,如双向有序分类资料的关联性检验,如 不同期次矽肺患者肺门密度级别分布不同期次矽肺患者肺门密度级别分布 矽肺期次矽肺期次 肺门密度级别肺门密度级别 合计合计 +4343 188 14 245 188 14 245 1 1 9696 72 169 72 169 6 17 6 17 5555 78 78 合计合计 50 301 141 49250 301 141 492 (3)RC表的表的2检验检验第24页,讲稿共28张,创作于星期日注意:注意:A:A:RCRC表的表的2 2检验适用于以下条件检验适用于以下
28、条件 T1T1;并且;并且1T51T5的格子数不超过总格子数的的格子数不超过总格子数的1/51/5。若条件不满足,可有三种方法处理:若条件不满足,可有三种方法处理:a a 增加样本数增加样本数 b b 删除理论数太小的行或列删除理论数太小的行或列 c c 将性质相近的行或列合并将性质相近的行或列合并 B:B:若结论是若结论是“差异具有统计学意义差异具有统计学意义”,仅说明其中至少有一,仅说明其中至少有一 组与其他组存在差异,是否各组两两之间均存在差异,还需组与其他组存在差异,是否各组两两之间均存在差异,还需进一步作进一步作2 2 黄金分割检验。黄金分割检验。C:C:等级资料不适宜用等级资料不适
29、宜用2 2检验。检验。第25页,讲稿共28张,创作于星期日练习1、从甲乙两文中查到同类研究的两个率比较的四个表资料,其卡方检验,、从甲乙两文中查到同类研究的两个率比较的四个表资料,其卡方检验,甲文甲文2 22 20.01(1)0.01(1),乙文,乙文2 22 20.05(1)0.05(1),可认为,可认为 A A 两文结果有矛盾两文结果有矛盾 B B 两文结果基本一致两文结果基本一致 C C 甲文结果更可靠甲文结果更可靠 D D 乙文结果更可靠乙文结果更可靠2、R RC C表的卡方检验中,表的卡方检验中,P0.05P0.05说明说明 A A 被比较的任何两个率之间差别均有显著性被比较的任何两
30、个率之间差别均有显著性 B B 样本率之间没有显著性差别样本率之间没有显著性差别 C C 至少某两个率之间有显著性差别至少某两个率之间有显著性差别 D D 只有两个率之间有显著性差别只有两个率之间有显著性差别 E E 大多数样本率之间有显著性差别大多数样本率之间有显著性差别第26页,讲稿共28张,创作于星期日3、下列哪项检验不适用卡方检验、下列哪项检验不适用卡方检验 A.两样本均数的比较两样本均数的比较 B.两样本率比较两样本率比较 C.多个样本构成比的比较多个样本构成比的比较 D.拟合优度检验拟合优度检验4、假设对两个率差别的假设检验分用假设对两个率差别的假设检验分用u检验和检验和X检验检验,则算则算得的得的u值和值和X值的关系有值的关系有 A.u检验比检验比X检验准确检验准确 B.X检验比检验比u检验准确检验准确 C.u=X2 D.u=E.X2=5 5、卡方检验中、卡方检验中,四格表资料的自由度一定为四格表资料的自由度一定为1.第27页,讲稿共28张,创作于星期日感感谢谢大大家家观观看看2023/4/9第28页,讲稿共28张,创作于星期日