《医学统计学案例分析(1)11350.pdf》由会员分享,可在线阅读,更多相关《医学统计学案例分析(1)11350.pdf(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 案例分析四格表确切概率法 【例 1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27 例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经 检验,得连续性校正2=3.134,P0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。表1-4 两种药物治疗急性心肌梗塞的疗效比较 药 物 有 效 无 效 合 计 有效率()中 药 12(9.33)2(4.67)14 85.7 西 药 6(8.67)7(4.33)13 46.2 合 计 18 9 27 66.7 【问题 1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?
2、为什么?【分析】(1)该资料是按中西药的治疗结果(有效、无效)分类的计数资料。(2)27 例患者随机分配到中药组和西药组,属于完全随机设计方案。(3)患者总例数n=2740,该医师用2检验是不正确的。当 n40 或T1 时,不宜计算2值,需采用四格表确切概率法(exact probabilities in 22 table)直接计算概率 案例分析卡方检验(一)【例 1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140 例胃炎患者分成中药组和西药组,结果中药组治疗80 例,有效 64 例,西药组治疗 60例,有效 35 例。该医师采用成组t 检验(有效=1,无效=0)进行假设检验,结果t
3、2.848,P0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t2.848,P0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。【问题 1-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1)该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2)随机抽取 140 例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3)该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资
4、料的比较。(4)该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2 检验(chi-square test)。【例1-2】2003 年某医院用中药和西药治疗非典病人 40人,结果见表 1-1。表1-1 中药和西药治疗非典病人有效率的比较 药 物 有 效 无 效 合 计 有效率()中 药 西 药 14(11.2)2(4.8)14(16.8)10(7.2)28 12 50.0 16.7 合 计 16 24 40 40.0 某医师认为这是完全随机设计的 2 组二分类资料,可用四格表的 检验。其步骤如下:1建立检验假设,确定检验水准 H0:两药的有效率相等,即
5、12 H1:两药的有效率不等,即12 2计算检验统计量 值 (1)计算理论频数 根据公式 计算理论频数,填入表 7-2 的括号内。(2)计算2 值 具体计算略。3确定P值,做出统计推断 查附表 6(2界值表),得 0.025P0.05,按0.05 水准,拒绝H0,接受H1,差异有统计学意义,可认为两药的有效率不等,中药疗效高于西药。【问题 1-2】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1)中西药的疗效按有效和无效分类,该医师认为此资料是二分类资料即计数资料是正确的。(2)40 例患者随机分配到西药组和中药组,属于完全随机设计方案。(3
6、)该医师用四格表 检验是正确的,但计算 值的公式不对。因为有一个理论频数(T21=4.8)小于 5 大于 1,应用连续性校正公式计算2值。具体计算略。查附表 6(2界值表),得 0.250P0.100,按0.05水准,不拒绝H0,差别无统计学意义,尚不能认为两药的有效率不相同,中药疗效与西药疗效基本相同。结论与前述相反。案例分析卡方检验(二)【例 1-3】某医师用某种中草药治疗不同类型的小儿肺炎,其中病毒性肺炎 60例,细菌性肺炎 60 例,治疗结果见表 1-2。该医师对此资料采用行列 检验,得2=7.077,P=0.069,差异无统计学意义,故认为此种中草药对不同类型小儿肺炎的疗效分布无差别
7、。表 1-2 某种中草药治疗不同类型小儿肺炎的疗效比较 小儿肺炎类型 治 愈 显 效 有 效 无 效 合 计 病毒性肺炎 21 17 11 11 60 细菌性肺炎 11 13 17 19 60 合 计 32 30 28 30 120 【问题 1-3】(1)该研究是什么设计?(2)统计分析的目的是什么?统计方法是否正确?【分析】(1)该资料为完全随机设计方案。(2)欲比较两组的疗效是否有差别,其比较的结局变量(分析变量)是等级资料,为单向有序分类资料。用2 检验不妥,因为如果对其中的两列不同疗效的数值进行调换,值不会有变化,但秩和检验统计量有变化,所以该资料应该采用利用等级信息较好的秩和检验或R
8、idit 分析。(经秩和检验,结果为 Z=-2.570,P=0.010,差异有统计学意义。该结论与上述结论相反。)案例分析卡方检验(三)【例 1-4】某医院采用甲乙两种方法测定 60 例恶性肿瘤患者体内ck20基因表达阳性率,甲法测定阳性率为 70.0,乙法测定阳性率为 38.3,两种方法一致测定阳性率为 26.7。为比较甲乙两种方法的测定阳性率是否有差异,该医生首先将资料整理为表 1-3。然后采用四格表 检验进行假设检验,得2=12.118,P0.005,差异有统计学意义,故认为甲乙两种方法的测定结果有差别,甲法测定阳性率较高。表 1-3 两种方法测定结果比较 测定方法 阳性数 阴性数 合
9、计 阳性率(%)甲 法 42 18 60 70.0 乙 法 23 37 60 38.3 合 计 65 55 120 54.2【问题 1-4】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应采用何种统计方法?【分析】(1)该资料是按两种方法测定结果(阳性、阴性)分类的计数资料。(2)该设计为同一受试对象接受两种不同的处理,属于自身配对设计方案。(3)该医师用完全随机设计资料的四格表2检验分析配对设计资料,其统计表和统计方法均不正确。(4)比较甲乙两种方法测定结果的阳性率是否有差别,应采用配对 2检验(或 McNemar 检验)。案例分析t 检
10、验【例 1-1】某医生随机抽取正常人和脑病病人各11 例,测定尿中类固醇排出量(mg/dl),结果如表 1-1。该医生根据此资料算得正常人尿中类固醇排出量的均数=4.266mg/dl,标准差S1=0.985mg/dl;脑病病人尿中类固醇排出量的均数=5.732mg/dl,标准差S2=1.626mg/dl,配对t检验结果,t=3.098,P 0.05),t=0.014,P0.05,故认为该县小学生卡介苗抗体效价无性别差异。表1-2 2005年某县30名小学生卡介苗抗体滴度测定结果 分组 卡介苗抗体滴度(倒数)男生 40 20 160 40 320 80 40 20 40 80 160 40 80
11、 40 40 40 女生 80 20 160 40 40 160 40 20 40 160 160 40 80 40 【问题 1-2】1该资料属于何种设计方案?2统计处理是否正确?为什么?【分析】(1)该资料是随机抽取当地 30 名小学男生和女生作为样本,测定每个观察对象的卡介苗抗体滴度,属于完全随机设计。(2)由于抗体滴度值是等比资料,服从对数正态分布,各组的平均滴度应用几何均数(G)描述,其假设检验不能直接用完全随机设计两样本均数比较的t检验,而应将观察值进行对数变换后再用t检验。方差分析【例 6-1】某研究者为研究核黄素缺乏对尿中氨基氮的影响,将 60 只Wistar大白鼠随机分为核黄素
12、缺乏、限食量、不限食量三组不同饲料组。每组 20 只大白鼠。一周后测尿中氨基氮的三天排出量,结果如表 6-1。该研究者对上述资料采用了两样本均数 t 检验进行两两比较,得出结论:三组之间均数差异均有统计学意义(P0.05)。检验进行两两比较,得出结论:三组之间均数差异均有统计学意义(P0.05)。表 6-1 3 组大白鼠在进食一周后尿中氨基氮的三天排出量(mg)核黄素缺乏组 6.02 3.70 2.46 4.71 3.82 7.04 4.73 4.77 3.93 6.56 8.69 3.44 5.96 3.60 2.36 4.65 3.77 6.94 4.62 4.63 限食量组 3.23 3
13、.47 2.59 3.30 2.60 4.99 3.20 4.27 3.14 8.42 7.14 2.49 3.13 3.26 2.50 3.21 2.61 4.90 3.23 4.07 不限食量组 8.21 5.66 5.34 7.36 6.84 5.20 5.11 4.69 9.33 11.55 9.98 4.04 8.06 5.48 5.19 7.30 6.76 5.08 5.05 4.61 【问题 6-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该研究者处理方法是否正确?为什么?【分析】(1)由于测定的是三组大白鼠尿中氨基氮含量,属于多组计量资料。(2)60 只大白鼠随
14、机分为三组,属于完全随机设计方案。(3)该研究者统计处理方法不正确,因为t检验适用于完全随机设计的两组计量资料的比较,不适用于多组计量资料的比较。(4)要比较检验多组完全随机设计计量资料的多个样本均数有无差别,需用完全随机设计计量资料的方差分析。2.【例 6-2】某医师研究 A、B、C 三种药物治疗肝炎的效果,将 30 只大白鼠感染肝炎后,按性别相同、体重接近的条件配成 10 个区组,然后将各配伍组中 3 只大白鼠随机分配到各组:分别给予 A、B 和 C 药物治疗。一定时间后,测定大白鼠血清谷丙转氨酶浓度(IU/L),如表 6-7。该医师用完全随机设计资料的方差分析方法对资料进行了假设检验,F
15、12.63,P0.001,故认为三种药物的疗效不全相同。表 6-2 A、B、C 三种药物治疗后大白鼠血清谷丙转氨酶浓度(IU/L)区组号 1 2 3 4 5 6 7 8 9 10 处理A 652.40 741.30 675.60 582.80 491.80 412.20 494.60 379.50 679.48 588.78 处理B 624.30 772.30 632.50 473.60 462.80 431.80 484.90 380.70 634.93 474.56 处理C 445.10 432.50 362.70 348.70 345.90 312.80 296.30 228.40 37
16、2.26 352.77 【问题 6-2】(1)该资料是什么资料?(2)该研究是什么设计?(3)统计分析方法是否恰当?【分析】(1)由于测定的是血清谷丙转氨酶浓度(IU/L),属于多组计量资料。(2)30 只大白鼠,按性别相同、体重接近划分为10 个区组。每个区组 3 只大白鼠随机采用 A、B、C 三种药物治疗,故属于随机区组设计方案。(3)该医师应用完全随机设计计量资料的方差分析进行检验是不正确的,应该选用随机区组设计的方差分析方法进行检验。案例分析秩和检验 例 1-1】某医师用改良的 Seldingers 插管技术对 8 例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测
17、定治疗前后血中的HCG 含量如表 1-1。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较的t检验,得t=2.460,P0.05,差异有统计学意义,故认为治疗前后血中 HCG 的含量有差别。表 1-1 灌注化疗前后 HCG 含量测定结果(pmol/L)病例号 (1)灌注前(X1)(2)灌注后(X2)(3)lgX1 (4)lgX2 (5)1 1280000 210000 6.1072 5.3222 2 75500 3300 4.8779 3.5185 3 12450 2210 4.0952 3.3444 4 1500000 9.3 6.1761 0.9685 5 10000 2500
18、4.0000 3.3979 6 9700 1203 3.9868 3.0803 7 15588 4825 4.1928 3.6835 8 4223 914 3.6256 2.9609 【问题 1-1】1这是什么资料?2该实验属于何种设计方案?3该医师统计方法是否正确?为什么?【分析】(1)该资料为计量资料。(2)该实验属自身配对设计方案。(3)该医师统计方法不正确。首先,配对资料一般采用对每对数据求差值后进行比较,而该医师采用完全随机设计资料的检验方法,统计方法与设计类型不 符;其次,该医师考虑了数据相差较大,即不满足t检验的前提条件正态分布,采用了对数变换,基本思想正确。但治疗前后的数据经对
19、数变换后,其差值的变异仍然较大(经正态性检验,P0.05),因此仍不满足配对t检验的条件,故该资料宜采用非参数检验方法,即 Wilcoxon 配对设计的符号秩和检验,目的是推断配对资料的差值是否来自中位数为零的总体。【例 1-2】某医生用某种中药治疗 I 型糖尿病患者和 II 型糖尿病患者共45 例,结果见表 1-2。为评价该中药对两型糖尿病的疗效有无差异,该医生对此资料进行2检验,得25.289,P0.05,差异无统计学意义,故认为该中药对两型糖尿病患者的疗效基本相同。表1-2 某种中药治疗两型糖尿病的疗效比较 疗效等级 I型糖尿病 II型糖尿病 合 计 无 效 9 3 12 好 转 8 9
20、 17 显 效 5 11 16 合 计 22 23 45 【问题 1-2】1该资料是什么资料?2该研究是什么设计?3统计分析中有无不妥之处?【分析】(1)该资料的分组变量(两型糖尿病)是二分类资料,分析变量(疗效等级)是等级资料,称为单向有序分类资料。(2)研究设计为完全随机设计。(3)统计分析不正确。该医生的研究目的是比较中药治疗两型糖尿病的 疗效,用2检验只能说明各处理组的效应在分布上有无不同,而不能说明各处理组效应的平均水平有无差别,也就是说2检验没有利用等级信息,因此效率较低。该资料宜用非参数检验的 Wilcoxon 秩和检验。案例分析直线相关与回归分析 【例 1-1】为评价环境噪音强
21、度对社区居民生活的影响程度,某市疾病预防控制中心监测了该市 10 个社区的环境噪音强度,同时调查各社区居民的失眠患病率(%),结果见表 1-1。经对噪音强度数量化(+=1,+=2,+=3,+=4,+=5)后,某医师对该资料采用 Pearson 直线相关分析,得r0.853,P0.005,认为环境噪音强度与居民失眠患病率之间存在正相关关系。表1-1 某市10个社区环境噪音强度与居民失眠患病率 社区编号 1 2 3 4 5 6 7 8 9 10 噪音强度 +失眠患病率(%)21.20 23.40 11.40 16.90 17.50 26.30 13.60 25.60 11.60 25.30 【问题
22、 1-2】1 这是什么资料?2 该医师处理方法是否正确?为什么?3 该资料应该用何种统计方法分析?【分析】(1)该资料包含环境噪音强度与居民失眠患病率两个变量,一个属于等级资料,一个属于计量资料。(2)该医师处理方法不正确,因为环境噪音强度为等级资料,不服从正态分布,因此,不能用 Pearson 直线相关分析。(3)该资料应选用非参数统计方法,可采用 Spearman 的等级相关(Spearmans rank correlation)来分析两者的关系。【例 1-2】某地对血吸虫流行区进行血吸虫与大肠癌关系的调查研究,抽查 39个乡的资料,各乡抽查人数相同。血吸虫感染率最低为 8.9,最高为 7
23、9.3。将血吸虫感染率()作 x,大肠癌标化死亡率(1/10 万)为 y,作相关回归分析,得 r0.6315,P0.01,b0.1344,a4.152。【问题 1-2】(1)能否用直线回归方程描述两者的关系,为什么?(2)若血吸虫感染率为 20,则大肠癌标化死亡率平均是多少?(3)若血吸虫感染率为 90,大肠癌标化死亡率平均又是多少?【分析】(1)能用直线回归方程描述两变量间的关系,因为回归系数的假设检验与相关系数的假设检验等价,既然 r 的假设检验P0.01,可认为两变量有直线关系,所以能用直线回归方程来描述两变量间的关系:4.152+0.1344x (2)将 x=20 代入方程,求得 y6
24、.84,则血吸虫感染率为 20时,大肠癌标化死亡率平均是 6.84/10 万,因为没有提供所需的数据,不可能求大肠癌标化死亡率的容许区间,所以到此结束。(3)由于血吸虫感染率的实测值范围是 8.979.3,90已超出此范围,不宜用该回归方程来估计大肠癌标化死亡率。案例分析-实验设计 1.案例 11-1 某医师观察某新药治疗急性气管炎的疗效,用氨苄青霉素作对照。病人入院时,体温在 39以下分入治疗组,39及以上分入对照组,结果新药疗效优于氨苄青霉素。【问题 11-1】(1)该医师的结论是否正确?(2)实验设计有何缺陷?(3)应该怎样正确设计?【分析】(1)该医师的结论不正确。(2)该实验设计违犯
25、了均衡性原则和随机化原则,实验结果没有可比性。因为体温在 39及以上者病情较重,39以下者病情较轻,治疗组和对照组病人的病情程度不同即病情不均衡,治疗组为轻病人,对照组为重病人,这类试验必然导致错误的试验结果。如果治疗组和对照组交换一下,对照组为轻病人,该新药可能就没有效果。(3)正确的实验设计:随机抽取足够样本含量的急性气管炎病人,采用随机方法,将 39及以上病人随机分成治疗组和对照组,将 39以下病人也随机分成治疗组和对照组,两组除了治疗药物不同外,其它条件尽可能相同,采用盲法进行治疗和观察,结果进行假设检验以后再下结论。上述分析表明:临床科研结果的好坏取决于临床试验设计的好坏,良好的实验
26、设计才能得到较好的科研结果。2.案例 11-2 某研究者欲评价多糖铁复合物治疗儿童轻度缺铁性贫血的疗效,在城北小学抽取 60 名确诊为轻度缺铁性贫血的儿童,服用多糖铁复合物为实验组;在城南小学抽取 60 名确诊为轻度缺铁性贫血的儿童,未服用多糖铁复合物为对照组,观察指标是血红蛋白含量。结果城北小学观察对象血红蛋白均值明显上升,城南小学观察对象血红蛋白略有提高,但比城北小学低,故认为多糖铁复合物有升血红蛋白作用,能有效治疗缺铁性贫血。【问题 11-2】(1)该研究者遵循的均衡原则是否合理?为什么?(2)该研究的混杂因素是什么?(3)应该怎样正确设计?【分析】(1)该实验设计的缺陷是违背了均衡原则
27、,即不清楚两所小学儿童的家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响血红蛋白含量的因素除药物外,也可能是儿童饮食营养条件,不能将血红蛋白量升高这一结果完全归之于多糖铁复合物的疗效。因此认为这个没计是不均衡设计。(2)本研究的混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难的,可通过交叉均衡设计,以达到均衡目的。(3)正确设计:将城南小学 60 名儿童随机分成两组,30 名服用多糖铁复合物,30名不服药;城北小学 60 名儿童也随机分成两组,30 名服药,30 名不服
28、药。观察一段时间后,对城南和城北小学分开比较试验组和对照组即服药与不服药的血红蛋白有无差别,也可将测得城南小学 30 名服药儿童和城北小学 30 名服药儿童合并,作为实验组求平均值,再将两小学各30 名未服药儿童的测定结果合并,作为对照组求平均值。对实验组和对照组的平均值进行假设检验,如果实验组的血红蛋白值高于对照组,且差异有统计学意义,可认为多糖铁复合物对血红蛋白有影响,对儿童轻度缺铁性贫血有治疗作用。3.案例 11-3 为评价某种国产抗菌新药的疗效,某医生抽取患有某种疾病且符合入选条件的 60 例患者,按入院后床位的单双号分为两组,每组 30 人。试验组服用该新药,对照组服用同类公认有效的
29、进口药,临床观察结果见表11-9。经四格表卡方检验,得卡方=3.750,P0.05,差异无统计学意义,故认为该国产抗菌新药与同类进口药的疗效基本相同。表 11-1 两组患者用药后有效率比较 【问题 11-3】(1)该研究属何种类型?(2)在设计的过程中是否遵循了实验设计的基本原则?(3)该临床试验为何种对照?(4)该医师的结论是否可靠?为什么?【分析】(1)该研究属临床试验设计。(2)在设计与实施的过程中,该医生是按照床位号码将入选的 60 例患者随意分组,未能按照随机化的原则分组。(3)该临床试验为标准对照。(4)由于该医生未遵循随机化原则,样本的代表性差,两组患者的非处理因素不均衡,可比性
30、差,因此其结论不可靠。4.例 11-4 某研究者欲评价佳加学生钙治疗儿童轻度缺钙的疗效,在实验幼儿园抽取 80名确诊为轻度缺钙的儿童,服用佳加学生钙为试验组;在该地机关幼儿园抽取 80名确诊为轻度缺钙的儿童,未服用佳加学生钙为对照组,观察指标是头发中钙的含量。结果试验组实验幼儿园的儿童发钙均值明显上升,机关幼儿园的观察对象分 组 例 数 有 效 有效率(%)国产抗菌新药 30 21 70.0 同类进口药 30 27 90.0 发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。佳加学生钙为试验组;在该地机关幼儿园抽取 80 名确诊为轻度缺钙的儿童,未服用佳加学生钙为对照
31、组,观察指标是头发中钙的含量。结果试验组实验幼儿园的儿童发钙均值明显上升,机关幼儿园的观察对象发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。【问题 11-4】(1)该研究者遵循了均衡原则吗?为什么?(2)该研究的混杂因素是什么?(3)应该怎样正确设计?【分析】(1)该实验设计的缺陷是违背了均衡原则,即不清楚两所幼儿园儿童的家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量的因素除药物外,也可能是儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量的因素除药物外,也可能是儿童饮食营养条件,不能将发钙升高这一结
32、果完全归之于佳加学生钙的疗效。因此认为这个没计是不均衡设计。(2)本研究的混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难的,可通过交叉均衡设计,以达到均衡目的。(3)正确设计:将实验幼儿园 80 名儿童随机分成两组,40 名服用佳加学生钙,40 名不服药;机关幼儿园 80 名儿童也随机分成两组,40 名服药,40 名不服药。观察一段时间后,对两个幼儿园分开比较试验组和对照组即服药与不服药的血清钙和发钙有无差别,也可将测得实验幼儿园 40 名服药儿童和机关幼儿园40 名服药儿童合并,作为实验组求平均值,再将两幼儿园各 40 名未服药儿童的 测定结果合并,作为对照组求平均值。对实验组和对照组的平均值进行假设检验,如果实验组的血清钙和发钙值高于对照组,且差异有统计学意义,可认为佳加学生钙对发钙有影响,对儿童轻度缺钙有治疗作用。