《多因素分析案例.docx》由会员分享,可在线阅读,更多相关《多因素分析案例.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、多因素分析 案例案例1某医生为争论乳腺癌彩超血流显像的相关因素,检测了121例乳腺癌患者,其中血流丰富者68个,中等血流者48个,无血流者5个。选择患者的年龄、乳腺癌的大小、组织学分类、导管内癌和浸润性导管癌组织学分级及雌激素受体,孕酮受体等因素,进展了多 因素logistic回归分析。结果显示,对血流程度有影响的因子,其作用从大到小依次为:肿 块大小 OR=5.931,肿块分好程度低分化 OR=4.318,中分化OR=1.681,患者年龄OR=0.949。其余因素对血流程度无影响。问题:本案例中的涉及到了哪些变量?分别属于什么类型?因变量自变量分别是什么? 本案例可否用直线相关或者回归分析?
2、为什么?在进展多因素logistic回归前,是否应领先进展单因素分析?如何分析?单因素logistic回归分析与多因素logistic回归分析有何区分?能否直接做多因素logistic回归分析?得到logistic回归分析结果后,如何解释?如何应用这个结果?案例 2 某争论者观看了确诊后实行同样方案进展化疗的26 例急性混合型白血病患者,欲了解某种不良染色体是否会影响患者病情的缓解,于是将治疗后 120 天内病症是否缓解作为结果变量 y缓解=0,未缓解=1,有无不良染色体 chr有=1,无作为争论因素,数据收集后具体数据见表 19-5进展一系列统计分析,请结合以下问题,对分析结果进展恰当的评价
3、。1表 19-5 急性混合型白血病患者化疗后观看数据ageblcdchrsextyageblcdchrsexty2800103048101115033111112014810101201350010704810101201390010504910001201400010160541100120042001020550101120421101120157110111604301111201601101109044001040610110400440010190620010160440110120162011011804510001080631100120147001018074001070(1)
4、依据有无不良染色体分组比较缓解率,考虑到例数较小,承受 Fisher 准确概率法, 得到P 值为 0.667,此时的结论如何?2考虑到有无不良染色体并非争论人员可以随机安排的处理,所以比较组之间其它影响患乾缓解的因素不肯定均衡,因而需要考虑平衡其他可能的影响因素的作用。于是该 争论者进一步查阅了相关文献,追加记录了患者的年龄 age岁、骨髓原幼细胞数分组 bl大于等于 50%=1,小于 50%=0、CD34 表达式 cd阳性=1,阴性=0、性别 sex男=1,女=0这几个变量数据见表 19-5,承受多因素 logistic 模型分析,经逐步法近 =0.10 水准得到表 19-6 中的结果。此时
5、的结论又如何?表 19-6 急性混合型白血病患者化疗后观看数据的逐步logistic 回归分析结果回归系数标准误X2自由度P 值RRBl-2.0540.9714.47210.0347.800常数项-1.8720.7606.07310.0140.154综合上述分析过程,你对此项争论的设计、资料收集及统计分析方法的选择有何评论?案例 3 某争论者为探讨帕金森病(PD)与吸烟的关系,承受以人群为根底的病例-比照争论,调查某市 PD 病例共 114 例,以及比照 205 例(性别、民族及居住于与病例相匹配)。承受非条件logistic 回归分析,结果见表 18-12。请依据所供给信息,分析该争论中存在
6、的主要统计学缺陷。表 18-12 PD 与吸烟关系的非条件logisti 回归分析变量回归系数标准误W a l dX 2P 值OROR 的 95%CI性别0.9360.02989.8210.0092.5491.420,4.579年龄0.0300.2994.6120.0321.0310.573,1.852吸烟年限-0.6190.3153.8660.0490.5380.290,0.346喝茶-1.6160.28332.6190.0000.1990.114,0.346饮酒-0.0310.3390.0090.9260.9690.499,1.884案例 4为探讨超重和肥胖对高血压病的影响,2023 年,
7、某争论者承受整群抽样的方法, 对某地 6 个镇 35 周岁以上的常住人口进展高血压普查,同时收集了身高、体重等相关信息。体质指数 BMI25 判为“超重或肥胖”,BMI5 为“正常”;收缩压140mmHg 和或 舒张压90mmHg 判为“高血压”。整理后资料见表 18-13。自变量 X 为体质指数,X=1 表示“超重或肥胖”,X=0 表示“正常”;因变量 Y 为是否患病, Y=1 表示“患病”,Y=0 表示“未患病”。X 对 Y 影响的单因素 logistic 回归结果见表 18-14。请问该二分类单因素logistic 回归所得OR 值与承受 2*2 表所计算的OR 有何关系?表 18-3
8、不同体质指数高血压患病率体质指数调查人数患病未患病患病率XY=1Y=0%病例比照超重或肥胖41481656(a)2492(b)39.92X=1 暴露 正常67921331(c)5461(d)19.60X=0 非暴露合计109402987795327.30Variables in the Equation95.0% C.I.for EXP(B)1Constant-2.415.0691229.3511.000.089a. Variable(s) entered on step 1: X.表 18-4非条件logistic 回归分析结果BS.E.WalddfSig.Exp(B)LowerUpperS
9、atepX1.003.044518.6661.0002.7262.5012.972案例 5某医生在河南平顶山煤矿区人群糖尿病DM现况调查根底上,对筛选出的174例糖尿病病例和 3066 例糖耐量正常者进展以人群为根底的病例-比照争论。调查内容包括性别、年龄、糖尿病史、肥胖、体力劳动、饮酒和饮食等因素,分析目的主要是糖尿病者 是否与肥胖有关。该医生应用单因素的分析方法,分别估量暴露于各危急因素的糖尿病患 病优势比,对优势比假设检验和区间估量。分析结果说明糖尿病患病与年龄、糖尿病史、体质指数BMI、腰臀比值WHR、舒张压、多食高粱豆类、职业体力劳动等的关联有 统计意义。该医生应用非条件 logis
10、tic 回归分析糖尿病发生与各种危急因素的关联性,先做糖尿病患病与逐个因素的单因素 logistic 回归结果摘要在表 18-6 中。然后将单因素分析有统计学意义的危急因素引入多因素 logistic 回归模型进展逐步筛选,筛选结果列在表 18-7 中,结果说明,年龄大、母亲有糖尿病史、同胞有糖尿病史、最重时体质指数 BMI高、腰臀比值WHR高、舒张压高、多食高粱和豆类可能是糖尿病的独立危急因子;职业性 体力活动强度高和多食浅色蔬菜可能是糖尿病患病的独立保护因子。争论:(1) 该争论在设计方面存在什么问题?(2) 该资料的统计分析存在什么问题?(3) 什么因素可能影响糖尿病与肥胖的关系,在该争
11、论设计中存在哪些可能的混杂因素?(4) 如何校正混杂因素的影响?(5) 目前的统计分析程序存在什么问题?(6) 如何应用logistic 回归校正混杂因素的影响?(7) 如何依据争论目的估量校正混杂因素后糖尿病与肥胖的关联?表 18-6 非条件logistic 回归单因素分析结果变量OROR 的 95%CI变量OROR 的 95%CI性别0.520.38-0.71年龄2.442.08-2.87居住年限1.581.24-2.03母亲 DM 史5.933.25-10.82子女有 DM8.952.22-36.08同胞 DM 史4.992.44-10.21现进 BMI3.352.41-4.65最重时
12、BMI4.443.01-6.56现时 WHR5.914.05-8.63饮酒指数0.670.47-0.96职业性体力0.710.63-0.80收缩压3.892.39-6.33活动舒张压3.282.27-4.48大米0.110.03-0.45小米1.641.24-2.18高粱2.961.35-6.52豆类1.471.19-1.82禽肉1.301.02-1.66鲜奶1.521.10-2.10豆制品1.271.03-1.06浅色蔬菜0.510.37-2.74动物油0.780.66-0.91两年前动物0.780.97-0.91月经1.801.38-2.36油表 18-7 非条件logistic 回归多因
13、素分析结果及各危急因子的PAR%值变量回归系数标准误标准回归系数OROR 的 95%CIPAR%年龄0.71340.09000.42422.041.71-2.4480.04母亲 DM 史1.79840.36130.13696.042.98-12.267.19同胞 DM 史0.80690.43490.05322.240.96-5.263.18职业性体力-0.11910.0689-0.09090.890.78-1.02-19.20活动最重时 BMI0.61350.22550.16911.851.19-2.8737.35现进 BMI0.94370.22070.25712.571.67-3.9648.80舒张压0.41110.25070.06701.511.01-2.268.15高粱0.79880.29510.07092.221.25-3.963.20豆类0.22110.11870.07741.250.99-1.5710.63浅色蔬菜-0.69350.1974-0.12020.500.34-0.74-269.54