《医学统计学计算与分析题题库(共45页).doc》由会员分享,可在线阅读,更多相关《医学统计学计算与分析题题库(共45页).doc(47页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上第一章 医学统计中的基本概念二、简答题1. 常见的三类误差是什么?应采取什么措施和方法加以控制?参考答案常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于
2、这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。2. 抽样中要求每一个样本应该具有哪三性?参考答案从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。(2)随机性: 就是要保证总体中
3、的每个个体均有相同的几率被抽作样本。(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。3. 什么是两个样本之间的可比性?参考答案可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。第二章 集中趋势的统计描述二、计算与分析1. 现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmo
4、l/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。参考答案 2. 某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下: 202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 159 149 160 142 210 142 18
5、5 146 223 176 241 164 197 174 172 189 174 173 205 224 221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156(1)编制频数分布表并画出直方图;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;(3)计算百分位数、和。参考答案(1)编制频数表:某地100例30-40岁健康
6、男子血清总胆固醇值的频数表甘油三脂(mg/dL)(1)频数(2)累积频数(3)累积频率(4)110 2 2 2125 4 6 6140111717155163333170276060185127272200138585215 79292230 59797245 3 100 100合计 100画直方图: 图 某地100例30-40岁健康男子血清总胆固醇值的频数分布(2)计算均数和中位数:从上述直方图能够看出:此计量指标近似服从正态分布,选用均数较为合适。(3)计算百分位数: 3 测得10名肝癌病人与16名正常人的血清乙型肝炎表面抗原(HBsAg)滴度如下表,试分别计算它们的平均滴度。肝癌病人与正
7、常人的血清乙肝表面抗原(HBsAg)滴度滴度倒数正常人数肝癌病人数 8 7 1 1652 3213 6432 12801 25601参考答案肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度测定结果 滴度倒数(X)正常人数()肝癌病人数()lgxlgxlgx 8710.906.300.9016521.206.002.4032131.501.504.5064321.815.433.62128012.110.002.11256012.410.002.41合计 16 10- 19.23 15.94 正常人乙肝表面抗原(HBsAg)滴度为1: 15.92肝癌病人乙肝表面抗原(HBsAg)滴度为1:3
8、9.26 离散程度的统计描述二、计算与分析1. 下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。 表 手术前后患者血催乳素浓度(ng/ml) 例号血催乳素浓度术前术后12764128801103 16002804324615398105 6266437500258 176030095002151022092参考答案血催乳素浓度术前均值672.4 ng/ml,术后均值127.2 ng/ml。手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。术前:,术后:, 可以看出:以标准差作为比较两组变异情况的指标,易夸
9、大手术前血催乳素浓度的变异。2. 某地144例3045岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。试估计该地3045岁成年男子血清总胆固醇的95%参考值范围;血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少?参考答案正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。又因血清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。下限:(mol/L)上限:(mmol/L)即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28 mmol/L6.62 mmol/L。该地正常成年
10、男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布值:问题转化为求值大于0.91的概率。由于标准正态分布具有对称性,所以值大于0.91的概率与值小于0.91的概率相同。查附表1得,所以说血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的18.14%。3. 某地200例正常成人血铅含量的频数分布如下表。(1)简述该资料的分布特征。(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。 表 某地200例正常成人血铅含量(mol/L)的频数分布血铅
11、含量频 数累积频数0.007 70.2449560.4845101 0.7232133 0.96281611.20131741.44141881.6841921.9241962.1611972.4021992.64 1 200参考答案(1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。 某地200例正常成人血铅含量(mol/L)的频数分布 血铅含量组中值频 数累积频数累积频率0.000.12773.50.240.36495628.00.480.604510150.50.720.8
12、43213366.50.961.082816180.51.201.321317487.01.441.561418894.01.681.80419296.01.922.04419698.02.162.28119798.52.402.52219999.52.642.761200100(2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。百分位数法:第95%百分位数位于1.68组段,组距为0.24,频数为4,该组段以前的累积频数为188,故即该地正常成人血铅值的95%参考值范围为小于1.80。正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。某地200例正常成人血
13、铅含量()均值和标准差计算表血铅含量组中值()频 数()0.00 0.12-0.927-6.445.92480.240.36-0.4449-21.569.48640.480.60-0.2245-9.92.1780.720.84-0.0832-2.560.20480.961.080.0328 0.840.02521.201.320.1213 1.560.18721.441.560.1914 2.660.50541.681.800.264 1.040.27041.922.040.314 1.240.38442.162.280.361 0.360.12962.402.520.402 0.800.32
14、002.642.760.44 1 0.440.1936合计 200-31.5219.8098计算均值和标准差: 单侧95%参考值范围:即该地正常成人血铅值的95%参考值范围为小于1.96,与百分位数法相比两者相差不大。第四章 抽样误差与假设检验二、计算与分析1. 为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。参考答案样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。,95%可信区间为 下限:(g/L)上限:(g/L)即该地成年男子红细胞总体均数的
15、95%可信区间为101.26g/L101.54g/L。2. 研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问题:如何衡量这100名儿童总胆固醇样本平均数的抽样误差?估计100名儿童的胆固醇平均水平的95%可信区间;根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。参考答案 均数的标准误可以用来衡量样本均数的抽样误差大小,即mg/dl, 样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。,则95%可信区间为 下限:(mg/dl)上限:(m
16、g/dl)故该地100名儿童的胆固醇平均水平的95%可信区间为201.62mg/dl213.38mg/dl。因为100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的95%可信区间的下限高于正常儿童的总胆固醇平均水平175mg/dl,提示患心脏病且胆固醇高的父辈,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。第五章 t检验二、计算与分析 1. 已知正常成年男子血红蛋白均值为140g/L,今随机调查某厂成年男子60人,测其血红蛋白均值为125g/L,标准差15g/L。问该厂成年男子血红蛋白均值与一般成年男子是否不同?参考答案因样本含量n50(n60),故采用样本均数与总体均数比较的u检
17、验。(1)建立检验假设, 确定检验水平,该厂成年男子血红蛋白均值与一般成年男子相同,该厂成年男子血红蛋白均值与一般成年男子不同a=0.05(2) 计算检验统计量=7.75(3) 确定P值,做出推断结论7.751.96,故P,P 1.19,F0.05,按0.05水准,不拒绝H0,差别无统计学意义。故认为健康人与度肺气肿病人1抗胰蛋白酶含量总体方差相等,可直接用两独立样本均数比较的t检验。(1)建立检验假设, 确定检验水平,健康人与度肺气肿病人抗胰蛋白酶含量相同,健康人与度肺气肿病人抗胰蛋白酶含量不同a=0.05(2) 计算检验统计量=1.12=5.63(3) 确定P值,做出推断结论t5.63 ,
18、P 0.001,拒绝H0,接受H1,差别有统计学意义,可认为健康人与度肺气肿病人1抗胰蛋白酶含量不同。4.某地对241例正常成年男性面部上颌间隙进行了测定,得其结果如下表,问不同身高正常男性其上颌间隙是否不同?表 某地241名正常男性上颌间隙(cm)身高 (cm)例数均数标准差1611160.21890.23511721250.22800.2561参考答案本题属于大样本均数比较,采用两独立样本均数比较的u检验。由上表可知,=116 , =0.2189 , =0.2351=125 , =0.2280 , =0.2561(1)建立检验假设, 确定检验水平,不同身高正常男性其上颌间隙均值相同,不同身
19、高正常男性其上颌间隙均值不同a=0.05(2) 计算检验统计量=0.91(3) 确定P值,做出推断结论u0.910.05,按=0.05水准,不拒绝H0, 差别无统计学意义,尚不能认为不同身高正常男性其上颌间隙不同。5.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下表,问两组的平均效价有无差别?表 钩端螺旋体病患者凝溶试验的稀释倍数标准株100200400400400400800160016001600320032003200水生株1001001002002002002004004008001600 参考答案本题采用两独立样本几何均数比较的t检验。t2.689t0.05/
20、2,22,P,故P0.05,差别有统计学意义,按a0.05水准,拒绝H0,接受H1,故认为男、女大学生的血清谷胱甘肽过氧化物酶的活力总体方差不等,不能直接用两独立样本均数比较的t检验,而应用两独立样本均数比较的t检验。=1.53, t0.05/22.009,t0.05,按=0.05水准,不拒绝H0, 差别无统计学意义,尚不能认为男性与女性的GSH-Px有差别。第六章 方差分析二、计算与分析1在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间
21、的部分凝血活酶时间有无差别? 各剂量组48小时部分凝血活酶时间(s)0.5 U1 U2 U3 U36.840.032.933.034.435.537.930.734.336.730.535.335.739.331.132.333.240.134.737.431.136.837.639.134.333.440.233.529.838.338.136.635.438.432.432.031.239.835.633.8参考答案如方差齐同,则采用完全随机设计的方差分析。经Bartlett 方差齐性检验,=1.8991 ,=3。由于=7.81, ,故0.05,可认为四组48小时部分凝血活酶时间的总体方差
22、齐同,于是采用完全随机设计的方差分析对四个剂量组部分凝血活酶时间进行比较。(1)提出检验假设,确定检验水准:,即四个剂量组部分凝血活酶时间的总体均数相同:、不全相同,即四个剂量组部分凝血活酶时间的总体均数不全相同=0.05(2)计算检验统计量,列于方差分析表中方差分析表变异来源平方和自由度均方值处理组间101.0860333.69534.80组内(误差)252.4780 36 7.0133总变异353.5640 39(3)确定值,做出推断结论 分子自由度,分母自由度,查界表(方差分析用),=2.87。由于=4.80,故0.05,按照= 0.05的显著性水准,拒绝,接受,差别有统计学意义,可认为
23、四个剂量组部分凝血活酶时间的总体均数不全相同,进而需进行均数间多重比较。 本题采用SNK法进行多重比较。(1)提出检验假设,确定检验水准:,即任意两组部分凝血活酶时间的总体均数相同:,即任意两组部分凝血活酶时间的总体均数不相同=0.05(2)计算检验统计量,用标记字母法标记 多重比较结果(=0.05)组别均数例数SNK标记1 U37.83010A2 U35.10010B3 U34.37010B0.5 U33.62010B(3)做出推断结论1U与 0.5U,1U与 2U ,1U与3U间差别有统计学意义(标记字母不同),可认为1U与 0.5U,1U与 2U ,1U与3U间部分凝血活酶时间的总体均数
24、不同。0.5 U、2U、3U组彼此间差别无统计学意义(均含有字母B),可认为这三组部分凝血活酶时间的总体均数相同。2为探讨小剂量地塞米松对急性肺损伤动物模型肺脏的保护作用,将36只二级SD大鼠按性别、体重配成12个配伍组,每一配伍组的3只大鼠被随机分配到对照组、损伤组与激素组,实验24小时后测量支气管肺泡灌洗液总蛋白水平(g/L),结果如下表。问3组大鼠的总蛋白水平是否相同?3组大鼠总蛋白水平(g/L)配伍组对照组损伤组激素组10.361.480.3020.281.420.3230.261.330.2940.251.480.1650.361.260.3560.311.530.4370.331.
25、400.3180.281.300.1390.351.580.33100.411.240.32110.491.470.26120.271.320.26参考答案本题采用随机区组设计的方差分析。(1)提出检验假设,确定检验水准:,即三组大鼠总蛋白水平的总体均值相同:、不全相同,即三组大鼠总蛋白水平的总体均值不全相同:,即不同配伍组大鼠总蛋白水平的总体均值相同:、不全相同,即不同配伍组大鼠总蛋白水平的总体均值不全相同=0.05(2)计算检验统计量,列于方差分析表中 方差分析表变异来源平方和自由度 均方值处理组间9.551224.7756719.80区组间0.1138110.0103 1.56误差0.1
26、460220.0066总变异9.810935(3)确定值,做出推断结论。对于处理因素,分子自由度=2,分母自由度=22,查界值表(方差分析用),=3.44。由于=719.80,故0.05,照= 0.05的显著性水准,不拒绝,差别无统计学意义,尚不能认为区组因素对大鼠总蛋白水平有影响。3为研究喹啉酸对大鼠急性和亚急性炎症的影响,将40只体重为20020(g)的雄性Wistar大鼠建立急性和亚急性炎症动物模型,然后随机分为4组,每组10只,给予不同的处理,观察其WBC值。4种处理分别为:腹腔注射生理盐水后3小时处死、腹腔注射生理盐水后6小时处死、腹腔注射喹啉酸(0.35mg/g)后3小时处死,腹腔
27、注射喹啉酸(0.35mg/g)后6小时处死。实验结果如下表。问喹啉酸与给药距处死的时间间隔(简称时间)对WBC值是否有影响? 不同药物与不同时间大鼠WBC值(103)时 间药 物生理盐水喹啉酸3h21.318.815.811.021.913.5 8.712.811.122.6 9.412.516.317.1 5.3 9.317.914.6 8.311.06h19.023.013.919.025.222.815.815.322.917.818.319.219.824.613.018.222.725.314.017.3 参考答案本题采用22析因设计方差分析。(1)提出检验假设,确定检验水准:,即A
28、因素两个水平组WBC值总体均数相等:,即A因素两个水平组WBC值总体均数不相等:,即B因素两个水平组WBC值总体均数相等 :,即B因素两个水平组WBC值总体均数不相等:A与B无交互效应 :A与B存在交互效应=0.052.计算检验统计量,列于方差分析表中。方差分析表变异来源平方和自由度均方值A因素423.1502 1423.150248.68B因素291.0603 1291.060333.48AB 3.5403 1 3.5403 0.41误差312.947036 8.6930总变异1030.6978393.确定值,做出推断结论。对于A因素,=1,=36,查界值表(方差分析用),=4.11。由于=
29、48.68,故 0.05,按照= 0.05的显著性水准,拒绝,接受,认为A因素(药物)两个水平组WBC值总体均数不相等。对于B因素,=1,=36,查界值表(方差分析用),=4.11。由于=33.48,故0.05,按照= 0.05的显著性水准,不拒绝,认为A(药物)与B(时间)间无交互效应。第七章 相对数及其应用二、计算与分析 1. 某工厂在“职工健康状况报告中”写到:“在946名工人中,患慢性病的有274人,其中女性 219人,占80%,男性55人,占20%。所以女性易患慢性病”,你认为是否正确?为什么?参考答案不正确,因为此百分比是构成比,不是率,要知道男女谁更易患病需知道946名工人中的男
30、女比例,然后计算男女患病率。 2. 在“锑剂短程疗法治疗血吸虫病病例的临床分析”一文中,根据下表资料认为“其中10岁组死亡率最高,其次为20岁组”,问这种说法是否正确? 锑剂治疗血吸虫不同性别死亡者年龄分布 年龄组男女合 计0 33 6101171820 461030 53 840 12 350 51 6合计292251 参考答案不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的死亡人数除各年龄段的调查人数得到死亡率。3. 某研究根据以下资料说明沙眼20岁患病率最高,年龄大的反而患病率下降,你同意吗?说明理由。某研究资料沙眼病人的年龄分布 年龄组沙眼人数构成比(%)0 47 4.610
31、19819.32033032.13019819.34012812.450 80 7.860 38 3.770 8 0.8合计 1027100.0参考答案不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的沙眼人数除各年龄段的调查人数得到患病率。4. 今有两个煤矿的工人尘肺患病率(%)如下表,试比较两个煤矿的工人尘肺总的患病率。 两个煤矿的工人尘肺患病率情况(%)工龄(年) 甲 矿乙 矿 检查人数尘肺人数患病率检查人数尘肺人数患病率 6140261200.8699220.20 6 42851683.92190580.42 10 254231612.43101411711.54合计 2085
32、36042.9039111273.25参考答案 两个煤矿的工人尘肺标准化患病率(%)工龄(年)标准构成甲 矿乙 矿原患病率预期患病人数原患病率预期患病人数 6150180.861290.2030 661903.922430.4226 10355612.4344211.54410合计24764814466甲矿尘肺患病率=乙矿尘肺患病率甲矿尘肺患病率高于乙矿尘肺患病率。5. 抽样调查了某校10岁儿童200名的牙齿,患龋130人,试求该校儿童患龋率的95%的区间估计。参考答案 (,)= 第八章 检验二、计算与分析1某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采
33、用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义?参考答案 本题是两组频数分布的比较,资料课整理成下表的形式。两组疗法病人的死亡率的比较组别死亡存活合计西医疗法1389102西医疗法加中医疗法9180189合计22269291(1)建立检验假设并确定检验水准 :,即两组病人的死亡率相等 :,即两组病人的死亡率不等 (2)用四个表的专用公式,计算检验统计量值=6.041 (3)确定P 值,作出推断结论以=1查附表7的界值表,得。按水准,拒绝,接受,可以认为两组病人的死亡率不等。2某医院研究中药治疗急性心
34、肌梗死的疗效,临床观察结果见下表。问接受两种不同疗法的患者病死率是否不同? 两种药治疗急性心肌梗死的疗效 组别存活死亡合计病死率(%)中药组653684.41非中药组12214 14.29合计775826.10参考答案 本题=,宜用四格表的确切概率法(1)建立检验假设并确定检验水准 :,即两种不同疗法的患者病死率相同 :,即两种不同疗法的患者病死率不同 (2)计算确切概率=0.2001 (3)作出推断结论按水准,不拒绝,无统计学意义,还不可以认为两种不同疗法的患者病死率不同。 3某医师观察三种降血脂药A,B,C的临床疗效,观察3个月后,按照患者的血脂下降程度分为有效与无效,结果如下表,问三种药物的降血脂效果是否不同? 三种药物降血脂的疗效 药物有效无效合计A 120 25 145B 602787