《卫生管理统计及软件应用贺佳课后习题答案.pdf》由会员分享,可在线阅读,更多相关《卫生管理统计及软件应用贺佳课后习题答案.pdf(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章一、名词解释参数:指总体中全部观察单位的观测值所得的特征值,是一个固定的常数,通常是未知的。统计量:指由样本计算得到的反映样本资料特征的统计指标,为随机变量,取值在参数附近波动,可作为参数的估计值。同质:指观察单位通常具有某种共性,即相同的状况或属性等,观察单位之间常常“大同小异”。变异:指同质观察单位之间的差异。概率:是描述随机事件发生可能性大小的一个度量,为一个固定的常数,取值在0到1之间,常用来表示。频率:在相同的条件下,独立地重复进行次实验,随机事件A出现了 f次,则 称“为事件A出现的频率。抽样误差:指由抽样引起的样本统计量与总体参数之间的差异,或者不同样本统计量之间的差异。二
2、、单项选择题l.E 2.E 3.B 4.A 5.D 6.D 7.B 8.D 9.C 10.D三、简答题1.卫生管理统计的基本步骤一般分为统计设计、收集资料、整理资料和分析资料四个步骤。这四个步骤紧密联系,前一步是后一步的基础,每一个步骤的工作质量都会影响最终结论的正确性。2.卫生管理统计中通常将资料分为定量资料、定性资料和等级资料三种类型。定量资料是测量每个观察单位某项指标得到定量的测量值,表现为数值大小,且有度量衡单位,如某医院出院患者的住院日。定性资料是将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料,测量值为定性的,表现为互不相容的属性或类别,如某医院住院患者中A型
3、、B型、A B型和0型人数。等级资料是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察档位数后得到的资料,具有半定量性质,表现为等级大小,如某病患者治愈、好转、无效、死亡的人数。第二章一、单项选择题l.C 2.B 3.E 4.B二、简单题I.利用SPSS直接建立数据库一般分为两步,第一步变量设置,在变量视图(VariableView)中完成,第二步数据录入,在 数 据 视 图(DataView)中完成。在建立数据库过程中要注意以下问题:建立数据库之前应先确定研究中需要的指标,哪些是重要指标,哪些是次要指标,哪些是标识变量,尽量做到数据库中含有研究所需要的每一个指标,同时尽量避
4、免冗余无用的指标。2.数据录入基本原则一个观测的数据在一行显示,一个指标即一个变量的数据在一列显示,录入完成后产生一个标准数据格式数据集。数据录入过程中要注意尽可能用数值变量代替字符变量,便于数据录入;要有标识变量,便于核查;对于多项选择题的录入要采用多重二分法或者多重分类法,切忌将多个选项录入一个变量。三、上机应用题在变量视图中做以下设置变量名数据类型小数点变量标签值标签资料类型No数值型0编号,标识变量NominalGender数值型0性别1=男,0=女NominalNation数值型0民族0=汉族,1=其它NominalIDno数值型0身份证号码NominalBirthd日期型0出生年月
5、NominalAddress字符型0居住地NominalTell数值型0电 话(家)NominalTel2数值型0电 话(手机)NominalTel3数值型0电 话(其他)Nominal注:其余各项默认即可。Relative数值型0亲属关系1 =子,2=女,3=其它人NominalAl数值型2身高ScaleA2数值型2体重ScaleA3数值型2腰围ScaleA4数值型2臀围ScaleA51数值型2SBP1ScaleA52数值型2SBP2ScaleA61数值型2DBP1ScaleA62数值型2DBP2ScaleA7数值型0服用降压药0=无=有NominalA8数值型0职业1=行政或其它管理,2=
6、医护人员,3=教师,4=军警保安,5=文化艺术,6=理工技术人员,7=金融法律,8=文员或秘书,9=工厂工人,10=个体经营者,11=商业或服务人员,12=农民或渔民,13=家庭主妇,14=其它,99=不详Nominal第三章一、名词解释1.单纯随机抽样:又称简单随机抽样,是按等概率原则直接从含有N个观察单位的总体中抽取n个观察单位组成样本。单纯随机抽样是最基本的抽样方法,也是其他抽样方法的基础。优点:均数(或率)及标准误的计算简便。缺点:总体较大时抽得的样本单元很分散,给实施调查带来困难。2.分层抽样:按与研究目的明显有关的因素(或特征),将观察单位分为若干的类型或组别(统计学上称“层,st
7、ratum),然后从每一层中按比例抽取一定数量的观察单位组成样本。优点:抽样误差较小,样本对总体有较好的代表性;便于在不同的层内采用不同的抽样方法,有利于调查组织工作的实施;可以对各层独立进行分析。3.非抽样误差:指除抽样误差以外的,由各种非随机因素引起的误差,主要包括抽样框误差、无应答误差和计量误差。非抽样误差成因复杂,可产生于调查工作的各个阶段、各个环节。非抽样误差难以测度,但可以控制,比如设计科学的调查研究方案、开展预调查、调查人员严格选择与培训、加强调查实施过程的组织管理、监督和检查及资料整理录入加强编码及双录等措施均可减少非抽样误差。二、简答题1.调查研究的质量控制应贯穿于调查工作的
8、各个阶段、各个环节,比如设计科学的调查研究方案、开展预调查、调查人员严格选择与培训、加强调查实施过程的组织管理、监督和检查及资料整理录入加强编码及双录等措施,以减少非抽样误差。2.(1)估计的容许误差。容许误差越大,估计精度越低,需要的样本量越小;反之,容许误差越小,估计精度越高,需要的样本量越大。(2)估计的置信度。置信度要求越高,即 a 的取值越小,则样本含量要求越大。置信水平一般取95%。(3)总体的变异程度。当总体率兀越接近0.5,变异程度越大,需要样本量越大;兀值偏离0.5 越远,变异程度越小,样本量越小。(4)应答率。在估算样本量时通常需要根据可能的应答率增加样本量。设估算出的样本
9、量为n,应 答 率 为 ,则校正的样本量为 =/。(5)设计效率。在估算样本量0r0 r时,应考虑复杂抽样设计的设计效率对研究结果的影响,一般先按照单纯随机抽样设计估计出初始样本量,再乘以设计效率Deff得到最终的样本量。3.抽样调查中的误差有两大类:抽样误差和非抽样误差。抽样误差是由于抽样使样本统计量与总体参数之间的差异。由于每次抽取样本所包含的观察单位是随机的,所以,不同样本之间以及样本与总体之间会存在偏差,由此产生了抽样误差。非抽样误差产生比较复杂,有以下几类:由于抽样框不完善导致的抽样框误差;由于调查获得的数据与所欲调查项目的真值之间不一致而导致的计量误差;由于无应答导致的无应答误差等
10、。非抽样误差不仅在抽样调查中,在全面调查中也是存在的。三、选择题1.D 2.E 3.B 4.B 5.E 6.D 7.A 8.B四、应用题1.已知,兀=0.2,5 =0.02,a=0.05,Z =1.96,代入公式(3-11)0.05/2有n =Za/2(1 _ 1.9 6 2 0.2(1 -0.2)5 0.0 3 2因此,需要调查6 8 3名6-1 1岁儿童。2.根据题意可以整理如下:年龄段(岁)N1nWip5 2Pi18-308002000.2290.0860.000376431-4510004000.2860.1820.000372246-6012004500.3430.3560.0005
11、0956 0以上5003000.1430.4630.0008288根据公式(3-5)(3-6)可计算总体两周患病率的估计值及标准误:p=W p=0.229*0.086+0.286*0.182+0.343*0.356+0.143*0.463=0.259一 229 20.0003764+(1-吧4 0.143 20.0008288 800 500=0.008785两周患病率的 95%置信区间为(0.259-1.96x0.008785,0.259+1.96x0.008785),即(0.242,0.276)o因此,该居民社区总的两周患病率为 25.9%,95%置信区间为(24.2%,27.6%)o第四
12、章一、单项选择题1.A 2.A 3.D 4.C 5.C 6.E二、简答题1.定量资料频数分布表的编制:求 出 全 距(range),2 确定组段数(k)根据样本含量多少确定组段数,一 般 设 815个组段,不宜过粗或过细。(3)求 组 距(class interval):根据资料的分布类型,组距分为相等与不等两种。确定组限:数量分组的组限一定要清楚明确,组间的衔接必须严密,不遗漏,也不重复:即要求第一个组段应包括资料中的最小值,最后一个组段应包括最大值;此外,应遵循“上限不在本组”的规则。规范的表示方法是采用半开半闭区间(右开左闭区间)的形式,即各组段只写明下限值,而不标出上限值,如 0,15
13、,30,但是最后一个组段必须采用闭区间。0 列频数表统计各组段频数,在此基础上计算频率、累计频数和累计频率。2.参见教材表4-4及 4-5 对集中趋势及离散趋势统计量的总结。3.中位数和均值都是数据集中趋势的描述统计量,中位数是位置代表值,不考虑极端值,可以适用于不拘分布或分布类型不明的资料;均值考虑全部数据,包括极端值,但是一般适用于对称分布资料,尤其是正态分布资料。4.这四个指标都是反映计量资料的离散程度。极差和四分位差可用于任何分布,后者比前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料服从对称分布,尤其是正态分布。5.变异系数可用于多组资料间度量衡单位不同或均数相
14、差悬殊时的变异程度比较。三、计算题1根据原始数据资料,对数据进行排序、分组后,得到频数分布表如下:表 4-9 某 地 120名正常成年人血清铜含量(imol/L)组段频 数 f频率P(%)(1)(2)(3)9.0032.5010.0043.3311.001210.0012.001310.8313.00 1714.1714.002218.3315.001815.0016.00-1310.8317.00119.1718.0054.1719.00-21.67合计120100.002.Z x=222+142+174+186=2107E m=2222+1422+1742+I862=381911x=三=亘
15、2Z=175.58(mg/dl)n 12(x-x)2I n-1=32.97(mg/d/)3.抗体滴度倒数的几何平均数为:21g 20+31g 40+21g 80+3 lg 160+1g 320)G=lg-i(-=70.5311故平均抗体滴度为1:70.53第五章一、名词解释相对数:是指两个有联系的指标之比。它可以是两个有联系的绝对数之比,也可以是两个统计指标之比。率:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用于说明某种现象发生的频率大小或强度,故又称频率指标。构成比:也称为构成指标,是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数
16、之比,用以说明某一事物内部各组成部分所占的比重或分布,常 用 百 分 数 表 示。相 对 比:是指两个有关 联 的指 标 之 比,用 以 描 述 两 者 的 对 比 水 平,是对比的最简单形式。常以百分数或倍数表示,说明一个指标是另一个指标的百分之几或几倍。二、简 答 题(略)三、单项选择题1.A 2.C 3.A 4.C 5.D 6.B 7.D四、计算分析题1.(1)表 1 某中学各类口腔卫生状况者的患翻情况口腔卫生情况调查人数患弱人数患 斜 人 数 构 成 比(%)患 制 率(%)良好者2 0 5 63 6 12 4.4 71 7.5 6中等者2 1 6 06 3 54 3.0 52 9.4
17、 0不好者9 6 34 7 93 2.4 84 9.7 4合计5 1 7 91 4 7 51 0 0.0 02 8.4 8(2)患 耦 人 数 百 分 比 是 构 成 比,患 斜 率 是 率,分别从构成比和率的定义上进 行 解 释。2.表 2某 地 2 0 0 b2 0 1 1 年医院床位统计数据年 末 床绝对增长量发 展 速 度()增 长 速 度()年份(1)符号逐 年(2)位数(3)累(4)计(5)定基比(6)环 比(7)定 基 比(8)环 比(9)2 0 0 1a03 6 1 0 71 0 0.01 0 0.02 0 0 2a14 1 7 4 45 6 3 75 6 3 71 1 5.6
18、1 1 5.61 5.61 5.62 0 0 3a25 0 7 1 51 4 6 0 88 9 7 11 4 0.51 2 1.54 0.52 1.52 0 0 4a35 6 7 0 72 0 6 0 05 9 9 21 5 7.11 1 1.85 7.11 1.82 0 0 5a46 0 8 3 02 4 7 2 34 1 2 31 6 8.51 0 7.36 8.57.32 0 0 6a56 5 8 4 12 9 7 3 45 0 1 11 8 2.31 0 8.28 2.38.22 0 0 7a67 0 7 2 13 4 6 1 44 8 8 01 9 5.91 0 7.49 5.97.
19、42 0 0 8a77 5 8 8 73 9 7 8 05 1 6 62 1 0.21 0 7.31 1 0.27.32 0 0 9a88 3 4 8 84 7 3 8 17 6 0 12 3 1.21 1 0.01 3 1.21 0.02 0 1 0a98 7 6 3 35 1 5 2 64 1 4 52 4 2.71 0 5.01 4 2.75.02 0 1 1a109 2 7 1 55 6 6 0 85 0 8 22 5 6.81 0 5.81 5 6.85.83.表3某三甲医院与某乡镇卫生院急性心肌梗死标准化治愈率某三甲医院 某乡镇卫生院严 重程度(1)标准治疗人数(2)原治愈率(%)
20、(3)预期治愈数(4)=(2)X (3)原 治 愈 率()(5)预期治愈数(6)=(2)X (5)轻1 0 08 0.08 07 0.07 0重1 0 06 0.06 04 0.04 0合计2 0 01 4 0一1 1 0T 4 0某三甲医院心肌梗死标准化治愈率=-X 1 0 0%=7 0.0%2Of t o某 乡 镇 卫 生 院 心 肌 梗 死 标 准 化 治 愈 率_ X 1 0 0%=5 5.0%2 0 0某三甲医院心肌梗死治愈率高于某乡镇卫生院。第 八 早一、名词解释1.统计指标:是反映总体现象综合数量特征的基本概念,用于获取总体现象的实际数量状况及其发展变化情况,包括三个构成要素,即
21、指标名称、计量单位和计算方法。2.孕产妇死亡率:是指某年中由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生的活产数之比。3.续发率:是指在一定观察期内某种传染病在易感接触者中二代病例的百分率。4.人口总数:又称总人口数,一般是指一定地域范围内(国家或地区)在某一特定时间的人口数量,是人口统计中最基本的指标。5.患病率:又称为现患率或流行率,是指某特定时间内受检人群中现患某种疾病的频率,可以用于描述病程较长或发病时间不易明确的疾病的患病情况。6.寿命表:又称为生命表,是指根据特定人群的年龄别死亡率计算出来的一种统计表,用于说明在特定人群年龄别死亡率的条件下人的生命过程。二、单项选择题1.A
22、2.A 3.C 4.D 5.B 6.B 7.E 8.D 9.A 10.C三、简答题1.医院统计主要包括工作效率统计、诊断质量统计、治疗质量统计、医疗管理质量统计、护理质量统计和卫生经济管理统计等内容。2.传染病预防与控制的统计指标主要包括传染病报告质量指标,如传染病漏报率、居民漏报率、医院漏报率、迟报率、漏诊率等;传染病疫情指标,如传染病感染率、发病率、续发率、死亡率、病死率等;预防接种指标,如疫苗接种率、保护率、抗体阳转率等。3.疾病统计的常用指标包括发病率、患病率、累积发病率、治愈率、有效率、死亡率、生存率等。4.寿命表的主要指标包括年龄组尚存人数、年龄组平均存活年数、年龄组生存人年数、年
23、龄组生存总人年数、年龄组平均期望寿命、年龄组死亡率、年龄组死亡概率、年龄组死亡人数等。四、计算分析题治愈率一期内出院患者中治愈人次数x 100%=298 x 100%=67.4%同期出院患者人次数 442病 死 率=因某病死亡人数同期某病病人的总数3()x 100%=x 100%=6.8%442第七章一、单项选择题1.B 2.A 3.C 4.D 5.B 6.C 7.D 8.D 9.D 10.C二、简答题1.应根据资料的性质和分析目的选择合适的统计图。2.(1)标题,它位于图的下方中间,概括地说明图的内容。一般情况下,标题应包含图的编号,以便在文字说明时使用方便。有时标题也包含资料产生的时间、地
24、点或来源。(2)图域,以纵横轴为坐标绘制的图形,一般取第一象限为作图区,两轴的交点为起点,考虑到图形的美观,长宽之比一般是7:5。(3)标目描述被研究的事物与指标,横标目位于横轴的下方,纵标目置于纵轴的左侧。(4)刻度,指纵横轴上的坐标,刻度数值按从小到大的顺序。(5)图例,在同一图形中比较两种或多种事物时,需用不同的线形、图示或颜色区分不同内容,应附图例加以说明。图例可放在图域的右上角空隙处或图中其它适当的位置。3.普通线图:用线段的升降表示某现象随另一现象变化而变化的趋势,纵横坐标均为算术尺度。半对数线图:一种特殊的线图,其纵坐标变量取对数尺度,横坐标变量为算数尺度,表示某现象随另一现象变
25、化而变化的速度。4,直条图:用等宽直条的长短表示相互独立的各项指标数量的大小,其横轴表示分类资料的分组,纵轴表示各指标数量的大小,各组之间是间断的,各直条间留有空隙。直方图:用矩形面积表示连续变量的频数(频率)分布,其横轴表示连续变量值的分组,纵轴表示频数或频率,各直条间不留空隙。5.联系:描述计数资料的构成比。区别:比较多个计数资料的构成比时,构成直条图较圆图更适用。第八章一、名词解释1.抽样误差:由随机抽样造成的样本均数与样本均数之间,样本均数与总体均数之间的差异称为均数的抽样误差。2.置信区间:按照给定的概率(1-a)所确定的包含总体参数的一个范围,该范围称为总体参数的置信区间,也称作可
26、信区间。3 .假设检验:又称作显著性检验,是用于判断样本指标与总体指标之间或样本指标与样本指标之间的差异有无统计学意义的一种统计方法。4 .检验水准:进行假设检验时,预先设定的小概率事件发生的概率值。5 .1 类错误:又称假阳性错误,即拒绝了原本成立的,时犯的错误。0二、单项选择1 .B 2.D 3.E 4.D 5.A 6.B三、简答题1 .样本均数的抽样分布有如下特点:(1)各样本均数未必等于总体均数;(2)各样本均数之间未必相等;(3)样本均数的分布具有一定的规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布;(4)样本均数之间的变异比较原变量明显缩小。2 .假设检验的基本
27、思想有:(1)小概率事件 小概率事件是指在一次随机试验中被认为基本上不会发生的事件,或者发生的概率非常小,可以认为不会发生。具体发生概率小于多少才算是小概率事件,是需要在解决实际问题时预先设定的,即检验水准a ,实际工作当中常取0.0 1 或 0.0 5,无特殊说明,一般为0.0 5。设定a =0.0 5 即规定发生概率不超过0.0 5 的事件即是小概率事件。(2)反证法思想 是指首先提出假设,假定某事实成立(即原假设),在此基础上选用适当的统计方法来估计该事件发生的概率P。如果P a,说明该事件不是小概率事件,尚不能认为该事实不成立;如 果 P W a ,说明该事件的发生属于小概率事件,我们
28、就有理由怀疑原假设的正确性,即该事实不成立。3.f 分布曲线的特点有:(1),分布是一簇曲线,而不是单条曲线;(2)以0为中心,单峰分布,左右对称;自由度V越小,s _越大,”直越分散,曲线的峰越矮,尾部越粗;X(4)随着自由度v的增大,分布逐渐逼近标准正态分布,当v趋近于无穷大时,/分布就完全称为标准正态分布。4.假设检验的基本步骤有:0)建立检验假设,确定检验水准a;0 选择检验方法,计算统计量;根据统计量与a大小关系确定P值;作 出 推 断 结 论。四、计算题1.一般采用均数的标准误来表征抽样误差大小,由于总体标准差未知,以样本标准差代替,计算结果如下:S=S=0-36=0.Q29x 忑
29、 J502.采用正态分布近似法估算总体率的95%置信区间,结果如下:0.375 1.96x p375(10.g g =0 375 0.0866V 120即全体居民的超重率总体率的置信区间为(28.8%,46.2%)o第九章一、名词解释方差齐性:指被比较的各组数据其总体的方差相等。在统计学上,若各方差之间在给定检验水准下没有统计学差异,则称为方差齐性,亦称等方差性、同方差性或方差一致性。二、单项选择题1.C 2.C 3.C 4.C 5.D 6.A 7.C 8.B 9.C 10.B三、简答题1.基本思想:r检验是用r分布理论来推论差异发生的概率,从而比较两个平均数的差异是否是由抽样误差造成的,从而
30、判断差异是否有统计学意义。应用条件:观测个体间独立,即任一个体的观测值不受其他个体观测值的影响;研究中的分析变量为服从正态分布的定量变量;两独立样本r检验还要求样本所来自的总体方差相等,即总体方差齐性。2.实际工作中,配对样本常见于三种情况。第一种情况主要在实验研究中,研究者将受试对象按某些特征(如性别、年龄等可能对研究结果有影响的因素,也称混杂因素)配成对子,再随机分配对子中的每个个体至处理因素的两个不同水平。除实验研究外,流行病学中常用的1:1匹配的病例对照研究虽为观察性研究,也可视为配对样本;第二种情况是将每份被测样品一分为二,再分配至不同的方法检测;第三种情况属于自身配对形式,每个受试
31、对象在因素处理前和处理后的比较。第一种情况又称异源性配对,后两种情况又称同源性配对。四、计算分析题1 .本题是单样本与已知总体均数比较的t检验。r=3.0 7 7,v=3 5,P 0.0 5,按a =0.0 5水准拒绝防,认为该地活动型结核患者与一般活动型结核患者的心率不同,该地患者心率较高。2 .本题属配对设计资料,故 应 用 配 对t检验方法计算。r=2.1 5 7,v=1 9,P P 0.1,按a=0.0 5 水准,不拒绝 H ,S_ _%-4甲、乙两药疗效相同。第十章一、名词解释1.组间变异:处理因素和随机误差引起的变异。2.组 内(误差)变异:个体差异和测量误差引起的变异。3.均方:
32、其实质是方差,由各离均差平方和除以相应自由度获得,反映了变异大小。二、最佳选择题1.C 2.B 3.C 4.D 5.A 6.C 7.C 8.D三、简单题1.方差分析的基本思想:根据研究设计类型和研究目的将总变异分解为两个或两个以上部分。不同部分的变异可用不同因素的作用或随机误差的作用来解释,通过比较某因素所致变异与随机误差,来判断该因素对研究结果是否有影响。应用条件:1.各样本来自正态总体。2.各样本所来自总体的方差相等。2.在随机区组设计的方差分析中,SS.SS、S S及S S的含义是什总 处理 区组 误么?SS:总变异,即总离均差平方和;SS:处理组间的变异;SS:区总 处理 区组组间的变
33、异;SS:误差的变异。误3.单因素方差分析时总变异分解为两个部分,即组间变异和组内变异,组内变异即随机误差引起的变异,分解过程可以表示为SS=s s +SS;随机总 组间 误差区组设计方差分析总变异分解为三个部分,即处理组间变异、区组间变异和组内变 异,此处的组内变同样由随机误差引起,具体分解过程可以表示为SS=S S +SS+SS。总 处理 区组 谡差四、计算分析题1本题为采用完全随机化设计获得的计量资料,共 有4组数据,可以采用单因素方差分析。采 用SPSS分析的主要结果为:表 10 1 统计描述(Descriptives)谷酰转肽酶NMeanStd.DeviationStd.Error9
34、5%Confidence Interval forMeanLower Bound Upper BoundMinimumMaximum病毒性2033.982520.332684.5465224.466543.49856.5682.05酒精性2034.706028.981476.4804521.142348.26978.60133.57非酒精性2054.008524.660075.5141642.467265.549816.47111.68健康人2023.659011.992162.6815318.046529.27153.5450.85Total8036.589024.577312.747833
35、1.119642.05843.54133.57表10-1为对四个变量进行统计描述的结果,主要给出了四个变量的名称、样本量、均数、标准差、标准误、95%置信区间的下限、上限以及最小值、最大值等。表10-2方差齐性检验结果(Test of谷酰转肽酶Homogeneity of Variances)Levene Statisticdfldf2Sig.2.14376.1024表1 0-2为方差齐性检验的结果,其中第一列为L ev en e统计量,第二列和第三列为两个自由度,第四列是检验的P值(S i g.),本例P=0.1 0 2 4 0.0 5 ,因此不能认为方差不齐,可以直接进行完全随机设计的方差
36、分析。表1 0-3完全随机设计资料的方差分析(A NOV A)谷酰转肽酶Sum of SquaresdfMean SquareFSig.Between Groups9619.26833206.4236.40.0006Within Groups38100.20976501.319Total47719.47879表1 0-3为完全随机设计资料方差分析的主要结果,列出了组间变异、组内(即误差)变异、总变异及各自对应的自由度(df),组间均方、组 内(误差)均方,尸值和尸值(S i g.)o本例尸=6.4 0,P=0.1 0 2 4 0.0 5。按a =0.0 5判断水准,拒 绝”0,差异有统计学意义
37、,可以看出,四个组的G G T含量不同。表 10-4 SNK-q 检 验 结 果(Homogeneous Subsets)谷酰转肽酶Student-Newman-Keulsa分组NSubset for alpha=0.0512健康人病毒性酒精性非酒精性Sig.2020202023.659033.982534.7060.269154.00851.0000Means for groups in homogeneous subsets are displayed.a.Uses Harmonic Mean Sample Size=20.000.表1 0-4为两两比较S NK q检验的结果。可以看出,健
38、康人、病毒性脂肪肝患者以及酒精性脂肪肝患者的G G T含量相同,而健康人、病毒性脂肪肝患者、酒精性脂肪肝患者与非酒精性脂肪肝患者的G G T含量均不相同。2本题为采用随机化区组设计获得的计量资料,可以采用两因素方差分析。采 用S PS S分析的主要结果为:表10-5随机区组设计资料的方差分析(Tests of Between-Subjects Effects)Dependent Variable:满意度分值SourceType III Sum ofSquaresdfMean SquareFSig.Corrected Model169.400a1214.1179.44.0000Intercept
39、3367.2253367.2252251.77.0000block24.52592.7251.82.1100group144.875348.29232.29.0000Error40.375271.495Total3577.00040Corrected Total209.77539a.R Squared=.808(Adjusted R Squared=.722)表1 0-5为随机化区组设计方差分析的主要结果,表中列出处理组间 g r o up 变异、区组间 bl o ck 变异、误差变异、总变异及各自对应的自由度4),处理组间均方、区组间均方、误差均方,F值 和P值(S i g.)。本例处理组间
40、:尸=3 2.2 9,尸 0.0 5,按a =0.0 5判断水准,不拒绝H ,差异无统计学意义,说明1 0个自然村之间满0意度总分相同。表 10-6Multiple Comparisons满意度分值Dunnett t(2-sided);(I)年龄段年龄段Mean Difference(l-J)Std.ErrorSig.95%Confidence IntervalLower BoundUpper Bound=20 and=655.3000*.54688.00003.93926.6608=35 and=652.7000*.54688.00011.33924.0608=50 and=651.9000
41、*.54688.0048.53923.2608Based on observed means.The error term is Mean Square(Error)=1.495.a.Dunnett t-tests treat one group as a control,and compare all other groups against it.*.The mean difference is significant at the.05 level.表10-6为采用Dunnett-t检验得到的多个样本均数的多重比较结果,三个不同的年龄段的满意度分值均与65岁及以上年龄段的满意度分值比较,
42、表中列出了比较的均数差值(Mean Difference)均数差值标准误(Std.Error)、P值(S ig.),及均数差值95%置 信 区 间(95%Confidence Interval)0可以看出,三个年龄段与65岁及以上年龄段比较,满意度分值均不相同。第十一章一、简答题(略)二、单项选择题1.D 2.C 3.C 4.A 5.D 6.A 7.D 8.D 9.D三、计算分析题1.检验统计量的计算用式11-3,得#=2.77,P0.05o2.检验统计量的计算用式11-5,得.2=0.0008,P=0.9781o3.检验统计量的计算用式11-6,得%2=3.945,P=0.0470o4.检验
43、统计量的计算用式11-7,得%2=75.03,P0.0001 o5.检验统计量的计算用式11-9,得%2=0.9286,P=0.6286o6.检验统计量的计算用式11-12,得%2=15.55,P0.00017.检验统计量的计算用式11-9,得为2=32.56,P0.0001o8.略。第十二章一、名 词 解 释(略)二、简 答 题(略)二、最佳选择题1.A 2.B 3.E 4.E 5.E 6.D 7.D 8.A四、计算 分 析 题(略)第十三章一、名词解释 1.相关系数,是表示两变量间的相关程度和方向的统计指标。2决定系数R 2是回归平方和与总离均差平方和之比,它反映了回归贡献的相对程度,即在
44、因变量的总变异中回归关系所能解释的比例。是对回归模型拟合程度的综合度量,可决系数越大,模型拟合程度越高。3回归系数方是表示_ 应变量)对自变量X在数值上的依存关系 的统计指标。二、填空题 1.两变量间无直线相关关系。2 .是表示两变量间的相关程度和方向。3 .应变量y对自变量x在数值上的依存关系。4 .两变量存在线性相关。三、单项选择题1 C 2 E 3 D 4 B 5 C 6 B 7 C 8 D 9 A 1 0 B四、问答题1 .因为有两种可能性会造成样本相关系数r或回归系数b不等于零,一种是抽样误差,一种是本质差。因此得到一个不等于零的r或b时,不能立即下结论说变量x和变量y存在直线相关关
45、系或直线回归关系,必须先作假设检验后再下结论。2 .(1)相关与回归分析要有实际意义。不要将毫无关联的两个事物或现象进行相关或回归分析。0 对相关分析的作用要正确理解。相关分析只是以相关系数r来描述两个变量间相互关系的密切程度和方向,并不能阐明两事物或现象间存在联系的本质。而且相关并不一定就是因果关系。0 注意相关与回归的区别和联系。作相关与回归分析时,必须关注异常点,异常点即为一些特大特小的离群值。6 回归方程的适用范围有其限度,直线回归与相关分析一般是在一定取值区间内对两个变量间的关系进行描述,超出这个区间,变量间关系类型可能会发生改变。6 一个有统计学意义的回归方程并不一定具有实践上的预
46、测意义。3.两者区别:(1)在意义上,相关反映两变量间的相互关系,回归反映两变量间的依存关系。(2)在应用上,说明两变量间的相互关系用相关,说明两变量间的依存变化的数量关系用回归。(3)资料要求上回归要求因变量Y服从正态分布;X是可以精确测量和严格控制的变量,一般称为一型回归。相关要求两个变量X、Y服从双变量正态分布。这种类型资料若进行回归分析称为二型回归。两者联系:(1)同一资料计算的r和 b,它们的正负号是一致的。r为正号说明两变量的相互关系同向变化的。b为正号,说明X增(减)一个单位,Y平均增(或减)b个单位。2 对同一资料,r和b的假设检验结果(t值)是一样的。即对同一样本,二者的t值
47、是相等的9 可用回归解释相关,r的平方称为决定系数,r2=回 /S S 总回归平方S S和的大小取决于决定系数。回归平方和越接近总平方和,则上越接近1,说明引入的相关效果越好。4.直线相关(积差法)要求资料符合双变量正态分布,秩相关的资料无特殊要求。秩相关把计量资料变为等级资料处理,丢失了部分信息。使用时应注意,能用直线相关(积差法)的尽量不使用秩相关;要进行回归分析的资料,更不宜作秩相关。5.相关分析的任务:是分析两个变量间相互关系的密切程度和方向。回归分析的任务:是分析两变量间的依存变化的数量关系。6.回归分析的应用条件?0)线 性(linear)反应变量丫的总体平均值与自变量X呈线性关系
48、,可通过散点图判断。独立性(independent)指任意两个观察值互相独立,可利用专业知识来判断。正态性(normal)在一定范围内任意给定X值,则对应的随机变量V服从正态分布,可通过专业知识、正态性检验、残差散点图来判断。等方差性(equal variance)在一定范围内对应于不同X值,V总体变异程度相同,可通过残差分析来判断。五、应用题1.经统计软件分析,双变量正态分布,符合直线相关条件。计算得到相关系数为0.98,P0.0001,拒绝H 0,接受Hj认为高中与大学的英语成绩之间有直线正相关关系。2.(1)画图略0 经SPSS软件,首先进行正态性检验,得知双变量为正态分布。计算相关系数
49、r=0.8677,P V 0.01,拒绝”,接受也,认为身长与胸围之间有直线正相关关系。经SPSS软件计算,由身长(x)推算胸围(y)的回归方程式为:y=a+bx=18.75+0.3408x3.(1)画出散点图略(2)经正态性检验两变量均为正态分布,故应用简单相关分析:r=0.99,P 0.0001说明两变量间高度相关(3)求出回归方程y-0.39+2.29x 估 计 出 利 润 率 为 4.19%4.该资料为等级资料,故应用秩相关分析:r=0.93,p 0,0 R ,自变量(因素)为危险因素;p 0,。火 1,因素为保护因素;B =0,OR=1,因素与结局无关联。三、分析题1.(1)列出lo
50、gistic回归模型为logit(P)=-0.0238+0.8203 X+0.9803X+0.4227XI 2 3解释各回归系数的含义年 龄(X)的回归系数p=0.8203,OR=2.2 7 1 3,解释为:年龄每增加11 I 1岁,老年人患糖尿病的危险性增加,患糖尿病的可能性是不患病的2.2713倍;糖尿病家族史(X)的回归系数P=0.9803,OR=2.6 6 5 4,解释为:有糖尿病2 2 2家族史相比无家族史者,患糖尿病的危险性增加,有家族史者患糖尿病的可能性是无家族史者患病可能性的2.6654倍;BMI(X)的回归系数B =0.4227,3 3OR=1.5261,解释为:BMI每增加