《卫生统计学复习题答案.doc》由会员分享,可在线阅读,更多相关《卫生统计学复习题答案.doc(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流卫生统计学复习题答案【精品文档】第 19 页中南大学网络教育课程考试复习题及参考答案卫生统计学一、名词解释1.计量资料2.计数资料3.等级资料4.总体5.样本6.变异7.频数表8.算术均数9.中位数10.极差11.方差12.标准差13.变异系数14.正态分布15.标准正态分布16.统计推断17.抽样误差18.标准误19.可信区间20.参数估计21.假设检验中P的含义22.I型和II型错误23.检验效能24.检验水准25.方差分析26.随机区组设计27.相对数28.标准化法29.构成比30.Yates校正31.非参数统计32.直线回归33.相关系数34.统
2、计图35.回归系数二、单项选择题:1.观察单位为研究中的( )。A.样本 B.全部对象 C.影响因素 D.个体2.总体是由( )。A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 3.抽样的目的是( )。A.研究样本统计量 B.由样本统计量推断总体参数C.研究典型案例研究误差 D.研究总体统计量4.参数是指( )。A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和5.关于随机抽样,下列那一项说法是正确的( )。A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本
3、具有更好的代表性,样本量应越大越好6.各观察值均加(或减)同一数后( )。A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变7.比较身高和体重两组数据变异度大小宜采用( )。A.变异系数 B.方差 C.极差 D.标准差8.以下指标中( )可用来描述计量资料的离散程度。( )A.算术均数 B.几何均数 C.中位数 D.标准差9.血清学滴度资料最常用来表示其平均水平的指标是( )。A.算术平均数 B.中位数 C.几何均数 D.平均数10.两样本均数的比较,可用( )。A.方差分析 B.t 检验 C.两者均可 D.方差齐性检验11.配伍组设计的方差分析中,配伍等于( )
4、。A.总-误差 B.总-处理 C.总-处理+误差 D.总-处理-误差12.在均数为,标准差为的正态总体中随机抽样,( )的概率为5%。( )A. B. C. D.13.完全随机设计方差分析的检验假设是( )。A.各处理组样本均数相等 B.各处理组总体均数相等C.各处理组样本均数不相等 D.各处理组总体均数不全相等14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( )。A.分别进行比较 B.两个率比较的2检验C.不具备可比性,不能比较 D.对性别进行标准化后再比较15.率的标准误的计算公式是( )。A. B. C. D.1
5、6.非参数统计应用条件是( )。A.总体是正态分布 B.若两组比较,要求两组的总体方差相等C.不依赖于总体分布 D.要求样本例数很大17.下述哪些不是非参数统计的特点( )。A.不受总体分布的限定 B.多数非参数统计方法简单,易于掌握C.适用于等级资料 D.检验效能总是低于参数检验18.设配对设计资料的变量值为X1和X2,则配对资料的秩和检验( )。A.把X1与X2的差数绝对值从小到大编秩 B.把X1和X2综合从小到大编秩C.把X1和X2综合按绝对值从小到大编秩 D.把X1与X2的差数从小到大编秩19.秩和检验和t检验相比,其优点是( )。A.计算简便,不受分布限制 B.公式更为合理C.检验效
6、能高 D.抽样误差小20.对两样本均数作比较时,已知n1、n2均小于30,总体方差不齐且分布呈偏态,宜用( )。A.t 检验 B.u 检验 C.秩和检验 D.F检验21.等级资料的比较宜用( )。A.t 检验 B.秩和检验 C.F检验 D.四格表X2检验22.两个小样本比较的假设检验,应首先考虑( )。A.t 检验 B.秩和检验 C.任选一种检验方法 D.资料符合哪种检验的条件23.对于配对比较的秩和检验,其检验假设为( )。A.样本的差数应来自均数为0的正态总体 B.样本的差数应来自均数为0的非正态总体C.样本的差数来自中位数为0的总体 D.样本的差数来自方差齐性和正态分布的总体24.用最小
7、二乘法确定直线回归方程的原则是各观察点( )。A.距直线的纵向距离相等 B.距直线的纵向距离的平方和最小C.与直线的垂直距离相等 D.与直线的垂直距离的平方和最小25.实验设计的三个基本要素是( )。A.受试对象、实验效应、观察指标 B.随机化、重复、设置对照C.齐同对比、均衡性、随机化 D.处理因素、受试对象、实验效应26.实验设计的基本原则( )。A.随机化、盲法、设置对照 B.重复、随机化、配对C.随机化、盲法、配对 D.随机化、重复、设置对照27.实验设计和调查设计的根本区别是( )。A.实验设计以动物为对象 B.调查设计以人为对象C.实验设计可随机分组 D.实验设计可人为设置处理因素
8、28.标准正态分布的均数与标准差分别为( )。A.0与1 B.1与0 C.0与0 D.1与129.正态分布有两个参数与,( )相应的正态曲线的形状越扁平。( )A. 越大 B. 越小 C. 越大 D.越小30.若X服从以,为均数和标准差的正态分布,则X的第95百分位数等于( )。A. B. C. D.31.计算某地某年麻疹发病率,其分母为 ( )A.该地体检人数 B.该地年平均就诊人数C.该地年平均人口数 D.该地平均患者人数 E.该地易感人群人数 32.两个独立小样本计量资料比较的假设检验,首先应考虑( )A.用 检验 B.用检验 C.用Wilcoxon秩和检验D.检验或Wilcoxon秩和
9、检验均可 E.资料符合检验还是Wilcoxon秩和检验条件33.若决定系数为0.04,则下列说法错误的是A.散点图中所有的实测点都排列在一条回归线上B.决定系数即是 C.y的总变异中有4可以由x的变化来解释D.相关系数0.2 E.回归贡献相对较小 34.老年人口系数下降,可使 ( )A.粗死亡率上升 B.粗死亡率下降 C.婴儿死亡率上升 D.婴儿死亡率下降 E.以上都不对 35.标准化以后的总死亡率( )A.标化后的率比原来的率低 B.标化后的率比原来的率高C.反映了实际水平 D.反映了相对水平,仅作为比较的基础E.不随标准选择的变化而变化36.配对样本差值的Wilcoxon符号秩检验,确定值
10、的方法为( )A.越大,越大 B.越大,越小C.值在界值范围内,小于相应的 D.值在界值范围内,大于相应的E.值即值,查界值表37.关于回归系数的描述,下列说法错误的是( )A.,表示回归直线与y轴交点在原点上方B.,回归直线与x轴平行 C.越大,则回归直线越陡D.b一般有单位 E.表示回归直线从左上方走向右下方38.实验设计和调查设计的根本区别是( )A.实验设计以动物为对象 B.调查设计以人为对象C.实验设计可随机分组 D.实验设计可人为设置处理因素E.两者无区别39.少年儿童人口系数下降,可使( )A.粗死亡率上升 B.粗死亡率下降 C.出生率上升 D.出生率下降 E.生育率下降40.以
11、下对于标准化法的描述错误的是 ( )A.标准化率是通过选择同一参照标准而计算的,目的是为了消除因年龄构成不同等混杂因素的影响,从而达到可比性B.样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,同样需做假设检验C.标准化率代表真实的死亡(或患病、发病)率水平D.一般在已知被标化组各年龄组死亡率时,宜采用直接法计算标准化率E.当所比较的两组内部各分组率的变化呈现交叉或非平行变化趋势时,不宜采用标准化法41.多样本计量资料的比较,当分布类型不清时选择( )A.检验 B.检验 C.检验 D.检验 E.检验42.回归系数的假设检验,其无效假设是( )A. B. C. D
12、. E.43.估计样本含量时,所定第类误差愈小,则( )A.所要的样本含量愈大 B.所要的样本含量愈小C.不影响样本含量 D.所定的样本含量愈准确E.所定的样本含量愈粗糙44.欲计算某年新生儿死亡率,则应选用作为分母的是( )A.某年新生儿总数 B.某年活产总数 C.当年怀孕的妇女数 D.妊娠28周以上的妇女数E.妊娠28周以上出生并存活的新生儿45.用以说明某现象发生的频率或强度的指标为 ( )A.率 B.构成比 C.相对比 D.绝对数 E.均数46.当四个样本率比较,得到0.05,3,则可以认为 ( )A.四个样本率都不相同 B.四个总体率都不相同C.四个样本率不同或不全相同 D.四个总体
13、率不同或不全相同 E.以上都不对47.成组设计两样本比较的秩和检验,其检验统计量是( )A.以秩和较小者为 B.以秩和较大者为C.以例数较小者秩和为 D.以例数较大者秩和为E.当两样本例数不等时,可任取一样本的秩48.直线回归分析中,有直线回归方程=0.004+0.0488X ,代入两点描出回归线。下面选项哪项正确( )A.所有实测点都应在回归线上 B.所绘回归直线必过点(,)C.原点是回归直线与Y轴的交点 D.回归直线X的取值范围为(-1,1)E.实测值与估计值差的平方和必小于零49.研究A药抗癌效果,将患有某种肿瘤的大白鼠随机分为两组,一组未给药,一组饲服抗癌A药;2周后检测体内存活的肿瘤
14、细胞数。这种对照在实验设计中称为 ( )A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照 E.历史对照50.行列表中,对于理论频数太小的情形,最好采用( )A.增大样本容量,以达到增大理论频数的目的B.删去理论频数太小的格子所对应的行或列C.理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并 D.性质不同的行或列中的实际频数合并E.使用连续性校正公式51.直线相关分析中,对相关系数作假设检验,其目的是 ( )A.检验相关系数r 是否等于0 B.推断两变量间是否存在直线相关关系C.检验两总体相关系数是否相等 D.推断两变量间相关方向E.推断两变量间密切程度52.用最小二乘法确定直
15、线回归方程的原则是( )A.各观测点距直线的纵向距离相等 B.各观测点距直线的纵向距离平方和最小C.各观测点距直线的垂直距离相等 D.各观测点距直线的垂直距离平方和最小E.各观测点距直线的纵向距离最小53.为研究新药“胃灵丹”治疗胃病(胃炎、胃溃疡)疗效,在某医院选择40例胃炎和胃溃疡病人,随机分成实验组和对照组,实验组用胃灵丹治疗,对照组用公认有效的“胃苏冲剂”。这种对照在实验设计中称为 ( )A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照 E.历史对照54.某研究欲调查某市中学生对艾滋病的认识,从全市40所中学随机抽取4所,对该4所学校的全部学生实施问卷调查。该种抽样方法属于(
16、)A.整群抽样 B.分层抽样 C.系统抽样 D.简单随机抽样 E.多阶段抽样三、简答题:1.对于一组近似正态分布的资料,除样本含量n外,还可计算和,问各说明什么?2.说明频数分布表的用途。3.试述正态分布的面积分布规律。4.均数的可信区间与参考值范围有何不同?5.假设检验中a和P的区别何在?6.假设检验时,当,则拒绝,理论依据是什么?7.怎样正确选用单侧检验和双侧检验?8.为什么假设检验的结论不能绝对化?9.为什么不能以构成比代率?请联系实际加以说明。10.方差分析的基本思想和应用条件是什么?11.为什么在方差分析的结果为拒绝H0、接受H1之后,对多个样本均数的两两比较要用多重比较的方法?12
17、.对于四格表资料,如何正确选用检验方法?13.什么叫做非参数检验?它和参数检验有什么区别?14.简述直线相关与秩相关的区别与联系。15.统计表有哪些要素构成?制表的注意事项有哪些?16.试述x2检验的基本思想17.非参数统计的特点和适用范围.18.两组或多组等级资料的比较,为什么不能用x2检验,而用秩转换的非参数检验?19.普通线图和半对数线图的主要区别是什么?20.对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准?21.某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大
18、于乙班?为什么?四、分析计算题:1.某医生研究脑缺氧对脑组织中生化指标的影响,将出生状况相近的乳猪按出生体重配成7对共2组,随机接受两种处理,一组设为对照组,一组设为脑缺氧模型组,实验结果见下表第(1)、(2)、(3)栏。试比较两组猪脑组织钙泵的含量有无差别。 两组乳猪脑组织钙泵含量(m g/g)乳猪号(1)对照组(2)试验组(3)差值d(4)=(2)-(3)10.35500.27550.079520.20000.2545-0.054530.31300.18000.133040.36300.32300.040050.35440.31130.043160.34500.29550.049570.3
19、0500.28700.0180合计0.30862.某医院比较几种疗法对慢性胃炎病人的疗效:单纯西药组治疗79例,有效63例;单纯中药组治疗54例,有效47例;中西医结合组治疗68例,有效65例。问:该资料属何种资料?实验设计属何种设计?欲比较3种疗法的疗效的差别,宜选用何种假设检验方法?写出该种检验方法的与;若求得的检验统计量为8.143,相应于的检验统计量的临界值为5.99,你如何做出结论?根据你的结论,你可能犯哪一类统计错误?3.某年某单位报告了果胶驱铅的疗效观察,30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116(mg/L),血铅均数为1.81(mg/L)。服用果胶20天
20、后再测,尿铅均数降为0.087(mg/L),血铅均数降为0.73(mg/L),说明果胶驱铅的效果较好。请评述以上研究。4.为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效,以纤维胃镜检查结果作为判断标准,选20名患者,以病人的年龄、性别、病型和病情等条件进行配对,在纤维胃镜下观察每一患者的溃疡面积减少百分率,面积减少百分率为40%以上者为治疗有效。问:(1) 如何将病人分组?(2) 如何对结果进行统计分析处理?5.试就下表资料分析比较甲、乙两医院乳腺癌手术后的5年生存率。甲、乙两医院乳腺癌手术后的5年生存率(%)腋下淋巴结 转 移甲 医 院乙 医 院病例数生存数生存率病例数生存数生存率无453577
21、.7730021571.67有71045068.38834250.60合计75548564.2438325767.106.假定正常成年女性红细胞数近似服从均值为4.18,标准差为0.29的正态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求:(1)变量X落在区间(4.00,4.50)内的概率;(2)正常成年女性的红细胞数95%参考值范围。7.为了解某中药治疗原发性高血压的疗效,将44名高血压患者随机分为两组。实验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如下表,问:该药治疗原发性高血压是否有效? 两种疗法治疗原发性高血压的疗效分组例数有效有效率/%实验组232191.30对照
22、组21523.818.某研究者采用配对设计进行实验,比较2种抗癌药物对小白鼠肉瘤抑瘤效果,先将10只染有肉瘤小白鼠按体重大小配成5个对子,每个对子内2只小白鼠随机接受两种抗癌药物,以肉瘤的重量为指标,实验结果见下表。问2种不同的药物的抑瘤效果有无差别?表2 不同药物作用后小白鼠肉瘤重量(g)编号A药B药(1)(2)(3)10.820.6520.730.5430.430.3440.410.2150.680.439.某胸科医院,同时用甲、乙两法测定202份痰标本中的抗酸杆菌,结果如下表。问甲、乙两法的检出率有无差别? 甲、乙两法检测痰标本中的抗酸杆菌结果甲 法乙 法合 计4925742110712
23、8合 计7013220210某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如下表,估计尿肌酐含量()对其年龄()的回归方程。8名正常儿童的年龄(岁)与尿肌酐含量(mmol/24h)编 号12345678年龄131196810127尿肌酐含量3.543.013.092.482.563.363.182.65表1中: 11.某地随机抽样调查了部分健康成人的血红蛋白量,结果见下表。问:该地健康成年男、女血红蛋白含量有无差别?某年某地健康成年男、女血红蛋白含量(gL-1)性别例数均数标准差男360134.57.1女255117.610.2参考答案一、名词解释:1.计量资料:对每个观察单
24、位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。2.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。3.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序变量。4.总体:总体指特定研究对象中所有观察单位的测量值。5.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。6.变异:同质个体间研究因素的差异。7.频数表:用
25、来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。8.算术均数:描述一组数据在数量上的平均水平。总体均数用表示,样本均数用表示。9.中位数:将一组观察值由小到大排列,位次居中的那个数。10.极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。11.方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。12.标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。13.变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。14.正态分布:若资料的频率曲线对应于数学上的正态曲
26、线,则称该资料服从正态分布。通常用记号表示均数为,标准差为的正态分布。15.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为。16统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。17.抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。18.标准误:通常将样本统计量的标准差称为标准误。19.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。20.参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。21.假设检验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及
27、小于)现有样本获得的检验统计量值的概率。22.I型和II型错误:I型错误指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用表示;II型错误,指接受了实际上不成立的H0,这类“存伪”的错误称为II型错误,其概率大小用表示。23.检验效能:1-称为检验效能,它是指当两总体确有差别,按规定的检验水准所能发现该差异的能力。24.检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准,记为。25.方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可
28、由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断,判断各因素对观测指标有无影响。26.随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。27.相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。28.标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。标准化法的基本思想就是选定一个统一“标准”(标准人口构成比或标准人口
29、数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。29.构成比(proportion)表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。常以100%为比例基数。计算公式为 (5.2)30.Yates校正:英国统计学家Yates F认为,由于分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的值不连续,尤其是自由度为1的四格表,求出的概率P值可能偏小,此时需对值作连续性校正(correction of continuity),这一校正即所谓的Yates校正(Yates corre
30、ction)。31.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。32.直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为
31、最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。33.相关系数:又称积差相关系数,以符号r表示样本相关系数,表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。34.统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。35.回归系数:是直线的斜率(slope),其统计意义是当变化一个单位时的平均改变的估计值。时直线从左下方走向右上方,随的增大而增大;时直线从左上方走向右下方,随的增大而减小;时直线与轴平行,与无直线关系。的计算公式为二、单项选择题:1.D 2.C 3.B 4.B
32、 5.A 6.B 7.A 8.D 9.C 10.C11.D 12.B 13.D 14.D 15.D 16.C 17.D 18.A 19.A 20.C21.B 22.D 23.B 24.B 25.D 26.D 27.D 28.A 29.C 30.B31.E 32.E 33.A 34.B 35.D 36.D 37.A 38.D 39.A 40.C41.D 42.E 43.A 44.B 45.A 46.D 47.C 48.B 49.B 50.A51.B 52.B 53.D 54.A 四、简答题:1.答:三个指标分别说明:(1)为算术均数,说明正态分布或近似正态分布资料的集中趋势;(2)为标准差,说明
33、正态分布或近似正态分布资料的离散趋势;(3)可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含总体的95%的个体值。2.答:频数分布表的用途是:(1) 描述频数分布的类型;(2) 描述频数分布的特征;(3) 便于发现一些特大或特小的可疑值;(4) 便于进一步做统计分析和处理。3.答:正态分布的面积分布规律是:(1)轴与正态曲线所夹面积恒等于或;(2)区间的面积为,区间的面积为,区间的面积为。4.答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示。区别点均数的可信区间参考值范围意义按预先给定的概率所确定的未知参数的可能范围。实际上一次抽样算
34、得的可信区间要么包含了总体均数,要么不包含。但可以说:该可信区间有多大(如当a=0.05时为95%)的可能性包含了总体均数。“正常人”的解剖、生理、生化某项指标的波动范围。计算公式s未知:*s已知:*s未知但n60: *正态分布:*偏态分布:PXP100-X用途估计总体均数判断观察对象的某项指标正常与否* 也可用(对应于单尾概率时)*也可用(对应于单尾概率时)5.答:a和P均为概率,其中a是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。
35、在假设检验中通常是将P与a对比来得到结论,若Pa,则拒绝H0,接受H1,有统计学意义,可以认为不同或不等;否则,若Pa,则不拒绝H0,无统计学意义,还不能认为不同或不等。6.答:P值是指从H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t或u)的概率。当P0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下“有差别”的结论的同时,我们能够知道可能犯I型错误的概率不会大于0.05(即通常的检验水准
36、),这在概率上有了保证。7.答:单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。8.答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0时,可能犯I型错误;“接受”H0时可能犯II型错误。无论哪类错误,假设检验都不可
37、能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。9.答:率和构成比所说明的问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,5060岁年龄组的高血压病例占52.24%,所占比重最大,60岁组则只占到6.74%。这是因为60岁以上受检人数少,造成患病数低于5060岁组,因而构成比相对较低。但不能认为年龄在5060岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。10.答:方差分析的基本思想就是根据试验设计的类型,将全部测量
38、值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。方差分析的应用条件:各样本是相互独立的随机样本,均服从正态分布;相互比较的各样本的总体方差相等,即具有方差齐性。11.答:方差分析的备择假设H1是g个总体均数不全相等,拒绝H0,接受H1,只说明g个总体均数总的来说有差别,并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。12.答:(1
39、)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。(2)对于两样本率比较的四格表资料,应根据各格的理论值T和总例数n的大小选择不同的计算公式:当且所有的时,用检验的基本公式或四格表资料检验的专用公式;当 但有时,用四格表资料检验的校正公式或,或改用四格表资料的Fisher确切概率法;当,或时,用四格表资料的Fisher确切概率法。若资料满足两样本率检验的条件,也可用检验。(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时当时,;当时,。13.答:非参数检验对总体分布不作严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作假设检验。如果总
40、体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。14.答:二者的联系:(1)两者所解决的应用问题相同,都可用来表示两个数值变量之间关系的方向和密切程度。(2)两个相关系数都没有单位,取值范围都在-11之间。(3)计算上,用秩次作积差相关,得到的就是秩相关系数。二者的区别:(1)资料要求不同。积差相关要求、服从双变量正态分布,秩相关可以是任意分布。(2)由于对资料要求不同,二者分属于参数统计与非参数统计方法,所以符合双变量正态分布条件时,积差相关的效率高于秩相关。(3)二者假设检验方法不同。15.答:一般说来,统计表由标题、标目、线条、数字四部分构成(有时附有备注)。编制统计表的注意事项:(1) 标题概括表的内容,写于表的上方,通常需注明时间与地