2023年医学统计学 课后超详细解析超详细解析答案.pdf

上传人:Che****ry 文档编号:91468066 上传时间:2023-05-27 格式:PDF 页数:85 大小:4.97MB
返回 下载 相关 举报
2023年医学统计学 课后超详细解析超详细解析答案.pdf_第1页
第1页 / 共85页
2023年医学统计学 课后超详细解析超详细解析答案.pdf_第2页
第2页 / 共85页
点击查看更多>>
资源描述

《2023年医学统计学 课后超详细解析超详细解析答案.pdf》由会员分享,可在线阅读,更多相关《2023年医学统计学 课后超详细解析超详细解析答案.pdf(85页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、第四章 定量资料的统计描述 4-1 1参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数 2非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用范围广,可适用于任何类型资料 参数检验 优点:资料信息利用充分;检验效能较高 缺点:对资料的要求高;适用范围有限 2非参数检验 优点:适用范围广,可适用于任何类型的资料 缺点:检验效能低,易犯型错误 凡适合参数检验的资料,应首选参数检验 对于符合参数检验条件者,采用非参数检验,其 检验效能低,

2、易犯型错误 第一章 绪论 1.举例说明总体和样本的概念。研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于 2007 年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地 2007 年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取 2000 人,分别

3、测的其红细胞数,组成样本,其样本含量为 2000 人。2.简述误差的概念。误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。3.举例说明参数和统计量的概念。某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,

4、仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。4.简述小概率事件原理。当某事件发生的概率小于或等于 0.05 时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章 调查研究设计 1.调查研究主要特点是什么?调查研究的主要特点是:研究的对象及其相关因素(包括研究因素和非研究因素)是客观第四章 定量资料的统计描述 4-2 存在的,不能人为给予干预措施不能用随机化分组来平衡混杂因素对调查结果的影响。2.简述调查设计的基本内容。明确调查目的和指标

5、确定调查对象和观察单位确定调查方法确定调查方式确定调查项目和调查表制定资料整理分析计划制定调查的组织计划。3.试比较常用的四种概率抽样方法的优缺点。(1)单纯随机抽样 优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。(2)系统抽样 优点是:易于理解,简便易行容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能

6、随意更改,否则可能造成另外的系统误差实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。(3)分层抽样 优点是:减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。(4)整群抽样 优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差,。4.常用的

7、非概率抽样方法有哪些?有偶遇抽样、立意抽样、定额抽样、雪球抽样等。5.简述调查问题的顺序安排。调查问题顺序安排总原则:符合逻辑一般问题在前,特殊问题在后易答题在前,难答题在后如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题敏感问题一般放在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。二、最佳选择题 1.实验性研究与观察性研究的根本区别在于 A.抽样方法不同 B.研究对象不同 C.是否设立对照组 D.假设检验方法不同 E.是否人为施加干预措施 2.以下抽样方法中不属于概率抽样的是 A.单纯随机抽样 B.系统抽样 C.整群抽样 D.分

8、层抽样 E.雪球抽样 3.条件相同时,下列抽样方法中抽样误差最大的是 A.单纯随机抽样 B.系统抽样 C.分层抽样 D.整群抽样 E.无法直接比较 4.下列关于调查设计的叙述,正确的是 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-3 A.明确调查目的是调查研究最核心的问题 B.采用抽样调查还是普查是由该地

9、区的经济水平决定的 C.调查设计出现缺陷时,可以通过相应的统计分析方法弥补 D.一旦制定了调查研究计划,在实际操作过程中,就不可改变 E.调查的质量控制主要在调查问卷设计阶段 5.为了解乌鲁木齐市儿童的肥胖状况,分别从汉族、维吾尔族、哈族、回族等民族中随机抽取部分儿童进行调查,这种抽样方法属于 A.单纯随机抽样 B.分层抽样 C.系统抽样 D.整群抽样 E.多阶段抽样 6.某县有 30 万人口,其中农村人口占 80%,现欲对农村妇女的计划生育措施情况进行调查,调查对象应为 A.该县所有的已婚夫妻 B.该县所有的农村妇女 C.该县所有的育龄期妇女 D.该县所有的已婚妇女 E.该县所有已婚育龄期农

10、村妇女 7.欲了解某地区狂犬病死亡人数上升的原因,较适宜的抽样方式为 A.单纯随机抽样 B.整群抽样 C.分层抽样 D.典型调查 E.普查 8.普查是一种全面调查的方法,与抽样调查相比,叙述正确的是 A确定普查观察单位非常简单 B普查适于发病频率较低疾病的调查 C普查不易获得反映平均水平的统计指标 D因涉及面广普查可产生较大的抽样误差 E普查更易统一调查技术,提高调查质量 9.以下五个问题中,最符合调查问卷设计要求的是 A你一个月工资多少?B你一个月吃多少克盐?C你是否有婚外恋:有 无 D你和你的妈妈认为女孩几岁结婚比较好?E如果只生一个孩子,你希望孩子的性别是:女 男 男女均可 1.E 2.

11、E 3.D 4.A第三章 实验研究设计【思考与练习】一、思考题 1.实验设计根据对象的不同可分为哪几类?2.实验研究中,随机化的目的是什么?3.什么是配对设计?它有何优缺点?4.什么是交叉设计?它有何优缺点?5.临床试验中使用安慰剂的目的是什么?总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-4 二、案例辨析

12、题“三联药物治疗士兵消化性溃疡”一文中,对 20002006 年在某卫生所采用三联药物治疗的 38 例消化性溃疡患者进行分析。内镜检测结果显示,痊愈 13 人,显效 14 人,进步 7 人,无效 4 人,有效率达 89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。该结论是否正确?如果不正确,请说明理由。三、最佳选择题 1.实验设计的三个基本要素是 A.处理因素、实验效应、实验场所 B.处理因素、实验效应、受试对象 C.受试对象、研究人员、处理因素 D.受试对象、干扰因素、处理因素 E.处理因素、实验效应、研究人员 2.实验设计的三个基本原则是 A.随机化、对照、

13、重复 B.随机化、对照、盲法 C.随机化、重复、盲法 D.均衡、对照、重复 E.盲法、对照、重复 3.实验组与对照组主要不同之处在于 A.处理因素 B.观察指标 C.抽样误差 D.观察时间 E.纳入、排除受试对象的标准 4.为了解某疗法对急性肝功能衰竭的疗效,用 12 头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。7 天后观察两组幼猪的存活情况。该研究采用的是 A.空白对照 B.安慰剂对照 C.实验对照 D.标准对照 E.自身对照 5.观察指标应具有 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用

14、于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-5 A.灵敏性、特异性、准确度、精密度、客观性 B.灵敏性、变异性、准确度、精密度、客观性 C.灵敏性、特异性、变异性、均衡性、稳定性 D.特异性、准确度、稳定性、均衡性、客观性 E.灵敏性、变异性、准确度、精密度、均衡性 6.比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成 A.选择性偏倚 B.测量性偏倚 C.混杂性偏倚 D

15、.信息偏倚 E.失访性偏倚 7.将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是 A.随机区组设计 B.完全随机设计 C.析因设计 D.配对设计 E.交叉设计 8.在某临床试验中,将 180 例患者随机分为两组,实验组给予试验药对照药的模拟剂,对照给予对照药试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。本试验中采用的控制偏倚的方法有 A.单盲、多中心 B.随机化、多中心 C.随机化、单盲 D.随机化、双盲双模拟 E.双盲双模拟、多中心 9.临床试验的统计分析应主要包括 A.可比性分析、疗效评价、安全性评价 B.可比性分析、优效性分析、劣效性

16、分析 C.可比性分析、安全性评价、可行性分析 D.优效性分析、等效性分析、安全性评价 E.疗效评价、安全性评价、可行性分析 10.药品上市后应用阶段进行的临床试验属于 A.I 期临床试验 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-6 B.II 期临床试验 C.III 期临床试验 D.IV 临床试验 E.

17、现场试验 四、综合分析题 1.欲将 16 只豚鼠随机分为两组,某研究员闭上眼睛从笼中抓了 8 只豚鼠作为实验组,剩下 8只作为对照组。该分组方法是否正确?若不正确,请说明理由。2.某研究人员欲将 12 只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分配到实验组和对照组,应如何分组?3.某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠血管紧张素的影响,并欲分析两药联合应用是否更为有效。(1)你认为该研究最好采用何种实验设计方案?并说明理由。(2)请帮该研究者实现 32 只大鼠的随机分组。【习题解析】一、思考题 1.根据受试对象不同,实验可以分为动物实验、临床试验

18、和现场试验三类。动物实验的受试对象为动物,也可以是器官、细胞或血清等生物材料;临床试验的受试对象通常为患者,持续时间可以较长,目的在于评价药物或治疗方法的疗效;现场试验的受试对象通常是未患某种疾病的人群,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,了解其在人群中产生的预防效果。2.实验研究中,随机化的目的在于使非处理因素在实验组和对照组中的影响相当,提高对比组间的可比性,使实验结论的外推具有科学性和可靠性。随机化是对资料进行统计推断的前提。3.配对设计是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。用以配对的因素应为可能影响实验结果的主要混杂

19、因素。在动物实验中,常将窝别、性别、体重等作为配对因素;在临床试验中,常将病情、性别、年龄等作为配对因素。配对设计和完全随机设计相比,其优点在于可增强处理组间的均衡性、实验效率较高;其缺点在于配对条件不易严格控制,当配对失败或配对欠佳时,反而会降低效率。在临床试验中,配对的过程还可能延长实验时间。4.交叉设计是一种特殊的自身对照设计。其中 2 2 交叉设计首先是将同质个体随机分为两组,每组先接受一种处理措施,待第一阶段结束后,两组交换处理措施进行第二阶段的实验,这样每个个体都接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。交叉设计一般不适于具有自愈倾向或病程较短的疾病研

20、究。总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-7 交叉设计的优点有:节约样本含量;能够控制个体差异和时间对处理因素的影响;在临床试验中同等地考虑了每个患者的利益。其缺点有:处理时间不能太长;当受试对象的状态发生根本变化时,后一阶段的处理将无法进行;受试对象一旦在某一阶段退出试验,就会造成数据缺失。5.临

21、床试验中使用安慰剂,目的在于消除由于受试对象和试验观察者的心理因素引起的偏倚,还可控制疾病自然进程的影响,显示试验药物的效应。二、案例辨析题 该结论不正确。研究某治疗方案对某病患者的治疗效果需进行临床试验,应遵循实验设计的三个基本原则,即对照、随机化和重复。只有设立了对照才能较好地控制非处理因素对实验结果的影响,不设立对照往往会误将非处理因素造成的偏倚当成处理效应,从而得出错误的结论。此研究仅纳入 38 例消化性溃疡患者,并未设立相应的对照组。而且这 38 例患者接受治疗的时间为 2000年至 2006 年,时间跨度太大,可能对研究结果造成影响的因素很多,在没有对照的情况下,不能控制非处理因素

22、对试验结果的影响,其研究结论不具有说服力。三、最佳选择题 1.B 2.A 3A.4.A 5.A 6.C 7.C 8.D 9.A 10.D 四、综合分析题 1.解:该分组方法不正确。随机不等于随便,随机的含义是指每只动物都有相同机会进入实验组或对照组,而该分组方法由于豚鼠活跃程度不相同,进入各组的机会就不同,较活跃的豚鼠进入实验组的机会增大,因此破坏了随机化原则。2.解:先将 6 对小鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第 18 行最左端开始横向连续取 12 个两位数字。事先规定,每一对中,随机数较小者序号为 1,对应于 A组,随机数较大者序号为 2,对应于 B 组。分配结果见

23、表 3-1。表 3-1 配对设计的 12 只小鼠随机分组的结果 对子数 1 2 3 4 5 6 动物编号 1.1 1.2 2.1 2.2 3.1 3.2 4.1 4.2 5.1 5.2 6.1 6.2 随机数 12 96 88 17 31 65 19 69 02 83 60 75 序号 1 2 2 1 1 2 1 2 1 2 1 2 组别 A B B A A B A B A B A B 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就

24、是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-8 SPSS 操作 数据录入:打开 SPSS Data Editor 窗口,点击 Variable View 标签,定义要输入的变量 number 和 pair,再点击 Data View 标签,录入数据(见图 3-1,图 3-2)。图 3-1 Variable View 窗口内定义要输入的变量 number 和 pair 图 3-2 Data View 窗口内录入数据 分析:TransformRandom Number Generators Active Gener

25、ator Initialization Set Starting Point Fixed Value Value:键入 20071222 设定随机种子为 20071222 OK TransformComput e Target Valuable:键入 random Numeric Expression:RV.Uniform(0,1)产生范围在 01 之间的伪随机数 OK 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据

26、研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-9 TransformRank Cases Variables(s):random By:pair 对每个对子中的两个伪随机数进行排序 OK 注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为 SPSS 的 Syntax 窗口中用编程来完成本题。FileNewSyntax,打开 Syntax 窗口,键入如下程序:input program.开始数据录入程序段 numeric k b n number pair(F8.0)/random(F8.6).string treat

27、(A1).compute k=2.处理组为2 compute b=6.对子数为6 compute n=b*k.loop number=1 to pute pair=rnd(number-1)/k+0.5).end pute k=lag(k).end loop.end file.end input program.结束数据录入程序段 set seed 20071222.设定随机种子为20071222 compute random=uniform(1).产生范围在01之间的伪随机数 rank variables=random by pair.对伪随机数排序 formats rrandom(F3.0

28、).compute treat=substr(ABCDEFGHIJKLMN,rrandom,1).根据伪随机数的序号进行分组 list number pair treat.结果中显示受试对象编号及被分到的处理组 在 Syntax 窗口中选择 RunAll 提交运行。注:程序中的 b(即对子数)可根据实际情况赋予不同的值。随机区组设计受试对象的分配也可以用此程序来实现,仅需将 k 值设为处理组数,b 值设为相应的区组数。结果及解释 Data View 窗口 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡

29、适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-10 图 3-3 SPSS 编程实现受试对象随机分配结果 Output 窗口 List number pair treat 1 1 A 2 1 B 3 2 A 4 2 B 5 3 B 6 3 A 7 4 A 8 4 B 9 5 B 10 5 A 11 6 B 12 6 A 编程实现随机分配的结果见 data view 窗口(图 3-3)或 output 窗口。可以看出 12 只小鼠被随机分配到 A

30、组和 B 组。在用此程序进行随机分组前,规定 A 组表示实验组,B 组表示对照组。则 1,3,6,7,10,12 号小鼠被分到实验组,2,4,5,8,9,11 号小鼠被分到对照组。3.解:总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-11 (1)该研究最好采用 2 2 析因设计的实验方案,如表 3-2所示。

31、因为析因设计不仅可以检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间的交互作用。因此既可分析 MEL 和 TXL 对糖尿病模型大鼠血管紧张素的影响,又可分析两药合用时的交互效应。表 3-2 MEL 和 TXL 对 32 只大鼠血管紧张素影响的析因设计 MEL TXL(用)b1(不用)b2(用)a1 a1b1 a1b2(不用)a2 a2b1 a2b2(2)先将 32 只大鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第 2 列最上端开始纵向连续取 32 个两位数字。对随机数字排序,事先规定,序号为 18 的豚鼠分为 A组,序号为 916 的大鼠分为 B 组,序号为 1724

32、 的大鼠分为 C 组,序号为 2532 的大鼠分为D 组,分配结果见表 3-3。表 3-3 32 只大鼠随机分组的结果 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 随机数 17 36 77 43 28 22 76 68 39 71 35 50 96 93 87 56 序号 1 8 25 11 5 4 22 19 9 20 7 14 30 28 27 15 分组 A A D B A A C C B C A B D D D B 编号 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 随机数 72 96 94 64

33、 44 76 17 17 76 29 80 40 56 65 43 96 序号 21 31 29 17 13 23 2 3 24 6 26 10 16 18 12 32 分组 C D D C B C A A C A D B B C B D SPSS 操作 数据录入:打开 SPSS Data Editor 窗口,点击 Variable View 标签,定义要输入的变量 number,见图3-4。再点击 Data View 标签,录入变量 number 的值,即从 132。图 3-4 Variable View 窗口内定义要输入的变量 number 总体的分布类型不做任何要求不受总体参数的影响比较

34、的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-12 分析:Transform Random Number Generators Active Generator Initialization Set Starting Point Fixed Value Value:键入 20071222 设定随机种子为 20071212 OK Transform Com

35、pute Target Valuable:键入 random Numeric Expression:RV.Uniform(0,1)产生范围在 01 之间的伪随机数 OK Transform Rank Cases Variables(s):random 对伪随机数排序 OK Transform RecodeInto Different Variables Input VariableOutput Variable:Rrandom 原变量名为伪随机数的序号Rrandom Output Variable Name:键入 treat 新变量名为 treat 点击 Change 点击 Old And N

36、ew Values Old Value Range:键入 1 through 8 Output variables are strings New Value Value:键入 A Rrandom 值为 18 时,treat 值为 A OldNew:点击 Add Old Value Range:键入 9 through 16 New Value Value:键入 B Rrandom 值为 916 时,treat 值为 B OldNew:点击 Add Old Value Range:键入 17 through 24 New Value Value:键入 C Rrandom 值为 1724 时,t

37、reat 值为 C 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-13 OldNew:点击 Add Old Value Range:键入 25 through 32 New Value Value:键入 D Rrandom 值为 2532 时,treat 值为 D OldNew:点击 Add Continu

38、e OK 注:当样本量较大时,最好编程实现,以免除数据录入的不便。以下为 SPSS 的 Syntax 窗口中用编程来完成本题。FileNewSyntax,打开 Syntax 窗口,键入如下程序:input program.开始数据录入程序段 numeric n k number group(F8.0)/random(F8.6).string treat(A1).compute n=32.受试对象总数为32 compute k=4.4个处理组 loop number=1 to n.end pute n=lag(n).compute k=lag(k).end loop.end file.end i

39、nput program.结束数据录入程序段 compute random=uniform(1).产生范围在01之间的伪随机数 set seed 20071222.设定随机种子为20071222 rank variables=random.对伪随机数排序 compute group=trunc(rrandom-1)*k/n).formats group(F3.0).compute treat=substr(ABCDEFGHIJKLMN,group+1,1).根据伪随机数的序号进行分组 list number treat.结果中显示受试对象编号及被分到的处理组 注:程序中的 n(受试对象总数)、

40、k(即处理组数)可根据实际情况赋予不同的值。输出结果 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-14 Data View 窗口(由于篇幅限制,仅列出前 16 例受试对象的分组情况)图 3-5 SPSS 编程实现受试对象随机分配结果 Output 窗口 List number treat number T

41、reat 1 D 17 C 2 D 18 C 3 B 19 B 4 C 20 C 5 D 21 B 6 D 22 A 7 B 23 C 8 C 24 D 9 D 25 C 10 A 26 A 11 D 27 B 12 B 28 A 13 C 29 A 14 B 30 A 15 A 31 B 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第

42、四章 定量资料的统计描述 4-15 16 A 32 D 编程实现随机分配的结果见 data view 窗口(图 3-5)或 output 窗口。可以看出 32 只大鼠被随机分配到 A、B、C、D 组。在用此程序进行随机分组前,事先规定 A、B、C、D 分别对应于对照组、MEL 组、TXL 组和 MEL+TXL 组。从分配结果中可以看出:10,15,16,22,26,28,29,30 号大鼠被分到对照组;3,7,12,14,19,21,27,31 号大鼠被分到 MEL 组;4,8,13,17,18,20,23,25 号大鼠被分到 TXL 组;1,2,5,6,9,11,24,32 号大鼠被分到 M

43、EL+TXL 组。第四章 定量资料的统计描述 【习题解析】一、思考题 1.均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中趋势。不同点:均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;中位数用于不对称分布资料、两端无确切值的资料、分布不明确的资料。2.同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察

44、值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。3.极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;标准差用于描述正态分布或近似正态分布资料的离散程度;变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。4.正态分布的特征:正态曲线在横轴上方均数处最高;正态分布以均数为中心,左右对称;正态分布有两个参数,即位置参数和形态

45、参数;正态曲线下的面积分布有一定的规律,正态曲线与横轴间的面积恒等于 1。曲线下区间(2.58,2.58)内的面积为 95.00%;区间(2.58,2.58)内的面积为 99.00%。5通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数;对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。二、案例辨析题 统计描述时,常见错误是对定量资料的描述均采用均数、标准差。正确做法是根据资料分布类型和特点,计算相应的集中趋势指标和离

46、散程度指标。本资料的血清胆固醇的频数分布图如下:总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-16 图 4-1 血清甘油三酯(TG)的频数分布 可见资料呈负偏态分布,不宜使用均数和标准差来描述其集中趋势和离散程度,而应计算中位数和四分位数间距,计算结果为:集中趋势指标150150122(1.7/26 1.7

47、5)/21.755XMX(mmol/L)离散程度指标 四分位数间距=75252.101.340.76PP(mmol/L)三、最佳选择题 1.B 2.E 3.B 4.C 5.D 6.E 7.A 8.D 9.D 四、综合分析题 1.解:输出结果 图4-4 尿总砷的频数分布图 由图4-4 可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。输出结果 频数 频数 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的

48、所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4-17 图4-5 尿总砷对数的频数分布图 由图可见lgx分布近似对称,可认为燃煤型砷中毒患者尿总砷含量近似服从对数正态分布。(2)燃煤型砷中毒患者尿总砷的含量近似服从对数正态分布,故应计算几何均数。输出结果 Des criptive Statistics176-1.99-.24-1.1831.39685176lgxValid N(listw ise)NMinimumMaximumMeanStd.Deviation 结果中的Mean表示尿总砷对数值的均数为-1.1831,求其反对数,得到几何均数

49、0.0656(g/L)G。2.解:(1)已知健康人的血清 TC 服从正态分布,故采用正态分布法制定 95%的参考值范围。下限:1.964.841.960.962.96XS(mmol/L)上限:1.964.841.960.966.72XS(mmol/L)该 市 4555 岁 健 康 男 性 居 民 的 血 清 总 胆 固 醇 的 95%参 考 值 范 围 为 2.96 mmol/L6.72mmol/L。(2)4555 岁健康男性居民的血清总胆固醇分布为正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。113.254.

50、841.660.96XZ 225.254.840.430.96XZ 查标准正态分布曲线下的面积表(附表 2)得:1()(1.66)0.0485Z 2()1(0.43)10.33360.6664Z 21()()0.66640.04850.617961.79%DZZ 总体的分布类型不做任何要求不受总体参数的影响比较的是分布或分布位置适用范围广可适用于任何类型资料参数检何类型的资料缺点检验效能低易犯型错误凡适合参数检验的资料应首选参数检验对于符合参数检验条件者采用非参数个类就是总体总体是根据研究目的所确定的所有同观察单位某种观察值即变量值的集合通常有无限总体和有限总体之第四章 定量资料的统计描述 4

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁