《生物统计学.doc》由会员分享,可在线阅读,更多相关《生物统计学.doc(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精品文档,仅供学习与交流,如有侵权请联系网站删除第一章 概论一、什么是生物统计学?生物统计学主要内容和作用?1、生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。属于生物数学的范畴2、主要内容 基本原则 对比设计试 验 设 计 方案制定 随机区组设计 常用试验设计方法 裂区设计资料的搜集和整理 拉丁方设计、正交设计统 计 分 析 数据特征数的计算 统计推断、方差分析 协方差分析、回归和相关分析 主成分分析、聚类分析3、生物统计学的基本作用: (1)提供整理和描述数据资料的科学方法,确定某些性状和特征的
2、数量特征(2)运用显著检验,判断试验结果的可靠性或可行性 (3)提供由样本推断总体的方法 (4)提供试验设计的一些重要原则二、解释概念:总体、个体、样本、变量、参数、统计数、效应、试验误差总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体;个体:组成总体的基本单元称为个体样本:从总体中抽出若干个体所构成的集合称为样本变量:变量,或变数,指相同性质的事物间表现差异性或差异特征的数据参数:描述总体特征的数量称为参数,也称参量统计数:描述样本特征的数量称为统计数,也称统计量效应:通过施加试验处理,引起试验差异的作用称为效应试验误差:误差也称为实验误差,是指观测值偏离真值的差异,
3、可分为随机误差和系统误差三、准确性与精确性有何区别?准确性,也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。 精确性,也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。准确性反应测量值与真值符合程度的大小,而精确性则是反映多次测定值的变异程度。(具体在课本第7页)第二章 样本统计量与次数分布一、算数平均数与加权平均数形式上有何不同?为什么说它们的实质是一致的? 1. 算术平均数 定义:总体或样本资料中所有观测数的总和除以观测数 的个数所得的商,简称平均数、均数或均值直接计算法或减去(加上)常数法 加权平均数2、实质是一样的,是因为它们都反映的一组
4、数据的平均水平二、为了评价两种药物对于小鼠体重的影响,随机从两组各抽出20只测定其体重(g),结果如下: 药物A处理组: 15, 15, 23, 24, 26, 25, 22, 19, 15, 17, 15, 20, 23, 21, 19, 22, 26, 21, 18, 23 药物B处理组: 31, 28, 26, 31, 28, 34, 32, 29, 32, 35, 28, 29, 33, 30, 34, 32, 36, 38, 40, 38 试从平均数、极差、标准差、变异系数几个指标评价两种药物对于小鼠体重的影响,并给出结论。详细结果略,本题考查平均数(P22)、极差(P24)、标准差
5、(P25)、变异系数(P27)等特征数第三章 概率与分布一、试解释必然事件、不可能事件、随机事件、频率、概率、正态分布、抽样误差、标准误? 必然事件:在一定条件下必然出现的现象称为必然事件不可能事件:在一定条件下必然不出现的事件称为不可能事件随机事件:在某些确定的条件下,可能出现也可能不出现的现象,称为随机事件,简称“事件”频率:若在相同的条件下,进行了n次试验,在这n次试验中,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率,记为W(A)=m/n 0W(A) 1概率:概率的统计定义:设在相同的条件下,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,则称p
6、为事件A出现的概率。 P(A) = p正态分布:正态分布也称为高斯分布,是一种连续型随机变量的概率分布。它的分布状态是多数变量值都围绕在平均值左右,由平均值到分布的两侧,变量数减少抽样误差:由这些样本算得的平均数有大有小,不尽相同, 与原总体均数相比往往表现出不同程度的差异。这种差异是由随机抽样造成的, 称为抽样误差标准误: 标准误,平均数抽样总体的标准差),标准误的大小反映样本平均数的抽样误差的大小,即精确性的高低2、已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值: (1) P(0.3u1.8) P=0.34617 (2) P (-1u 1) P=0.6826 (3) P
7、(-1.96u 1.96) P=0.95 (4) P (-2.5830,无需连续性矫正,用u检验;事先不知道两个生存率孰高孰低,用双尾检验答案:u=-0.958 ,接收H0,否定HA,即两医院乳腺癌手术后5年生存率无显著差异(注:此类题型详解见课本P72例4.14、例4.15;例4.14是不需要连续性矫正的情况,例4.15是需要连续性矫正的情况)第五章 2 检验一、2主要有几种用途?各自用于什么情况下的假设检验? 2检验的用途:适合性检验(也称吻合度检验)、独立性检验 、同质性检验(1)适合性检验 比较观测数与理论数是否符合的假设检验 用途:遗传学中用以检验实际结果是否符合遗传规律 、样本的分
8、布与理论分布是否相等 、自由组合定律(2)独立性检验 是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立(3)同质性检验 在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行2 检验 (课本P78P80是样本方差的同质性检验,个人觉得考的几率不大) 二、有一大麦杂交组合,F2的芒性状表型有钩芒、长芒和短芒三种,观察其对应株数为348,115,157。试检验其比率是否符合9:3:4的理论比率 分析:此题为2适合性检验答案:2=0.041,20.05=3.84;20.05,接收H0,否定
9、HA,即大麦F2的比率符合9:3:4的理论比率(注:df=1时,需进行连续性矫正;课本P85例5.1、P87例5.3)对于资料数多于两组的值,可以用下列简式:(课本P87例5.3)三、某仓库调查不同品种苹果的耐储藏情况,随机抽取“国光”苹果200个,腐烂14个;“红富士”苹果178个,腐烂16个,试问这两种苹果的耐贮性差异是否显著?分析:次题为2独立性检验 (22 列联表的独立性检验)答案:2=0.274,20.05, 接收H0,否定HA,即这两种苹果的耐贮性差异与苹果种类无关(注:此类题型见课本P88例5.4)22 列联表需要进行连续性矫正,简式为 (课本P8822 列联一般形式、例5.4)
10、2列联表不需要进行连续性矫正,简式为r列联表不需要进行连续性矫正第六章 方差分析一、什么是方差分析?方差分析的基本思想与一般步骤? 方差分析又叫变量分析,它是用以检验两个或多个均数间差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸 基本思想:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小 总变异来源于处理效应和实验误差 一般步骤:(1)平方和计算 (2)自由度计算 (3)计算方差 (注:详见课本P99例6.1)二、什么是多重比较?多重比较有哪些方法? 多重比较:要明确不同处理平均数两两间差异的显著性,每个处理的平
11、均数都要与其他的处理进行比较,这种差异显著性的检验就叫多重比较; 统计上把多个平均数两两间的相互比较称为多重比较。方法: 最小显著差数法 (LSD法 )和最小显著极差法(LSR法) LSD法的实质是两个平均数相比较的t检验法、 LSR法克服了LSD法的局限性,采用不同平均数间用不同的显著差数标准进行比较,它可用于平均数间的所有相互比较三、为了研究氟对种子发芽的影响,分别用四种不同浓度的氟化钠溶液处理种子,随后进行发芽试验(每盆50粒,每处理重复三次),观察它们的发芽情况,测得芽长如下表。试作方差分析,并用LSD法、SSR法和q法分别进行多重比较处理1230ugg-1(对照)8.98.48.61
12、0ugg-18.27.97.550ugg-17.05.56.1100ugg-15.06.34.1答案:F=15.225*, s12=0.574,s=0.406四、用同一公猪对三头母猪进行配种试验,所产各头仔猪断奶时的体重(kg)资料如下:No.1:24.0,22.5,24.0,20.0,22.0,23.0,22.0,22.5;No.2:19.0,19.5,20.0,23.5,19.0,21.0,16.5;No.3:16.0,16.0,15.5,20.5,14.0,17.5,14.5,15.5,19.0试分析母猪对仔猪体重效应的差异显著性答案:F=21.515*,s12=0.944第七章 回归和
13、相关分析一、什么叫回归分析?回归截距和回归系数的统计学意义? 回归分析:(因果关系)如果对x的每一个可能的值,都有随机变量y的一个分布相对应,则称随机变量y对变量x存在回归关系,是一个变量的变化受另一个变量或几个变量的制约回归截距:常量a,a是总体回归截距,是回归直线在纵坐标的截距,它是y的本底水平,即x对y没有任何作用时y的数量表现,它属于不能用x来估计的部分回归系数:为总体回归系数,x表示依变量y的值改变中,由y与自变量x的线性回归关系 所引起变化的部分,即可以由x直接估计的部分Y=a+bx:a为当x=0时的Y值,即直线在y轴上的截距,称为回归截距;b为回归直线的斜率,称为回归系数,其含义是自变量x改变一个单位,依变量y平均增加或减少的单位数二、什么叫相关分析?相关系数和决定系数各具什么意义? 相关分析:(平行关系) 是两个以上变量之间共同受到另外因素的影响相关系数:如果两个变量间呈线性关系,但不需要由一个变量来估计另一个变量,只需了解两个变量的相关程度以及相关性质,可以通过计算表示 两个变量相关程度和性质的统计数相关系数来进行研究决定系数:统计中还有另外一个表示相关程度的统计数 决定系数,决定系数定义为相关系数r的平方。决定系数的含义是变量x引起y变异的回归平方和占y变异总平方和的比率,只能表示相关程度,不能表示相关性质【精品文档】第 8 页