《2022年生物统计学.docx》由会员分享,可在线阅读,更多相关《2022年生物统计学.docx(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精品学习资源生物统计学是数理统计在生物学讨论中的应用,它是用数理统计的原理和方法来分析和说明生物界各种现象和试验调查资料的科学;生物统计学的主要内容:1. 试验设计 调查设计, 广义的试验设计是指试验讨论课题设计, 狭义的试验设计主要是指试验单位 如动物试验的畜、禽 的选取、重复数目的确定及试验单位的分组;广义的调查设计 是 指 整个调查方案的制定 , 狭义的调查设计主要 包含抽样方法的选取,抽样单位、抽样数目的确定等内容;2. 统计分析 , 统计分析 最重要的内容是差异显著性检验; 另一个重要内容即进行相关分析与回来分析 .总体 : 依据讨论目的确定的讨论对象的全体称为总体populatio
2、n; 个体 : 组成总体的基本单元称为个体individual;样本 : 总体的一部分称为样本sample ;有限总体 : 含有有限个个体的总体称为有限总体; 无限总体 : 包含有无限多个个体的总体叫无限总体;样本容量 : 样本中所包含的个体数目叫样本容量或大小sample size,样本容量常记为n;通常把 n 30 的样本叫小样本,n 30 的样本叫大样本 ;随机抽取 random sampling的样本 : 是指总体中的每一个个体都有同等的时机被抽取组成样本 ;统计分析的特点 : 通过样原来推断总体是统计分析的基本特点; 有很大的牢靠性但有肯定的错误率这是统计分析的又一特点;变量:相同性
3、质的事物间表现差异性或差异特点的数据;通常用xi表示;连续变量:表示在变量范畴内可抽出某一范畴的全部值,这种变量之间是连续的、无限的;如小麦的株高;非连续变量 离散变量:表示在变量数列中, 仅能取得固定数值; 如菌落数、 动物产仔数等;常数:表示能代表事物特点和性质的数值,通常由变量运算而来,在肯定过程中是不变的;如样本的平均数、标准差等;参数 : 由总体运算的特点数叫参数parameter,是对一个总体特点的度量; 统计数 : 由样本运算的特点数叫统计量staistic,它是总体参数的估量值;精确性 accuracy也叫精确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度;精
4、确性 precision也叫精确度, 指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度;随机误差也叫抽样误差sampling error这是由于很多无法掌握的内在和外在的偶然因素所造成;随机误差影响试验的精确性;系统误差也叫片面误差lopsided error, 这是 由于试验动物的初始条件相差较大,饲料种类、 品质、 数量、饲养条件未掌握相同,测量的仪器不准、 标准试剂未经校正, 以及观测、记载、抄录、运算中的错误所引起;系统误差影响试验的精确性;欢迎下载精品学习资源试验资料的类型 :1. 数量性状资料计数资料非连续变量 :由计数法得到的数据, 小麦穗数、鱼的尾数计量资料连续变量
5、:由测量或度量所得的数据, 小麦株高、人的身高、体重等;2. 质量性状资料 : 统计计数法 &评分法试验资料的来源 : 调查和试验调查分普查和抽样调查;算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数;中位数 M d :将资料中全部观测值依大小次序排列,居于中间位置的观测数. 众数 M o :资料中次数最多的一组的中点值;标准差的特性:1、标准差的大小,受多个观测值的影响,假如观测数与观测数间差异较大,其离均差也大, 因而标准差也大,反之就小;2、在运算标准差时, 对在各观测数上加上或减去一个常数,其标准差不变; 假如给各观测数乘以或除以一个常数a,就所得的标准差扩大
6、或缩小了 a 倍;3、在资料听从正态分布的条件下, 资料中约有 68.26%的观测值在平均数左右一倍标准差 S范畴内;约有 95.43%的观测值在平均数左右两倍标准差 2S范畴内;约有 99.73%的观测值在平均数左右三倍标准差 3S 范 围内;标准差的作用:1、表示变量分布的离散程度;标准差小, 说明变量的分布比较密集在平均数邻近,标准差大, 就说明变量的分布比较离散;因此,可以用标准差的大小判定平均数代表性的大小;2、利用标准差的大小, 可以概括的估量出变量的次数分布及各类观测数在总体中所占的比例;3、估量平均数的标准误; 在运算平均数的估量标准误时,可依据样本标准差代替总体标准差进行运算
7、;4、进行平均数的区间估量和变异系数的运算;随机试验 : 通常我们把依据某一讨论目的, 在肯定条件下对自然现象所进行的观看或试验统称为试验; 而一个试验假如满意下述三个特性, 就称其为一个随机试验,简称试验:1试验可以在相同条件下多次重复进行;2每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果; 3每次 试验总是恰好显现这些可能结果中的一个,但在一次试验之前却不能确定这次试验会显现哪一个结果;随机试验的每一种可能结果,在肯定条件下可能 发 生 ,也 可 能 不 发生,称为随机大事,简称 事 件频率 : 在相同条件下进行几次重复试验, 假如随机大事 A 发生的次数为m,那么 mn 称为
8、随机事欢迎下载精品学习资源件 A 的频率 .概率 : 当试验重复数n 逐步增大时, 随机大事 A 的频率 W A就越来越稳固地接近某一数值p, 那么 就 把 p 称为随机大事 A 的概率,记为: P A p方差分析的相关术语和符号试验因素处理因素,因素,因子: 试验中所讨论的影响试验指标的缘由或缘由组合;固定因素可控因素& 随机因素非控因素因素水平水平: 每个试验因素的不同状态处理的某种特定状态或数量上的差异;试验处理处理: 指对受试对象赐予的某种外部干预或措施,是试验实施因子水平的一个组合; 单因素处理 &多因素处理 试验单位 : 指在试验中能接受不同试验处理的独立的试验载体,就是依据讨论目
9、的而确定的观测总体;重复 : 指在试验中, 将一个处理实施在两个或两个以上的试验单位上;处理实施的试验单位数;方差和方差分析 : 方差是描述变异的一种指标,方差分析也就是对变异的分析;对总变异进行分析,看总变异是由哪些部分组成的,这些部分间的关系如何;方差分析的基本步骤1、将样本数据的总平方和和总自由度分解为各变异因素的平方和和自由度;2、列方差分析表进行F 检验,以弄清各变异因素在总变异中的重要程度;3、对各处理平均数进行多重比较;回来分析的意义1、预报 , 生物学中, 讨论两变量之间的关系, 可以帮忙我们揭示生物各性状之间的内在联系, 同时,也可以由一个变量去预报另一个变量;2、减小试验误
10、差试验设计广义的试验设计是指试验讨论课题设计,也就是指整个试验方案的拟定;狭义的试验设计主要是指试验单位 如动物试验的畜、禽 的选取、重复数目的确定及试验单位的分组;欢迎下载精品学习资源试验设计的基本要素1、处理因素:指对受试对象赐予的某种外部干预或措施,称为处理因素,简称处理; 与处理因素相对应的是非处理因素,是引起试验误差的主要来源,在试验设计时应引起高度重视,尽量加以有效掌握;2、受试对象:处理因素的客体,实际上就是依据讨论目的而确定的观测总体;3、处理效应:是处理因素作用于受试对象的反应,是讨论结果的最终表达;试验误差的来源1试验材料固有的差异;2试验条件不一样;3操作技术不一样;4偶
11、然性因素的影响;掌握试验误差的途径1选择纯合一样的试验材料;2改良操作治理制度,使之标准化;3细心选择试验单位;4采纳合理的试验设计;试验设计的基本原就一重复 :重复是指试验中同一处理实施在两个或两个以上的试验单位上;设置重复的主要作用在于估量试验误差和降低试验误差;二随机 :随机是指试验中每一处理及每个重复都有同等的时机设置在任何一个试验单位上,防止试验人员主观倾向的影响,以保证试验条件在空间和时间上的匀称性;随机化是在试验中排除非试验因素干扰的重要手段,目的是为了获得无偏的误差估量量,通常可以采纳抽签、摸牌、查随机数字表等方法来实现;三局部掌握 :在试验中,当试验环境或试验单位差异较大时,
12、仅依据重复和随机化两原就进行设计不能将试验环境或试验单位差异所引起的变异从试验误差中别离出来,因而试验 误差大,试验的精确性与检验的灵敏度低;为解决这一问题,在试验环境或试验单位差异大的情形下, 可将整个试验环境或试验单位分成假设干个小环境或小组,在小环境或小组内使非处理因素尽量一样,这就是局部掌握;比照试验设计排列特点:每一供试品种均直接排列在对比区旁边,使每一小区可与其相邻的对比区直接比较;统计分析 : 一般采纳百分比法,即设对比CK 为 100,然后将各处理和对比相比较,求出其百分数;间比设计 : 隔几个品种设一个CK成组比较法这种方法在只有两个处理时采纳;方法是把试验材料随机分成两组,
13、各接受一种处理; 数据统计方法为成组t 检验;欢迎下载精品学习资源配比照较试验用于两个处理的试验;尽可能削减材料本身差异对试验结果带来的影响; 统计方法为成对 t 检验;完全随机化设计用于多组或多个处理水平相互比较的试验; 这种方法适用于试验材料均一性很好的情形; 试验设计主要原就就是保证样本的随机性; 统计方法为单因素方差分析;随机区组试验设计随机区组设计是依据局部掌握和随机原理进行的设计;方法:将试验单位按性质不同分成与重复数一样多的区组,每个区组均包括各处理的一个小区,区组内各处理随机排列;统计分析 :一单因素随机区组试验结果的方差分析把区组和试验因素一起看成是两因素 试验; 设试验有
14、k 个处理、 n 个区组,把总变异分解为区组、处理和误差三个部分;二两因素随机区组试验结果的方差分析.试验中有两个因素A 和 B,分别具有 a、b 个水平,两因素各水平组成 ab 个处理组合, 每个处理组合在r 个区组间的三项分组资料,全部试验共得rab 个观测值;正交表的特性1、任一列中,不同数字显现的次数相等2、任两列中,同一横行所组成的数字对显现的次数相等正交设计一般有以下几个步骤: 一确定因素和水平 二选用合适的正交表选用正交表的原就是:既要能支配下试验的全部因素,又要使部分水平组合数处理数尽可能地少; 三进行表头设计, 列出试验方案所谓表头设计, 就是把选择出的因素和要考察的交互作用分别排入正交表的表头适当的列上; 四列出试验方案把正交表中支配各因素的每个列 不包含欲考察的交互作用列 中的每个数字依次换成该因素的实际水平,就得到一个正交试验方案;欢迎下载