《2023年试验统计方法生物统计复习总结盖钧镒主编全.doc》由会员分享,可在线阅读,更多相关《2023年试验统计方法生物统计复习总结盖钧镒主编全.doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一章实验因素:被变动并设有待比较的一组解决的因子或实验研究的对象(研究对象的效应).实验解决:单因素实验中的每一个水平即为一个解决;多因素实验中是不同因素的水平结合在一起形成的解决组合,也简称为解决。实验水平:实验因素内不同的级别或状态简朴效应:在同一因素内两种水平间实验指标的差异。 重要效应:一个因素内各简朴效应的平均数。 交互作用效应:简称互作: 因素内简朴效应间差异的平均。 什么是实验方案,如何制订一个对的的实验方案?试结合所学专业举例说明之。根据实验目的和规定所拟定的用来进行比较的一组实验解决的总称。 制订实验方案的要点:1. 目的明确。2. 选择适当的因素及其水平。3. 设立对照水
2、平或解决。4. 应用唯一差异原则。实验误差的概念:实验结果与解决真值之间的差异系统误差影响力数据的准确性,偶尔误差影响了数据的精确性,共同影响了实验解决间比较的可靠性。来源:(1)实验材料固有的差异(2)实验时农事操作和管理技术的不一致所引起的差异(3)进行实验时外界条件的差异控制途径:(1)选择同质一致的实验材料(2) 改善操作和管理技术,使之标准化(3) 控制引起差异的外界重要因素,(选择条件均匀一致的实验环境;,实验中采用适当的实验设计和科学的管理技术;应用相应的科学记录分析方法。) 第二章实验设计的三个基本原则1.反复 2.随机排列 3.局部控制反复的作用: 估计实验误差 ;减少实验误
3、差 。 随机的重要作用:无偏估计实验误差;研究随机事件-获得随机变量-概率的性质-进行记录分析(记录推断)!局部控制就是分范围分地段或分空间地控制非解决因素,使之对各实验解决的影响在较小空间内达成最大限度的一致,从而有效地减少实验误差。这是减少误差的重要手段之一第三章总体:具有共同性质的个体所组成的集团.有限总体-由有限个个体构成的总体.无限总体-总体所包含的个体数目有无穷多个 .样本:从总体中抽取若干个个体的集合称为样本。参数:由总体中所有个体观测值计算得总体特性值. 记录数:测定样本中的各个体而得的样本特性数,如平均数等,称为记录数关系:实验研究的目的是为了获得总体的信息或特性;实验研究的
4、方法则是抽样研究;运用样本的结果(记录数)推断或估计总体特性 (参数).平均数的意义:平均数是数据的代表值,表达资料中观测值的中心位置(集中趋势),并且可作为资料的代表而与另一组资料相比较,借以明确两者之间相差的情况。算术平均数-一个数量资料中各个观测值的总和除以观测值个数所得的商数,称为算术平均数算术平均数的两个重要特性:(1)离均差之和为零(2)离均差平方的总和最小变异数的意义:一表达资料数据间的变异限度或离散限度或离均限度;二可以衡量平均值的代表性.变异数的种类: 一、极差 二、方差 三、标准差 四、变异系数计算方法:1.极差-是资料中最大观测值与最小观测值的差数。2. 样本均方为S2,
5、总体方差用 表达。样本标准差公式: 总体标准差公式:变异系数-样本的标准差对均数的百分数: 变异系数是一个不带任何单位的平均一个单位纯数离均限度,其作用:消除了平均值大小及所带单位不同的影响,其可用以比较二个事物的变异度大小。第四章记录概率:记录学上用n较大时稳定的频率近似代表概率。通过大量实验而估计的概率称为实验概率或记录概率,以p表达。标准正态离差:正太分布曲线特性的第五点?正态曲线与横轴之间的总面积等于1,因此在曲线下横轴的任何定值,例如从y=y1到y=y2之间的面积,等于介于这两个定值间面积占总面积的成数,或者说等于y落于这个区间内的概率。正态曲线的任何两个y定值ya与yb之间的面积或
6、概率乃完全以曲线的和而拟定的。小概率原理-若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次实验中不太也许发生,这称为小概率事件实际不也许性原理,简称小概率原理。小概率事件实际不也许性原理在记录假设测验中的应用:假如事先假设了一些条件,在这些假设的条件下若计算出某一事件为一小概率事件,然而它在一次正常的实验中居然发生了;反过来说明假设的条件不对的,从而否认该假设(接受另一个相反的假设)。抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的记录数所相应的概率分布称为抽样分布。抽样分布是记录推断的理论基础。单个样本平均数抽样分布及其参数?假如从容量为N的有限总体抽样,若
7、每次抽取容量为n的样本,那么一共可以得到 个样本(所有也许的样本个数)。 抽样所得到的每一个样本可以计算一个平均数,所有也许的样本都被抽取后可以得到许多平均数。假如将抽样所得到的所有也许的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种记录数都可以是一个变量,这种变量的分布称为记录数的抽样分布。(1) 该抽样分布的平均数 与母总体的平均数相等:(2) 该抽样分布的方差与母总体方差间存在如下关系:两个样本平均数差数抽样分布及其参数?假如从一个总体随机地抽取一个样本容量为n1的样本,同时随机独立地从另一个总体抽
8、取一个样本容量为n2的样本,那么可以得到分别属于两个总体的样本,这两个独立随机抽取的样本平均数间差数( )的抽样分布参数与两个母总体间存在如下关系:(1) 该抽样分布的平均数与母总体的平均数之差相等:(2) 该抽样分布的方差与母总体方差间的关系为:第五章区间估计:在一定的概率保证之下,由样本的记录数估计出总体参数也许位于的区间.置信区间:在一定的概率保证之下,由样本的记录数估计出的总体参数也许位于的区间.区间的上、下限称为置信限。一般以L1和L2分别表达置信下限和上限。置信系数或置信度:保证总体参数位于置信区间的概率以P=(1 )表达。 记录假设 :对样本所属的总体(特性值或参数)提出假设(涉
9、及无效假设和备择假设两个,在后面有说明)。 无效假设:记作H0,假设样本所属总体效应或参数(平均数)与某一指定值相等或假设两个总体参数相等,即相对而言都不具有自己的独特效应. 备择假设:记作HA,假设样本所属总体效应或参数(平均数)与某一指定值不相等或假设两个总体参数不相等,或相对而言它们都有自己的独特效应.所以也可以称为有效假设.假设测验时直接测验的记录假设是无效假设,由于只有无效假设相称于总体已知,这样才干从已知的总体中进行抽样分布,才干进一步计算样本在无效假设中出现的概率。区间估计与记录假设测验的关系为:1.假如无效假设位于置信区间内,就接受无效假设,称为差异不显著;2.假如无效假设位于
10、置信区间外,就否认无效假设,接受备择假设,称为差异显著;什么是显著水平?为什么要有一个显著水平?根据什么拟定显著水平?它和记录推断有何关系?用来测验假设的小概率标准5%或1%等,称为显著水平由于显著水平不同也许直接影响到推断结果.本例题假如用0.01水平就要接受无效假设,所以必须事先拟定显著水平. 选用显著水平的原则:记录上达显著,事实上有应用价值. 选用显著水平的原则:实验误差小的,选高水平0.01; 实验误差大的,选低水平0.05.什么叫记录推断?它涉及哪些内容?什么是记录假设测验,它的原理和方法?记录推断:运用概率论和抽样分布的原理,由样本结果(记录数)推断或估计其总体特性(参数).它有
11、两条路:一是记录假设测验,二是参数的区间估计.记录假设测验的含义:一方面对样本所属的总体提出记录假设(无效假设 ,备择假设 )然后计算样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小则否认该假设,从而接受另一个相反的备择假设具体有以下三大步: (一)提出记录假设:对所研究的总体一方面提出记录假设 (二)计算概率: 在假定无效假设为对的的前提下,研究抽样分布,从而计算出样本在无效假设的总体中出现的概率(三) 推断: 根据“小概率事件事实上不也许发生”原理接受或否认无效假设第六章方差分析的思想:任何事物的数量特性都是受多种因素的影响,其中起重要作用的因素所引起的变异量(方差)就大;
12、起次要作用的因素所引起的变异量就小;不起作用的因素其变异量(方差)就不能显著大于实验误差的变异量(方差).方差分析的思绪:一方面把实验资料的总变异分解为各个因素(涉及实验误差)的变异,并计算出它们的方差,运用误差方差对各个因素进行方差的显著性测验,最后对方差显著的因素内的各个水平的平均数进行多重比较.方差分析的环节: 1.平方和及自由度的分解:把实验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差. 2.F测验:运用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的. 3.多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),
13、以明确哪些平均数间差异显著,哪些平均数间差异不显著.F测验需具有条件:(1)变数y遵循正态分布N( , ),(2) s12 和 s22 彼此独立 。多重比较的三种方法: 1.最小显著差数法(LSD法) 2.复极差法( q法) 3.Duncan氏新复极差法(SSR法)多重比较方法尺度的大比较:1.P=2时:2.P2时:应用(1)实验事先拟定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法(LSD法); (2)新复极差法(SSR法)合用于实验精确度一般的所有均值间的互相 比较.(3) q法测验合用于实验精确度较高的所有均值间的互相比较.方差分析的含义是什么?如何进行自
14、由度和平方和的分解?如何进行F测验和多重比较?方差分析 :是将总变异剖分为各个变异来源的相应部分,从而发现各变异因素在总变异中相对重要限度的一种记录分析方法平方和及自由度的分解:把实验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.F测验:运用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的. F测验(方差差异的显著性测验或方差的同质性测验)的方法:1. 提出记录假设2.规定显著水平3. 计算概率4.推断:假如 就否认无效假设,接受备择假设假如 接受无效假设多重比较的基本思绪运用误差方差计算出最小显著差异标准,若任两个均值之差的绝对值 标
15、准, 则它们的总体均值 就差异显著; 反之就差异不显著.多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.方差分析有哪些基本假定?(1) 解决效应与环境效应等应当具有“可加性” (2)实验误差 应当是随机的、彼此独立的,具有平均数为零并且作正态分布,即“正态性”。(3)所有实验解决必须具有共同的误差方差,即误差同质性。第九章1什么叫回归分析?直线回归方程和回归截距、回归系数的记录意义是什么?如何计算?如何对直线回归进行假设测验和区间估计?回归分析:计算回归方程为基础的记录分析方法。(一)直线回归方程式 (91)n a回归截
16、距:a是x=0时Y的值,即回归直线在y 轴上的截距。n b回归系数:b是x 每增长一个单位数时,Y平均地将要增长(b0时)或减少(b0时)的单位数。建立回归方程或求a和b的原理是:最小二乘法或最小平方法原理,即使各个实际值y与回归直线相应值之差平方之和最小.其几何图形上的含义:各个实际观测点与回归直线上点之距离和为最小,即误差为最小.(1).提出记录假设,H0: =0 , Ha: O(2).规定显著水平为0.05或0.01(3).计算概率:计算b来自 =0的总体的概率2什么叫相关分析?相关系数、决定系数各有什么具体意义?如何计算?如何对相关系数做假设测验?相关分析:计算相关系数为基础的记录分析
17、方法。计算表达Y 和X 相关密切限度的记录数,并测验其显著性。相关系数是两个变数标准化离差的乘积之和的平均数。 n 相关系数的功能定义:表达变量间相关性质与限度的记录数n 相关系数的计算定义:由自变量引起的回归平方和占依变量总平方和比率的平方根n 相关系数的推导定义:是两个变数标准化离差的乘积之和的平均数。 n 一般回答问题时常指功能定义!决定系数为由x不同而引起的y 的平方和 占y总平方和SSy= 的比率所以决定系数即相关系数r 的平方值。n (一) H0: 的假设测验n 测验一个样本相关系数 r 来自无线性相关总体的概率,所作的假设为H0: =0对HA: 0。n 在的总体中抽样,r的分布随样本容量n的不同而不同。n r的抽样误差:n 当 时: 或 (9.37) n 此 t 值遵循 的t分布,由之可测验H0: 。n 对于同一资料,线性回归的显著性等价于线性相关的显著性。n 将(937)移项,即可得到自由度和显著水平一定期的临界 r 值: (计算题待续。)