《吉林农业大学 DPS生物统计实验指导.doc》由会员分享,可在线阅读,更多相关《吉林农业大学 DPS生物统计实验指导.doc(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、生物试验设计实验教学指导 喇叭吆喝 微信公众平台赵珑吉林农业大学生物试验设计实验教学指导一、适用专业:生物技术、生物工程本科专业二、教学目标:本课程是生物科学专业课程,主要研究生物的遗传与变异、试验处理与环境间数量关系的一门科学,是运用生物统计学的基本原理和基本方法处理研究的资料和数据,从而做出科学推断的一门交叉学科。 通过本课程的学习,希望学生能掌握常用的生物统计和试验设计方法。以便在研究中能使用通用统计软件进行生物学实验的设计和实验数据的统计分析。在信息时代的今天,如何存储、整理和分析处理数据是一件极重要的工作。由于对数据的分析大都是基于基本的统计原理进行的,国内外学者编制了许多统计软件包
2、,其中DPS、SPSS、SAS(Statistical Analysis System)、DPS(data processing system)系统是国际上公认的统计软件,它们包容量大,伸缩性强,为各行各业广泛采用。为了让学生了解统计软件系统、并能正确地进行数据处理,本课程安排16次实验。三、实验教学学时数:16学时四、 实验内容(见下文):五、考核方式以实验报告平时成绩为主,参考动手能力、上课纪律、值日卫生、考勤等情况,占期末考试的30%。六、参考书1. 生物统计学 李春喜 主编,科学出版社(二十一世纪高等院校教材)2. 试验优化设计和统计分析 科学出版社3. 李云雁,胡传荣.试验设计与数据
3、处理M.北京:化学工业出版社,2008.7:158-159第一次实验课(4学时)实验一 Excel、DPS在生物统计中应用 1学时1、实验目的(1)使学生掌握Excel、DPS在生物统计中的应用方法。2、实验内容(1)材料用具:装有Excel、DPS软件的计算机及输出设备。(2)讲解Excel、DPS统计功能(3)举例说明基本用法3、作业与思考熟悉Excel、DPS软件的统计分析功能实验方法与步骤一、1加载Excel“分析工具库”在默认的情况下,Excel是没有加载“分析工具库”,无法进行统计分析。先查看计算机是否加载“分析工具库”。首先启动excel2007以上版本,检查“工具”菜单中是否有
4、“数据数据分析”命令。如果没有发现“数据分析”命令,就表示未加载“分析工具库”。可按照下列步骤来加载“分析工具库”。(1) 选取“文件”菜单中的“选项”命令,弹出“Excel选项”的对话框,。(2)选中“加载项”“分析工具库”复选框,单击“确定”按钮,按提示完成加载过程。此时再查看“数据”菜单,就可发现最右侧的“数据分析”命令,表示安装完成。单击“工具”菜单中“数据分析”命令,得图1.2,即可进行相关的统计分析。图1.2 “数据分析”对话框示意图2分析工具库提供的统计分析方法分析工具库提供的常用统计分析方法如下:单向分类资料的方差分析双向分类交叉分组无重复资料的方差分析双向分类交叉分组有重复资
5、料的方差分析描述性统计量计算二总体方差的同质性检验编制频数分布表及绘制直方图排位与百分比排位二样本均数差数的u检验配对资料的t检验等方差非配对资料的t检验异方差非配对资料的t检验一元线性回归与多元线性回归分析计算多个变量两两之间的相关系数及协方差进行随机和顺序抽样3Excel统计分析的粘贴函数 Excel提供的统计分析粘贴函数如下:AVERAGEBINOMDISTCHIDISTCHIINVCHITESTCONFIDENCECORRELCOVARFDISTFINVFTESTGEOMEANHARMEANINTERCEPTMAX MEDIANMINMODENORMDISTNORMINVNORMSDI
6、STNORMSINVPOISSONSLOPESTDEVSTDEVPTDISTTINVTTESTVARVARPZTEST计算算术平均值计算二项式分布的概率值计算特定2分布的单尾概率值计算一定单尾概率值时的2临界值计算独立性检验的2值计算总体平均值的置信区间计算两组数据的相关系数计算两组数据的协方差计算特定F分布的单尾概率值计算一定概率时的临界F值计算二个样本方差之比F值的概率计算几何平均数计算调和平均数计算直线回归的截距计算最大值计算一组给定数字的中位数计算最小值计算一组数据的众数计算正态分布的累积函数计算正态分布累积函数的逆函数计算标准正态分布的累积函数计算标准正态分布累积函数的逆函数计算泊松
7、分布的概率计算给定数据的直线回归系数计算样本标准差计算样本总体的标准差计算学生氏-t分布的概率值计算特定概率时学生氏-t分布的临界t值计算t检验时的学生氏-t检验相关的概率计算样本的方差计算样本总体的方差计算Z检验的双尾概率值4Excel的常用基本概念(1)工作薄和工作表Microsoft excel工作簿是计算和储存数据的文件,每一个工作簿都可以包含多张工作表,因此,可在单个文件中管理各种类型的相关信息。使用工作表可以对数据进行组织和分析,可以同时在多张工作表上输入和编辑数据,并且可以对来自不同工作表的数据进行汇总计算。在创建图表之后,既可以将其置于原始数据所在的工作表上,也可以放置在单独的
8、工作表上。工作表的名称显示于工作簿窗口底部的工作表标签上,单击这个标签即可进入该工作表。当前所在的工作表称为活动工作表,在它的标签上标有单下划线。可以在同一工作簿内或两个工作簿之间对工作表进行改名、添加、删除、移动或复制等编辑操作。在默认情况下,每个工作薄由3个工作表组成,用户可以根据需要添加更多的工作表。每个工作表由256列和65 536行组成。行和列相交形成单元格,它是存储数据的基本单位。列用英文字母表示,开始是单个英文字母,然后是2个英文字母组合,即由AIV共256列。行用阿拉伯数字表示,由165 536。每个单元格的定位可以通过该单元格所对应的行数和列标来确定,如B6就表示B列第6行的
9、单元格。在活动工作表众多的单元格中,其中有一单元格含有粗边框线,此单元格为活动单元格,在该单元格中可以输入和编辑数据。每进入一个工作表时,A1自动为活动单元格。在活动单元格的右下角有一小黑方块,这个黑方块称为填充柄,利用此填充柄可以填充相邻单元格区域的内容。(2)单元格和区域引用引用是指调用工作表中的数据用于计算分析,是通过标识工作表上的单元格或区域来实现的。通过引用,指明在计算时所使用的数据在工作表中的位置,可以使用工作表中不同区域的数据,或者在多个计算公式中使用同一单元格的数值。还可以引用同一工作簿不同工作表、不同工作簿、甚至其他应用程序中的数据。引用不同工作簿中的数据称为外部引用,引用其
10、他程序中的数据称为远程引用。如果要引用某一单元格的数据,可在计算公式中输入该单元格的标识,例如要引用在列B和行10这一单元格的数据,在计算公式中输入B10,或者用鼠标点击该单元格。如果要引用某个区域的数据,可在计算公式中输入该区域左上角单元格的标识,后面跟一个冒号(:),后面再写上该区域右下角单元格的标识。例如,要引用从单元格C5到单元格C15这一区域,可输入C5:C15;如要引用从单元格A5到单元格B10这一区域,即可输入A5:B10。(3)绝对引用与相对引用的区别当生成公式时,对单元格或区域的引用通常基于他们与公式单元格的相对位置。如在单元格A8中包含公式=8B5,Microsoft ex
11、cel将在距单元格A8上面一个单元格和右面一个单元格处的单元格中查找数值,这就是相对引用。当复制使用相对引用的公式时,被粘贴公式中的引用将被更新,并指向与当前公式位置相对应的其他单元格。如单元格A8中的公式被复制到单元格A10中,单元格A10中的公式已经改为=8B7,即从单元格A8上面和右面一个单元格处的单元格中查找数值。如果在复制公式时,不希望引用发生改变,可使用绝对引用。绝对引用的方式是在相对引用列标和行数字前加上美元符号,即B5。如在单元格A8中包含的公式=8B5,现在将公式复制到另一单元格中,则公式中的引用将不发生改变。实验方法与步骤二1启动DPS数据分析系统或者或者其它“DPS.ex
12、e”程序,版本不同,图标不同。启动后,显示如下图,即可进行相关的统计分析。同学们自行浏览DPS数据分析系统。重点关注“试验设计”、“试验统计”、“分类数据统计”、“多元分析”四个命令模块实验二 试验数据整理 1学时1、实验目的了解资料搜集整理的意义,更好地掌握次数分布表、图的制作方法,学会利用excel进行数据整理与图表制作。2、实验内容(1)材料用具:装有excel软件的计算机及输出设备或计算器。(2)举例说明数据排序并分组,然后编制次数分布表。(3)利用excel将整理后的数据绘制直方图和折线图。3、作业与思考(1)利用excel将表中的数据进行排序并分组,然后编制次数分布表。(2)利用e
13、xcel将整理后的数据绘制直方图和折线图。实验方法和步骤1图表向导的利用用excel中的“图表向导”可以快速准确的绘制图表。它是一连串的对话框,依照它逐步建立或修改图表。新建图表需四个步骤,修改图表只需两个步骤。步骤1:选择图表类型选择“常用”工具栏中的“图表向导”按扭,如图2.1图标或单击菜单栏中“插入”再击“图表”命令,激活图表向导对话框,如图2.2。图2.1 图表按钮 图2.2 表类型示意图excel提供了两大类的图形:标准类型和自定义类型,用户可根据需要选择。步骤2:选定数据区域如果在单击图表向导之前,就已选定数据范围,那么图表向导的第二对话框就会自动设定数据区域。如果事先没有设定,用
14、户可自己设定。步骤3:设定图表选项完成步骤2之后,单击“下一步”按钮进入步骤3。在步骤3里有很多的选项卡:“标题”、“坐标轴”、“网格线”、“图例”、“数据标志”、“数据表”。步骤4:指定图表位置当完成步骤3后,单击“下一步”按钮即可进入步骤4。可以选定“作为新工作表插入”或“作为其中的对象插入”。然后单击“完成”按钮结束图表向导,完成了图表的制作。2“数据分析”工具栏运用现以水稻品种120行产量(kg)为例,说明其方法与步骤。表2.1 水稻品种120行产量(kg)表1772151979715924511911913115216710416121412517518819217617595199
15、1161652149515883801381511871261342061379897129143174159165136108141148168163176102194173751301491501551111581311899114215215416312320515513120918397119181187131215111186150155197116254239160179151198124179184168169173181188211175122151171166143190213192231163159177147194227169124159159图2.3数据sheet 1(
16、1)打开excel,输入原始数据和各组的上限,样式见图2.3,图中从A1单元格到L10单元格的区域为原始数据,各组的上限值位于M1到M11单元格。(2)从“工具”菜单中选定“数据分析”命令,再选定“直方图”,确定后出现直方图对话框。(3)在输入区域中输入A1:L10,在接收区域中输入M1:M11,在输出选项中选定输出区域如A12后,单击确定,得到频数分布表。若在“直方图”对话框中选定“图表输出”复选框,则直方图也同时输出,如图2.4。图2.4 直方图示意图实验三 特征数计算 1学时1、实验目的掌握各种特征数的计算方法,学会利用excel进行特征数的计算。2、实验内容(1)材料用具:装有exce
17、l软件的计算机。(2)举例计算平均数、极差、方差、标准差3、作业与思考(1)利用excel 查找最大值、最小值,计算算术平均数等特征数实验方法和步骤在生物统计分析中主要计算平均数和变异数。平均数主要有算术平均数、几何平均数及中数,变异数主要有极差、方差、标准差、变异系数。1算术平均数用AVERAGE函数可用来计算算术平均数,例如一组数据2,3,4,5,6的平均数可在单元格中键入“=AVERAGE(2,3,4,5,6)”得 4。如果这5个数据分别存放于A1到A5的字段中,则键入“= AVERAGE(A1:A5)”得4。通常“平均数”是指算术平均数。2几何平均数用GEOMEAN函数可用来计算几何平
18、均数,例如6,15,35,105,260的几何平均数可在单元格中键入“=GEOMEAN(6,15,35,105,260)”得38.63。3中数计算如果观察值次数是偶数,则取中间两个观察值的算术平均数作为中数。用MEDIAN函数可以计算中数。如在单元格中输入“=MEDIAN(2,3,4,7,8)”得4;在单元格中输入“=MEDIAN(2,3,4,7)”得3.5。4极差资料中最大值减去最小值是极差,可以利用MAX求得最大值,用MIN 求得最小值,两者的差数就是极差。5方差 平方和除以自由度即为方差。用VARP函数可以求总体方差;用VAR函数可以求样本的方差。如在单元格中输入“=VARP(1,2,3
19、,4,5)”得2;在单元格中输入“=VAR(1,2,3,4,5)”得2.5。6标准差就是方差开平方。用STDEVP可以计算总体标准差;用STDEV则可以计算样本标准差。如在单元格中输入“=STDEVP(1,2,3,4,5)”得1.;在单元格中输入“=STDEV(1,2,3,4,5)”得1.。实验四 卡平方(2)测验 1学时1、实验目的(1)掌握卡平方测验的基本原理和步骤。(2)掌握次数资料的适合性测验和独立性测验方法。2、实验内容(1)通过实际例子,说明适合性测验的方法和步骤。(2)通过举例说明22表、2c表和rc表的独立性测验方法和步骤。(3)掌握DPS统计函数在卡平方(2)测验中的应用3、
20、作业与思考(1)谈谈适合性测验的方法和步骤,并说明你得出的数据依据。(2)说明独立性测验的方法和步骤及其应用。 实验方法和步骤按下表所列次数检验茎用芥菜的播种期与病毒病是否有关?表4 茎用芥菜不同播种期的病毒病病株观测株数播 种 期病 株健 株总 数8月上旬94578月中旬7454总 数1. 建立工作表 打开DPS工作簿,“文件”-“新建”,将excel中sheet 6数据输入DPS工作簿。图4.1 :2 选择数据:只选择数据区域,不要选择处理的名称标记图4.23“分类数据统计”“四个表(2x2表)分析”,结果如下截图图4.3 自由度df=1,采用校正卡方0.3996,统计概率p=0.5273
21、(见上图中的实框内的内容)。结果判定:此时统计概率p0.05 (a=0.05是显著水平判定标准,0.05差异不显著,0.05 (a=0.05是显著水平判定标准,0.05差异不显著,0.05差异显著。下同), 所以方差的差异不显著,即方差整齐。于是应该采用等方差t检验比较两组平均数的差异显著性,结果见图中第9行:t检验的统计概率p=0.0094,0.05差异不显著,0.05差异显著),所以,两组平均数差异显著。根据平均数的大小,确定B法产率高于A法。实验六 单因素试验结果的方差分析 1学时1、实验目的(1)掌握单因素随机试验和拉丁方试验的方差分析方法;(2)了解缺区估计的原理和方法。2、实验内容
22、(1)举例说明单因素随机试验和拉丁方试验的方差分析方法。(2)缺一个小区单因素完全随机以及拉丁方试验的方差分析方法。3、作业与思考讨论单因素随机与拉丁方试验的方差分析方法的差异实验方法和步骤以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),得结果如表6,试进行方差分析。表6 不同药剂处理的水稻苗高(cm)药剂ABCD观察值192120222324182521271927132015221 将资料6表中的数据复制到DPS表中,其输入格式如图6.1。图6.1 原始数据示意图23 DPS“文件”“新建”,将上表(或者见excel中sheet 3)数据输入DPS新工
23、作簿4. 选定数据区域5. 选择DPS计算命令:单击“试验统计”,选择“完全随机设计”单击”单因素统计分析”,弹出对话框,选中列表中“Duncan新复极差法”,点击“确定”。6. 结果如下:7. 结果判定:p=0.0487 (图中黑框), 0.05, 差异不显著;处理间比较p=0.00990.05, 差异不显著;处理间比较p=0.00010.05, 差异显著。5. 于是查看处理间多重比较,见下图;结果判定参考上题。(实验7.2 二因素重复值ANOVA)施用A1、A2、A33种肥料于B1、B2、B33种土壤,以小麦为指示作物,每处理组合种3盆,得产量结果(g)于表7-2。试作方差分析。表 7-3
24、 种肥料施入3种土壤的小麦产量(g)肥料种类盆土壤种类B1(油砂)B2(二合)B3(白僵)A1121.419.617.6221.218.816.6320.116.417.5A2112.013.013.3214.213.714.0312.112.013.9A3112.814.212.0213.813.614.6313.713.314.01 将资料7-3表中数据资料整理,变成DPS的数据格式(见excel中sheet 5),如下图7-3.1 2. DPS“文件”“新建”,将数据复制到DPS中,输入格式如上。3. 选择数据,DPS“试验统计完全随机设计两因素有重复试验统计分析”,弹出对话框:请填入A
25、因素和B因素的水平数。即 单击“确认”OK勾选“Duncan新复极差法”4. 得到方差分析结果:5. 结果分析:A因素间p=0.00010.05、AxB的p=0.00590.05, 这两项差异显著。6. 于是查看多重比较A1显著好,于是查看A1中各个组合间多重比较,如下图:从结果可以看出,A1B1组合是优选水平组合的实验方案。然后,对于处理组合多重比较(见下图),也能够证实我们的判定:a1b1优组合。(实验7.2-2 随机区组二因素ANOVA)有一玉米品种与施肥量试验,品种为A因素,分为A1、A2、A33个水平,施肥量为B因素,分B1、B2、B33个水平,随机区组设计,重复3次,小区计产面积3
26、0m2,其田间布置及产量(kg/30m2)如表7-4:A1B312.0A3B313.5A2B121.8A2B320.3A1B215.8A1B121.8A3B215.0A2B222.5A3B118.8A1B117.3A3B213.5A1B218.0A2B221.8A3B117.3A2B122.5A2B319.5A1B312.0A3B314.3A3B312.0A2B321.0A1B311.3A2B122.8A1B120.3A3B212.8A3B115.8A2B217.3A1B217.3表7-4 玉米品种与施肥量试验田间布置图1 资料整理成DPS的数据格式,见excel中sheet 9,2. DPS
27、“文件”“新建”,把整理后的数据输入DPS工作簿中。3. 选择数据区域,选在DPS计算命令:单击“试验统计“选择“随机区组设计二因素试验统计分析”,弹出对话框:填写A因素的水平数,B因素的水平数。即单击“确认”,勾选“Duncan新复极差法”单击“确定”4 得方差分析结果,如下:图7-4.2 数据分析对话框示意图A因素间p=0.0001, B因素间p=0.0001, AxB的p=0.0166, 三者都是pCB空列。空列的作用是估计交互作用的效应,本例中,空列极差很小,表明因素的交互作用很小,那么,结果种的数据能够很好的反映各单因素的主效应。于是可以根据极差分析结果的总表,得出优组合:A3C2B
28、26. 同时,得到方差分析表:方差分析结果判定:第1,2,3,4列分别代表因素A, B, C,空列;根据上表的统计概率p值可知,A、B、C三个因素的水平间比较,都是差异不显著。因此,我们只需要查看处理组合的多重比较。处理组合之间的多重比较如下:差异均不显著7. 综合分析,采用极差分析的结果,选择A3C2B2优组合。实验九简单回归与相关分析 2学时1、试验目的(1)通过实验使学生了解回归与相关分析的意义 。(2)掌握一元回归方程与相关系数的计算方法和显著性检验方法。2、实验内容(1)举例说明一元线性回归方程的建立、估计标准误的计算方法。(2)用t测验和F测验说明说明一元线性回归关系的假设(3)说
29、明一元线性回归系数、回归截距和y估计值的置信区间计算方法。3、作业与思考(1)讨论一元线性回归与相关分析的注意事项。(2)讨论回归与相关的关系。实验方法和步骤某水稻研究所,进行水稻品种生育期与产量试验,其部分品种生育期与产量结果列于下表,试作回归相关分析。(生育期为x,单位:天;产量为y,单位:kg/667m2)。表9 水稻品种生育期与产量试验结果表品种编号12345678生育期x(天)112114116119123128129131产量y(kg/667m2)3713824154414384614794741输入数据 将上述资料录入DPS空白工作簿中。图9.1原始数据示意图2数据分析计算选择目
30、标数据的区域,图9.2 数据分析对话框示意图2. 选择DPS计算命令,“多元分析回归分析线性回归”;3. 单击右下方“返回编辑”按钮。结果截图如下相关系数决定系数回归截距回归系数,查看回归的各项系数:相关系数0.9547(黑框):指示自变量x1和因变量y之间的相关度为95.47%。下图中,在输出结果中可读出回归系数(b1)为5.2794、回归截距(b0)为-208.8235,则列回归方程图9.3 回归对话框示意图4. 对回归系数进行显著性检验:下图中,查看对于回归系数的显著性检验,b1回归系数(回归斜率)的显著性概率p=0.0008,回归显著;b0回归截距的显著性概率p=0.0672,回归不显
31、著。决定系数R2=0., 指示:回归方程拟合了91.1375%的数据,即91.1375%的数据能够用上述拟合方程说明。图9.4 回归对话框示意图:查看回归系数显著性检验的概率p值5采用作图软件,(DPS无此功能,可以使用excel,origin等)绘制回归直线图和标定实际相关点采用如下方法显示线性拟合图:Excel绘制点图,鼠标移动到点上,单击右键,出现选项,左键选择添加趋势线,出现选项,左键选择“线性”,左键再点击选项,勾选显示公式,单击确定,显示结果。图9.5 某水稻品种生育期与产量关系的直线回归方程6推断:该品种的生育期天数与产量之间存在极显著的回归关系,可以利用上述回归方程式和回归直线
32、图预测产量。一般情况下,该品种水稻的生育期天数每增加一天,其产量将平均提高5.2794 kg/667m2。第四次实验课 (共4学时)实验十 均匀设计和统计分析 注:使用DPS完成设计,采用DPS回归分析(多元二次多项式拟合)。1、试验目的(1)掌握均匀设计的回归分析方法;2、试验内容(1)举例说明均匀设计的方法及其回归分析;3、作业与思考联系实际,练习均匀设计实验的设计和回归分析实验方法和步骤1、 均匀设计的方法:DPS 单击“试验设计”“均匀设计”“均匀试验设计”,弹出对话框填写3因子,7 水平;点击“确认”,等待运算。出现结果:2. 进行实验和数据整理按照均匀设计方案(第13行)进行实验。
33、将具体实验条件数据和通过实验得到的实验结果数据,进行数据输入,试验结果放在x3的右列。Excel中sheet11。 如下表113. DPS“文件”“新建”,将数据复制到DPS工作簿,选定数据区域:4. 选择DPS计算命令:多元分析回归分析二次多项式逐步回归:5. 引入和剔除变量,看p值(此处F值应该为P值),其方法和原则如下:查看p值(这里“-”符号意思是“p=”),引入变量按yes,剔除变量按No,直到所有”已引进变量”的p值都0.05。然后,结束按OK。此例是按照方差分析F值的办法和原则,引入和剔除变量,稍后再做分析。此例实操步骤如下:引入变量按yes剔除变量按No剔除变量按No结束按OK
34、然后,连续关闭弹出的对话框,直到出现数据,6. 得到如下很多结果:(1)先查看回归系数的显著性检验,如下表:p值都是0.05, 回归系数检验显著,回归方程成立。(2) 查看二次多项回归方程,如下:简写成:(3) 查看最优参数的组合,以及最佳产率y:欲令Y最大,x1取最大值3.4;当x1=3.4时,原方程变为:,求偏导即得x3=2.7621。 x1=3.4,x3=2.7621,此时收率最大51.87% ,高于实验测定最大值48.2%(4) 查看其它指标,进一步验证回归显著性:指示:拟合方程可以说明97.772%的数据。越小越好,说明“拟合点”与“样本点”之间的差异小。7、重复试验,验证x1=3.4,x3=2.7621最优条件,以及最大收率51.87%。实验十