《(1.12.4)--植物数量性状遗传体系检测中回交或自交家系重复试验数据的分析方法.pdf》由会员分享,可在线阅读,更多相关《(1.12.4)--植物数量性状遗传体系检测中回交或自交家系重复试验数据的分析方法.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、植物数量性状遗传体系检测中回交或自交家系重复试验数据的分析方法摘要:为提高主基因+多基因混合遗传分析的精度,降低试验误差,采用重复内分组随机区组设计,对低遗传力性状的 B1 2和 B2 2或 F2 3家系平均数资料进行遗传分析。通过 AIC 准则和适合性检验比较无主基因(A-0)、1 对主基因(A)、2 对主基因(B)、多基因(C)、1 对主基因+多基因(D)和 2 对主基因+多基因(E)模型以鉴定其遗传模式。采用 IECM 算法估计混合模型参数。通过油菜 HSTC14宁油 7 号初花期 F2 3家系平均数资料阐明该方法。关键词:数量性状;主基因+多基因混合遗传;IECM 算法;油菜中图分类号
2、:Q348文献标识码:A 文章编号:0253-9772(2001)04-0329-04Detection of Genetic System of QuantitativeTraits Using Backcross and Selfing FamiliesZHANG Yuan-ming,GAI Jun-yi,QI Cun-kou(Soybean Research Institute,Nanjing Agricultural University;National Centerof Soybean Improvement,Ministry of Agriculture,Nanjing,2100
3、95,China)Abstract:To improve the precision in the genetic analysisof quantitative traits,the B1 2and B2 2,or F2 3familiesin a ran-domized blocks design were used to identify the mixed major gene plus polygene inheritance model while error variance wasestimated from the analysis of variance.Five kind
4、s of genetic models were established,including:one-major-gene model,two-major-gene model,polygene model,mixed one-major-gene plus polygene model,and mixed two-major-gene plus poly-gene model.The AIC value and a set of tests of goodness-of-fit were used to identify the most fitted model among the pos
5、-sible ones.The iterated ECM(IECM)algorithm was used to obtain maximum likelihood estimates of the parameters insample likelihood function.An example of the genetic analysis of days from planting to flowering of a rape cross was usedto illuminate the above procedure.Key words:quantitative trait;majo
6、r genes plus polygene mixed inheritance;IECM algorithm;mixture model;brassica napus L.QTL 作图启示数量性状可由效应大的主基因和效应小的多基因所控制,因而支持主基因+多基因混合遗传模式理论。由此,王健康和盖钧镒在 El-ston&Steward 的基础上提出了 1 对主基因+多基因的统计分析方法 1 4,7,8,章元明和盖钧镒拓展到2对主基因+多基因混合遗传模型 5 6。应用研究发现,试验误差大小和性状遗传力高低是影响其分析效果的重要因素,特别是以单株观测值为基础的方法。因此,发展以家系为试验单位并结合有重
7、复试验来降低试验误差提高低遗传力性状检测 QTL体系的精度。其中最便于获得的试验材料是回交或自交家系世代。为此,本文提出利用B1 2和B2 2或F2 3收稿日期:2000-05-29;修回日期:2000-08-10基金项目:国家 973 项目、重庆市科委应用基础研究项目资助作者简介:章元明(1965-),男,重庆永川人,硕士研究生毕业,副教授,研究方向:数量遗传学和生物统计学。E-mail:soyzhang 遗传 HEREDITAS(Beijing)23(4):329 332,2001研究报告DOI:10.16288/j.yczz.2001.04.009家系的主基因+多基因混合遗传分析法。为提
8、高参数估计的效率和准确性,采用 IECM 算法 5。1分析方法的导演1.1试验数据的统计模型利用家系进行遗传试验近来一些研究者常采用重复内分组随机区组设计。由于这种设计也属不完全区组设计,特别适用于供试样本为随机样本的情形,这时假定分组后的每组家系均为总体代表性样本,组间应无显著差异,若存在显著差异,应为环境误差,可予以剔除。设将家系群体供试家系随机分为 a 组,每组有 b 个家系,每家系设置 c 个重复,按重复内分组随机区组设计,每一重复种 ab 小区。若数据单位为小区时,数量性状 xijk的数学模型为:xijk=+i+k+()ik+j(i)+ijk其中,为群体平均数;i为第i 组的效应,服
9、从 N(0,2);k为重复效应,组与重复间的互作效应()ik N(0,2);j(i)为第 i 组内第 j 个家系的效应,服从 N(0,2);试验误差随机变量 ijk N(0,2)。其期望均方见应用实例中的表 2。若数据单位为小区内单株,其数学模型为:xijkl=+i+k+()ik+j(i)+()jk(i)+ijkl其中,()jk(i)与以小区为数据单位的 ijk同义,可检测组内家系间的差异显著性;ijkl N(0,2e)为小区内株间差异。这时,可利用小区平均数进行以下的分析。显然,相同材料不同重复间差异为误差差异,该误差是小区内单株间误差的 1/n(n 为小区内观测植株数)。若组间差异显著,则
10、剔除组效应 后进行以下分析。若组内不同家系间差异不显著,则分析到此为止。通过方差分析得到的误差方差作为混合模型成分分布方差中的误差方差组分。1.2B1 2、B2 2和 F2 3家系群体的遗传组成当存在 1 对主基因时,假定亲本主基因型为AA(P1)和 aa(P2),B1=F1P1,B2=F1P2。按主基因型家系分,B1 2为 AA 和 aa 家系等比例混合,用 N(1t,21t)(t=1,2)表示其家系平均数分布;B2 2为 Aa 和aa 家系等比例混合,用 N(2 t,22 t)(t=1,2)表示其家系平均数分布;F2 3为 AA、Aa 和aa 家系按 1 2 1 混合,用 N(3t,23
11、t)(t=1,2,3)表示其家系平均数分布。记成分分布方差的主基因、多基因和环境三种方差组分分别为 C0、2j0和2e/n,则211=210+2e/n,212=211+C0221=222+C0,222+2e/n231=233=230+2e/n,232=231+C0其中,C0=(1/2d2+1/4h2)/n。2 对主基因的情形参见文献5。1.3 遗传模型的建立、分布参数和遗传参数的估计主+多基因遗传体系的基本假定参见文献 4。B1 2和 B2 2群体鉴定主基因+多基因遗传模型的样本似然函数为:L1(Y|)=n1i=1k1t=11tf(x1i;1t,21 t)n2i=1k2t=12tf(x2 i;
12、2t,22t)F2 3的样本似然函数为:L2(Y|)=n3i=1k3t=13tf(x3i;3t,23 t)其中,f(xi;,2)是正态分布 N(,2)的密度函数,n1与 k1、n2与 k2以及 n3与 k3分别是 B1 2、B2 2和 F2 3群体的家系数和成分分布个数。由此可建立A(1 对主基因)、B(2 对主基因)、C(多基因)、D(1 对主基因+多基因)和 E(2 对主基因+多基因)5类遗传模型,表 1 列出了 E 类模型和利用 B1 2和B2 2的 C、D 类模型。应当注意,多基因存在时,可不作多基因符合加性-显性模型的假定。采用 IECM 算法 5获得似然函数 L1(Y )和L2(Y
13、 )中分布参数的极大似然估计值。根据五类模型 AIC 值和适合性检验选择最适遗传模型。用最小二乘法估计一阶遗传参数,用文献 1,3,4 的方法估计二阶遗传参数。以上模型分布参数的IECM 算法均用 Turbo C+语言编写计算程序,欢迎读者来函联系。2应用实例与讨论油菜 HSTC14宁油 7 号的 120 个 F2 3家系分10 组种植,每组 12 个家系,每家系重复 2 次,每重复观测 4 株初花期(以 3 月 1 日记为 1),其方差分析见表 2。从表 2 可知,家系间差异显著,分组间差异不显著。因此,可直接利用原始资料(表 3)进行以下分析。330遗传 HEREDITAS(Beijing
14、)200123卷表 1B1 2和 B2 2或 F2 3家系群体所包含的成分分布数及可估的遗传参数Table 1The number of component distributions(NCD)and estimable genetic parametersof B1 2and B2 2,or F2 3under mixed major gene plus polygene inheritance models模型Model成分分布个数NCD独立参数个数No.independentparameter一阶遗传参数1st order genetic parameter约束条件数No.restric
15、tiveconditionsB1 2&B2 2C24m1,m2-D-146m1,m2,d,h-D-245m1,m2,d,(h=0)1D-345m1,m2,d(=h)1D-445m1,m2,d(=-h)1E-1812m1,m2,da,db,ha,hb,i,jab,jba,l-E-288m1,m2,da,db,ha,hb,(i=jab=jba=l=0)2E-386m1,m2,da,db,(ha=hb=0)4E-465m1,m2,d(=da=db,ha=hb=i=jab=jba=l=0)3E-586m1,m2,da=ha,db=hb,(i=jab=jba=l=04E-665m1,m2,d(=da=h
16、a=db=hb,i=jab=jba=l=0)3F2 3E-1910m3,da,db,ha,hb,i,jab,jba,l-E-296m3,da,db,ha,hb,(i=jab=jba=l=0)4E-394m3,da,db,(ha=hb=0)6E-463m3,d(=da=db,ha=hb=i=jab=jba=l=0)3E-594m3,da=ha,db=hb,(i=jab=jba=l=0)6E-663m3,d(=da=ha=db=hb,i=jab=jba=l=0)4表 2方差分析表Table 2Analysis of variance变异来源Source of variationDFSSMSF期望均
17、方Expectation mean squares重复Replication16.356.351.502+b2+ab2分组Set963.507.05560.842+c2f+b2+bc2重复分组ReplicationSet938.154.23892.452+b2 家系间Family110684.216.22013.602+c2f误差Error110190.041.72762总Total239982.25表 3油菜 HSTC14宁油 7 号 F2 3家系初花期的次数分布Table 3Distributions of days from planting toflowering for a cros
18、s between two rape cultivars28-30-32-34-36-38-40-n xP14042.3077F12035.0000P24031.8000F2 33861 1203314124034.6303 主基因存在的鉴定结果见表 4。由表 4 可知,E-1 模型的AIC 值最低,且 E-1 模型的适合性检验结果也最好(表 5),因此,E-1 模型为最适模型。在遗传参数估计时,为了使估计值更符合实际情况并估计出多基因的加性与显性效应,可利用亲本和F1的群体平均数与 F2 3成分分布平均数共同估计一阶遗传参数,其估计值为:m=36.17,da=db=0.99,ha=-3.17
19、,hb=-1.43,i=0.95,jab=-3314 期章元明等:植物数量性状遗传体系检测中回交或自交家系重复试验数据的分析方法1.62,jba=-3.36,l=6.90,d=3.28,h=-3.42。这一遗传参数估计结果既能有效地解释亲本和 F1的表现,又能解释 F2 3群体的表现。因此,在利用单一分离群体进行分离分析时加进亲本和F1群体平均数估计一阶遗传参数是十分有效的方法。通过上述一阶遗传参数估计值计算 F2 3群体各主基因型的理论值,由所获得的理论值计算 F2 3群体主基因遗传方差:2mg=1.2437;进而计算多基因遗传方差:2pg=3.2526-1.2437-1.7276=0.28
20、13。由此,主基因遗传率 h2mg=1.2437/3.2526=38.24%,多基因遗传率 2pg=0.2813/3.2526=8.70%。表 4遗传模型的 AIC值Table 4AIC values under various genetic models模型ModelAIC模型ModelAIC模型ModelAICA-01181.1718B-4983.5978E-1960.2113A-1977.8405B-5992.8699E-2976.0257A-21006.0497B-6990.8681E-3972.0565A-31029.6340C968.0446E-4970.0588A-4999.5
21、370D-1972.0274E-5972.0541B-1968.4349D-2970.0557E-6970.0546B-2977.7195D-3972.0528B-3982.2790D-4972.0356表 5F2 3群体配合 A-0,A-1,B-1,C,D-1 和 E-1 模型的适合性检验Table 5Tests of goodness-of-fit for Models A-0,A-1,B-1,C,D-1 and E-1 in F2 3population模型ModelU21U22U23nW2DnA-00.677(0.41)1.095(0.30)54.3441.3730.160A-12.3
22、09(0.13)4.6507.5090.7660.144B-10.148(0.70)0.125(0.72)8.4430.459(0.05)0.102C0.118(0.73)0.780(0.38)4.840.4950.114D-10.114(0.74)0.769(0.38)4.8510.4940.114E-10.001(0.98)0.040(0.84)0.491(0.48)0.266(0.10)0.088(0.05)利用家系重复试验资料的分离分析与文献 2 利用单株资料的分离分析比较,前者一方面可降低误差以提高参数估计精度,另一方面只需一次就可鉴定出数量性状的遗传模式。王健康等(1997)和盖钧
23、镒等(1998)是首先确定成分分布数然后确定遗传模型的 1,2,本文是利用文献 3,4 的数量性状联合多个分离世代的分离分析的思路完成的,这就避免了具有相同成分分布数时不能区分是 1 对主基因控制的还是 2 对主基因控制的缺陷,并且在分布参数的估计中考虑了相应的遗传背景。在估计一阶遗传参数时利用亲本和 F1的平均数资料,这对确定主基因效应相对大小是有作用的并能有效地解释亲本、F1和 F2 3群体的表现。这是因为 P1与 P2之间差异可度量基因的加性效应,中亲值与 F1间差异可度量基因的显性效应的缘故。参 考 文 献(References):1 盖钧镒,王健康.利用回交世代或F2 3家系世代鉴定
24、数量性状主基因-多基因混合遗传模型 J.作物学报,1998,24(4):402 409.2 王健康,盖钧镒.利用杂种 F2世代鉴定数量性状主基因-多基因混合遗传模型并估计其遗传效应 J.遗传学报,1997,24(5):432 440.3 王健康,盖钧镒.数量性状主基因-多基因混合遗传的 P1、F1、P2、F2和F2 3联合分析方法 J.作物学报,1998,24(6):651 659.4 Gai J Y,Wang J K.Identification and estimation of a QTL modeland its effects J.Theor Appl Genet,1998,97(7):1162 1168.5 章元明,盖钧镒.数量性状分离分析中分布参数估计的 IECM算法 J.作物学报,2000,26(6):699 706.6 章元明,盖钧镒.利用DH或 RIL 群体鉴定 QTL 体系并估计其遗传效应 J.遗传学报,2000,27(7):634 640.7 盖钧镒,王健康.利用回交世代鉴定数量性状主基因-多基因混合遗传模型 J.遗传,1998,20(增刊):110 111.8 王健康,盖钧镒.利用图形分析鉴定数量性状遗传体系中的主基因 J.遗传,1998,20(增刊):139 140.332遗传 HEREDITAS(Beijing)200123卷