《R语言因子实验设计和解释案例分析报告 附代码数据.docx》由会员分享,可在线阅读,更多相关《R语言因子实验设计和解释案例分析报告 附代码数据.docx(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、R语言因子实验设计和解释案例分析报告示例1:两组比较示例2:多个组实例3:两个条件,两个基因型,一个交互项。野生型治疗效果(主效应)。0突变体治疗的效果0没有治疗的突变型和野生型之间有什么区别?。通过治疗,突变型和野生型有什么区别?。基因型的不同反应(相互作用项)实例4:两个条件,三个基因型。基因型I的条件效应(主效应)。基因型HI的条件效应。基因型n的条件效应。在条件a下in与II的影响。基因型HI与基因型I的条件效应的相互作用项。基因型HI与基因型n的条件效应的相互作用项。为了允许iDEP中的复杂模型(http:/g+1ab.org/idep/),我尝试了解如何构建事实模型,并从DESeq
2、2中提取期望的结 果。以下是基于DESeq2中resutls ()函数的帮助文档,以及Mike Love对用户提问的回答。我想要做的一个重点是,当研究设计涉及多个因素时(参见上面关于基因型+治疗实例的图),结果的解释是棘手的。与 R中的回归分析类似,分类因素的参考水平构成了我们的分歧的基础。然而,默认情况下,它们是按字母顺序确定的。 选择每个因素的参考水平是至关重要的。否则你的系数可能会有所不同,这取决于你如何进入DESeq2的实验设计。这 可以通过R中的relevel ()函数完成。参考级别是构成有意义比较基础的因素的基线级别。在野生型与突变型实验中, “野生型”是参考水平。在治疗与未治疗,
3、参考水平显然是未经处理的。例3中的更多细节。例1:两组比较首先制作一些示例数据。library (DESeq2)dds -makeExampleDESeqDataSet(n=10000 , 6)assay(dds)i:io,# samplei sample? samples sampled samples sample6# genei# gene26 4 111 2 139 12 23 13 14 28# gene3 #gene4 # genes # gene6 # geney # gene858 121 173 178 118 9704038327 3 6 9 8 1248 8 35 38
4、21 1336 50 61 52 44 226 8 16 14 18 19# geneg214 266 419 198 157 166# geneio 20 12 16 12 16 2这是一个非常简单的实验设计,有两个条件。colData(dds)# DataFrame with 6 rows and 1 column # # condition# # sampleiA# # sample2A# # samplesA# # sample4B# # samplesB# # sample6 B dds-DESeqCdds) resultsNames(dds)# # 1 n Intercept* c
5、ondit ion_B_vs_An这显示了可用的结果。 请注意,默认情况下,R会根据字母顺序为因素选择一个参考级别。这里A是参考水平。 折 叠变化定义为B与A比较。要更改参考级别,请尝试使用“同一个”()函数。res -results (dds , contrast 二 “condition res -res order(res$pa(y ) J library (knitr)kable(resi:5?-(3:4)baseMeanlog2FoldChangepvaluepacjjgene9056360.168909-2.0453790.00000000.0001366gene308743.89
6、7516-2.2033030.00001730.0858143gene376372,409877-1.8347870.00004340.1434712gene2054322.4949631.5374080.00006810.1689463gene46176.2274156. 1252380.00020190.4008408如果我们想用B作为控制,并用B作为基线定义倍数变化。 那我们可以这样做:res - results (dds, contrast = “condition ix=which.min(res$padj)res las=2: main=rownames(dds) I ix )ge
7、ne9056700600 -500 -400 -300 -2001000怎 d E ,示例2:多个组假设我们有三个组A, B和C.dds111=6)dds$condition-factor(c(nAH, HAH, nBn, nBn, HCH, nCn)dds-DESeq(dds)res=resultsCdds, contrast=c(nconditionlnCfMAn)res -res order(res$pa(y ) Jkable(resi = 5 , -(3 : 4)baseMeanlog2FoldChangepvaluepadjgene23.634986-5.1017730.03486790.5515088gene204.678176-4.4909820.04456640.5515088gene3456.068672-1.4621550.01678200.5515088gene35537.847175-1.1772400.00879130.5515088gene4193.9678101.0647340.04120340.5515088