《R语言实战学习笔记-第五章(共4页).doc》由会员分享,可在线阅读,更多相关《R语言实战学习笔记-第五章(共4页).doc(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上第五章:高级数据管理5.2数值和字符处理函数l 数学函数ceiling(x)不小于x的最小整数round(x,digits=n)四舍五入,保留n位floor(x)不大于x的最大整数signif(x,digits=n)指定位数的有效数字trunc(x)去尾取整log(x,base=n)对x取底为n的对数l 统计函数mad(x)绝对中位差diff(x,lag=n)滞后差分quantile(x,probs)分位数scale(x,center=TRUE,scale=TRUE)为数据对象x进行中心化或标准化处理range(x)值域l 概率函数代码:设定随机数种子 runif(5
2、) #生成0到1区间上服从均匀分布的伪随机数1 0. 0. 0. 0. 0. runif(5)1 0. 0. 0. 0. 0. set.seed(1234) #显式指定伪随机数种子 runif(5)1 0. 0. 0. 0. 0. set.seed(1234) runif(5)1 0. 0. 0. 0. 0.代码:生成多元正态数据 install.packages(MASS) library(MASS) options(digits=3) set.seed(1234) mean=c(230.7,146.7,3.6) sigma=matrix(c(15360.8,6721.2,-47.1,672
3、1.2,4700.9,-16.5, -47.1,-16.5,0.3),nrow=3,ncol=3) mydata mydata names(mydata) options(digits=2) student math science english roster z score roster y roster$gradescore=y1 roster$gradescore=y2 roster$gradescore=y3 roster$gradescore=y4 roster$gradescorey4 name lastname firstname roster roster roster5.4
4、控制流5.4.1重复和循环l for结构for(var in seq) statement 例:for(i in 1:10) print(“Hello”)l while结构while(cond) statement 例:i0) print(“Hello”;i-i-1)5.4.2条件执行l if-else结构if(cond) statementif(cond) statement1 else statement2l ifelse结构ifelse(cond,statement1,statement2),若cond为TRUE,则执行第一个语句,否则执行第二个l switch结构swich(expr,
5、),表示与expr的各种可能输出值绑定的语句5.5用户自编函数l 一个函数的大概结构:myfunction mystats-function(x,parametric=TRUE,print=FALSE)if(parametric)center-mean(x);spread-sd(x)elsecenter-median(x);spread-mad(x)if(print¶metric) cat(Mean=,center,n,SD=,spread,n)else if(print&!parametric)cat(Median=,center,n,MAD=,spread,n) result se
6、t.seed(1234) x y y5.6整合与重构l 转置:t()函数,格式t(matrix)l 整合数据:aggregate(x,by,FUN),其中x是待折叠的数据对象,by是一个变量名组成的列表,这些变量将被去除掉以形成新的观测,而FUN则是用来计算描述性统计量的标量函数,它用来计算新观测中的值。l reshape包原始数据集IDTIMEX1X21156123521612224数据集的融合是将它重构为这样一种格式:每个测量(最后两列的值)变量独占一行,行中带有要唯一确定这个测量所需的标识符变量(ID,TIME以及观测属于X1还是X2)。library(reshape)md-melt(mydata,id=(c(“id”,”time”)融合后的数据集IDTIME变量值11X1512X1321X16IDTIME变量值22X1211X2612X2521X2122X24数据集的重铸,cast()函数,调用函数newdata-cast(md,formula,FUN),其中md为已融合的数据,formula描述了最后想要的结果,FUN是数据整合函数,其接受公式形如:rowvar1+rowvar2+ colvar1+colvar2+在这个公式中,前者定义了要换掉的变量集合,以确定各行的内容,后者定义了要划掉的,确定各列内容的变量集合。专心-专注-专业