《R语言实战学习笔记-第四章(共2页).doc》由会员分享,可在线阅读,更多相关《R语言实战学习笔记-第四章(共2页).doc(2页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上第四章 基本数据管理4.1一个示例l 代码:创建一个数据框 manager date country gender age q1 q2 q3 q4 q5 leadership mydata mydata$sum mydata$mean attach(mydata) mydata$sumx mydata$mean detach(mydata)方法三:(此方法将运算结果保存在了原始数据表格里) mydata mydata4.3变量的重编码l 逻辑运算符:= 严格等于;!= 不等于;!x 非x;x|y x或y;x&y x和y;isTRUE(x) 测试x是否为真l 代码:将l
2、eadership表的连续型年龄变量重编码为类别型变量 leadership$ageleadership$age=99 leadership$agecatleadership$age75leadership$agecatleadership$age=55&leadership$age=75 leadership$agecatleadership$age55leadership-within(leadership,agecat75=55&age=75-Middle Agedagecatage55install.packages(reshape) library(reshape) leadersh
3、ip names(leadership)2 y is.na(y)输出1 FALSE FALSE FALSE TRUEl 重编码某些值为缺失值例: leadership$ageleadership$age=99newdatamydate strDates dates dates1 1965-01-05 1975-08-16l 输出当前日期和时间 Sys.Date() date()4.9数据集的合并l 添加列:merge()函数调用格式:total-merge(dataframeA,dataframeB,by=ID)l 添加行:rbind()函数调用格式:total-rbind(dataframeA,dataframeB)l 随机抽样:sample()函数从leadership数据集中随机抽取一个大小为3的样本:Mysample-leadershipsample(1:nrow(leadership),3,replace=F)专心-专注-专业