《统计学-基于R第3版习题答案(第二章).pdf》由会员分享,可在线阅读,更多相关《统计学-基于R第3版习题答案(第二章).pdf(18页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、习题2.1 (1)简单频数分布表:工作总结人大 R语言统计学 基于 R(第 3 版) 例题和习题数据(公开资源)exercisech2exercise2_1.RData) summary(exercise2_1) 行业性别满意度电信业 :38 男:58 不满意 :75 航空业 :19 女:62 满意 :45 金融业 :26 旅游业 :37 二维列联表: mytable1 addmargins(mytable1) # 增加边界和不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表: myt
2、able1 count1 count2 count3 par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) barplot(count1,xlab=行业 ,ylab=频数 ) barplot(count2,xlab=性别 ,ylab=频数 ) barplot(count3,xlab=满意度 ,ylab=频数 )帕累托图: count1 par(mai=c(0.7,0.7,0.1,0.8),cex=0.8) x bar text(bar,x,labels = x,pos=3) # 条形图增加数值 y par(new=T) pl
3、ot(y,type=b,lwd=1.5,pch=15,axes=F) axis(4) # 右 Y 轴 mtext(累积频率 ,side=4,line=3) mtext(累积分布曲线,line=-2.5,cex=0.8,adj=0.75)复式条形图: mytable1 barplot(mytable1,xlab=行业 ,ylab=频数 ,legend=rownames(mytable1),args.legend=list(x=13), beside = T)脊形图: library(vcd) spine(行业 满意度 ,data=exercise2_1,xlab=满意度 , ylab=行业 ,m
4、argins=c(4,3.5,1,2.5)马赛克图: mosaicplot(性别 +行业 +满意度 ,data=exercise2_1,col=2:3)(3)饼图: count1 name percent label1 par(pin=c(3,3),mai=c(0.1,0.4,0.1,0.4),cex=0.8) # 圆的大小 pie(count1,labels=label1,init.angle = 90)扇形图: count1 name percent labs library(plotrix) fan.plot(count1,labels=labs,ticks=200)2.2 (1)分 1
5、0 组,绘制频数分布表工作总结人大 R语言统计学 基于 R(第 3 版) 例题和习题数据(公开资源)exercisech2exercise2_2.RData) library(actuar) v gd1 table1 d hist(d,breaks=10,xlab=寿命 ,ylab=频数 )茎叶图: stem(exercise2_2$灯泡寿命 ) The decimal point is 2 digit(s) to the right of the | 26 | 0 28 | 968 30 | 0557882356799 32 | 7888990134569 34 | 113356677991
6、12223344455559 36 | 033566600024445567788 38 | 22455566670055669 40 | 001017 2.3 (1)箱线图:工作总结人大 R语言统计学 基于 R(第 3 版) 例题和习题数据(公开资源)exercisech2exercise2_3.RData) boxplot(exercise2_3,-1,xlab=城市 ,ylab=气温 ,cex.lab=0.8,cex.axis=0.6) # 从第二列开始,到最后小提琴图: library(vioplot) x1 x2 x3 x4 vioplot(x1,x2,x3,x4,names=c(北
7、京 ,沈阳 ,上海 ,南昌 )(2)点图: library(reshape) table1_1 table1_1 dotchart(table1_1$温度 ,groups=table1_1$城市 ,xlab=温度 ,pch=20) library(lattice) dotplot(温度 城市 ,data=table1_1,pch=19)核密度图: library(lattice) dp1 plot(dp1) library(sm) pare(table1_1$温度 ,table1_1$城市 ,lty=1:6,col=1:6) legend(topleft,legend = levels(tab
8、le1_1$城市 ),lty=1:6,col=1:6)(3)轮廓图 matplot(t(exercise2_3,-1),type=b,xlab=城市 ,ylab=温度 ,pch=1,xaxt=n) axis(side=1,at=1:10,labels = c(北京 ,沈阳 ,上海 ,南昌 ,郑州 ,武汉 ,广州 ,海口 ,重庆,昆明 ) legend(bottomright,legend=names (exercise2_3,-1) # 取列名雷达图: library(fmsb) table1 radarchart(table1,axistype=0,seg=4,maxmin=F,vlabel
9、s=exercise2_3,1) legend(x=topleft,legend=names(exercise2_3,2:11), col=1:10, lty=1:10) #lty图例(4)星图: matrix1 rownames(matrix1) stars(matrix1,key.loc=c(7,2,5),cex=0.8)脸谱图: library(aplpack) faces(t(matrix1),nrow.plot = 5,ncol.plot = 2,face.type = 0) effect of variables: modified item Var height of face
10、1月 width of face 2月 structure of face 3月 height of mouth 4月 width of mouth 5月 smiling 6月 height of eyes 7月 width of eyes 8月 height of hair 9月 width of hair 10月 style of hair 11月 height of nose 12月 width of nose 1月 width of ear 2月 height of ear 3月 2.4 (1)散点图: plot(地区生产总值, 最终消费支出,xlab=,ylab=最终消费支出) ab
11、line(lm(最终消费支出地区生产总值,data=exercise2_4) points(固定资产投资, 最终消费支出,ylab=最终消费支出,pch=2,col=blue) abline(lm(最终消费支出固定资产投资,data=exercise2_4),col=blue)气泡图: r symbols(最终消费支出, 地区生产总值,circles=r, inches=0.3, fg=white,bg=lightblue,ylab=最终消费支出,xlab=地区生产总值) text(最终消费支出, 地区生产总值,rownames(exercise2_4) mtext(气泡大小 =最终消费支出,
12、line=-2.5,adj=0.1)(2)星图: matrix1 rownames(matrix1) stars(matrix1,key.loc=c(7,2,5),cex=0.8)脸谱图: library(aplpack) faces(matrix1,nrow.plot = 6,ncol.plot = 6,face.type = 0)2.5 时序图:工作总结人大 R语言统计学 基于 R(第 3 版) 例题和习题数据(公开资源)exercisech2exercise2_5.RData) table1 plot(table1,2,xlab=年份 ,ylab=价格指数 ,type=n) points
13、(table1,2,type=o,xlab=年份 ,ylab=城镇价格指数) lines(table1,3,type=b)2.6 洛伦茨曲线:工作总结人大 R语言统计学 基于 R(第 3 版) 例题和习题数据(公开资源)exercisech2exercise2_6.RData) library(DescTools) Lc(exercise2_6$不同阶层人口数的收入额*10000/exercise2_6$不同收入阶层的人口数,exercise2_6$不同收入阶层的人口数) # 标红为组中值,收入/ 人数$p 1 0.0000000 0.3478261 0.6086957 0.8260870 0
14、.9565217 1.0000000 $L 1 0.00000000 0.06060606 0.15151515 0.33333333 0.63636364 1.00000000 $L.general 1 0 20000 50000 110000 210000 330000 $Gini 1 0.6232632 $x 1 1250.00 2500.00 6000.00 16666.67 60000.00 $n 1 80 60 50 30 10 attr(,class) 1 Lc plot(Lc(exercise2_6$不同阶层人口数的收入额*10000/exercise2_6$不同收入阶层的人口数,exercise2_6$ 不同收入阶层的人口数),xlab=人数比例 ,ylab=收入比例 ,col=4,panel.first=grid(10,10,col=gray70)结论: 0.4, 收入差距巨大