R语言绘制双坐标图的案例详解
之前推送了一系列关于使用ggplot2包绘制统计图形的文章,有网友询问是否可以绘制双轴的统计图形。很抱歉,Hradly在设计ggplot2包时就没有将双轴图形功能考虑进来。难道R语言就无法绘制双轴图形了吗?非也,R不仅是统计学家的标准工具,也是一款绘制图形的理想工具。下面就跟大家介绍plotrix包中的twoord.plot()函数和twoord.stackplot()函数,它们可以实现双坐标轴图形的绘制。
twoord.plot()函数语法及参数含义:
twoord.plot(lx,ly,rx,ry,data=NULL,main="", xlim=NULL,lylim=NULL,rylim=NULL, mar=c(5,4,4,4),lcol=1,rcol=2, xlab="",lytickpos=NA,ylab="", ylab.at=NA,rytickpos=NA,rylab="", rylab.at=NA,lpch=1,rpch=2, type="b",xtickpos=NULL, xticklab=NULL,halfwidth=0.4, axislab.cex=1,do.first=NULL,...)
lx,ly,rx,ry:分别指定左坐标轴和右坐标轴的值,必须是连续的值
data:需要绘制双轴图形的数据框
main:为图形指定标题
xlim:限制横坐标值的范围
lylim,rylim:限制左右纵坐标值的范围
mar:设置图形边界距,默认值为(5,4,4,4)
lcol,rcol:设置左右坐标轴的颜色,这样可以起到图例的作用
xlab:设置横坐标轴标签
lytickpos:设置左坐标轴刻度标签的位置
ylab:设置左坐标轴标签
ylab.at:设置左坐标轴标签位置
rytickpos:设置右坐标轴刻度标签的位置
rylab:设置又坐标轴标签
rylab.at:设置右坐标轴标签位置
lpch,rpch:设置左右坐标轴图形的外观
type:指定图形类型
xtickpos:设置横坐标轴刻度标签位置
xticklab:设置横坐标轴刻度标签
halfwidth:设置用户给定条形图宽度的一半
axislab.cex:设置坐标轴标签和刻度标签的大小
do.first:通过该参数可以往图形中添加背景色或网格线
下面通过案例来说明twoord.plot()函数的应用:
library(plotrix)
绘制双轴的两个线图
Date <- seq(from = as.Date(‘2015-01-01'), to = as.Date(‘2015-12-01'), by = ‘month') Consumers <- c(100,80,120,153,200,188,220,322,300,321,282,304) Amount <- c(1000,840,1458,1844,2045,2000,2548,5081,5000,5200,4800,4971) df1 <- data.frame(Date = Date, Consumers=Consumers, Amount = Amount) twoord.plot(lx = df1$Date, ly = df1$Consumers, rx = df1$Date, ry = df1$Amount, main = ‘双轴的两条线图', xlab = ‘月份', ylab = ‘会员人数', rylab = ‘总消费额', type = c(‘line','line'))
虽然双坐标轴图形已经绘制好,但图中有几个不满意的地方:
1)横坐标轴的刻度标签不是正确的日期格式
2)右坐标轴刻度标签很挤
3)图形不炫酷,想添加背景色或网格线
好,这些不满意的地方都不是问题,twoord.plot()函数可以轻松搞定:
1)通过xticklab参数重新设置横坐标轴的刻度标签
2)通过rytickpos参数重新设置刻度标签
3)通过do.first参数给图形添加背景色和网格线
twoord.plot(lx = df1$Date, ly = df1$Consumers, rx = df1$Date, ry = df1$Amount, main = ‘双轴的两条线图', xlab = ‘月份', ylab = ‘会员人数', rylab = ‘总消费额', type = c(‘line','line'), xtickpos=as.numeric(df1$Date), xticklab = as.character(df1$Date), rytickpos = seq(500,5000,by = 1500), do.first = ‘plot_bg(col = \'gray\'); grid(col = \'white\', lty = 2)')
这样的图形结果要比上面的图看起来舒服多了。如果想把左坐标轴的会员人数用条形图表示,右坐标轴的总消费额用线条表示,该如何操作呢?很简单,只需将type参数设置为(‘bar’,’line’)就可以了:
twoord.plot(lx = df1$Date, ly = df1$Consumers, rx = df1$Date, ry = df1$Amount, lcol = ‘steelblue', main = ‘双轴的两条线图', xlab = ‘月份', ylab = ‘会员人数', rylab = ‘总消费额', type = c(‘bar','line'), xtickpos=as.numeric(df1$Date), xticklab = as.character(df1$Date), rytickpos = seq(500,5000,by = 1500), do.first = ‘plot_bg(col = \'gray\'); grid(col = \'white\', lty = 2)')
哎?又有问题了,这个条形图怎么这么细窄?超级难看。不要着急,只要稍稍调整halfwidth参数的大小即可,这里设置为8:
twoord.plot(lx = df1$Date, ly = df1$Consumers, rx = df1$Date, ry = df1$Amount, lcol = ‘steelblue', main = ‘双轴的两条线图', xlab = ‘月份', ylab = ‘会员人数', rylab = ‘总消费额', type = c(‘bar','line'), xtickpos=as.numeric(df1$Date), xticklab = as.character(df1$Date), rytickpos = seq(500,5000,by = 1500), halfwidth = 8, do.first = ‘plot_bg(col = \'gray\'); grid(col = \'white\', lty = 2)')
这会儿图形正常了。还记得直方图是如何绘制的吗?hist()函数,直方图+核密度图是如何绘制的?hist()函数+lines()函数:
set.seed(1000) x = rnorm(1000,10,3) h <- hist(x, breaks = 50)
绘制直方图和核密度图
hist(x, breaks = 50, col = ‘steelblue') lines(density(x), col = ‘red')
哎?核密度线怎么成了一条直线了?原来是因为直方图高度对于的频次与核密度值不是一个量纲,即频次在0~60之间,而核密度值在0~1之间。如果要使核密度曲线体现出来,必须将hist()函数中freq参数设置为FALSE:
绘制直方图和核密度图
hist(x, breaks = 50, col = ‘steelblue', freq = FALSE) lines(density(x), col = ‘red', lwd=2)
如果我既想看到不同组的频次,又想看到对应的密度值该怎么办呢?这个时候就需要绘制双轴图了:
x1 <- h$mids y1 <- h$counts x2 <- seq(min(x), max(x), by = 0.01) y2 <- dnorm(seq(min(x), max(x), by = 0.01),10,3) twoord.plot(lx = x1, ly = y1, rx = x2, ry = y2, type=c(‘bar','l'), lcol = ‘steelblue', rcol = ‘red', ylab = ‘Counts', rylab = ‘Density', main = ‘Histogram and density curve', halfwidth=0.2, lylim = c(0,max(y1)+1), rylim = c(0,0.2),lwd=2)
关于twoord.plot()函数,最后再介绍一种图,帕累托图形。即图形中包一个纵坐标轴表示绝对数量,另一个纵坐标轴表示累计百分比。实现该图脚本如下:
type <- 1:7 absolute <- c(12,15,20,28,11,5,7) cum_per <- cumsum(absolute)/sum(absolute) twoord.plot(lx = type, ly = absolute, rx = type, ry = cum_per, type=c(‘bar','l'), lcol = ‘steelblue', rcol = ‘red', ylab = ‘总数', rylab = ‘累计百分比%', main = ‘帕累托图', xtickpos=type, xticklab = c(‘A','B','C','D','E','F','G'))
下面再看一下twoord.stackplot()函数,该函数与twoord.plot()的不同之处在于,其可以绘制堆叠图,函数具体语法和参数含义如下:
twoord.stackplot(lx, rx, ldata, rdata,
lcol, rcol, ltype, rtype, border, rylab, lylab,
xlab,
..., incrylim=NULL,halfwidth=0.4, leftfront=FALSE, mar = c(5, 4, 4, 4))
lx,rx:指定左右横坐标轴的值
ldata,rdata:指定左右纵坐标轴的值
lcol, rcol:指定左右坐标轴的颜色
ltype, rtype:指定左右坐标轴线的类型
border:指定条形图边框颜色
rylab,lylab:指定左右纵坐标轴标签
xlab:指定横坐标轴标签
incrylim:增加坐标轴值的范围
halfwidth:设置用户给定条形图宽度的一半
leftfront:如果leftfront设置为TRUE的话,则左坐标轴将置于顶层
mar:设置图形边界距,默认值为(5,4,4,4)
现在有一个场景是这样的,需要绘制某APP在2015年各月中新老会员人数及新会员所占比重:
set.seed(1111) Date <- 1:12 Old <- round(runif(12, 100,300)) New <- round(runif(12, 50,120)) Ratio <- New/(New+Old) twoord.stackplot(lx=Date, rx=Date, ldata=cbind(Old, New), rdata=Ratio, lcol=c(‘steelblue','orange'), rcol='red', ltype=”bar”, rtype='l', border=”grey80”, lylab = ‘人数', rylab = ‘新客比例', xlab='月份', main='新老客占比', incrylim=0.1)
上图能够很高的看出新老客之间的数量对比,同时也能看出新客的趋势线,唯一不足的是,没有图例,下面就以图层的概念,在该图的基础上添加一下图例:
扩展绘图区域并添加图层
par(xpd=TRUE) par(new=TRUE)
在原来图形的基础上绘制一张空图
plot(0:1, 0:1, type=”n”, xlab=””,ylab=””, axes=FALSE)
添加左坐标轴轴图例
legend(0, 1.5, leg=c(‘老客', ‘新客'), fill=c(‘steelblue','orange'), bty = ‘n')
添加右坐标轴轴图例
legend(-0.03, 1.25, leg='新客比例', col='red', lty = 1, bty = ‘n') par(xpd=FALSE, new=FALSE)
非常完美,根据以上的场景要求,就绘制完一幅图形了,而且也能迅速的了解到图所表达的内容。
关于R语言绘制双坐标图的文章就介绍至此,更多相关R语言绘制双坐标图内容请搜索编程教程以前的文章,希望以后支持编程教程!
下一章:R语言随机抽样详解
专题:随机抽样简单随机抽样从总体中抽取样本的方法很多,最常用的方法是简单随机抽样。简单随机抽样:从容量为N的总体中,任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。放回抽样(重复抽样 ...