这节主要介绍一些比较新鲜的图,这些图也是可视化的一部分,虽然在统计分析中不太正式,但是,其趣味性,直观性相对于传统的图表更加好,一般在EXCEL中是很难画出的,而在R中便可以轻松的画出,只需几行代码,这里会简单介绍和贴出一些代码及画图效果.
1.星象图
星象图就是把每个样本画成一个星星,或圆盘,其中每一个角代表一个变量,而每个角的线长代表数值大小.
stars(iris[,1:3])
stars(iris[,1:3],draw.segments = TRUE)
2.脸谱图
脸谱图同星象图的原理,人的头发长短,和眼睛大小,等等表示变量值的大小,也是将一个样本绘制成一张脸谱.由于人天生对脸谱的识别性高,所以把样本画成脸谱图非常适合.
3.茎叶图
主茎叶是前几位数,后面枝叶上每一个数代表一个数据,这样就将数据进行分类了,可以直观的看到数据的分布,还不丢失原始信息,这就是茎叶图比箱线图好的地方.
sterm(iris[,3])
4.雷达图
雷达图即同星相图,只是雷达图是多边形.
maxmin <- data.frame(
total=c(5, 1),
phys=c(15, 3),
psycho=c(3, 0),
social=c(5, 1),
env=c(5, 1))
RNGkind("Mersenne-Twister")
set.seed(123)
dat <- data.frame(
total=runif(3, 1, 5),
phys=rnorm(3, 10, 2),
psycho=c(0.5, NA, 3),
social=runif(3, 1, 5),
env=c(5, 2.5, 4))
dat <- rbind(maxmin,dat)
radarchart(dat, axistype=1, seg=5, plty=1, vlabels=c("Total\nQOL", "Physical\naspects",
"Phychological\naspects", "Social\naspects", "Environmental\naspects"),
title="(axis=1, 5 segments, with specified vlabels)", vlcex=0.5)
5.词云图
词云图就是把频率出现最大的几个词画出来,频率越大字体就越大.这样非常直观的表现了高频词.word_freq是已经分好的词,并统计过的数据
library(wordcloud)
par(bg = 'black')
#绘制出现频率最高的前50个词
wordcloud(words = word_freq$Word, freq = word_freq$Freq, max.words = 50,
random.color = TRUE, colors = rainbow(n = 7))
par(opar)
PPV原创文章,严禁转载. (文:@白加黑治感冒
-大数据培训讲师
国内领先的大数据学习社区和职业培训平台,欢迎关注!