文章がいくつかあってなんか面白いことできないかと聞かれたのでwordcloudはどうですかと言ったものはいいが、やったことがなかったのでやってみる。
wordcloudでできる。
library(wordcloud) library(tm) data(SOTU) corp <- SOTU corp <- tm_map(corp, removePunctuation) corp <- tm_map(corp, removePunctuation) corp <- tm_map(corp, tolower) corp <- tm_map(corp, removeNumbers) corp <- tm_map(corp, function(x)removeWords(x,stopwords())) term.matrix <- TermDocumentMatrix(corp) term.matrix <- as.matrix(term.matrix) colnames(term.matrix) <- c("SOTU 2010","SOTU 2011") comparison.cloud(term.matrix,max.words=40,random.order=FALSE) data(crude) crude <- tm_map(crude, removePunctuation) crude <- tm_map(crude, function(x)removeWords(x,stopwords())) tdm <- TermDocumentMatrix(crude) m <- as.matrix(tdm) v <- sort(rowSums(m),decreasing=TRUE) d <- data.frame(word = names(v),freq=v) pal <- brewer.pal(9,"BuGn") pal <- pal[-(1:4)] wordcloud(d$word,d$freq,c(8,.3),2,,FALSE,,.15,pal)