网站首页 > 技术文章 正文
今天给大家写一写文本挖掘的基础操作-----词云图的制作,像这样:
词云图是一个很好的展示文本内容的方法。
word cloud is “an image composed of words used in a particular text or subject, in which the size of each word indicates its frequency or importance。
在词云图中,字越大说明这个词词频越高,也就越重要,今天就教大家一步一步做一个词云图。
首先是包的安装和加载:
require(devtools)
install_github("lchiffon/wordcloud2")
library(wordcloud2)
这个包是带有示例数据的,大家运行下面的代码就可以看到数据和出图:
head(demoFreq)
wordcloud2(data=demoFreq, size=1.6)
运行代码就可以出现本文的第一个图
wordcloud2这个方法有很多的参数可以调,现在就给大家调调看
比如我想改变颜色,变成随机的暗色
wordcloud2(demoFreq, size=1.6, color='random-dark')
什么?
随机的暗色不好看?那我自己设定颜色,比如我就爱看绿色和蓝色,安排:
wordcloud2(demoFreq, size=1.6, color=rep_len( c("green","blue"), nrow(demoFreq) ) )
什么,背景你也不满意,要改
改成黑色行不:
wordcloud2(demoFreq, size=1.6, color='random-light', backgroundColor="black")
形状也想改?没问题:
‘circle’ (default), ‘cardioid’ (apple or heart shape curve, the most known polar equation), ‘diamond’ (alias of square), ‘triangle-forward’, ‘triangle’, ‘pentagon’, and ‘star’有很多的形状可以选择
wordcloud2(demoFreq, size = 0.7, shape = 'star')
你还可以自己找个图片蒙版,你高兴就行:
wordcloud2(demoFreq, figPath = "~/Desktop/R-graph-gallery/img/other/peaceAndLove.jpg", size = 1.5, color = "skyblue", backgroundColor="black")
你还可以设置字体旋转:
wordcloud2(demoFreq, size = 2.3, minRotation = -pi/6, maxRotation = -pi/6, rotateRatio = 1)
minRotation , maxRotation, rotateRatio分别为最小和最大旋转角度,以及旋转比例。
我们还可以选择将词云图做成字母形状:
letterCloud( demoFreq, word = "R", color='random-light' , backgroundColor="black")
今天写了很多的词云设置,强烈建议大家自己操作一波哦。
小结
今天写了文本挖掘的第一篇文章,之后还会写如何做中文的词云以及别的挖掘技巧,感谢大家耐心看完。发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。内容我都会写的很细,用到的数据集也会在原文中给出链接,你只要按照文章中的代码自己也可以做出一样的结果,一个目的就是零基础也能懂,因为自己就是什么基础没有从零学Python和R的,加油。
(站外链接发不了,请关注后私信回复“数据链接”获取本头条号所有使用数据)
往期内容:
猜你喜欢
- 2025-07-27 仅需 15 行 Python 代码,即可将视频文件转录为文本稿件
- 2025-07-27 python中必须掌握的20个核心函数—split()详解
- 2025-07-27 数据处理基石:DeepSeeK总结 50 个常用函数指南!(第一集)
- 2025-07-27 Python文本处理进阶:unicodedata模块完全解析
- 2025-07-27 15、职场人必看!VBA文本处理的N个实用技巧大放送(零基础入门)
- 2025-05-03 数字化的意义到底是什么?(数字化意味着什么)
- 2025-05-03 Excel常用技能分享与探讨(5-宏与VBA简介之VBA的函数与过程)
- 2025-05-03 Python:print()函数使用指南(python print的用法)
- 2025-05-03 ArkUI-Text/Span 详解(argparse.argumentparser)
- 2025-05-03 数据库SQL语句学习笔记(6)-使用函数处理数据
- 08-06中等生如何学好初二数学函数篇
- 08-06C#构造函数
- 08-06初中数学:一次函数学习要点和方法
- 08-06仓颉编程语言基础-数据类型—结构类型
- 08-06C++实现委托机制
- 08-06初中VS高中三角函数:从"固定镜头"到"360°全景",数学视野升级
- 08-06一文讲透PLC中Static和Temp变量的区别
- 08-06类三剑客:一招修改所有对象!类方法与静态方法的核心区别!
- 最近发表
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- windowsscripthost (69)
- apt-getinstall-y (100)
- node_modules怎么生成 (87)
- chromepost (71)
- flexdirection (73)
- c++int转char (80)
- mysqlany_value (79)
- static函数和普通函数 (84)
- el-date-picker开始日期早于结束日期 (70)
- asynccallback (71)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)