加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

手把手:R语言文本挖掘和词云可视化实践

发布时间:2021-05-19 11:16:14 所属栏目:大数据 来源:网络整理
导读:感谢eBDA 工作室的投稿! eBDA工作室是植根于运营商的一支数据分析团队,是由一群喜欢数据分析和创新的小伙伴组成的,成立两年以来,我们在底层数据存储HDFS/ORCFile,计算框架和资源管理MapReduce/Storm/Spark/Yarn,到数据分析工具Hive/Pig/R/Spss,数据集

rbind(d[nchar(d$word)==1,][1:10,],d[nchar(d$word)==2,][1:20,d[nchar(d$word)>3,])->result_r #提取不同字数的单词中词频最高的TOP50单词,作为词云绘制的素材

write.table(result_r,"result.csv",row.names = FALSE) #保存结果为csv文件


通过一款开源的词云可视化工具tagxedo,将导出的词频矩阵绘制为各种形状的词云图。

手把手:R语言文本挖掘和词云可视化实践

图六 团队词云


看看,除了对“数据”、“互联网”的关心是天经地义的,我们说的最多的竟然是“吃”,名副其实的“吃货”团队,民以食为天嘛。“周报”赫然醒目也是醉了,其它的高频词都和工作息息相关,“实验室”、“工程师”,还有“平台”、“服务器”、“数据库”,真心是学习型聊天群啊。最开心的要数“哈哈哈”,证明我们的工作也是欢笑多多,其乐无穷的。


想看到每位童鞋的词云有什么不同么?

手把手:R语言文本挖掘和词云可视化实践

图七 个体词云一


爽朗的“哈哈哈”,愤怒的“啊啊啊”,最擅用“[图片]”在群里展现心情。致我们的美女数据分析师,也是团队大象logo的设计者。


下面重磅推出我们的首席数据科学家,瞧瞧科学家的世界与我们是多么的不同。竟然……基本都是英文术语。

手把手:R语言文本挖掘和词云可视化实践

图八个体词云二


五、建模流程

下面用一张图简单回顾一下本文实现的建模过程:

手把手:R语言文本挖掘和词云可视化实践

图九 整体分析思路

希望上面的案例分析能帮助大家更好的理解文本挖掘和舆情分析可视化的一些分析思路和呈现方式,我们也会尽力挖掘更多的创意,制作更好的产品呈现给大家,谢谢!。


2015年8月干货文件打包下载,请点击大数据文摘底部菜单



大数据文摘精彩文章:

回复【金融】 看【金融与商业】专栏历史期刊文章

可视化】感受技术与艺术的完美结合

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读