加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据处理之——dplyr

发布时间:2021-01-25 12:24:45 所属栏目:大数据 来源:网络整理
导读:dplyr 简介 关于 R 中的数据处理,上期我们介绍了 plyr ,这期我们接着介绍数据处理相关包 dplyr 。 dplyr 其实可以看做是 plyr 的升级版, dplyr 中的 d 指 dataframe ,它专注于做基于数据框的处理。如果你熟悉了 dplyr 的这一套处理函数,它将会大大提升

full_join()?全连接,它包括所有xy数据.

full_join## Source: local data frame [3 x 4]
## 
## ? ? ? x ? ? y ? ? a ? ? b
## ? (dbl) (int) (dbl) (chr)
## 1 ? ? 1 ? ? 2 ? ?10 ? ? a
## 2 ? ? 2 ? ? 1 ? ?NA ? ?NA
## 3 ? ? 3 ? ?NA ? ?10 ? ? a

集合操作

  • intersect(x,y): 集合取交集

  • union(x,y): 集合取并集

  • setdiff(x,y): 取x中与y不同的部分

12,153);">1L,153);">1L## Source: local data frame [2 x 2]
## 
## ? ? ? x ? ? y
## ? (int) (int)
## 1 ? ? 1 ? ? 1
## 2 ? ? 2 ? ? 1
## Source: local data frame [2 x 2]
## 
## ? ? ? x ? ? y
## ? (int) (int)
## 1 ? ? 1 ? ? 1
## 2 ? ? 2 ? ? 2
intersectdf1,204); border-top-left-radius: 4px; border-top-right-radius: 4px; border-bottom-right-radius: 4px; border-bottom-left-radius: 4px; background-color: white;">## Source: local data frame [1 x 2]
## 
## ? ? ? x ? ? y
## ? (int) (int)
## 1 ? ? 1 ? ? 1
union## Source: local data frame [3 x 2]
## 
## ? ? ? x ? ? y
## ? (int) (int)
## 1 ? ? 1 ? ? 1
## 2 ? ? 2 ? ? 1
## 3 ? ? 2 ? ? 2
setdiff## Source: local data frame [1 x 2]
## 
## ? ? ? x ? ? y
## ? (int) (int)
## 1 ? ? 2 ? ? 1
df2,204); border-top-left-radius: 4px; border-top-right-radius: 4px; border-bottom-right-radius: 4px; border-bottom-left-radius: 4px; background-color: white;">## Source: local data frame [1 x 2]
## 
## ? ? ? x ? ? y
## ? (int) (int)
## 1 ? ? 2 ? ? 2

等价关系

R中的两表操作函数与sql有如下等价关系:

小结

本文介绍了dplyr的主要功能,但是它还有一些特殊的函数及功能,比如介绍了如何连接Mysql等结构化数据库;介绍了不用写sql语句便可对数据库中的数据进行查询的方法;还有当采用mutate函数进行数据整合时,如何利用窗口函数等等,这些听起来是不是很炫酷啊,那么就开始你自己的dplyr之旅吧!


?本文来自№→★飞刀的微信公共帐号“数据挖掘与R语言”,用微信添加数据挖掘与R语言公众号,即可订阅。转载必须保留作者、公共帐号信息。

长按识别图中二维码?


(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读