加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据处理之——dplyr

发布时间:2021-01-25 12:24:45 所属栏目:大数据 来源:网络整理
导读:dplyr 简介 关于 R 中的数据处理,上期我们介绍了 plyr ,这期我们接着介绍数据处理相关包 dplyr 。 dplyr 其实可以看做是 plyr 的升级版, dplyr 中的 d 指 dataframe ,它专注于做基于数据框的处理。如果你熟悉了 dplyr 的这一套处理函数,它将会大大提升
副标题[/!--empirenews.page--]

dplyr简介

关于R中的数据处理,上期我们介绍了plyr,这期我们接着介绍数据处理相关包dplyrdplyr其实可以看做是plyr的升级版,dplyr中的ddataframe,它专注于做基于数据框的处理。如果你熟悉了dplyr的这一套处理函数,它将会大大提升你处理数据的速度和效率。

示例数据

dplyr中使用的示例数据继续沿用pgdat数据集,如果你想要获取该数据集的源代码,可以通过点击微信公众号右下角的案例数据得到。

单表操作函数

select

  • select(.data,...): 该函数实现了对数据集的列进行选取

  • rename(.data,...): 该函数可以对数据集的列名进行重命名,会保留完整数据集

## 在pgdat数据集中选择场次、球员姓名、助攻数、得分、抢断、失误数据
pgdat1 <- select(pgdat,rk,0);">player,0);">ast,0);">pts,0);">stl,0);">tov)
headpgdat1)
## ? rk player ast pts stl tov
## 1 ?1 ? 库里 ? 6 ?46 ? 2 ? 2
## 2 ?2 ? 库里 ? 5 ?37 ? 2 ? 4
## 3 ?3 ? 库里 ? 8 ?17 ? 1 ? 2
## 4 ?4 ? 库里 ? 9 ?27 ? 2 ? 3
## 5 ?5 ? 库里 ?15 ?21 ? 3 ? 3
## 6 ?6 ? 库里 ? 7 ?39 ? 2 ? 4
renamepgdat1,0);">name = player## ? rk name ast pts stl tov
## 1 ?1 库里 ? 6 ?46 ? 2 ? 2
## 2 ?2 库里 ? 5 ?37 ? 2 ? 4
## 3 ?3 库里 ? 8 ?17 ? 1 ? 2
## 4 ?4 库里 ? 9 ?27 ? 2 ? 3
## 5 ?5 库里 ?15 ?21 ? 3 ? 3
## 6 ?6 库里 ? 7 ?39 ? 2 ? 4

filter/slice

  • (编辑:核心网)

    【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读