加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据处理之——dplyr

发布时间:2021-01-25 12:24:45 所属栏目:大数据 来源:网络整理
导读:dplyr 简介 关于 R 中的数据处理,上期我们介绍了 plyr ,这期我们接着介绍数据处理相关包 dplyr 。 dplyr 其实可以看做是 plyr 的升级版, dplyr 中的 d 指 dataframe ,它专注于做基于数据框的处理。如果你熟悉了 dplyr 的这一套处理函数,它将会大大提升

summarise(.data,...): 该函数可以操作多列数据,生成单个数值。

summarisemast meanmpts ## ? ? ? mast ? ?mpts
## 1 8.305489 21.7852

sample_n/sample_frac

  • sample_n(tbl,size,...): 给定抽样数据条数,按行进行数据抽样

  • sample_frac(tbl,...): 给定抽样数据比率,按行进行数据抽样

# 随机抽取5条数据
sample_n5## ? ? ?rk name ast pts stl tov ## 1320 60 沃尔 ?10 ?28 ? 5 ? 2 ## 863 ?23 保罗 ?10 ?17 ? 4 ? 2 ## 2146 46 欧文 ? 2 ?13 ? 0 ? 4 ## 54 ? 54 库里 ? 7 ?25 ? 1 ? 3 ## 1261 ?1 沃尔 ?13 ?15 ? 1 ? 3
# 按0.01比例抽取部分数据
sample_frac0.01## ? ? ?rk name ast pts stl tov ## 1274 14 沃尔 ? 9 ?24 ? 1 ? 4 ## 59 ? 59 库里 ? 7 ?44 ? 0 ? 3 ## 2109 ?9 欧文 ? 8 ?16 ? 1 ? 2 ## 1332 72 沃尔 ?11 ?19 ? 2 ? 7

分组操作函数

group_by

  • (编辑:核心网)

    【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读