加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据处理之——dplyr

发布时间:2021-01-25 12:24:45 所属栏目:大数据 来源:网络整理
导读:dplyr 简介 关于 R 中的数据处理,上期我们介绍了 plyr ,这期我们接着介绍数据处理相关包 dplyr 。 dplyr 其实可以看做是 plyr 的升级版, dplyr 中的 d 指 dataframe ,它专注于做基于数据框的处理。如果你熟悉了 dplyr 的这一套处理函数,它将会大大提升

filter(.data,...): 该函数返回匹配条件的数据行,实现了对数据集的行进行选取

  • slice(.data,...): 该函数可以通过行位置对数据集进行筛选,它也是对数据集的行进行选取的一种方式

  • # 选择得分大于40分的数据
    filterpts > 40) %>% head
    ## ? rk name ast pts stl tov
    ## 1 ?1 库里 ? 6 ?46 ? 2 ? 2
    ## 2 21 库里 ? 3 ?41 ? 4 ? 5
    ## 3 24 库里 ? 6 ?46 ? 2 ? 3
    ## 4 25 库里 ? 8 ?51 ? 0 ? 5
    ## 5 26 库里 ? 7 ?42 ? 1 ? 7
    ## 6 33 库里 ? 2 ?51 ? 3 ? 7
    # 选择助攻数大于15的数据
    ast 15## ? rk name ast pts stl tov ## 1 ?6 保罗 ?16 ?20 ? 1 ? 2 ## 2 13 保罗 ?16 ?15 ? 2 ? 3 ## 3 17 保罗 ?16 ?12 ? 5 ? 3 ## 4 44 保罗 ?19 ?21 ? 1 ? 3 ## 5 58 保罗 ?18 ?18 ? 0 ? 2 ## 6 ?6 沃尔 ?16 ?22 ? 2 ? 4
    slice(pgdat1,1:6)
    ## ? rk name ast pts stl tov
    ## 1 ?1 库里 ? 6 ?46 ? 2 ? 2
    ## 2 ?2 库里 ? 5 ?37 ? 2 ? 4
    ## 3 ?3 库里 ? 8 ?17 ? 1 ? 2
    ## 4 ?4 库里 ? 9 ?27 ? 2 ? 3
    ## 5 ?5 库里 ?15 ?21 ? 3 ? 3
    ## 6 ?6 库里 ? 7 ?39 ? 2 ? 4

    为了显示方便,这里的数据用head函数做了处理,仅显示前几行数据,%>%操作符会在本文下文中做介绍,此处可暂时忽略。

    arrange

    • (编辑:核心网)

      【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读