加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

Python Pandas模块数据统计与分析常用方法

发布时间:2019-07-11 22:56:48 所属栏目:移动互联 来源:软件测试开发技术栈
导读:Pandas模块数据统计与分析常用方法 df.describe():按各列返回基本统计量和分位数 df.count():计算非NA值的数量,axis=0 按列计算,axis=1 按行计算,默认axis=0。 df.max():计算最大值,axis=0 按列计算,axis=1 按行计算,默认axis=0。 df.min():计算
副标题[/!--empirenews.page--]

 Python Pandas模块数据统计与分析常用方法

Pandas模块数据统计与分析常用方法

  • df.describe():按各列返回基本统计量和分位数
  • df.count():计算非NA值的数量,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.max():计算最大值,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.min():计算最小值,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.sum():计算和,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.mean():计算平均值,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.median():计算中位数,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.var():计算方差,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.std():计算标准差,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.mad():根据平均值计算平均绝对偏差,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.cumsum():计算累计求和,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df.cov():计算协方差矩阵,axis=0 按列计算,axis=1 按行计算,默认axis=0。
  • df1.corrwith(df2):计算相关系数
  • df1['col1'].groupby(df1['col2']):列1 按照列2 分组,即列2为Key。
  • grouped.agg({ 'col1':'fun1' , 'col2':'fun2' }):通过分组系列,还可以传递函数的列表或字典来进行聚合。对不同的列应用不同的函数的聚合,函数可以是多个。

示例数据集说明

接下来,我们将以如下数据集,分享各函数的使用方法。

Python Pandas模块数据统计与分析常用方法

df.describe()

按各列返回基本统计量和分位数。

Python Pandas模块数据统计与分析常用方法

df.count()

计算非NA值的数量,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

​df.max()

计算最大值,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.min()

计算最小值,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.sum()

计算和,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.mean()

计算平均值,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.median()

计算中位数,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.var()

计算方差,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.std()

计算标准差,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.mad()

根据平均值计算平均绝对偏差,axis=0 按列计算,axis=1 按行计算,默认axis=0。

{!-- PGC_COLUMN --}

Python Pandas模块数据统计与分析常用方法

df.cumsum()

计算累计求和,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df.cov()

计算协方差矩阵,axis=0 按列计算,axis=1 按行计算,默认axis=0。

Python Pandas模块数据统计与分析常用方法

df1.corrwith(df2)

计算相关系数。

Python Pandas模块数据统计与分析常用方法

df1['col1'].groupby(df1['col2'])

列1 按照列2 分组,即列2为Key。

Python Pandas模块数据统计与分析常用方法

df.groupby('col1')

DataFrame按照列1分组。

Python Pandas模块数据统计与分析常用方法

grouped.agg(['fun1','fun2'])

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读