加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

官方调研重磅发布,Pandas或将重构?

发布时间:2019-10-27 18:25:47 所属栏目:教程 来源:呆鸟
导读:为指引 Pandas 未来开发方向,Pandas 官方团队于 2019 年夏搞了一次调研,这次调研历时 15 天,共有 1250 条反馈数据。问卷数据保存在 data 文件夹的 2019.csv.zip 文件里。 这里又学一招,原来 pandas 可以直接从压缩文件里读取数据文件,原文用的是 .gz

数据显示 Windows 用户居多。

  1. oses = [  
  2.     "Linux",  
  3.     "Windows",  
  4.     "MacOS"  
  5. ]  
  6. df['您用哪种操作系统?'].str.split(';').explode().value_counts().div(  
  7.     len(df)).loc[oses].apply(pct_format)  
  1. Linux      61.57%  
  2. Windows    60.21%  
  3. MacOS      42.75%  
  4. Name: 您用哪种操作系统?, dtype: object 

这里用 0.25 版推出的 explode 方法定义了个函数。

  1. def split_and_explode(s):  
  2.     return s.str.split(";").explode().to_frame() 

conda 是最流行的虚拟环境工具。

  1. replace = {  
  2.     "否,我不用虚拟环境": "否"  
  3. }  
  4. col = '您是否用过下列 Python 虚拟环境工具?(多选)'  
  5. sns.countplot(y=col,  
  6.               data=split_and_explode(df[col]).replace(replace),  
  7.               color='k').set(title='您是否用过下列 Python 虚拟环境工具?',  
  8.                              ylabel="")  
  9. sns.despine() 

官方调研重磅发布,Pandas或将重构?

绝大多数答卷人只用 Python 3。

  1. df['Python 2 还是 3?'].value_counts(normalize=True).rename(  
  2.     index={"2;3": "2 & 3"}).apply(pct_format)  
  1. 3        92.39%  
  2. 2 & 3     6.80%  
  3. 2         0.81%  
  4. Name: Python 2 还是 3?, dtype: object 

Pandas API

开源软件团队很难了解用户实际爱用哪些功能,这次调研,我们特地提了一些问题,了解了大家的喜好。

CSV 与 Excel 是最流行的文件类型,真是让人喜忧参半。

  1. sns.countplot(y='您常用哪个读写器读取数据?',  
  2.               data=df['您常用哪个读写器读取数据?'].str.split(';').explode().to_frame(),  
  3.               color='k').set(title="您常用哪个读写器读取数据?",  
  4.                              ylabel="")  
  5. sns.despine(); 

官方调研重磅发布,Pandas或将重构?

为了做好重构 pandas 内核的准备,我们还调研了 100 列及以上大型 DataFrame 的处理情况。

  1. sns.countplot(y='处理 100 列及以上大型 DataFrame 的频率',  
  2.               data=df, color='k').set(title="处理大型 DataFrame 的频率",  
  3.                                       ylabel="");  
  4. sns.despine() 

官方调研重磅发布,Pandas或将重构?

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读