加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

一行代码将Pandas加速4倍

发布时间:2020-01-10 10:08:18 所属栏目:移动互联 来源:站长网
导读:副标题#e# 虽然Pandas的功能非常强大,但是对于大数据集来说,确实是很慢的。 虽然 panda 是 Python 中用于数据处理的库,但它并不是真正为了速度而构建的。了解一下新的库 Modin,Modin 是为了分布式 panda 的计算来加速你的数据准备而开发的。 Pandas是处

the data with Modinimport modin.pandas as pds = time.time()df =  

pd.read_csv("esea_master_dmg_demos.part1.csv")e =  

time.time()print("Modin Loading Time = {}".format(e-s)) 

为了测量速度,我导入了time模块,并在read_csv()之前和之后放置了一个time()。panda 将数据从 CSV 加载到内存需要 8.38 秒,而 Modin 需要 3.22 秒。这是 2.6 倍的加速。对于只修改 import 语句来说,这不算太寒酸!

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读