加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

吐血整理!绝不能错过的24个Python库

发布时间:2019-08-01 17:57:02 所属栏目:建站 来源:读芯术
导读:Python有以下三个特点: 易用性和灵活性 全行业高接受度:Python无疑是业界最流行的数据科学语言 用于数据科学的Python库的数量优势 事实上,由于Python库种类很多,要跟上其发展速度非常困难。因此,本文介绍了24种涵盖端到端数据科学生命周期的Python库

Pandas在Python or Anaconda中已完成预安装,但以防需要,安装代码如下:

  1. pip install pandas 

吐血整理!绝不能错过的24个Python库

Pandas有以下特点:

  • 数据集连接和合并
  • 删除和插入数据结构列
  • 数据过滤
  • 重塑数据集
  • 使用DataFrame对象来操作数据等

下面是一篇文章以及一份很棒的Cheatsheet,有助于使Pandas技能达标:

  • 《Python中用于数据操作的12种有用的Pandas技术》传送门:https://www.analyticsvidhya.com/blog/2016/01/12-pandas-techniques-python-data-manipulation/
  • 《CheatSheet:在Python中使用Pandas进行数据探索》传送门:https://www.analyticsvidhya.com/blog/2015/07/11-steps-perform-data-analysis-pandas-python/

5. PyOD

传送门:https://pyod.readthedocs.io/en/latest/

难以发现异常值?这绝非个例。别担心,PyOD库就在这里。

PyOD是一个全面的、可伸缩的Python工具包,用于检测外围对象。离群值检测基本上是识别与大多数数据显著不同的稀有项或观测值。

以下代码可用于下载pyOD:

  1. pip install pyod 

PyOD是如何工作的?如何实现PyOD?下面一则指南将回答所有关于PyOD的问题:

《学习在Python中使用PyOD库检测异常值的绝佳教程》传送门:

https://www.analyticsvidhya.com/blog/2019/02/outlier-detection-python-pyod/

6. NumPy

传送门:https://www.numpy.org/

与Pandas一样,NumPy也是一个非常受欢迎的Python库。NumPy引入了支持大型多维数组和矩阵的函数,同时还引入了高级数学函数来处理这些数组和矩阵。

NumPy是一个开源库,有多方贡献者。在 Anaconda和Python中已预安装Numpy,但以防需要,下面是安装代码:

  1. $ pip install numpy 

吐血整理!绝不能错过的24个Python库

下面是使用NumPy可执行的一些基本功能:

创建数组:

  1. import numpy as np 
  2. x = np.array([1, 2, 3]) 
  3. print(x) 
  4. y = np.arange(10) 
  5. print(y) 
  1. output - [1 2 3] 
  2.          [0 1 2 3 4 5 6 7 8 9] 

基本运算:

  1. a = np.array([1, 2, 3, 6]) 
  2. b = np.linspace(0, 2, 4) 
  3. c = a - b 
  4. print(c) 
  5. print(a**2) 
  1. output - [1. 1.33333333 1.66666667 4. ] 
  2.          [ 1 4 9 36] 

以及更多其他功能!

7. SpaCy

传送门:https://spacy.io/

吐血整理!绝不能错过的24个Python库

目前已经讨论了如何清理数据和处理数值数据。但是如果正在处理文本数据呢?到目前为止,现有的库都无法解决该问题。

Spacy是一个非常有用且灵活的自然语言处理( NLP )库和框架,用于清理创建模型的文本文档。与类似用途的其他库相比,SpaCy速度更快。

在Linux中安装Spacy:

  1. pip install -U spacy 
  2. python -m spacy download en 

其他操作系统上安装Spacy,请点击:https://spacy.io/usage

以下是学习spaCy的课程:

《简化自然语言处理——使用SpaCy(在Python中)》传送门:

https://www.analyticsvidhya.com/blog/2017/04/natural-language-processing-made-easy-using-spacy-%e2%80%8bin-python/

用于数据可视化的Python库

下一步是什么呢?数据可视化!此处假设已得到验证,并且发掘了隐藏的观点和模式。

下面是三个用于数据可视化的绝佳Python库。

8. Matplotlib

传送门:https://matplotlib.org/

Matplotlib是Python中最流行的数据可视化库。允许生成和构建各种各样的图。Matplotlib是笔者的首选库,可与Seaborn一起用于进行数据可视化研究。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读