加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

14个QA,讲述python与数据科学的“暧昧情事”

发布时间:2019-05-06 01:12:32 所属栏目:建站 来源:读芯术
导读:Python最近火了,大红大紫那种。PYPL(编程语言受欢迎程度) 四月官方榜单宣布,Python荣获NO.1,竟然连朋友圈里的文科生都开始转发Python课程打卡的链接了这是怎样一个令全民疯狂的语言? 作为编程界的头牌名媛,Python平易近人的态度和精明婉约的灵动深得各
副标题[/!--empirenews.page--]

Python最近火了,大红大紫那种。PYPL(编程语言受欢迎程度) 四月官方榜单宣布,Python荣获NO.1,竟然连朋友圈里的文科生都开始转发Python课程打卡的链接了……这是怎样一个令全民疯狂的语言?

作为编程界的“头牌”名媛,Python平易近人的态度和精明婉约的灵动深得各个大佬欢心。比如:人工智能、web开发、爬虫、系统运维、数据分析与计算等等。这几位风流多金的行业精英随便哪个都能“逆转未来”。

本文为你精心准备了一段Python与数据科学的“暧昧史”——用Python进行数据科学概述,包括Numpy,Scipy,pandas,Scikit-Learn,XGBoost,TensorFlow和Keras等模块、包、库的用法。

python/数据科学/语言

1. 为何选择Python?

Python作为一种语言,十项全能,易于学习,安装简单。同时有很多扩展,非常适合进行数据科学研究。像Google、Instagram、Youtube、Reddit等明星网站都在用Python搭建核心业务。

Python不仅仅用于数据科学,还使用Python来做更多的工作——如编写脚本、构建API、构建网站等等。

关于Python的几点重要事项需要注意。

  • 目前,有两种常用的Python版本。它们是版本2和3。大多数教程和本文将默认使用的是Python的最新版本Python 3。但有时会遇到使用Python 2的书籍或文章。版本之间的差异并不大,但有时在运行版本3时复制和粘贴版本2代码将无法正常工作,因此需要进行一些轻微的编辑。
  • 要注意Python十分介意空白的地方(即空格和返回字符)。如果把空格放在错误的地方,程序很可能会产生错误。
  • 与其他语言相比,Python不需要管理内存,也有良好的社区支持。

2. 安装Python

安装用于数据科学的Python的最佳方法是使用Anaconda发行版。

Anacoda有你使用Python进行数据科学研究所需的资料,包括将在本文中介绍的许多软件包。

单击Products - > Distribution并向下滚动,可以看到适用于Mac,Windows和Linux的安装程序。即使Mac上已经有Python,也应该考虑安装Anaconda发行版,因为有利于安装其他软件包。

此外,还可以去官方Python网站下载安装程序。

包管理器:

包是一段Python代码,而不是语言的一部分,包对于执行某些任务非常有帮助。通过包,我们可以复制并粘贴代码,然后将其放在Python解释器(用于运行代码)可以找到的地方。

但这很麻烦,每次启动新项目或更新包时都必须进行内容的复制和粘贴操作。因此,我们可以使用包管理器。Anaconda发行版中自带包管理器。如果没有,建议安装pip。

无论选择哪一个,都可以在终端(或命令提示符)上使用命令轻松安装和更新软件包。

3. 使用Python进行数据科学研究

Python迎合许多不同开发人员的技术要求(Web开发人员,数据分析师,数据科学家),因此使用该语言具有很多不同的编程方法。

Python是一种解释型语言,不必将代码编译成可执行文件,只需将包含代码的文本文档传递给解释器即可。

快速浏览一下与Python解释器交互的不同方法吧。

(1) 在终端

14个Q&A,讲述python与数据科学的“暧昧情事”

如果打开终端(或命令提示符)并键入单词'Python',将启动一个shell会话。可以在对话中输入有效的Python命令,以实现相应的程序操作。

这可以是快速调试某些东西的好方法,但即使是一个小项目,在终端中调试也很困难。

(2) 使用文本编辑器

14个Q&A,讲述python与数据科学的“暧昧情事”

14个Q&A,讲述python与数据科学的“暧昧情事”

如果你在文本文件中编写一系列Python命令并使用.py扩展名保存它,则可以使用终端导航到该文件,并通过输入python YOUR_FILE_NAME.py来运行该程序。

这与在终端中逐个输入命令基本相同,只是更容易修复错误并更改程序的功能。

(3) 在IDE中

14个Q&A,讲述python与数据科学的“暧昧情事”

IDE是一种专业级软件,可以进行软件项目管理。

IDE的一个好处是,使用调试功能可以告诉你在尝试运行程序之前出错的位置。

某些IDE附带了项目模板(用于特定任务),你可以使用这些模板根据最佳实践设置项目。

(4) Jupyter Notebooks

14个Q&A,讲述python与数据科学的“暧昧情事”

这些方法都不是用python进行数据科学的最佳方式,最好是使用Jupyter Notebooks。

Jupyter Notebooks使你能够一次运行一“块”代码,这意味着你可以在决定下一步做什么之前看到输出信息-这在数据科学项目中非常重要,我们经常需要在获取输出之前查看图表。

如果你正在使用Anaconda,且已经安装了Jupyter lab。要启动它,只需要在终端中输入'jupyter lab'即可。

如果正在使用pip,则必须使用命令'python pip install jupyter'安装Jupyter lab。

4. Python中的数字计算

NumPy软件包中包含许多有用的函数,用于执行数据科学工作所需的数学运算。

它作为Anaconda发行版的一部分安装,并且使用pip安装,就像安装Jupyter Notbooks一样简单('pip install numpy')。

我们在数据科学中需要做的最常见的数学运算是矩阵乘法,计算向量的点积,改变数组的数据类型以及创建数组!

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读