加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

14个QA,讲述python与数据科学的“暧昧情事”

发布时间:2019-05-06 01:12:32 所属栏目:建站 来源:读芯术
导读:Python最近火了,大红大紫那种。PYPL(编程语言受欢迎程度) 四月官方榜单宣布,Python荣获NO.1,竟然连朋友圈里的文科生都开始转发Python课程打卡的链接了这是怎样一个令全民疯狂的语言? 作为编程界的头牌名媛,Python平易近人的态度和精明婉约的灵动深得各

使用Scikit-Learn的一般框架是这样的——将数据集拆分为训练和测试数据集:

14个Q&A,讲述python与数据科学的“暧昧情事”

实例化并训练一个模型:

14个Q&A,讲述python与数据科学的“暧昧情事”

使用metrics模块测试模型的工作情况:

(2) XGBoost

在Python中常用于机器学习的第二个包是XGBoost。

Scikit-Learn实现了一系列算法,XGBoost只实现了一个梯度提升的决策树。

最近这个包(和算法)因其在Kaggle比赛(任何人都可以参加的在线数据科学比赛)上被使用而取得成功,变得非常受欢迎。

训练模型的工作方式与Scikit-Learn算法的工作方式大致相同。

12. Python中的深度学习

Scikit-Learn中提供的机器学习算法几乎可以满足任何问题。话虽这么说,但有时你需要使用最先进的算法。

由于使用它们的系统几乎优于其他所有类算法,因此深度神经网络的普及率急剧上升。

但是很难说神经网络正在做什么以及它为什么这样做。因此,它们在金融、医学、法律和相关专业中的使用并未得到广泛认可。

神经网络的两大类是卷积神经网络(用于对图像进行分类并完成计算机视觉中的许多其他任务)和循环神经网络(用于理解和生成文本)。

探索神经网工作时超出了本文的范围的机理,如果你想做这类工作,只要知道你需要寻找的包是TensorFlow(Google contibution!)还是Keras。

Keras本质上是TensorFlow的包装器,使其更易于使用。

13. Python中的数据科学API

一旦训练了模型,就可以在其他软件中访问它的预测,方法是创建一个API。

API允许模型从外部源一次一行地接收数据并返回预测。因为Python是一种通用的编程语言,也可用于创建Web服务,所以很容易使用Python通过API为模型提供服务。

如果需要构建API,应该查看pickle和Flask。Pickle允许训练有素的模型被保存在硬盘驱动器上,以便以后使用。而Flask是创建Web服务的最简单方法。

14. Python中的Web应用程序

最后,如果你想围绕数据科学项目构建功能齐全的Web应用程序,则应使用Django框架。

Django在Web开发社区非常受欢迎,并且用于构建Instagram和Pinterest的第一个版本(以及许多其他版本)。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读