加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

想当数据科学家的你这13个错误可别犯

发布时间:2018-08-16 08:47:30 所属栏目:教程 来源:佚名
导读:技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战 前言 当你看这篇文章的时候,我们知道你已经决定把数据科学当作你的工作。当下越来越多的企业需要数据支持其决策,世界也变得越来越紧密,几乎每个企业都需要大量的数据科学实践。

8. 没有花费足够的时间去探索和可视化数据

想当数据科学家的你这13个错误可别犯

数据可视化是数据科学中的一个重要方面,但许多渴望成功的数据科学家都倾向于草草了事并进入后续的模型构建阶段。这种方法或许能在竞赛中奏效,但绝对会在现实世界中失败。理解你的数据是你要去做的最重要的事情,你的模型的输出会反映这一点。

通过花时间了解数据集并尝试不同的可视化图表,你将能对要解决的挑战或问题有更为深入的理解。你定会惊讶于通过这么做获得的洞见!逐渐明晰的模式和趋势、一目了然的暗含规律,更棒的是,可视化是向客户展示你的发现的最佳方式!

作为一名数据科学家,你需要有天生的好奇心。这是数据科学非常有吸引力的地方之一:你越是好奇,你便会问越多的问题,这将助你对数据有更好的理解,并助你发现之前没有发现的问题!

如何避免这个问题?

练习!下次处理一个数据集的时候花更多时间在这个步骤上,你会惊讶于它给你带来的洞见。提出问题,并请教你的经理、领域中的专家,在互联网上寻求解决方案。若你什么都没找到,可以在社交媒体上继续询问,条条大路通罗马!

为了助你起步,我在下边列出了几项你可以参阅的资源:

• Comprehensive Guide to Data Visualization in R

• A Comprehensive Guide to Data Exploration(强烈推荐)

• 18 Free Exploratory Data Analysis Tools For People who don't code well

9. 缺乏结构化的方法来解决问题

想当数据科学家的你这13个错误可别犯

来源:MindMatters.co.in

结构化思考对数据科学家有诸多好处:

• 让你将一个问题从逻辑上分为几个部分

• 让你将问题如何发展以及如何设计你的方法的过程可视化

• 让你以逻辑化和易于理解的方式帮助用户或客户理解你框架的流程

有更多的理由认为具有结构化的思维方式是非常有帮助的。可以想象,没有结构化的思维方式是违反直觉的。你的工作和解决问题的方法都是随意的,当遇到复杂的问题时,你还会忘记自己的步骤。

当你面试的时候,你将不可避免地面对一些案例研究的题目,例如一些估计问题或者谜题。在面试的压力和时间限制之下,面试官会看你如何组织你的思路来得到你最终的结果。很多情况下,这将成为你取得工作的关键因素,要么因此与这个工作失之交臂,要么因此得到这个工作。

如何避免这个问题?

你可以通过简单的培训和严谨的方法获得结构化的思维方式。下面列出了一些文章,可以帮助你开始这个关键的学习:

• The Art of Structured Thinking and Analysis

• Tools for Improving Structured Thinking

• Must for Data Scientists & Analysts: Brain Training for Analytical Thinking

10. 试图一次学习多个工具

想当数据科学家的你这13个错误可别犯

我见过这个太多次了。由于每个工具都有其缺点和其独特的功能,人们倾向于尝试一次学习所有的工具。这是个坏主意,因为你最终掌握不了它们中的任何一个。工具只是实现数据科学的一种手段而不是最终目标!

如何避免这个问题?

选择一个工具并坚持下去,直到你掌握它为止。如果你已经开始学习 R,那么不要被 Python 诱惑。坚持使用 R,从入门到精通,然后尝试将另一种工具融入你的技能组合中,你可以通过这种方法学到更多。

每个工具都有一个出色的用户社区,你可以在遇到困难时使用。使用我们的论坛来提问,在线搜索,永不言弃。我们的目的是通过一个工具学习数据科学,而不是通过数据科学学习一个工具。

11. 不能坚持学习

这个问题适用于所有数据科学家而不仅仅是新手,那就是我们容易分心。我们学习一段时间(比如一个月),然后我们在接下来的两个月里停止了学习。在那之后试图接着之前的知识点继续学习,那将是一场噩梦。早先学过的概念基本忘光了,笔记也丢了,感觉就像我们最近几个月完全浪费了一样。

我个人也经历过这一点。由于总是需要同时处理各种事情,我们可以找借口和理由不学习。但这最终是我们自己的损失。如果数据科学就像打开教科书和塞满一切一样容易,那么到今天,每个人都能成为数据科学家。然而事实上它需要长期的努力和学习,这是人们容易忽视的一点,直到为时已晚。

如何避免这个问题?

为自己设定目标。绘制出时间表并贴在墙上:计划你想要学习的方式和内容,并为自己设定截止日期。例如,当我想学习神经网络时,我给了自己几周时间学习,然后在黑客马拉松比赛中测试了我学到的东西。

当你决定成为一名数据科学家,你就应该准备好投入时间和精力。如果你不断寻找不去学习的借口,这个领域可能并不适合你。

12. 远离讨论和竞赛

这一节是对我们上述其中几点的一个总结。渴望成功的数据科学家倾向于回避在社区中发布他们的分析,因为他们担心受到批评。但是如果你不收到社区的反馈,你就不会成长为数据科学家。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读