加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一文详解数据科学家的必备技能(附学习资源)

发布时间:2019-01-18 07:14:21 所属栏目:教程 来源:陈之炎翻译
导读:数据科学家需要涉猎的知识面很广,包括:机器学习、计算机科学、统计学、数学、数据可视化、沟通和深度学习,那么数据科学家应如何制定他们的学习预算,才能最大限度地满足雇主的需要? 我浏览了一些求职网站,想找出哪些技能是数据科学家最需要掌握的技能

下图显示了这些语言、框架和其他数据科学软件工具的列表。

一文详解数据科学家的必备技能(附学习资源)

历史比对

GlassDoor分析了2017年1月至2017年7月期间在其网站上的数据科学家最常见的10种软件技能。以下是与2018年10月LinkedIn, Indeed, SimplyHired, 和Monster平均水平相比,它们在网站上出现频率的比较。

结果非常相似。我的分析和GlassDoor’s都发现Python、R和SQL是最受欢迎的。我们还发现了同样的前九位技术技能,只是顺序略有不同。

结果表明,与2017年上半年相比,目前对R、Hadoop、Java、SAS和MATLAB需求较少,Tableau需求则更大。这就是我所期望的,对 KDnuggets developer survey等来源的结果的补充。在那里,R、Hadoop、Java和SAS都显示出明显的多年下降趋势,Tableau显示出明显的上升趋势。

建议

根据以上分析结果,为当前和有抱负的数据科学家,提出一些一般性的建议,以使自己在职场上更受欢迎:

1. 证明你可以进行数据分析,并专注于成为真正擅长机器学习的人。

2. 投资于自己的沟通技巧。我建议阅读《Made to Stick》这本书,它对你的想法会有更大的影响。还可以查看名称为 Hemmingway Editor的APP(应用程序),以提高写作的清晰度。

《Made to Stick》:https://www.amazon.com/Made-Stick-Ideas-Survive-Others/dp/1400064287

Hemmingway Editor:http://www.hemingwayapp.com/

3. 掌握一个深度学习的框架。对深度学习框架的熟练程度是精通机器学习的重要组成部分。有关深度学习框架在用法、兴趣和流行程度方面的比较,请参阅下方链接中的文章:

https://towardsdatascience.com/deep-learning-framework-power-scores-2018-23607ddf297a

4. 如果在学习Python和R之间进行选择,请选择Python。如果对Python不感冒,考虑学习R。如果你会使用Python的同时也知道R,你肯定会更有市场。

当雇主正在寻找一位具备Python技能的数据科学家时,他们也期望应聘者能了解常见的Python数据科学库,如:numpy、pandas、scikit-learn和matplotlib。如果想学习这组工具,我建议提供以下资源:

1. DataCamp和 DataQuest:它们都是定价合理的在线SaaS数据科学教育产品,在这些产品中,您可以一边编写代码一边学习,二者都教授一些技术工具。

DataCamp

https://www.datacamp.com/

DataQuest

https://www.dataquest.io/

2. Data School拥有多种资源,包括一套很好的视频,解释数据科学的概念。

Data School

https://www.dataschool.io/start/

视频资源:https://www.youtube.com/dataschool

3. 麦金尼(McKinney)的《用于数据分析的Python》。这本书由pandas库的主要作者撰写,重点关注pandas,还讨论了基本的python,numpy和scikit-learn等数据科学的知识。

Python for Data Analysis

https://www.amazon.com/Python-Data-Analysis-Wrangling-IPython/dp/1491957662

4. Müller&Guido的《用Python进行机器学习简介》。米勒是scikit-learn的主要维护者。这是一本用于学习机器学习scikit-learn的很好的书。

Introduction to Machine Leaning with Python

https://www.amazon.com/Introduction-Machine-Learning-Python-Scientists-ebook/dp/B01M0LNE8C

如果你想探究深度学习,我建议在进入TensorFlow或PyTorch之前先从Keras或FastAI开始。Chollet的《用Python进行的深度学习》一书是学习Keras的很好的资源。除了这些建议之外,我建议你了解自己感兴趣的内容,尽管在决定如何分配学习时间时有很多因素需要考虑。

如果你想通过网络门户寻找一份数据科学家的工作,我建议你从LinkedIn开始——它的结果总是最多的。

如果你在网上求职或者在求职网站上发布职位,关键词非常重要。“数据科学”返回的结果是“数据科学家”返回结果数的近3倍。但是,如果你在严格地寻找数据科学家的工作,你最好还是输入 “数据科学家”这个关键字。

无论你在哪个网站找工作,我建议你建立一个在线组合列表,列出你对所需求技能领域的熟练程度。我还建议用LinkedIn个人资料展示你的技能。

作为这个项目的一部分,我收集了其他数据,可能也会写成文章。跟我来,不要错过哦。

如果您希望看到交互式图表和它们背后的代码,请查看我的Kaggle Kernel:

Kaggle Kernel:https://www.kaggle.com/discdiver/the-most-in-demand-skills-for-data-scientists/

作者简介:

Jeff Hale是一位经验丰富的企业家,曾为多家公司管理过技术、运营和财务。专注于机器学习领域的数据科学家,子商务公司的共同创始人和首席运营官。目前,杰夫正将他对数据驱动决策的热情转化为以数据科学家为职业期盼。他对机器学习、交流和数据分析很感兴趣。

  • 原文标题:The Most in Demand Skills for Data Scientists
  • 原文链接:https://www.kdnuggets.com/2018/11/most-demand-skills-data-scientists.html

译者简介:陈之炎,北京交通大学通信与控制工程专业毕业,获得工学硕士学位,历任长城计算机软件与系统公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护,在人工智能深度学习和自然语言处理(NLP)方面积累有一定的经验。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读