数据科学中的强大思维

发布时间：2019-08-28 18:32:45 所属栏目：教程来源：栗峰

导读：如果你参加过统计学入门课程，就会知道数据点可以用来激发灵感，也可以用来测试理论，但两者却不能兼顾，这是为什么呢? 图1 人类擅长在所有的事物中寻找对应的模式。真模式，假模式，命名的模式。我们是那种能在薯片上找到猫王的脸的生物。如果你倾向于

这里的问题是，你只有一个数据集，而你需要不止一个数据集。如果你有很多数据，那么我会为你模拟一个黑客攻击，扰乱你的思路。

数据科学中的强大思维

图6

七、奇特的技巧

要想在数据科学中胜出，只需通过拆分数据将一个数据集转换为(至少)两个数据集。然后用一个获取灵感，另一个用于严格的测试。如果最初启发你的模式也存在于那些没有机会影响你的观点的数据中，那么这将是一个更有希望的选择，这种模式就像是存在于猫砂里的东西，你要从中挖出你的数据。

如果相同的现象存在于两个数据集中，也许这是一个普遍的现象，它也存在于这些数据集中的任何地方。

八、令人惊叹

如果未经审视的生活不值得过下去，那么以下四个词就是生活的准则:把该死的数据拆开。

如果每个人都能分享自己的数据，世界会变得更好。我们会有更优的答案(从统计学)到更好的问题(从分析学)。人们不把数据分割作为一种强制性习惯的唯一原因是，在上个世纪，它是一种奢侈的事情，很少有人能负担得起;数据集非常小，如果你试图拆分它们，那么可能就什么都没有了。(在这里可以了解更多关于数据科学史的信息。)

数据科学中的强大思维