如何为机器学习获取有效数据处理小数据的7个技巧值得一看

发布时间：2019-07-17 11:39:10 所属栏目：建站来源：雷锋字幕组

导读：本文转自雷锋网，如需转载请至雷锋网官网申请授权。我们经常会听到，大数据是建立成功的机器学习项目的关键。一个主要的问题是：许多组织没有你需要的数据。在没有基本的、必要的、未经处理数据的情况下，我们应该如何为机器学习的概念建立原型并加以验

最近，我正为一位客户建立目标检测原型，这对准确性有较高要求。通过对MobileNet Single Shot Detector的微调和应用，工作效率已经很大程度的提升了，该迁移学习模型是通过谷歌的数据集训练得到的（含有900万张已标记的图片）。在一天的训练后，我能提供一个相当稳健的目标检测模型，在一个采用1500张已标记图片的测试中，显示0.85的mAP。

7. 尝试弱学习者的组合

有时，你只需要面对一个现实，你就是没有足够的数据来搞胡里花哨的东西。幸运的是，你可以转而求助许多传统机器学习AI，它们对你的数据集规模并不敏感（不会因数据的低容量产生较大的测试偏差）。

当数据集小，数据点维度高的时候的时候，像Support Vector Machine 这样的AI是一个好的选择。

遗憾的是，这些AI并不总是像先进应用方法一样准确。这就是为什么他们会称之为弱学习者了，至少与高参数化神经网络相比。

改善这一情况的方法是，结合几个弱学习者的成果。（这可以是Support Vector Machines和Decision Trees的数组，他们可以在一起工作，建立预测）。这就是联合学习所指的内容了。

（编辑：核心网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页

杭州网站优化的几个注	网站优化效果不好怎么
网站结构怎么优化？对	网站文章内容持续更新

如何为机器学习获取有效数据 处理小数据的7个技巧值得一看

如何为机器学习获取有效数据处理小数据的7个技巧值得一看