加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

如何为机器学习获取有效数据 处理小数据的7个技巧值得一看

发布时间:2019-07-17 11:39:10 所属栏目:建站 来源:雷锋字幕组
导读:本文转自雷锋网,如需转载请至雷锋网官网申请授权。 我们经常会听到,大数据是建立成功的机器学习项目的关键。 一个主要的问题是:许多组织没有你需要的数据。 在没有基本的、必要的、未经处理数据的情况下,我们应该如何为机器学习的概念建立原型并加以验

最近,我正为一位客户建立目标检测原型,这对准确性有较高要求。通过对MobileNet Single Shot Detector的微调和应用,工作效率已经很大程度的提升了,该迁移学习模型是通过谷歌的数据集训练得到的(含有900万张已标记的图片)。在一天的训练后,我能提供一个相当稳健的目标检测模型,在一个采用1500张已标记图片的测试中,显示0.85的mAP。

7. 尝试弱学习者的组合

有时,你只需要面对一个现实,你就是没有足够的数据来搞胡里花哨的东西。幸运的是,你可以转而求助许多传统机器学习AI,它们对你的数据集规模并不敏感(不会因数据的低容量产生较大的测试偏差)。

当数据集小,数据点维度高的时候的时候,像Support Vector Machine 这样的AI是一个好的选择。

遗憾的是,这些AI并不总是像先进应用方法一样准确。这就是为什么他们会称之为弱学习者了,至少与高参数化神经网络相比。

改善这一情况的方法是,结合几个弱学习者的成果。(这可以是Support Vector Machines和Decision Trees的数组,他们可以在一起工作,建立预测)。这就是联合学习所指的内容了。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读