加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

【Kaggle入门级竞赛top5%排名经验分享】— 分析篇

发布时间:2018-08-17 01:44:53 所属栏目:教程 来源:佚名
导读:技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战 Kaggle作为公认的数据挖掘竞赛平台,有很多公开的优秀项目,而其中作为初学者入门的一个好的项目就是:泰坦尼克号生还者预测。 可能这个项目好多朋友也听说过,可能很多朋友也做过

不同Pclass下的年龄分布也不同,三个分布的中位数大小按Pclass1 Pclass2 Pclass3排列。这也符合实际情况,Pclass1的乘客是社会上的拥有一定财富和地位的成功人士,年龄比较大,而Pclass3的人数最多,因为大多数人还都是普通人(有钱人毕竟少数),并且这些人多是年轻人,年龄在20-30之间。

【Kaggle入门级竞赛top5%排名经验分享】— 分析篇

结论:

从散点图来分析:

  • Pclass1和Pclass2的女性几乎都是Survived的,Pclass3中女性Survived则不是很明显了;
  • Pclass1的男性生还率最高,Pclass2和Pclass3的生还率比较低,但是Pclass2中年龄小的乘客几乎全部生存;

印证了那个原则:妇女和孩子优先营救。

【Kaggle入门级竞赛top5%排名经验分享】— 分析篇
【Kaggle入门级竞赛top5%排名经验分享】— 分析篇
【Kaggle入门级竞赛top5%排名经验分享】— 分析篇

2. Fare分布和特征分析

【Kaggle入门级竞赛top5%排名经验分享】— 分析篇

结论:

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读