加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

用Python分析北京二手房房价

发布时间:2018-10-26 13:21:18 所属栏目:教程 来源:xiaoyu
导读:数据初探 首先导入要使用的科学计算包numpy,pandas,可视化matplotlib,seaborn,以及机器学习包sklearn。 importpandasaspd importnumpyasnp importseabornassns importmatplotlibasmpl importmatplotlib.pyplotasplt fromIPython.displayimportdisplay plt.

可以看到,6层二手房数量最多,但是单独的楼层特征没有什么意义,因为每个小区住房的总楼层数都不一样,我们需要知道楼层的相对意义。另外,楼层与文化也有很重要联系,比如中国文化七上八下,七层可能受欢迎,房价也贵,而一般也不会有4层或18层。当然,正常情况下中间楼层是比较受欢迎的,价格也高,底层和顶层受欢迎度较低,价格也相对较低。所以楼层是一个非常复杂的特征,对房价影响也比较大。

总结

本次分享旨在让大家了解如何用Python做一个简单的数据分析,对于刚刚接触数据分析的朋友无疑是一个很好的练习。不过,这个分析还存在很多问题需要解决,比如:

  • 解决爬虫获取的数据源准确度问题;
  • 需要爬取或者寻找更多好的售房特征;
  • 需要做更多地特征工程工作,比如数据清洗,特征选择和筛选;
  • 使用统计模型建立回归模型进行价格预测;

作者:xiaoyu,一个半路转行的数据挖掘工程师,Python数据科学。

【编辑推荐】

  1. 非科班的我如何自学Python在上海找到一份15K的工作?
  2. 想省油钱,你使用Python为你的油箱加油啊
  3. 机器学习之神经网络及Python实现
  4. 改善Python程序的91个建议
  5. 12种Python 机器学习 & 数据挖掘工具包,一定让你受益匪浅
【责任编辑:未丽燕 TEL:(010)68476606】
点赞 0

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读