加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

Python爬取北京二手房数据,分析北漂族买得起房吗? | 附完整源码

发布时间:2018-08-22 21:09:06 所属栏目:教程 来源:徐麟
导读:技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战 房价高是北漂们一直关心的话题,本文就对北京的二手房数据进行了分析。 本文主要分为两部分:Python爬取赶集网北京二手房数据,R对爬取的二手房房价做线性回归分析,适合刚刚接触Py

Data.csv知识点存储文件路径默认是工作目录,关于Python中如何查看工作目录:

  1. import os  
  2.  
  3. #查看pyhton 的默认工作目录 
  4. print(os.getcwd()) 
  5.  
  6. #修改时工作目录 
  7. os.chdir('e:workpython') 
  8. print(os.getcwd()) 
  9. #输出工作目录 
  10. e:workpython 
  • 爬虫打印的是字典形式,每个房屋信息都是一个字典,由于Python中excel相关库是知识盲点,所以爬虫的时候将字典循环直接写入了CSV。

Pycharm中打印如下:

Python爬取北京二手房数据,分析北漂族买得起房吗? | 附完整源码

将字典循环直接写入CSV效果如下:

Python爬取北京二手房数据,分析北漂族买得起房吗? | 附完整源码

  • 很多初学者对于Address不知如何处理,这里强调一下Beautiful Soup 中.contents的用法,亲身体会,我在这里花了好多时间才找到答案。

Python爬取北京二手房数据,分析北漂族买得起房吗? | 附完整源码

02、R对爬取的二手房房价做一般线性回归分析

下面我们用R对抓取的赶集网北京二手房数据做一些简单的分析。

数据的说明

  • Name:主要是商家的醒目标题,不具备分析参考意义
  • Type:卧室数、客厅数、卫生间数
  • Area:面积(平方米)
  • Towards:朝向
  • Floor:楼层
  • Decorate:装修情况,如精装修、简单装修、毛坯房
  • Address:二手房的地址
  • TotalPrice:总价
  • Price:均价(元/平方米)

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读