加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

Python 从爬虫到数据分析

发布时间:2019-05-16 12:07:47 所属栏目:建站 来源:大鹏
导读:大家好,我是大鹏,城市数据团联合发起人,致力于Python数据分析、数据可视化的应用与教学。 和很多同学接触过程中,我发现自学Python数据分析的一个难点是资料繁多,过于复杂。大部分网上的资料总是从Python语法教起,夹杂着大量Python开发的知识点,花了

9行代码,我们完成了Excel里的透视表、拖动、排序等鼠标点击动作。最后再用Python中的可视化包matplotlib,快速出图:

Python 从爬虫到数据分析

Python 从爬虫到数据分析

B.函数化分析

以上是一个简单的统计分析过程。接下来就讲讲Excel基础功能不能做的事——自定义函数提效。观察数据可以发现,数据中记录了周票房和总票房的排名,那么刚刚计算了周票房排名的代码,还能不能复用做一张总票房分析呢?

Python 从爬虫到数据分析

当然可以,只要使用def函数和刚刚写好的代码建立自定义函数,并说明函数规则即可:

  1. def pypic(pf): 
  2.     #定义一个pypic函数,变量是pf 
  3.     dataTop1_sum = data[['电影名',pf]] 
  4.     #取出源数据中,列名为“电影名”和pf两列数据 
  5.  
  6.     dataTop1_sum = dataTop1_sum.groupby('电影名').max()[pf].reset_index() 
  7.     #用“电影名”来分组数据,相同电影连续霸榜的选择最大的pf票房保留,其他数据删除 
  8.  
  9.     dataTop1_sum = dataTop1_sum.sort_values(by=pf,ascending=False) 
  10.     #将数据按照pf进行降序排序 
  11.  
  12.     dataTop1_sum.index = dataTop1_sum['电影名'] 
  13.     del dataTop1_sum['电影名'] 
  14.     #整理index列,使之变为电影名,并删掉原来的电影名列 
  15.  
  16.     dataTop1_sum[:20].iloc[::-1].plot.barh(figsize = (6,10),color = 'orange') 
  17.     name=pf+'top20分析' 
  18.     plt.title(name) 
  19.     #根据函数变量名出图 

定义函数后,批量出图so easy:

Python 从爬虫到数据分析

Python 从爬虫到数据分析

学会函数的构建,一个数据分析师才算真正能够告别Excel的鼠标点击模式,迈入高效分析的领域。

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读