加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

如何成为数据分析师系列(二):可视化图表进阶

发布时间:2019-01-02 09:36:06 所属栏目:教程 来源:月下柳人松
导读:继上一篇如何成为数据分析师系列(一):可视化图表初阶整理了折线图、柱形图、散点图、饼图4种基本图表的特性及其使用场景,这次整理了一些平常不太使用,但在合适的场景的使用它们,往往能为你的分析报告加分不少的图表。 需要说明的是,这次演示的图表几

应用举例

如何成为数据分析师系列(二):可视化图表进阶

甘特图(Gantt chart)

如何成为数据分析师系列(二):可视化图表进阶

应用场景:项目管理

甘特图对于说明项目各元素的起始与终止日期效果非常好,清楚看到需要完成的内容和截止时间对于项目的成功非常关键。 多数情况下,我们把甘特图和项目管理联系到一起,不过它其实还可以用来表现随时间推移事物的变化(人员、机器、订单等)。

  • 显示项目进度。例如:说明关键可交付成果、所有者、截止期限。
  • 显示随时间推移的其他事物使用事项。例如:机器使用的持续时间、团队成员有空与否,订单发货时间等。

桑基图(Sankey diagram)

如何成为数据分析师系列(二):可视化图表进阶

桑基图,即桑基能量分流图,也叫桑基能量平衡图。

起源

  • 1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名世界,此后便以其名字命名为“桑基图”。

应用场景

  1. 展示分类维度间的相关性,以流的形式呈现同一类别的元素数量;
  2. 表示集群的发展,比如特定人群的分布,如:杏仁活跃医生在一段时间的活跃状态变迁;
  3. 具有流程图的性质,表示能量/物质流转。

核心特征

最明显的特征是始末端的分支宽度总各相等,即所有主支宽度的总和应与所有分出去的分支宽度的总和相等,保持能量的平衡。

图形制作

  • 1.S型曲线-sigmoid Fuction

如何成为数据分析师系列(二):可视化图表进阶

该函数图像的特点有: 1. 连续,光滑,严格单调; 2. 关于(0, 0.5)中心对称; 3. 值域为(0,1).

1. 简单桑基图 数据格式如下。左为Data,右为模型Model,要求制作桑基图表示用户ID从position 1变化为position 2的路径。

如何成为数据分析师系列(二):可视化图表进阶

如何成为数据分析师系列(二):可视化图表进阶

  • a. 连接Excel文件,将Data与Model均拖入数据,并由Link进行inner join连接;
  • b. 创建计算字段Sigmoid Function代表S曲线函数:1/(1+EXP(1)-[t]);
  • c. 创建计算字段Curve代表曲线:[Position 1]+(([Position 2]-[Position 1])*[Sigmoid Function]);
  • d. 将t拖拽至[列],Curve拖拽至[行],并调整为连续的维度; e. 将Name、ID拖到详细信息,Name拖拽到颜色;
  • f. 选择标记类型为 线,一个简单的桑基图就完成了,示例可参见Tableau文件。

如何成为数据分析师系列(二):可视化图表进阶

难点理解:曲线是如何生成的!

每一个用户有position 1、position 2,以ID=1的用户为例:

  1. position 1=1  
  2. position 2= 100  
  3. [Position 2]-[Position 1]=99  
  4. ([Position 2]-[Position 1])*[Sigmoid Function] 

将上式记作A,根据S曲线特性,当t->负无穷时,函数s->0,A->0;因s函数严格单调,当t增大时,s增大;当t->正无穷时,s->1,A->([Position 2]-[Position 1])。所以curve=[Position 1]+(([Position 2]-[Position 1])*[Sigmoid Function])可生成一条S曲线.

难点是设置position,让每个类别的点靠近。不仅是大类别要靠近,细分类别也要靠近

词云

如何成为数据分析师系列(二):可视化图表进阶

应用场景

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读