加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

Power BI入门教程

发布时间:2021-01-11 18:02:14 所属栏目:大数据 来源:网络整理
导读:题记:这篇文章不仅是Power BI的入门教程,同时相对于Qlik Sense进行了简单比较。 最近把一个Qlik Sense的示例应用手动转成了Power BI的应用,把相关步骤和遇到的问题记录如下,权当作一个入门教程。 1,准备原始数据 由于Qlik Sense的示例应用只有一个单独
副标题[/!--empirenews.page--]

题记:这篇文章不仅是Power BI的入门教程,同时相对于Qlik Sense进行了简单比较。

最近把一个Qlik Sense的示例应用手动转成了Power BI的应用,把相关步骤和遇到的问题记录如下,权当作一个入门教程。

1,准备原始数据

由于Qlik Sense的示例应用只有一个单独的qvf文件,那么原始数据只有通过qvf来导出。此qvf中的数据模型如下图所示:

Qlik Sense并没有提供数据模型包含数据的完整导出功能,所以只能采用最麻烦和原始的方式,即:创建表格,在表格中添加某个数据表的所有字段,然后再利用可视化对象的导出功能导出数据为xlsx文件。通过这种方式,把所有表都导出。注:但在实际操作当中,未必所有表都导出,因为有些表可以在Power BI中生成(比如日期表DateParts),有些表在Power BI中也用不到(比如月份顺序表Month Sort Order)。

当然,如果你拿得到原始数据的文件或者数据库,那么就可以跳过这一步。

2,加载数据

这步比较简单,在Power BI中新建一个文档,通过“获取数据”-“Excel”来选择需要导入的xlsx文件。

选择文件之后,会显示“导航器”对话框。在这里选择需要导入的工作表(可以选择多个)。选择工作表之后,可以直接点“加载”,也可以点“编辑”来打开“查询编辑器”修改ETL脚本(当然在加载之后还是可以重新编辑脚本)。如果直接点“加载”之后,Power BI就会把选择的工作表中的数据加载进来,这个时候就可以在“数据”视图中预览其中的数据,右侧的“字段”边栏也会显示表及其包含的字段:

这个时候,你会发现表名称是xlsx文件中默认的Sheet1,修改表名称的最简单方式就是,在表名称上点右键选择“重命名”。另外,有些xlsx文件导入之后,数据可能会出现下面这种没有正常识别列名称的问题,这个时候就需要用到“查询编辑器”中的“提升的标题”(把第一行数据当作标题/列名)的功能:

“查询编辑器”是一个强大的UI操作界面,帮你自动生成Power Query的M语言脚本,可以通过“高级编辑器”来查看每个表的Power Query脚本。而Power Query的第一步就是通过“源”和“导航”脚本来实现Extract-Load的步骤。对于Power BI而言,Extract-Load可以实现的能力有:

  • 从各类数据源中提取数据:各类文件、各类数据库、各类Azure的PaaS、各类联机服务和其他数据源(比如R脚本)

  • 对数据源的配置进行设置

  • 直接录入数据

3,转换和塑造数据

在加载数据的过程中或者之后,还可以继续利用“查询编辑器”来对加载的数据进行转换和塑造(即Transform)。所谓转换和塑造就是利用Power Query的M语言脚本来对数据的加载过程,进行额外处理。我大致把这个过程中Power BI能提供的能力整理了一下:

  • 通用

    • 列的管理:选择列、删除列

    • 行的管理:保留行(前后、间隔、重复、错误)、删除行

    • 排序:基于一个列或多个列进行升降序

    • 合并数据:可以是合并数据(两个表提供不同的列),也可以是追加数据(两个表提供不同的行)

  • 转换

    • 表数据管理:对原始数据进行分组、提升第一行作为标题、行列颠倒、首尾行调换、对数据行计数

    • 所有列的处理:重命名列名、数据类型的自动检测和手动修改、替换值、填充单元格(上下两个方向皆可)、透视列(正逆两个方向)、转换为列表(列表转回列)

    • (编辑:核心网)

      【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读