加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

程序员笔记|3个问题带你入门数据建模

发布时间:2019-05-16 11:32:02 所属栏目:教程 来源:hanfeng
导读:一、何为建模 数据几乎总是用于两种目的:操作型记录的保存和分析型决策的制定。简单来说,操作型系统保存数据,分型型系统使用数据。 前者一般仅反映数据的最新状态,按单条记录事务性来处理;其优化的核心是更快地处理事务。 后者往往是反映数据一段时间

维度是维度建模的基础和灵魂。在维度建模中,将度量称为"事实",将环境描述为"维度",维度是用于分析事实所需要的多样环境。维度所包含的表示维度的列,称为维度属性。维度属性是查询约束条件、分组和报表标签生成的基本来源,是数据易用性的关键。维度的作用一般是查询约束、分类汇总以及排序等。维度的设计过程就是确定维度属性的过程,如何生成维度属性,以及所生成的维度属性的优劣,决定了维度使用的方便性,成为数据仓库易用性的关键。正如Kimball所说的,数据仓库的能力直接与维度属性的质量和深度成正比。

在整个设计过程中,应当遵循下面一些原则:

  • 维度属性尽量丰富,为数据使用打下基础。
  • 给出详实的、富有意义的文字描述。
  • 沉淀通用维度属性,为建立一致性维度做好铺垫。
  • 严格区分事实与维度,通过使用场景进行区分。

2、事实表设计

事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度和与业务过程有关的度量。在设计过程中,可以选择不同类型的事实表,它们有各自的适用场景。

在整个设计过程中,应当遵循下面一些原则:

程序员笔记|3个问题带你入门数据建模

  • 选择一种适合的事实表类型。
  • 事实尽可能完整,包含整个业务过程的全部事实。
  • 确保每一个事实度量都是一致性,反复计算都会得到相同的结果。尽量记录一些“原子”事实,而不是加工后的结果。
  • 可适当做些”维度退化属性”,提高事实表的查询性能。
  • 为提高聚合性能,可适度做些上卷汇聚事实表。

【本文是51CTO专栏机构宜信技术学院的原创文章,微信公众号“宜信技术学院( id: CE_TECH)”】

戳这里,看该作者更多好文

【编辑推荐】

  1. 解决线上数据库死锁,就是这么简单!
  2. 看看这些大龄程序员都做了些什么
  3. 一篇运维老司机的大数据平台监控宝典(1)-联通大数据集群平台监控体系进程详解
  4. 一篇运维老司机的大数据平台监控宝典(2)-联通大数据集群平台监控体系详解
  5. 机器学习能革了数据库索引的命吗?
【责任编辑:赵宁宁 TEL:(010)68476606】
点赞 0

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读