宁波企业网站制作推荐,垂直门户网站都有什么,做的比较好的企业网站,c2c电商平台可以分为文章目录维度建模过程相关概念1. 收集业务需求与数据实现2. 协作维度建模研讨3. 四步骤维度设计过程4. 业务过程5. 粒度6. 描述环境的维度7. 用于度量的事实8. 维度模型事实表技术术语1. 事实表结构2. 可加、半可加、不可加事实3. 事实表中的空值4. 一致性事实5. 事务事实表6. …
文章目录维度建模过程相关概念1. 收集业务需求与数据实现2. 协作维度建模研讨3. 四步骤维度设计过程4. 业务过程5. 粒度6. 描述环境的维度7. 用于度量的事实8. 维度模型事实表技术术语1. 事实表结构2. 可加、半可加、不可加事实3. 事实表中的空值4. 一致性事实5. 事务事实表6. 周期快照事实表7. 累积快照事实表8. 无事实的事实表9. 聚集事实表10. 合并事实表维度建模过程相关概念
1. 收集业务需求与数据实现 开始维度建模工作前项目组需要通过与业务代表交流理解业务需求包括关键性能指标、商业问题、决策制定过程等同时与源系统专家交流数据实际情况分析数据访问、及分析可行性。
2. 协作维度建模研讨 维度模型应该由主题专家与企业数据管理代表合作设计而成。工作由数据建模者负责但模型应该通过与业务代表开展一系列高级别交互讨论而获得而不应该由不懂业务需求的人来设计。
3. 四步骤维度设计过程 维度模型设计期间主要涉及4个主要的决策 (1) 选择业务过程 (2) 生命粒度 (3) 确认维度 (4) 确认事实 要回答上述问题需要考虑业务需求以及底层数据源。按照业务过程、粒度、维度、事实声明的流程确定表明和列名、示例领域值以及业务规则业务数据管理者必须参与详细的设计活动以确保涵盖正确的业务。
4. 业务过程 业务过程是组织完成的操作型活动多数事实表都会关注某一业务过程的结果。过程的选择是非常重要的因为它定义了他特定的设计目标以及对粒度、维度、事实的定义。每个业务过程对应企业数据仓库总线矩阵的一行。
5. 粒度 在选在维度或事实前必须声明粒度且每个候选维度或事实必须与定义的粒度保持一致。在所有维度设计中强制实行一致性是保证BI应用性能和易用性的关键。 在从给定的业务过程获取数据时原子粒度是最低级别的粒度。我们强烈建议从原子粒度的数据开始设计因为只有原子粒度数据能够承受无法预期的用户查询。
6. 描述环境的维度 维度提供围绕某一业务过程事件所设计的“谁、什么、何时、何处、为什么、如何”等背景。维度表是数仓的灵魂因其包含确保DW/BI系统能够被用作业务分析的入口和描述性标识。
7. 用于度量的事实 事实是来自业务过程事件的度量基本上都是以数量值表示。一个事实表行与按照事实表粒度描述的度量事件之间存在一对一关系因此事实表对应一个物理可观察的事件。
8. 维度模型 维度模型对数据关系发生变化具有灵活的适应性。当发生以下变化时不需要改变现存的BI查询或应用 当事实与存在的事实表粒度一致时可以创建新列 通过建立新的外键列可以将维度关联到已经存在的事实表上 可以在维度表上通过建立新列添加属性 可以使事实表的粒度更原子化方法是在维度表上增加属性然后以更细的粒度重置事实表
事实表技术术语
1. 事实表结构 事实表的设计完全依赖于物理活动不收可能产生的最终报表的影响。除数字度量外事实表总是包含外键用于关联与之相关的维度也包含可选的退化维度键和时间戳。查询请求的主要目标是基于事实表开展计算和聚集操作。
2. 可加、半可加、不可加事实 最灵活、最有用的事实是完全可加的可加事实可以按照与事实表关联的任何维度汇总。 半可加事实可以对某些维度汇总但不能对所有维度汇总。“差额”是常见的半可加事实除了时间维度外可以跨所有维度进行加法操作。 最后一些事实是完全不可加的例如“比率”。对非可加事实一种好的方法是存储非可加事实的完全可加分量并在计算出最终的非可加事实前将这些分量汇总到最终的结果集合中。
3. 事实表中的空值 事实表中可以存在空度量值然而事实表中的外键不能存在空值。一旦遇到外键维度未知或无法应用的情况需要用默认值代理键而不是空值填充。
4. 一致性事实 如果需要比较或计算不同事实表中的度量值则必须保证这些事实表的定义是一致的如果它们不兼容则应该有不同的命名用于告诫用户和BI应用。
5. 事务事实表 事务事实表的一行对应空间或时间上某点的度量事件仅当存在度量时才会建立行。它总是包含一个与维度表关联的外键也可能包含精确的时间戳和退化维度键。度量数字事实必须与事务粒度保持一致。
6. 周期快照事实表 周期快照事实表中的每行汇总了发生在某一标准周期如某天、周、月的多个度量事件。粒度是周期性的而不是个体事务。这些事实表的外键是均匀的即使周期内没有活动发生也会在事实表中为每个事实插入包含0或空值的行。
7. 累积快照事实表 累积快照事实表的行汇总了发生在过程开始和结束之间可预测步骤内的度量事件。管道或工作流过程例如订单具有定义的开始点标准中间过程定义的结束点它们在此类事实表中都可以被建模。
8. 无事实的事实表 无事实事件的存在是为了记录一些列某一时刻发生的多为实体。如在给定的某天发生的学生参加课程事件本身没有度量但记录了事件的多维外键。
9. 聚集事实表 聚集事实表是对原子粒度事实表数据进行简单的数字化上卷操作目的是为了提高查询性能。
10. 合并事实表 通常来自多个业务过程的以相同粒度表示的事实可以合并为一个单一的合并事实表这样做会增加ETL的负担但降低了BI应用的分析代价。合并事实表特别适合那些经常需要共同分析的多过程度量。