上海一网通办,雅虎网站优化怎么做,自建站什么意思,山东世界500强企业维度的作用一般是查询约束、分类汇总以及排序等#xff0c;我们在进行维度表设计时#xff0c;应当提前考虑#xff1a; #xff08;1#xff09;维度属性尽量丰富#xff0c;为数据使用打下基础
比如淘宝商品维度有近百个维度属性#xff0c;为下游的数据统计、分析、…
维度的作用一般是查询约束、分类汇总以及排序等我们在进行维度表设计时应当提前考虑 1维度属性尽量丰富为数据使用打下基础
比如淘宝商品维度有近百个维度属性为下游的数据统计、分析、探查提供了良好的基础。 2给出详实的、富有意义的文字描述
属性不应该是编码而应该是真正的文字。在间里巴巴维度建模中 一般是编码和文字同时存在比如商品维度中的商品 ID 和商品标题、 类目 ID 和 类目名称等。ID 一 般用于不同表之间的关联而名称一般用 于报表标签 3区分数值型属性和事实
数值型宇段是作为事实还是维度属性可以参考字段的一般用途。如果通常用于查询约束条件或分组统计则是作为维度属性;如果通常 用于参与度量的计算 则是作为事实。比如商品价格可以用于查询约 束条件或统计价格区间 的商品数量此时是作为维度属性使用的;也可 以用于统计某类目 下商品的平均价格此时是作为事实使用的。另外 如果数值型字段是离散值则作为维度属性存在的可能性较大;如果数 值型宇段是连续值 则作为度量存在的可能性较大但并不绝对需要 同时参考宇段的具体用途。 4沉淀出通用的维度属性为建立一致性维度做好铺垫
有些维度属性获取需要进行比较复杂的逻辑处理有些需要通过多表关联得到或者通过单表 的不同宇段混合处理得到或者通过对单表 的某个字段进行解析得到。此时需要将尽可能多的通用的维度属性进 行沉淀。一方 面可以提高下游使用的方便性减少复杂度;另一方面可以避免下游使用解析时由于各自逻辑不同而导致口径不 一致。 5退化维度Degenerate Dimension
在维度类型中有一种重要的维度称作为退化维度。这种维度指的是直接把一些简单的维度放在事实表中。退化维度是维度建模领域中的一个非常重要的概念它对理解维度建模有着非常重要的作用退化维度一般在分析中可以用来做分组使用。 6缓慢变化维Slowly Changing Dimensions
维度的属性并不是始终不变的它会随着时间的流逝发生缓慢的变化这种随时间发生变化的维度我们一般称之为缓慢变化维SCD缓慢变化维一般使用代理健作为维度表的主健。 缓慢变化维的三种常用处理方式
① TYPE1 直接覆盖原值
适用于不看历史数据简单粗暴 ② TYPE2 拉链表
需要在维度行再增加三列有效日期、截止日期、行标识可选。
在旧的一行数据增加关链时间end_date新的一行数据增加开链时间和关链时间多条数据加起来是一个完整的时间周期。 ③ TYPE3 增加属性列