在设计数据仓库模型的时候,最常见的有两种:星型模型与雪花模型。选择哪一种模型需要根据业务需求以及性能的多重考量来定。
- 星型模型由包含数据库核心数据的中央事实数据表和为事实数据表提供描述性属性信息的多个维度表组成。维度表通过主键关联事实表中的外键。如下图。
−所有的事实都必须保持同一个粒度。
−不同的维度之间没有任何关联。
星型模型
- 雪花模型是在基于星型模型之上拓展来的,每一个维度可以再扩散出更多的维度,根据维度的层级拆分成颗粒度不同的多张表。如下图。
−优点是减少维度表的数据量,各个维度表之间按需关联。
−缺点是需要额外维护维度表的数量。
雪花模型
本实践基于TPC-DS的SS(Store Sales)模型做验证。该模型为雪花模型,下图显示了该数据模型的结构。
TPC-DS Store Sales ER-Diagram
有关该模型中事实表Store_Sales及各维度表的信息,请查阅TPC-DS官方文档。