背景信息
维度表:结合业务的数据域规划,提取出各业务数据域中进行数据分析时可能存在的维度,并将维度及其属性通过维度表的方式存储下来。例如,在进行电商业务数据分析时,可用的维度及其属性有:订单维度(属性包括订单ID、订单创建时间、买家ID、卖家ID等)、用户维度(性别、出生日期等)、商品维度(包括商品ID、商品名称、商品上架时间)等,此时您就可以将这些维度和属性创建为订单维度表、用户维度表、商品维度表等,将维度属性记录作为维度表的字段。后续您可将这些维度表发布到数仓中,通过ETL将实际维度数据按照维度表定义的方式进行存储,方便业务人员在后续的数据分析进行取用。
功能入口
- 单击左上方的图标,选择全部产品 > 数据建模 > 维度建模 > 正向建模,进入正向建模页面;
- 新建维度表:在正向建模页面,鼠标悬停至图标,单击“新建维度表” 。
详细操作步骤
- 表信息填写。
主要参数说明如下:
填写参数 | 参数说明 |
---|---|
数据源 | 需通过集群注册Hive组件,且在引擎管理中将集群与调度资源组绑定,系统自动生成内置的Hive数据源,如果有多个,下拉单选。 |
数据库名 | 该数据源下已创建的数据库,下拉单选。 |
表物理类型 | 表的物理类型。 |
表属性 | 内部表:默认为内部表;外部表:外部表需要填写外部表的Location。 |
数仓分层 | 跟所选的分层对应。 |
表类型 | 维度表的表类型: ● 普通维度表:无特殊需求可选择此项; ● 枚举维度表:可进行枚举的维度表,如部门id与部门名称; ● 层级维度表:需要设置层级关系的维度表,支持指标做上卷和下钻,例如国家、省份、市县等。 |
挂载类型 | 表所属的挂载类型,如数据域。 |
挂载类型名 | 跟挂载类型对应,选择具体的数仓要素的名称。 |
表名主体 | 用于表达该表的作用,是表英文名的组成部分;由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。一般情况下表英文名包含:固定字符(如dim)_数据域_表名主体_存储策略。 |
表名规范 | 通过已配置的表名规范约束表名。选择表名规范后,可点击“使用推荐表名”,系统生成推荐表名。 |
存储策略 | 维度表基于什么策略(即存储数据的时间周期及数据量范围)存储数据。 |
维度 | 维度表是基于哪个维度建设的。 |
描述 | 表描述。 |
表英文名 | 维度表的英文名,由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。只要选择了表名规范,不管是强规则还是弱规则,都可以点击“使用推荐表名”,系统生成推荐表名。如果选择的表名规范为强规则,则需遵循表名规范进行建设。 |
表别名 | 维度表的别名,由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。一般用于逆向建模,当表英文名不符合规范时,此参数可填写规范的名称,作为辅助表英文名用。 |
表中文名 | 维度表的中文名,由中文、英文字母、下划线(_)、and(&)、英文括号组成。 |
负责人 | 当前维度表的责任人,默认为创建维度表的用户,可选多个。 |
完成表信息填写,点击“保存为草稿”或“下一步”;点击“保存为草稿”则可在左侧“草稿”tab,查看草稿列表;点击“下一步”,则进入步骤2“字段管理”。
- 字段管理。
- 选择字段。
字段管理支持快捷模式与代码模式。
A. 快捷模式:支持从表/视图导入、 从字段标准导入。
如下截图为从表/视图导入:
如下截图为从字段标准导入:
B. 代码模式导入:支持解析sql内容导入字段。有两种方式:
其一:保留快捷模式字段,将快捷模式所选的字段自动生成sql带到代码模式的输入框;其二:清空快捷模式字段,不将快捷模式所选的字段带到代码模式的输入框。
点击“确认”,则进入“设置字段属性”。
-
设置字段属性。
- 字段英文名、字段中文名、数据类型、描述口径。
- 设置非空属性、关联字段标准、标准值域。
- 关联类型选维度属性,并选择关联的内容。
- 设置主键和分区键。
字段配置完成后,可以根据实际场景配置1个或多个主键字段;针对Hive表,建议您配置分区字段并确定分区字段格式。
- 发布申请。
设置完成后,即可提交发布申请。