背景信息
事实表:又叫明细数据表,结合业务过程的规划,梳理分析各业务过程中可能产生的实际数据,将这些实际数据字段通过明细数据表的方式存储下来。例如下单这一业务过程中,您可以创建下单这一明细数据表,用于记录下单过程可能产生实际数据字段,例如订单ID、订单创建时间、商品ID、数量、金额等。后续您可将明细数据表发布到数仓中,通过ETL将真实的数据按照明细数据表的定义方式进行存储,便于业务分析时取用。
功能入口
- 单击左上方的图标,选择全部产品 > 数据建模 > 维度建模 > 正向建模,进入正向建模页面;
- 新建事实表:在正向建模页面,鼠标悬停至图标,单击“新建事实表”。
详细操作步骤
- 表信息填写。
主要参数说明如下:
填写参数 | 参数说明 |
---|---|
数据源 | 需通过集群注册Hive组件,且在引擎管理中将集群与调度资源组绑定,系统自动生成内置的Hive数据源,如果有多个,下拉单选。 |
数据库名 | 该数据源下已创建的数据库,下拉单选。 |
表物理类型 | 表的物理类型。 |
存储格式 | 必选,下拉单选,默认值为:ORC;可选项为:TextFile、SequenceFile、Parquet、ORC、Avro、RCFile。 |
表属性 | 内部表:默认为内部表;外部表:外部表需要填写外部表的Location。 |
数仓分层 | 跟所建的模型类型相对应。 |
表类型 | 根据实际情况,选择事务事实表、周期快照表或累加表。 |
挂载类型 | 表所属的挂载类型,如业务过程。 |
挂载类型名 | 跟挂载类型对应,选择具体的数仓要素的名称。 |
表名主体 | 用于表达该表的作用,是表英文名的组成部分;由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。一般情况下表英文名包含:固定字符(如dwd)_业务过程_表名主体_存储策略。 |
表名规范 | 通过已配置的表名规范约束表名。选择表名规范后,可点击“使用推荐表名”,系统生成推荐表名。 |
存储策略 | 事实表基于什么策略(即存储数据的时间周期及数据量范围)存储数据。 |
描述 | 表描述。 |
表英文名 | 事实表的英文名,由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。只要选择了表名规范,不管是强规则还是弱规则,都可以点击“使用推荐表名”,系统生成推荐表名供使用。如果选择的表名规范为强规则,则需遵循表名规范进行建设。 |
表别名 | 事实表的别名,由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。一般用于逆向建模表英文名不规范时,此参数可填写规范的名称,作为辅助表英文名用。 |
表中文名 | 事实表的中文名,由中文、英文字母、下划线(_)、and(&)、英文括号组成。 |
负责人 | 当前事实表的责任人,默认为创建事实表的用户,可选多个。 |
点击“保存为草稿”或“下一步”;点击“保存为草稿”则可在左侧“草稿”tab,查看草稿列表;点击“下一步”,则进入步骤2“字段管理”。
- 字段管理。
- 选择字段。
字段管理支持快捷模式与代码模式。
A. 快捷模式:支持从表/视图导入、 从字段标准导入。
如下截图为从表/视图导入:
如下截图为从字段标准导入:
B. 代码模式导入:支持解析sql内容导入字段。有两种方式:
其一:保留快捷模式字段,将快捷模式所选的字段自动生成sql带到代码模式的输入框;其二:清空快捷模式字段,不将快捷模式所选的字段带到代码模式的输入框。
点击“确认”,则进入“设置字段属性”。
-
设置字段属性。
- 字段英文名、字段中文名、数据类型、描述口径;
- 设置非空属性、关联字段标准、标准值域、度量单位;
- 关联类型可选择维度属性或原子指标,并选择所关联的内容。
- 设置主键和分区键。
字段配置完成后,可以根据实际场景配置1个或多个主键字段;针对Hive表,建议您配置分区字段并确定分区字段格式。
- 发布申请。
设置完成后,即可提交发布申请。