背景信息
应用表是面向具体业务场景,用于组织相同时间周期、相同维度的指标或统计粒度的统计数据,为后续的业务查询、OLAP分析、数据分发等提供基础。
功能入口
- 单击左上方的图标,选择全部产品 > 数据建模 > 维度建模 > 正向建模,进入正向建模页面;
- 新建应用表:在正向建模页面,鼠标悬停至图标,单击“新建应用表”。
详细操作步骤
- 表信息填写。
主要参数说明如下:
参数 | 参数说明 |
---|---|
数据源 | 需通过集群注册Hive组件,且在引擎管理中将集群与调度资源组绑定,系统自动生成内置的Hive数据源,如果有多个,下拉单选。 |
数据库名 | 该数据源下已创建的数据库,下拉单选。 |
表物理类型 | 表的物理类型。 |
存储格式 | 必选,下拉单选,默认值为:ORC;可选项为:TextFile、SequenceFile、Parquet、ORC、Avro、RCFile。 |
表属性 | 内部表:默认为内部表;外部表:外部表需要填写外部表的Location。 |
数仓分层 | 跟所建的模型类型相对应。 |
表类型 | 应用表的表类型: ● 普通应用表:只能统计单粒度的数据,不会做多个粒度数据的再次汇总; ● 轻度应用表:可以统计多个粒度的数据,并将不同粒度的数据进行再次汇总。 |
挂载类型 | 表所属的挂载类型,如数据集市或分析主题。 |
挂载类型名 | 跟挂载类型对应,选择具体的数仓要素的名称。 |
表名主体 | 用于表达该表的作用,是表英文名的组成部分;由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。一般情况下表英文名包含:固定字符(如ads)_数据集市_表名主体_统计周期。 |
表名规范 | 通过已配置的表名规范约束表名。选择表名规范后,可点击“使用推荐表名”,系统生成推荐表名。 |
统计周期 | 用于确定应用表需要整合的统计数值的时间范围。例如,近一天,近一周。 |
统计粒度 | 应用表是基于哪个维度,也即是基于哪个统计粒度建设的。 |
业务限定 | 应用表是基于哪个业务范围,也即是基于哪个业务限定建设的。 |
描述 | 表描述。 |
表英文名 | 应用表的英文名,由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。只要选择了表名规范,不管是强规则还是弱规则,都可以点击“使用推荐表名”,系统生成推荐表名供使用。如果选择的表名规范为强规则,则需遵循表名规范进行建设。 |
表别名 | 应用表的别名,一般用于逆向建模表英文名不规范时,此参数可填写规范的名称,作为辅助表英文名用。由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。 |
表中文名 | 应用表的中文名,由中文、英文字母、下划线(_)、and(&)、英文括号组成。 |
负责人 | 当前应用表的责任人,默认为创建应用表的用户,可选多个。 |
点击“保存为草稿”或“下一步”;点击“保存为草稿”则可在左侧“草稿”tab,查看草稿列表;点击“下一步”,则进入步骤2“字段管理”。
- 字段管理。
- 选择字段。
字段管理支持快捷模式与代码模式。
A. 快捷模式:支持从表/视图导入、 从字段标准导入、从派生指标导入、从复合指标导入。
如下截图为从表/视图导入:
如下截图为从字段标准导入:
如下截图为从派生指标导入:
如下截图为从复合指标导入:
B. 代码模式导入:支持解析sql内容导入字段。有两种方式:
其一:保留快捷模式字段,将快捷模式所选的字段自动生成sql带到代码模式的输入框;其二:清空快捷模式字段,不将快捷模式所选的字段带到代码模式的输入框。选择其中一种代码模式,进入SQL模式弹窗。
点击“确认”,则进入“设置字段属性”。
-
设置字段属性。
- 字段英文名、字段中文名、数据类型、描述口径;
- 设置非空属性、关联字段标准、标准值域、度量单位;
- 关联类型可选择维度属性、派生指标、复合指标,并选择所关联的内容。
- 设置主键和分区键。
字段配置完成后,可以根据实际场景配置1个或多个主键字段;针对Hive表,建议您配置分区字段并确定分区字段格式。
- 发布申请。
设置完成后,即可提交发布申请。