背景信息
接入表:主要是用于数据库、日志等基础源数据的引入而落地的表。
功能入口
- 单击左上方的图标,选择全部产品 > 数据建模 > 维度建模 > 正向建模,进入正向建模页面;
- 新建接入表:在正向建模页面,鼠标悬停至图标,单击“新建接入表” 。
详细操作步骤
- 表信息填写。
主要参数说明如下:
填写参数 | 参数说明 |
---|---|
数据源 | 需通过集群注册Hive组件,且在引擎管理中将集群与调度资源组绑定,系统自动生成内置的Hive数据源,如果有多个,下拉单选。 |
数据库名 | 该数据源下已创建的数据库,下拉单选。 |
表物理类型 | 表的物理类型。 |
存储格式 | 必选,下拉单选,默认值为:ORC;可选项为:TextFile、SequenceFile、Parquet、ORC、Avro、RCFile。 |
表属性 | 内部表:默认为内部表;外部表:外部表需要填写外部表的Location。 |
数仓分层 | 跟所建的模型类型相对应。 |
挂载类型 | 表所属的挂载类型,如数据域。 |
挂载类型名 | 跟挂载类型对应,选择具体的数仓要素的名称。 |
表名主体 | 用于表达该表的作用,是表英文名的组成部分;由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。一般情况下表英文名包含:固定字符(如ods)_数据域_表名主体_存储策略。 |
表名规范 | 通过已配置的表名规范约束表名。选择表名规范后,可点击“使用推荐表名”,系统生成推荐表名。 |
存储策略 | 接入表基于什么策略(即存储数据的时间周期及数据量范围)存储数据。 |
描述 | 表描述。 |
表英文名 | 接入表的英文名,由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。只要选择了表名规范,不管是强规则还是弱规则,都可以点击“使用推荐表名”,系统生成推荐表名。如果选择的表名规范为强规则,则需遵循表名规范进行建设。 |
表别名 | 接入表的别名,由小写英文字母、下划线(_)、数字组成,并以小写英文字母开头。一般用于逆向建模,当表英文名不符合规范时,此参数可填写规范的名称,作为辅助表英文名用。 |
表中文名 | 接入表的中文名,由中文、英文字母、下划线(_)、and(&)、英文括号组成。 |
负责人 | 当前接入表的责任人,默认为创建接入表的用户,可选多个。 |
完成表信息填写,点击“保存为草稿”或“下一步”;点击“保存为草稿”则可在左侧“草稿”tab,查看草稿列表;点击“下一步”,则进入步骤2“字段管理”。
- 字段管理。
- 选择字段。
字段管理支持快捷模式与代码模式。
A. 快捷模式:支持从表/视图导入、 从字段标准导入。
如下截图为从表/视图导入:
如下截图为从字段标准导入:
B. 代码模式导入:支持解析sql内容导入字段。有两种方式:
其一:保留快捷模式字段,将快捷模式所选的字段自动生成sql带到代码模式的输入框;其二:清空快捷模式字段,不将快捷模式所选的字段带到代码模式的输入框。
点击“确认”,则进入“设置字段属性”。
- 设置字段属性。
- 字段英文名、字段中文名、数据类型、描述口径。
- 设置非空属性、关联字段标准、标准值域。
- 关联类型选维度属性,并选择所关联的内容。
- 设置主键和分区键。
字段配置完成后,可以根据实际场景配置1个或多个主键字段;针对Hive表,建议您配置分区字段并确定分区字段格式。
- 发布申请。
设置完成后,即可提交发布申请。