您可以通过可视化模式、DDL模式或SQL脚本方式新建数据表。
- (推荐)可视化模式:您可以直接在DataArts Studio数据开发模块通过No Code方式,新建数据表。
- (推荐)DDL模式:您可以在DataArts Studio数据开发模块,通过选择DDL方式,通过SQL语句新建数据表。
- SQL脚本方式:您也可以在DataArts Studio数据开发模块或对应数据湖产品的SQL编辑器上,开发并执行用于创建数据表的SQL脚本,从而创建数据表。
本章节以可视化模式和DDL模式为例,介绍如何在数据开发模块新建数据表。
前提条件
- 已在云服务中创建数据库。
- 已在数据开发模块中创建与数据表类型匹配的数据连接,请参见新建数据连接。
新建数据表(可视化模式)
- 登录DataArts Studio控制台。选择实例,点击“进入控制台”,选择对应工作空间的“数据开发”模块,进入数据开发页面。
详见下图:选择数据开发
- 在数据开发主界面的左侧导航栏,选择“数据开发 > 脚本开发”或“数据开发 > 作业开发”,进入“右侧区域”页面。
- 在左侧菜单选择,单击“数据连接”,目录层级展开至“tables”,右键单击“新建数据表”。
- 在弹出的对话框中,显示“配置基本属性”页面,选择“数据表连接类型”,并参见下表配置相关参数。
基本属性
数据连接类型 | 参数说明 |
---|---|
DLI | 请见下方DLI数据表中的“基本属性”部分 |
DWS | 请见下方DWS数据表中的“基本属性”部分 |
MRS Hive | 请见下方MRS Hive数据表中的“基本属性”部分 |
- 单击“下一步”,在“配置表结构”页面配置下表所示的参数。
表结构
数据连接类型 | 参数说明 |
---|---|
DLI | 请见下方DLI数据表中的“表结构”部分 |
DWS | 请见下方DWS数据表中的“表结构”部分 |
MRS Hive | 请见下方MRS Hive数据表中的“表结构”部分 |
- 单击“保存”,新建数据表。
新建数据表(DDL模式)
- 登录DataArts Studio控制台。选择实例,点击“进入控制台”,选择对应工作空间的“数据开发”模块,进入数据开发页面。
详见下图:选择数据开发
- 在数据开发主界面的左侧导航栏,选择“数据开发 > 脚本开发”/“数据开发 > 作业开发”,进入“右侧区域”页面。
- 在左侧菜单选择,单击“数据连接”,目录层级展开至“tables”,右键单击“新建数据表”。
- 单击“DDL模式建表”,选择如下表所示的参数,并在下方的编辑器中输入SQL语句。
数据表参数
参数 | 说明 |
---|---|
数据连接类型 | 选择数据表所属的数据连接类型。 DLI DWS HIVE |
数据连接 | 选择数据表所属的数据连接。 |
数据库 | 选择数据表所属的数据库。 |
- 单击“确定”,新建数据表。
查看表详情
- 在数据开发主界面的左侧导航栏,选择“数据开发 > 脚本开发”或“数据开发 > 作业开发”,进入“右侧区域”页面。
- 在左侧菜单选择,单击“数据连接”,目录层级展开至数据表的名称,右键单击“查看表详情”。
- 进入数据表详情页面,查看下表所示的数据表信息。
表详情页面
页签名称 | 说明 |
---|---|
表信息 | 显示数据表的基本信息和存储信息。 |
字段信息 | 显示数据表的字段信息。 |
数据预览 | 预览数据表的10条记录。 |
DDL | 显示DLI/DWS/MRS Hive数据表的DDL。 |
查看数据表列详情
- 在数据开发主界面的左侧导航栏,选择“数据开发 > 脚本开发”或“数据开发 > 作业开发”。
- 在左侧菜单选择,展开数据连接目录,在数据表下查看对应的列信息。
删除表详情
- 在数据开发主界面的左侧导航栏,选择“数据开发 > 脚本开发”或“数据开发 > 作业开发”,进入“右侧区域”页面。
- 在左侧菜单选择,单击“数据连接”,目录层级展开至数据表的名称,右键单击“删除”。
- 在弹出的“删除数据表”页面,单击“确定”,删除数据表。
参数说明
DLI数据表
参数 | 是否必选 | 说明 |
---|---|---|
基本属性 | ||
表名 | 是 | 数据表的名称。只能包含英文小写字母、数字、“”,不能为纯数字,不能以“ ”开头,且长度为1~63个字符。 |
别名 | 否 | 数据表的别名,只能包含中文字符、英文字母、数字、“”,不能为纯数字,不能以“ ”开头,且长度为1~63个字符。 |
数据连接 | 是 | 选择数据表所属的数据连接。 |
数据库 | 是 | 选择数据表所属的数据库。 |
数据位置 | 是 | 选择数据存储的位置: OBS DLI |
数据格式 | 是 | 选择数据的格式。“数据位置”为“OBS”时,配置该参数。 parquet:支持读取不压缩、snappy压缩、gzip压缩的parquet数据。 csv:支持读取不压缩、gzip压缩的csv数据。l orc:支持读取不压缩、snappy压缩的orc数据。 json:支持读取不压缩、gzip压缩的json数据。 |
路径 | 是 | 选择数据存储的OBS路径。“数据位置”为“OBS”时,配置该参数。 |
表描述 | 否 | 数据表的描述信息。 |
表结构 | ||
列名 | 是 | 填写列名,列名不能重复。 |
类型 | 是 | 选择数据类型。 |
列描述 | 否 | 填写列的描述信息。 |
操作 | 否 | 单击,增加列。 |
DWS数据表
参数 | 是否必选 | 说明 |
---|---|---|
基本属性 | ||
表名 | 是 | 数据表的名称。只能包含英文字母、数字、“”,不能为纯数字,不能以“ ”开头,且长度为1~63个字符。 |
别名 | 否 | 数据表的别名,只能包含中文字符、英文字母、数字、“”,不能为纯数字,不能以“ ”开头,且长度为1~63个字符。 |
数据连接 | 是 | 选择数据表所属的数据连接。 |
数据库 | 是 | 选择数据表所属的数据库。 |
模式 | 是 | 选择数据库的模式。 |
表描述 | 否 | 数据表的描述信息。 |
高级选项 | 否 | 提供以下高级选项: 选择数据表的存储方式 − 行存模式 − 列存模式 选择数据表的压缩级别 − 行存模式:压缩级别的有效值为YES/NO。 − 列存模式:压缩级别的有效值为YES/NO/LOW/MIDDLE/HIGH,还可以配置列存模式同一压缩级别下不同的压缩水平0-3(数值越大,表示同一压缩级别下压缩比越大)。 |
表结构 | ||
列名 | 是 | 填写列名,列名不能重复。 |
数据分类 | 是 | 选择数据类型的类别: 数值类型 货币类型 布尔类型 二进制类型 字符类型 时间类型 几何类型 网络地址类型 位串类型 文本搜索类型 UUID类型 JSON类型 对象标识符类型 |
类型 | 是 | 选择数据类型。 |
列描述 | 否 | 填写列的描述信息。 |
是否建ES索引 | 否 | 单击复选框时,表示需要建立ES索引。建立ES索引时,请同时在“CloudSearch集群名”中选择建立好的CSS集群。如何创建CSS集群,请参见《云搜索服务用户指南》。 |
ES索引数据类型 | 否 | 选择ES索引的数据类型: text keyword date long integer short byte double boolean binary |
操作 | 否 | 单击,增加列。 |
MRS Hive数据表
参数 | 是否必选 | 说明 |
---|---|---|
基本属性 | ||
表名 | 是 | 数据表的名称。只能包含英文小写字母、数字、“”,不能为纯数字,不能以“ ”开头,且长度为1~63个字符。 |
别名 | 否 | 数据表的别名,只能包含中文字符、英文字母、数字、“”,不能为纯数字,不能以“ ”开头,且长度为1~63个字符。 |
数据连接 | 是 | 选择数据表所属的数据连接。 |
数据库 | 是 | 选择数据表所属的数据库。 |
表描述 | 否 | 数据表的描述信息。 |
表结构 | ||
列名 | 是 | 填写列名,列名不能重复。 |
数据分类 | 是 | 选择数据类型的类别: 原始类型 ARRAY MAP STRUCT UNION |
类型 | 是 | 选择数据类型。 |
列描述 | 否 | 填写列的描述信息。 |
操作 | 否 | 单击,增加列。 |