前提条件
- 在创建数据连接前,请确保您已创建所要连接的数据湖(如DataArts Studio所支持的数据库、云服务等)。
- 在创建DWS类型的数据连接前,您需要先在DWS服务中创建集群,并且具有KMS密钥的查看权限。
- 在创建MRS HBase、MRS Hive、MRS Kafka、MRS Ranger、MRS Spark、MRS Presto类型的数据连接前,需确保您已创建MRS集群,并且在创建数据链接时已创建选择所需要的组件。
- 在创建RDS类型的数据连接前,请确保您已创建RDS数据库实例。DataArts Studio平台目前仅支持RDS中的MySQL和PostgreSQL数据库引擎。
- 在创建数据连接前,请确保待连接的数据湖与DataArts Studio实例之间网络互通。
- 如果数据湖为云下的数据库,则需要通过公网或者专线打通网络,确保数据源所在的主机可以访问公网,并且防火墙规则已开放连接端口。
- 如果数据湖为云上服务(如DWS、MRS等),则网络互通需满足如下条件:
①DataArts Studio实例(指DataArts Studio实例中的CDM集群)与云上服务处于不同区域的情况下,需要通过公网或者专线打通网络。
②DataArts Studio实例(指DataArts Studio实例中的CDM集群)与云上服务同区域情况下,同虚拟私有云、同子网、同安全组的不同实例默认网络互通;如果同虚拟私有云但是子网或安全组不同,还需配置路由规则及安全组规则,配置路由规则请参见《虚拟私有云》帮助文档有关“添加路由信息”的章节,配置安全组规则请参见《虚拟私有云》帮助文档中有关“ 添加安全组规则”的章节。
③此外,您还必须确保该云服务的实例与DataArts Studio工作空间所属的企业项目必须相同,如果不同,您需要修改工作空间的企业项目。
创建数据连接
- 在DataArts Studio控制台首页,选择对应工作空间的“管理中心”模块,进入管理中心页面。详见下图选择管理中心
- 在管理中心页面,单击“数据连接”,进入数据连接页面。详见下图创建数据连接
- 单击“创建数据连接”,在弹出的对话框中,选择“数据连接类型”为“RDS”,详见下图创建数据连接并参见表RDS数据连接配置相关参数。
说明
不建议使用MySQL(待下线)连接器,推荐使用RDS连接MySQL数据源。
RDS数据连接方式依赖于OBS。如果没有与DataArts Studio同区域的OBS,则不支持RDS数据连接。
RDS连接配置参数详见下图
RDS数据连接详见下表
参数 | 是否必选 | 说明 |
---|---|---|
数据连接名称 | 是 | 数据连接的名称,只能包含英文字母、数字、下划线和中划线,且长度为1~50个字符。 |
标签 | 否 | 标识数据连接的属性。设置标签后,便于统一管理。说明标签的名称,只能包含中文、英文字母、数字和下划线,不能以下划线开头。且长度不能超过100个字符。 |
IP | 是 | RDS的访问地址。 如果为RDS数据源,可以通过RDS管理控制台获取访问地址:1. 根据创建的帐号登录管理控制台。2. 单击“云数据库RDS”,从左侧列表选择实例管理。3. 单击某一个实例名称,进入实例基本信息页面。 在连接信息标签中可以获取到内网地址。 |
端口 | 是 | RDS的访问端口。 如果为RDS数据源,可以通过RDS管理控制台获取访问端口:1. 根据的帐号登录管理控制台。2. 单击“云数据库RDS”,左侧列表选择实例管理。3. 单击某一个实例名称,进入实例基本信息页面。 在连接信息标签中可以获取到数据库端口。 |
驱动程序名称 | 是 | 驱动程序名称:com.mysql.jdbc.Driverorg.postgresql.Driver |
驱动文件路径 | 是 | 驱动文件在OBS上的路径。需要您自行到官网下载.jar格式驱动并上传至OBS中。MySQL驱动:获取地址https://downloads.mysql.com/archives/c-j/,建议5.1.48版本。PostgreSQL驱动:获取地址https://jdbc.postgresql.org/download.html,建议42.1.4版本。说明如果需要更新驱动文件,则需要先在数据集成页面重启CDM集群,然后通过编辑数据连接的方式重新选择新版本驱动,更新驱动才能生效。 |
用户名 | 是 | 数据库的用户名,创建集群的时候,输入的用户名。 |
密码 | 是 | 数据库的访问密码,创建集群的时候,输入的密码。 |
KMS密钥 | 是 | KMS密钥名称。 通过KMS管理控制台获取密钥名称:1. 根据的帐号登录管理控制台。2. 单击“密钥管理服务”,左侧列表选择密钥管理。 在密钥列表可以获取到密钥名称。 |
绑定Agent | 是 | RDS为非全托管服务,DataArts Studio无法直接与非全托管服务进行连接。CDM集群提供了DataArts Studio与非全托管服务通信的代理,所以创建RDS的数据连接时,请选择一个CDM集群。如果没有可用的CDM集群,请先通过数据集成增量包进行创建。CDM集群作为网络代理,必须和RDS网络互通才可以成功创建MRS连接,为确保两者网络互通,CDM集群必须和RDS处于相同的区域、可用区、VPC和子网,安全组规则需允许两者网络互通。 |
- 单击“测试”,测试数据连接的连通性。如果无法连通,数据连接将无法创建。
- 测试通过后,单击“确定”,创建数据连接。
参考
创建RDS类型的数据连接时,需要注意哪些事项?
创建RDS类型的数据连接时,需要绑定由CDM集群提供的代理服务,目前不支持低于1.8.6版本的CDM集群。