操作场景
使用DLI访问其他数据源的数据前,首先要通过建立增强型跨源连接打通DLI和数据源之间的网络,DLI才能够访问、导入、查询、分析其他数据源的数据。
例如:DLI连接MRS、RDS、CSS、Kafka、DWS时,需要打通DLI和对应数据源VPC之间的网络,才能实现数据互通。
本节操作介绍在控制台创建增强型跨源连接的操作步骤。
约束和限制
- DLI提供的default队列不支持创建跨源连接。
- Flink作业访问DIS,OBS和SMN数据源,无需创建跨源连接,可以直接访问。
- 增强型跨源连接需要使用VPC、子网、路由、对等连接功能,因此需要获得VPC(虚拟私有云)的VPC Administrator权限。
- 使用DLI增强型跨源时,弹性资源池/队列的网段与数据源网段不能重合。
- 访问跨源表需要使用已经创建跨源连接的队列。
- 跨源表不支持Preview预览功能。
- 检测跨源连接的连通性时对IP约束限制如下:
−IP必须为合法的IP地址,用“.”分隔的4个十进制数,范围是0-255。
−测试时IP地址后可选择添加端口,用":"隔开,端口最大限制5位,端口范围:0~65535。
例如192.168.xx.xx或者192.168.xx.xx:8181。
- 检测跨源连接的连通性时对域名约束限制如下:
−域名的限制长度为1到255的字符串,并且组成必须是字母、数字、下划线或者短横线。
−域名的顶级域名至少包含两个及以上的字母,例如.com,.net,.cn等。
−测试时域名后可选择添加端口,用":"隔开,端口最大限制为5位,端口范围:0~65535。
例如example.com:8080。
操作流程
创建增强型跨源连接操作流程
前提条件
- 已创建弹性资源池/队列用于绑定跨源连接。
- 已获取外部数据源的虚拟私有云、子网、内网IP、端口和安全组信息。
- 外部数据源的安全组已放通弹性资源池/队列的网段。
操作步骤
创建增强型跨源连接
- 登录DLI管理控制台。
- 在左侧导航栏中,选择“跨源管理 > 增强型跨源 ”。
- 选择“增强型跨源”,单击“创建”。
配置增强型跨源连接信息,详细参数介绍请参见下表。
参数说明
参数 | 参数说明 |
---|---|
连接名称 | 所创建的跨源连接名称。 名称只能包含数字、英文字母、下划线。不能为空。 输入长度不能超过64个字符。 |
虚拟私有云 | 数据源所使用的虚拟私有云。 |
子网 | 数据源所使用的子网。 |
主机信息 | 可选参数,用于配置主机的IP与域名的映射关系,在作业配置时只需使用配置的域名即可访问对应的主机。 例如:访问MRS的HBase集群时需要配置Zookeeper实例的主机名(即域名)与对应的IP地址。每行填写一条记录,填写格式为:“IP主机名/域名”。 示例: 192.168.0.22 node-masterxxx1.1com 192.168.0.23 node-masterxxx2.1com |
- 单击“确定”,创建增强型跨源连接。
创建完成后,增强型跨源连接的链接状态显示“已激活”,代表该链接创建成功。
数据源所在安全组放通弹性资源池的网段
- 在DLI管理控制台,获取弹性资源池/队列的网段。
单击“资源管理 > 队列管理”,选择运行作业的队列,单击队列名称旁的按钮,获取队列的网段信息。
- 登录VPC控制台。找到数据源所在的VPC。
- 查找安全组名称,在“弹性网卡 > 更多 > 更改安全组”中可以查到所属安全组。
- 在左侧导航树选择“访问控制 > 安全组”。
- 单击外部数据源所属的安全组名称,进入安全组详情界面。
- 在“入方向规则”页签中添加放通队列网段的规则。
详细的入方向规则参数说明请参考下表。
入方向规则参数说明
参数 | 说明 | 取值样例 |
---|---|---|
优先级 | 安全组规则优先级。 优先级可选范围为1-100,默认值为1,即最高优先级。 优先级数字越小,规则优先级级别越高。 |
1 |
策略 | 安全组规则策略。 | 允许 |
协议端口 | 网络协议。目前支持“All”、“TCP”、“UDP”、“ICMP”和“GRE”等协议。 端口:允许远端地址访问指定端口,取值范围为:1~65535。 |
本例中选择TCP协议,端口值不填或者填写为数据源的端口。 |
类型 | IP地址类型。 | IPV4 |
源地址 | 源地址用于放通来自IP地址或另一安全组内的实例的访问。 | 本例填写获取的队列网段。 |
描述 | 安全组规则的描述信息,非必填项。 | _ |
测试DLI队列与数据源的连通性
- 获取数据源的私有内网IP和端口。
以RDS数据源为例:在RDS控制台“实例管理”页面,单击对应实例名称,查看“连接信息”>“内网地址”,即可获取RDS内网地址。查看“连接信息”>“数据库端口”,获取RDS数据库实例端口。
- 在DLI管理控制台,单击“资源管理 > 队列管理”。
- 选择增强型跨源所绑定的队列,单击操作列“更多 > 测试地址连通性”。
- 输入数据源连接地址和端口,测试网络连通性。
格式: IP: 端口
注意测试连接前,请确保外部数据源的安全组已放通队列的网段。