作业中源连接为配置Oracle数据库连接,源端作业参数如下表所示。
表 Oracle作为源端时的作业参数
参数类型 | 参数名 | 说明 | 取值样例 |
---|---|---|---|
基本参数 | 使用SQL语句 | 导出关系型数据库的数据时,您可以选择使用自定义SQL语句导出。 | 否 |
SQL语句 | “使用SQL语句”选择“是”时,您可以在这里输入自定义的SQL语句,CDM将根据该语句导出数据。 说明 SQL语句只能查询数据,支持join和嵌套写法,但不能有多条查询语句,比如select * from table a; select * from table b。 不支持with语句。 不支持注释 ,比如"--",“/*”。 不支持增删改操作,包括但不限于以下操作: load data delete from alter table create table drop table l into outfile |
select id,name from sqoop.user; | |
模式或表空间 | “使用SQL语句”选择“否”时,显示该参数,表示待抽取数据的模式或表空间名称。单击输入框后面的按钮可进入模式选择界面,用户也可以直接输入模式或表空间名称。 如果选择界面没有待选择的模式或表空间,请确认对应连接里的帐号是否有元数据查询的权限。 说明 该参数支持配置通配符( * ),实现导出以某一前缀开头或者以某一后缀结尾的所有数据库。例如:表示导出所有以“SCHEMA”开头的数据库。 表示导出所有以“SCHEMA”结尾的数据库。 表示数据库名称中只要有“SCHEMA”字符串,就全部导出。 |
SCHEMA_E | |
表名 | “使用SQL语句”选择“否”时,显示该参数,表示要抽取的表名。单击输入框后面的按钮可进入表的选择界面,用户也可以直接输入表名称。 如果选择界面没有待选择的表,请确认表是否已经创建,或者对应连接里的帐号是否有元数据查询的权限。 该参数支持配置为时间宏变量,且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合,可以实现定期同步新增数据。 说明 表名支持配置通配符( * ),实现导出以某一前缀开头或者以某一后缀结尾的所有表(要求表中的字段个数和类型都一样)。例如: 表示导出所有以“table”开头的表。 表示导出所有以“table”结尾的表。 表示表名中只要有“table”字符串,就全部导出。 |
table | |
高级属性 | 抽取分区字段 | “使用SQL语句”选择“否”时,显示该参数,表示抽取数据时使用该字段进行数据切分,CDM依据此字段将作业分割为多个任务并发执行。一般使用数据均匀分布的字段,例如以自然增长的序号字段作为分区字段。 单击输入框后面的按钮可进入字段选择界面,用户也可以直接输入抽取分区字段名。 说明 抽取分区字段支持CHAR、VARCHAR、LONGVARCHAR、TINYINT、SMALLINT、INTEGER、BIGINT、REAL、FLOAT、DOUBLE、NUMERIC、DECIMAL、BIT、BOOLEAN、DATE、TIME、TIMESTAMP类型,建议该字段带有索引。 当选择CHAR、VARCHAR、LONGVARCHAR抽取分区字段类型时,字段值不支持ASCII字符代码表之外的字符,不支持中文字符。 |
id |
Where子句 | “使用SQL语句”选择“否”时,显示该参数,表示配置抽取范围的Where子句,不配置时抽取整表。 该参数支持配置为时间宏变量,实现抽取指定日期的数据。 | DS='${dateformat(yyyy-MM-dd,-1,DAY)}' | |
分区字段是否允许空值 | 是否允许分区字段包含空值。 | 是 | |
按表分区抽取 | 从Oracle导出数据时,支持从分区表的各个分区并行抽取数据。启用该功能时,可以通过下面的“表分区”参数指定具体的Oracle表分区。 该功能不支持非分区表。 数据库用户需要具有系统视图dba_tab_partitions和dba_tab_subpartitions的SELECT权限。 |
否 | |
表分区 | 输入需要迁移数据的Oracle表分区,多个分区以&分隔,不填则迁移所有分区。 如果有子分区,以“分区.子分区”的格式填写,例如“P2.SUBP1”。 |
P0&P1&P2.SUBP1&P2.SUBP3 | |
作业拆分字段 | 使用该字段将作业拆分为多个子作业并发执行。 | - | |
拆分字段最小值 | 表示抽取数据时“作业拆分字段”的最小值。 | - | |
拆分字段最大值 | 表示抽取数据时“作业拆分字段”的最大值。 | - | |
子作业个数 | 根据“作业拆分字段”的最小值和最大值限定的数据范围,将作业拆分为多少个子作业执行。 | - |
说明Oracle作为源端时,如果未配置“抽取分区字段”或者“按表分区抽取”这2个参数,CDM自动使用ROWID进行数据分区。