租户
数据湖探索支持多个组织、部门或应用共享使用资源。通过提供一个逻辑实体来统一使用不同资源和服务,这个逻辑实体就是租户。多个不同的租户统称多租户。租户对应公司。一个租户可以创建多个子用户,并可以对不同用户授予不同权限。
项目
各个服务中的一些可以访问的资源集合称为项目。一个账号可以在一个区域下创建多个项目,并基于项目进行授权。不同项目下的资源相互隔离。项目可以是一个部门或者一个项目组。
数据库
数据湖探索中数据库的概念、基本用法与Oracle数据库基本相同,它还是数据湖探索管理权限的基础单元,赋权以数据库为单位。
在数据湖探索中,表和数据库是定义底层数据的元数据容器。表中的元数据让数据湖探索知道数据所在的位置,并指定了数据的结构,例如列名称、数据类型和表名称。数据库是表的逻辑分组。
元数据
元数据(Metadata)是用来定义数据类型的数据。主要是描述数据自身信息,包含源、大小、格式或其它数据特征。数据库字段中,元数据用于诠释数据仓库的内容。
计算资源
数据湖探索服务中的队列即为计算资源,计算资源是使用数据湖探索服务的基础,用户执行的SQL作业和Spark作业都需要使用计算资源。
存储资源
存储资源是数据湖探索服务内部存储的资源,用于存储数据库和数据湖探索表,是向数据湖探索导入数据的必备条件,体现用户数据存储在数据湖探索中的数据量。
SQL作业
在SQL作业编辑器执行的SQL语句、导入数据和导出数据等操作,在系统中对应的执行实体,称之为SQL作业。
Spark作业
Spark作业是指用户通过可视化界面和RESTful API提交的作业,支持提交Spark Core/DataSet/Streaming/MLlib/GraphX等Spark全栈作业。
CU
CU是队列的计价单位。 1CU= 1Core 4GMem。不同规格的队列对应的计算能力不一样,规格越高计算能力越好。
OBS表、数据湖探索表、CloudTable表
不同表类型表示不同的数据存储位置。
• OBS表表示数据存储在OBS服务的桶中。
• 数据湖探索表表示数据存储在本服务内部的表中。
• CloudTable表表示数据储存在CloudTable服务的表中。
可通过数据湖探索创建表,与其他服务的数据进行关联,以此来实现不同数据源的联合查询分析。
常量与变量
环境变量中,常量与变量的区别如下:
• 常量在程序运行过程中,所表示的值是无法被改变的。
• 变量是“可读、可写”,而常量是“只读”的。变量是在程序运行过程中,内部存储的值,随时可以被改变的一段内存地址。比如:int a = 123,这里的a就是一个整型变量。