集群
集群指运行高性能计算的节点集合,可以提供单节点不能提供的强大计算能力,拥有高性能、弹性扩展、稳定可靠等优点。
节点
-
登录节点:登录节点需要绑定弹性公网IP,您可通过远程登录该节点、使用命令行操作集群。
-
管控节点:管控节点是用于管理整个集群的节点,能够进行作业调度。
-
计算节点:计算节点用于运行高性能计算作业,计算节点的硬件配置选择是影响高性能计算集群整体性能的关键点。
当前版本仅支持管控节点和计算节点,管控节点兼备登录节点的功能,您需要将管控节点绑定公网IP。
作业
作业指用户提交到高性能计算集群进行高性能计算的基本工作单元,包括Shell脚本、可执行文件等。
用户
-
普通权限组:普通用户只可以进行提交作业、查看作业等操作。
-
sudo权限组:sudo权限组的用户是管理集群的管理员,不仅可以提交作业、查看作业,还可以执行sudo命令。
当前版本仅支持普通权限组。
调度器
调度器指集群上调度作业的软件。目前市面上主流调度器有Slurm、PBS、LSF等,当前版本仅支持Slurm。