操作步骤
- 登录云骁智算控制台。
- 进入对应工作空间。
- 在左侧导航栏中,选择“训练>自定义训练”进入训练任务列表。
- 在训练任务列表中,单击训练任务名称,进入自定义训练任务详情页。
- 在任务详情页面可查看任务信息和运行情况。
任务信息
可查看任务的基本信息、环境、资源、存储配置等信息。此处显示最近一次编辑后的任务信息。
运行情况
- 查看每一次训练任务运行记录的运行ID、创建来源、所属队列、状态、运行时长、训练框架、开始时间信息。训练任务状态详见训练任务生命周期。
- 查看运行记录的详情,包括运行记录的基本信息、实例、日志、TimeLine和监控。
运行记录详情 | 说明 |
---|---|
基本信息 | 查看该运行记录的任务名称、ID、描述、所属队列、镜像、存储、训练框架、启动命令、环境变量、资源配置、Tensorboard、运行人等信息。 |
实例 | 查看该运行记录下占用的实例信息,包括角色、实例名称、状态、重启次数、实例IP、Host IP、运行时长、开始时间、查看日志等。 |
日志 | 选择实例,查看对应实例的标准输出日志。 注意:运行记录停止后日志消失,请在停止前保存所需日志数据。如果需要长期查看日志数据,需在存储内单独建立目录保存日志数据。 |
TimeLine | 查看该运行记录的时间线。 |
监控 | 选择实例,查看对应实例的监控信息。 |
- 对运行记录进行停止、删除操作。停止和删除操作后训练任务释放使用的资源,但停止操作保存运行记录。