CTCCL环境变量
CTCCL兼容NCCL环境变量,NCCL环境变量参考:Environment Variables — NCCL 2.20.3 documentation (nvidia.com)。
CTCCL容器已修改环境变量如下:
环境变量 | 说明 | 取值 |
---|---|---|
NCCL_IB_QPS_PER_CONNECTION | 单连接使用的QP数量 | 配置范围1-128,默认值8 |
NCCL_DEBUG | 打印日志级别 | VERSIONWARN(默认值)INFOTRACE |
开启CTCCL自研特性,需要添加如下变量:
环境变量 | 说明 | 取值 |
---|---|---|
CTCCL_IB_RETRY_DISABLE | 开启故障重传机制 | 默认开启 |