CTCCL测试
在NVIDIA平台上,可以使用NCCL-Test工具测试CTCCL的性能。
-
测试代码下载路径:
https://github.com/NVIDIA/nccl-tests.git
-
编译:
make MPI=1 MPI_HOME={{MPI路径}} CUDA_HOME={{CUDA路径}} NCCL_HOME={{NCCL路径}} -j 40
-
使用 mpirun 启动训练进程:
mpirun --allow-run-as-root -np 2 -H IP1,IP2 -x NCCL_IB_HCA=mlx5_2 -x NCCL_IB_QPS_PER_CONNECTION=8 all_reduce_perf -b 8 -e 1G -f 2 -g 8