searchusermenu
  • 发布文章
  • 消息中心
h****n
有目共赏
3 文章|3 获赞|4 粉丝|4469 浏览
社区专栏视频问答关注
全部文章Ta的评论
  • UM(Unified Memory)机制和GDR(GPU Direct RDMA)是CUDA中两项比较重要的特性。 早期写CUDA程序时,CPU的地址空间和GPU的地址空间是分开的,需要频繁的使用cudaMemcpy频繁地将CPU memory和GPU memory之间地内容来回拷贝。 UM机制使得程序员能够使得指针统一访问全局的地址空间,而不用管指针所指向的内容具体是在CPU的memory上还是GPU的memory上,省去了CPU和GPU之间显式地数据拷贝。 而GDR则允许程序员在编写RDMA相关程序时直接注册GPU上的memory,然后网卡可以直接将GPU中的memory内容DMA到网卡上,不用再将GPU memory中的内容拷贝到CPU的memory中。
    h****n
    2023-09-26
    453
    1
  • NCCL(Nvidia communication collective library)是一个Nvidia开发的集合通信库,支持在单节点或多节点之间的GPU环境下的集合通信操作,提供了基本的集合通信操作原语(send,recv,broadcast,scatter,gather,allreduce等各种操作)。
    h****n
    2023-09-25
    3705
    1
  • 集合通信是大规模分布式机器学习和分布式训练中的重要中间件。集合通信能够使得集群中一个进程组内的多个进程之间相互通信。集合通信最早起源于MPI(Message Passing Interface, MPI),用于多CPU集群内进程之间的消息互通。随着机器学习和深度学习的发展,对算力的要求不断提高,GPU,DPU,NPU等各种异构硬件也在不断发展,集合通信也逐渐开始应用于异构计算平台下,比如Nvidia的NCCL,阿里的ACCL,华为的HCCL。
    h****n
    2023-09-25
    311
    1
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 3 篇文章
文章获得 3 次赞同
文章被浏览 4469 次
获得 4 人关注
个人荣誉查看规则
有目共赏