searchusermenu
  • 发布文章
  • 消息中心
#紫金DPU
关注该标签
专栏文章 105
视频 0
问答 0
  • 本文属于自研交换机技术领域,尤其涉及一种自研交换机每日编译发布自动化流程的实现。
  • 在开发过程中,对于不熟悉的代码,可以通过调试去加快熟悉程序流程。同时对于某些容易复现的内存被踩问题,也可以通过调试快速定位root cause根因。 其中X86和ARM CPU都支持debug exception,便可以利用perf工具启用。
  • FAUCET是一个基于SDN(Software-Defined Networking)理念的开放源代码网络流量控制器,由新西兰研究与教育先进网络(REANNZ)开发并维护。它的设计目标是简化和加速SDN的部署,提供了一个强大且可扩展的平台,用于实验和生产环境。 FAUCET的核心是将传统路由器的功能转移到软件中,使得网络管理者可以更灵活地控制数据包的流向,实现动态的策略调整。它兼容OpenFlow 1.3协议,并支持多租户、流表统计和安全功能,如DoS攻击防护。 本教程演示了Open vSwitch如何使用通用OpenFlow控制器,使用Faucet控制器作为入门的简单方法。它使用Open vSwitch的“主”分支和Faucet的1.6.15版本进行了测试。它不使用OVS或Faucet中的高级或最近添加的功能,因此这两个软件的其他版本可能同样运行良好。
  • 从代码角度分析异步事件的生成过程,阐述不同事件使用不同接口上送异步事件的过程。
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA;
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA
  • 在过去的二十年中,计算引擎的游戏一直是尝试将尽可能多的内核和附加功能封装到一个插槽中,并使每单位功耗和散热的整体系统性价比下降。
  • 智能网卡存储业务验证过程中,从host侧发送到soc侧的IO读写存储报文,在soc侧需要对IO读写报文进行解析并响应,如果是blk write命令,需要回复blk cpl完成响应,如果是blk read命令,需要返回读数据与blk cpl响应。
  • 本文介绍了tftpd-hpa的使用场景,安装和使用
  • 现有FPGA的AI加速技术往往使用单卡方案实现某个模型的加速,或者使用FPGA集群实现模型的分布式推理,但是没有更细力度的加速方案。单卡和集群的方案容易造成功能固化,通用性不够,同时资源消耗大,很难实现资源共享。本文考虑到AI中常用算法中的基本计算单元,构建常用的算子,比如卷积算子、浮点累加器算子等等,可以实现更细粒度的功能整合。同时由于基于PCIe SR-IOV技术,实现vf级的算子动态调度,进一步增加资源的灵活度。
  • 项目源代码在git库上的管理方法,确保做到版本功能正确和使用便捷兼容。
  • GIC400硬件及使用
  • NSDI 2023最新论文 SRNIC: A Scalable Architecture for RDMA NICs分析,由港科大陈凯教授团队和字节跳动RDMA郭传雄团队合作论文,主要提出了一种基于RDMA的可扩展架构,解决RDMA的连接可扩展性问题
  • 本文详细阐述去堆叠技术的原理和实现方式,以及去堆叠和堆叠对比的优劣势。
  • linux 下动态库与静态库的使用以及遇到的一些问题记录
  • 本文介绍了命令行开发工具Klish及其在自研交换机管理框架中的应用
  • 介绍Prometheus的基本概念,以及Ubuntu系统搭建Prometheus环境步骤。
  • 在云计算环境中,存在多种不同类型的流量,常见的有网络、存储、计算流量,为了保障不同流量的服务QoS,会对物理带宽进行分配管理。本文介绍了一种高效带宽利用率的管理方案。
  • UVM积分板(scoreboard)是UVM验证平台必不可少的验证组件,用来检查待测设计(DUT)/参考模型(REF)的行为。UVM不提供积分板的实现方式,只提供uvm_scoreboard基类扩展,具体实现方式留给实现者。uvm_syoscb开源积分板,可以满足多种比较方法与模型,比较方法包括乱序比较(out of order)、顺序比较(in order)、按产生者顺序比较(in order by producer);模型包括设计模型(RTL,门级)、定时/非定时参考模型(SystemVerilog、SystemC、Python)以及物理设备。uvm_syoscb以其高重用性、高适配性,可以快速在UVM验证平台集成使用,加快验证平台的开发与测试,提高验证效率。本文详细介绍如何在UVM验证平台中集成开源积分板uvm_syoscb。
  • 安装rpm包,除了使用rpm包源外,有时后需要自己搜索安装包,通过本文能学会自己搜索需要的RPM包。
  • UM(Unified Memory)机制和GDR(GPU Direct RDMA)是CUDA中两项比较重要的特性。 早期写CUDA程序时,CPU的地址空间和GPU的地址空间是分开的,需要频繁的使用cudaMemcpy频繁地将CPU memory和GPU memory之间地内容来回拷贝。 UM机制使得程序员能够使得指针统一访问全局的地址空间,而不用管指针所指向的内容具体是在CPU的memory上还是GPU的memory上,省去了CPU和GPU之间显式地数据拷贝。 而GDR则允许程序员在编写RDMA相关程序时直接注册GPU上的memory,然后网卡可以直接将GPU中的memory内容DMA到网卡上,不用再将GPU memory中的内容拷贝到CPU的memory中。
  • cpp-yaml可以应用于各种需要解析YAML文件的情况,如配置文件、数据交换格式、用户设置等。使用cpp-yaml可以让C++应用程序更加灵活,易于配置和管理。
  • 不管你是否身处 ICT 行业,这两年有一个词你肯定听说过,那就是 DPU 。 作为一个全新兴起的科技概念,DPU 正在以惊人的速度崛起,成为整个行业甚至整个社会的关注重点。尤其是投资领域,对 DPU 简直是趋之如骛,将其视为未来颠覆行业的潜力技术。 究竟什么是 DPU ?它和我们熟悉的 CPU 、 GPU 有什么区别?
  • 简要介绍Meter 实现中的srTCM和trTCM实现逻辑
  • 点击加载更多
#紫金DPU
关注该标签
专栏文章 105
视频 0
问答 0
  • 本文属于自研交换机技术领域,尤其涉及一种自研交换机每日编译发布自动化流程的实现。
  • 在开发过程中,对于不熟悉的代码,可以通过调试去加快熟悉程序流程。同时对于某些容易复现的内存被踩问题,也可以通过调试快速定位root cause根因。 其中X86和ARM CPU都支持debug exception,便可以利用perf工具启用。
  • FAUCET是一个基于SDN(Software-Defined Networking)理念的开放源代码网络流量控制器,由新西兰研究与教育先进网络(REANNZ)开发并维护。它的设计目标是简化和加速SDN的部署,提供了一个强大且可扩展的平台,用于实验和生产环境。 FAUCET的核心是将传统路由器的功能转移到软件中,使得网络管理者可以更灵活地控制数据包的流向,实现动态的策略调整。它兼容OpenFlow 1.3协议,并支持多租户、流表统计和安全功能,如DoS攻击防护。 本教程演示了Open vSwitch如何使用通用OpenFlow控制器,使用Faucet控制器作为入门的简单方法。它使用Open vSwitch的“主”分支和Faucet的1.6.15版本进行了测试。它不使用OVS或Faucet中的高级或最近添加的功能,因此这两个软件的其他版本可能同样运行良好。
  • 从代码角度分析异步事件的生成过程,阐述不同事件使用不同接口上送异步事件的过程。
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA;
  • virtio_blk;存储卸载;智能网卡;DPU;FPGA
  • 在过去的二十年中,计算引擎的游戏一直是尝试将尽可能多的内核和附加功能封装到一个插槽中,并使每单位功耗和散热的整体系统性价比下降。
  • 智能网卡存储业务验证过程中,从host侧发送到soc侧的IO读写存储报文,在soc侧需要对IO读写报文进行解析并响应,如果是blk write命令,需要回复blk cpl完成响应,如果是blk read命令,需要返回读数据与blk cpl响应。
  • 本文介绍了tftpd-hpa的使用场景,安装和使用
  • 现有FPGA的AI加速技术往往使用单卡方案实现某个模型的加速,或者使用FPGA集群实现模型的分布式推理,但是没有更细力度的加速方案。单卡和集群的方案容易造成功能固化,通用性不够,同时资源消耗大,很难实现资源共享。本文考虑到AI中常用算法中的基本计算单元,构建常用的算子,比如卷积算子、浮点累加器算子等等,可以实现更细粒度的功能整合。同时由于基于PCIe SR-IOV技术,实现vf级的算子动态调度,进一步增加资源的灵活度。
  • 项目源代码在git库上的管理方法,确保做到版本功能正确和使用便捷兼容。
  • GIC400硬件及使用
  • NSDI 2023最新论文 SRNIC: A Scalable Architecture for RDMA NICs分析,由港科大陈凯教授团队和字节跳动RDMA郭传雄团队合作论文,主要提出了一种基于RDMA的可扩展架构,解决RDMA的连接可扩展性问题
  • 本文详细阐述去堆叠技术的原理和实现方式,以及去堆叠和堆叠对比的优劣势。
  • linux 下动态库与静态库的使用以及遇到的一些问题记录
  • 本文介绍了命令行开发工具Klish及其在自研交换机管理框架中的应用
  • 介绍Prometheus的基本概念,以及Ubuntu系统搭建Prometheus环境步骤。
  • 在云计算环境中,存在多种不同类型的流量,常见的有网络、存储、计算流量,为了保障不同流量的服务QoS,会对物理带宽进行分配管理。本文介绍了一种高效带宽利用率的管理方案。
  • UVM积分板(scoreboard)是UVM验证平台必不可少的验证组件,用来检查待测设计(DUT)/参考模型(REF)的行为。UVM不提供积分板的实现方式,只提供uvm_scoreboard基类扩展,具体实现方式留给实现者。uvm_syoscb开源积分板,可以满足多种比较方法与模型,比较方法包括乱序比较(out of order)、顺序比较(in order)、按产生者顺序比较(in order by producer);模型包括设计模型(RTL,门级)、定时/非定时参考模型(SystemVerilog、SystemC、Python)以及物理设备。uvm_syoscb以其高重用性、高适配性,可以快速在UVM验证平台集成使用,加快验证平台的开发与测试,提高验证效率。本文详细介绍如何在UVM验证平台中集成开源积分板uvm_syoscb。
  • 安装rpm包,除了使用rpm包源外,有时后需要自己搜索安装包,通过本文能学会自己搜索需要的RPM包。
  • UM(Unified Memory)机制和GDR(GPU Direct RDMA)是CUDA中两项比较重要的特性。 早期写CUDA程序时,CPU的地址空间和GPU的地址空间是分开的,需要频繁的使用cudaMemcpy频繁地将CPU memory和GPU memory之间地内容来回拷贝。 UM机制使得程序员能够使得指针统一访问全局的地址空间,而不用管指针所指向的内容具体是在CPU的memory上还是GPU的memory上,省去了CPU和GPU之间显式地数据拷贝。 而GDR则允许程序员在编写RDMA相关程序时直接注册GPU上的memory,然后网卡可以直接将GPU中的memory内容DMA到网卡上,不用再将GPU memory中的内容拷贝到CPU的memory中。
  • cpp-yaml可以应用于各种需要解析YAML文件的情况,如配置文件、数据交换格式、用户设置等。使用cpp-yaml可以让C++应用程序更加灵活,易于配置和管理。
  • 不管你是否身处 ICT 行业,这两年有一个词你肯定听说过,那就是 DPU 。 作为一个全新兴起的科技概念,DPU 正在以惊人的速度崛起,成为整个行业甚至整个社会的关注重点。尤其是投资领域,对 DPU 简直是趋之如骛,将其视为未来颠覆行业的潜力技术。 究竟什么是 DPU ?它和我们熟悉的 CPU 、 GPU 有什么区别?
  • 简要介绍Meter 实现中的srTCM和trTCM实现逻辑
  • 点击加载更多