全部文章Ta的评论
- 本文介绍在DeepSeek小参数量蒸馏模型部署需求下,如何使用天翼云自研GPU虚拟化技术对单块GPU卡进行切分,实现算力及显存资源的最大利用。c****d2025-02-18710
- Docker 是一个开源的容器化平台,用于简化软件的部署、管理和交付。它通过将应用程序及其依赖项打包到一个可移植的容器中,解决了许多软件开发和运维中的挑战。本文主要讲述Docker镜像的制作和修改,以及Docker常用的几类操作。并附以具体的命令代码,以供读者的参考和学习。c****d2024-08-30840
- 本文探讨了CUDA中数值精度对计算性能和模型规模的影响,特别是在GPU加速计算环境中。文章首先概述了GPU的并行计算能力和深度学习对数值精度的需求,随后介绍了与数值精度相关的基础概念,包括浮点数据的存储结构、高精度数据以及低精度数据的定义。进一步分析了高精度数据类型如double和fp32,以及在AI领域中越来越受到重视的低精度数据类型,如fp16、fp8以及fp4格式。最后对PyTorch框架中的数值精度属性进行了代码验证分析。c****d2024-08-28591
- 详细介绍了大语言模型中常用的解码策略,涵盖了基础解码和高级解码两大类。在基础解码部分,文章阐述了贪心算法、Beam Search和采样等经典方法的原理和特点。在高级解码部分,探讨了一些最新的创新策略,包括投机采样、美杜莎解码和对比解码等。c****d2024-08-091353
共 4 条
- 1
页
没有更多了
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 4 篇文章
文章获得 4 次赞同
文章被浏览 349 次
获得 0 人关注
个人荣誉查看规则