全部文章Ta的评论
- 该章节包含DDP的一些知识。 计算机的算法都是基于一个一个函数操作组合在一起得到的,那么我们在讲解分布式算法之前,我们必须先了解一下组成这种算法所应用于硬件的函数操作——集合通信的基本概念1****m2024-12-11300
- 在人工智能的浪潮中,视觉图像生成技术以其独特的魅力和广泛的应用前景,成为研究和应用的热点。这项技术不仅推动了艺术创作和设计领域的革新,也为科学研究和数据分析提供了新的视角。1****m2024-08-07380
- 1****m2024-04-191390
- 1****m2023-06-121250
- DeepSpeed-Chat是微软最新公布的一套工具,用于训练类ChatGPT模型。该工具基于微软的大模型训练工具DeepSpeed,使用它可以非常简单高效地训练自己的ChatGPT。1****m2023-06-121530
- 1****m2023-06-12870
- 我们宣布开发了GPT-4,这是一个大规模的多模型模型,可以接受图像和文本输入,并生成文本输出。虽然在许多实际场景中不如人类能力强,但在各种专业和学术基准测试中,GPT-4表现出与人类水平相当的性能,包括在模拟的律师考试中获得了约前10%的考生得分。 GPT-4是一个基于Transformer的模型,预先训练以预测文档中的下一个标记。后训练对齐过程可提高其事实准确性和符合所需行为的表现。该项目的核心组件是开发基础架构和优化方法,这些方法在各种规模下表现出可预测性。这使我们能够根据使用的计算资源不到GPT-4的1/1,000来准确预测GPT-4的某些方面的性能。1****m2023-05-06240
- Swin Transformer 的全称为 "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows",是由微软亚洲研究院的研究团队于2021年提出的一种图像分类模型。Swin Transformer 采用了基于 Transformer 的架构,具有更小的计算和内存需求,同时在 ImageNet 数据集上取得了最先进的性能。1****m2023-04-20750
共 11 条
- 1
页
没有更多了
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 11 篇文章
文章获得 0 次赞同
文章被浏览 846 次
获得 0 人关注
个人荣誉查看规则