searchusermenu
  • 发布文章
  • 消息中心
1****m
初出茅庐
11 文章|0 获赞|0 粉丝|846 浏览
社区专栏视频问答关注
全部文章Ta的评论
  • 该章节包含DDP的一些知识。 计算机的算法都是基于一个一个函数操作组合在一起得到的,那么我们在讲解分布式算法之前,我们必须先了解一下组成这种算法所应用于硬件的函数操作——集合通信的基本概念
    1****m
    2024-12-11
    30
    0
  • 在人工智能的浪潮中,视觉图像生成技术以其独特的魅力和广泛的应用前景,成为研究和应用的热点。这项技术不仅推动了艺术创作和设计领域的革新,也为科学研究和数据分析提供了新的视角。
    1****m
    2024-08-07
    38
    0
  • 论文《Vision INstruction Tuning》提出的端到端训练的多模态模型。作者使用 GPT-4 生成的指令跟随数据微调 LLaVA 可以达到比较惊艳的效果。
    1****m
    2024-07-18
    38
    0
  • 昇腾llama2-70b模型spike问题验证
    1****m
    2024-04-19
    139
    0
  • Visual Instruction Tuning(可视化指令)
    1****m
    2023-06-12
    125
    0
  • BPE算法(Byte Pair Encoding),其目的是「使用一些子词来编码数据」。该方法已经成为了BERT等模型标准的数据预处理处理方式。
    1****m
    2023-06-12
    39
    0
  • DeepSpeed-Chat是微软最新公布的一套工具,用于训练类ChatGPT模型。该工具基于微软的大模型训练工具DeepSpeed,使用它可以非常简单高效地训练自己的ChatGPT。
    1****m
    2023-06-12
    153
    0
  • Deepspeed-chat训练指标以及代码解析
    1****m
    2023-06-12
    87
    0
  • 多模态机器学习,英⽂全称MultiModal Machine Learning(MMML) 模态(modal)是事情经历和发⽣的⽅式,我们⽣活在⼀个由多种模态(Multimodal)信息构成的世界,包括视觉信息、听觉信息、⽂本信息、嗅觉信息等等,当研究的问题或者数据集包含多种这样的模态信息时我们称之为多模态问题,研究多模态问题是推动⼈⼯智能更好的了解和认知我们周围世界的关键。
    1****m
    2023-06-12
    98
    0
  • 我们宣布开发了GPT-4,这是一个大规模的多模型模型,可以接受图像和文本输入,并生成文本输出。虽然在许多实际场景中不如人类能力强,但在各种专业和学术基准测试中,GPT-4表现出与人类水平相当的性能,包括在模拟的律师考试中获得了约前10%的考生得分。 GPT-4是一个基于Transformer的模型,预先训练以预测文档中的下一个标记。后训练对齐过程可提高其事实准确性和符合所需行为的表现。该项目的核心组件是开发基础架构和优化方法,这些方法在各种规模下表现出可预测性。这使我们能够根据使用的计算资源不到GPT-4的1/1,000来准确预测GPT-4的某些方面的性能。
    1****m
    2023-05-06
    24
    0
  • Swin Transformer 的全称为 "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows",是由微软亚洲研究院的研究团队于2021年提出的一种图像分类模型。Swin Transformer 采用了基于 Transformer 的架构,具有更小的计算和内存需求,同时在 ImageNet 数据集上取得了最先进的性能。
    1****m
    2023-04-20
    75
    0
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 11 篇文章
文章获得 0 次赞同
文章被浏览 846 次
获得 0 人关注
个人荣誉查看规则
初出茅庐