9****m-作者主页-天翼云开发者社区

全部文章Ta的评论

InternVL 1.5 论文解读
介绍了InternVL 1.5，一种开源的多模态大型语言模型（MLLM），旨在缩小开源与专有商业模型在多模态理解能力上的差距。通过集成强大的视觉编码器、采用动态高分辨率策略以及利用高质量的双语数据集，InternVL 1.5在各种基准测试中展示了强大的性能。
AI
9****m
2024-08-30
42
0
sora文生视频技术解析
sora可以说是现在文生视频领域中效果最好的模型了，但OpenAI并未开源sora的全部技术，只是在官网上公开了一篇相关的技术文档，根据技术文档我们可以从中可以窥探一二，下面的内容就是根据技术文档来解析的。
AI
9****m
2024-06-26
107
0
LoRA技术解析：大语言模型的高效微调之道
在人工智能的浪潮中，大语言模型如GPT-3正变得越来越强大，它们能做的事情让人惊叹。但这些模型的规模也让人望而却步——高达数十亿甚至数千亿的参数量，让每一次的微调都显得既昂贵又耗时。不过，好消息是，LoRA技术的出现，让我们看到了解决这一问题的希望。
AI
9****m
2024-05-07
102
0
ViT:用transformer做大规模的图像识别
transformer大家都知道，在nlp领域已经用的很成熟了，基于此发展出了GPT和BERT两种方式的预训练语言模型，为NLP各项下游任务带来了显著的性能提升。那transformer这么有效好用的方法是否适用于cv领域呢？答案是肯定的，ViT将标准的transformer结构运用到图像识别任务上取得了很好的性能，并证明了在大量数据进行预训练后，再迁移到中小型数据集（ImageNet, CIFAR-100, VTAB等），ViT能够取得和最高水平卷积神经网络类似的结果，同时大幅减少训练中的计算资源消耗。
AI
9****m
2023-09-27
101
0
多模态文生图算法：模型评价指标
生成模型在自然语言处理、图像生成等领域中得到了广泛应用。然而，由于其基于概率模型，难以保持客观性，因此需要使用一些技术来弥补不足。生成模型的评估是一个复杂的问题，需要综合考虑多个因素。虽然目前尚未就应使用哪些指标达成共识。Borji (2018)进行了广泛比较，下面是当前研究中最广泛使用的几种方法。
AI
9****m
2023-06-30
1422
0
从0到1实践MLPerf——一个开源的AI性能评估基准
MLPerf是一套用于衡量机器学习软硬件性能的通用基准，主要用来测量训练和推理不同神经网络所需要的时间。MLPerf包含了不同领域的Benchmark子项，主要包括图像分类、目标检测、翻译、推荐、语音识别、情感分析以及强化学习。
AI
9****m
2023-05-08
3617
1
CLIP:一种基于对比学习的图像-文本多模态模型
CLIP是一种新的机器学习方法，它可以同时理解图像和文本。CLIP是用对比学习的方式来预训练一个能够同时处理图像和文本的模型。CLIP可以用自然语言来分类图像，用图像来生成文本描述，用文本来检索图像等等。CLIP只需要一个简单的线性分类器或者最近邻搜索就可以完成这些任务，不需要任何额外的训练或者微调。下面将介绍CLIP的方法，以及优势和局限性，并给出一些后续有意思的应用工作。
AI
9****m
2023-05-12
2166
0

共 7 条前往

页

没有更多了

个人简介

暂未填写公司和职务

暂未填写个人简介

暂未填写技能专长

暂未填写毕业院校和专业

个人成就

共发表过 7 篇文章

文章获得 1 次赞同

文章被浏览 7557 次

获得 1 人关注

个人荣誉查看规则

有目共赏

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云