searchusermenu
  • 发布文章
  • 消息中心
Siqin
5 文章|0 获赞|0 粉丝|147 浏览
社区专栏视频问答关注
全部文章Ta的评论
  • 随着人工智能技术的快速发展,多模态(Multimodal)大模型已经成为连接不同数据形式的关键桥梁,使得机器能够更好地理解复杂的真实世界场景。在过去半年里,该领域取得了许多令人瞩目的成就,从模型架构创新到应用场景拓展。
    Siqin
    2024-12-13
    0
    0
  • 跨模态图像-文本检索(Image-text Retrieval,ITR)是根据给定的用户在一种模态中的表达,从另一模态中检索出相关样本,通常包括两个子任务:图像-文本(i2t)和文本-图像(t2i)检索。ITR在搜索领域具有广泛的应用前景,是一个有价值的研究课题。由于语言和视觉的深度模型的繁荣,在过去的几年里见证了ITR的巨大成功。例如,伴随着BERT的兴起,基于transformer的跨模态预训练范式获得了发展,其预训练-微调的形式被扩展到下游的ITR任务中,加速了其发展。
    Siqin
    2024-12-13
    0
    0
  • 在现代办公和数据处理的日常工作中,PowerPoint(PPT)文件是展示和汇报的重要工具。然而,当需要生成大量报告或动态更新内容时,手动操作PPT变得低效和乏味。幸运的是,Python提供了一个强大的库——python-pptx,可以帮助我们通过代码自动化生成、修改和美化PPT,极大提升工作效率。
    Siqin
    2024-09-20
    30
    0
  • 在生成式AI领域,InstructPix2Pix 是一项颠覆性的技术,它通过结合图像编辑与自然语言处理,让用户通过简单的文字指令快速修改图像。这种方法不需要深入的图像处理专业知识,而是将图像编辑变得更为直观和易于操作,特别适用于没有图像编辑经验的用户。
    Siqin
    2024-09-20
    33
    0
  • 随着人工智能技术的不断发展,多模态算法在学术研究和实际应用中越来越受到关注。多模态算法是指能够处理和融合多种类型数据(如图像、文本、音频等)的算法。它们在自然语言处理、计算机视觉、语音识别等领域都表现出强大的能力。本文将介绍近期多模态SOTA(State of the Art)模型的进展,并探讨其在实际应用中的潜力。
    Siqin
    2024-05-29
    84
    0
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 5 篇文章
文章获得 0 次赞同
文章被浏览 147 次
获得 0 人关注
个人荣誉查看规则
暂未获得荣誉