全部文章Ta的评论
- 预训练的LLM在特定领域或任务上的专业技能仍有待提升。为了弥补这一不足,微调技术应运而生。本文将重点介绍几种低成本的LLM微调和模型应用技术,包括其原理和实现方法。y****n2024-05-27460
- 近年来,研究人员探索了多种创新方法来有效扩展LLM的上下文处理能力,旨在使模型能够更好地理解并生成长篇幅、连贯的文本内容。本文将深入探讨几种核心技术和其实现方法,包括长度外推、注意力近似、无注意力变换器、模型压缩和硬件感知变换器,以及特定技术如位置插值(PI)和NTK-Aware Scaled RoPE。y****n2024-05-271290
- 知识推理是从已有的知识出发,得出未知的、隐性的知识,具体到知识图谱中,即利用图谱中现有的知识(三元组),得到一些新的实体间的关系或者实体的属性(三元组)。本文进一步从理论和示例的角度出发,介绍知识推理的基础,增进大家对知识推理的了解。y****n2023-04-30750
- AIGC(AI技术自动生成内容)是人工智能领域一个重要的分支,在智能问答、跨模态生成等场景中有广泛应用前景。2022年11月30日,OpenAI发布了最新的ChatGPT模型,成为现今最具影响力的语言AIGC模型之一。本文将从功能、技术、影响等方面着手,带大家认识超级对话模型ChatGPT。y****n2023-04-30110
- 大模型的开发成本高、算力要求高,一直成为不少中小企业和个人开发者不得不面临的难题。LoRA等低资源大模型微调技术,无疑为大家带来了福音。本文将主要介绍低资源微调大模型方法LoRA。y****n2023-04-302480
共 5 条
- 1
页
没有更多了
个人简介
暂未填写公司和职务
暂未填写个人简介
暂未填写技能专长
暂未填写毕业院校和专业
个人成就
共发表过 5 篇文章
文章获得 0 次赞同
文章被浏览 509 次
获得 0 人关注
个人荣誉查看规则
暂未获得荣誉