模型简介
Llama3-8B是Meta 开发并发布的Llama3 系列中规模为80亿参数的大型语言模型 (LLM),指令调优模型针对对话用例进行了优化,在常见的行业基准测试中优于许多可用的开源聊天模型。
使用场景
Llama 3的预期用例是英语语境下的商业和研究。其中指令调优模型特别适合用于助手类聊天应用,而预训练模型可以适应各种自然语言生成任务。 Llama 3可供各种规模的个人、创作者、研究人员和企业使用。
超出范围的用途:以任何违反适用法律或法规(包括贸易合规法)的方式使用。在英语以外的语言中使用。以 Llama 3 可接受使用政策和许可协议禁止的任何其他方式使用。
注意开发者可以采用英语以外的语言对 Llama3 模型进行微调,前提是它们符合 Llama 3 社区许可证和可接受使用政策。
评测效果
Llama 3 模型在标准自动基准测试下的结果。
技术亮点
- Llama 3 是一种自回归语言模型,它使用优化的转换器架构。优化版本使用监督微调(SFT)和具有人类反馈的强化学习(RLHF)来符合人类对帮助性和安全性的偏好。
- 使用分组查询注意力(GQA)来提高推理可扩展性。
- Llama 3 在来自公开来源的超过 15 万亿tokens数据上进行了预训练。微调数据包括公开可用的指令数据集,以及超过 1000万个人工注释的示例。
相关引用
如对您有帮助,欢迎引用。
@article{llama3modelcard,
title={Llama 3 Model Card},
author={AI@Meta},
year={2024},
url = {https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md}
}
免责声明
Llama3-8B-Instruct模型,来源于第三方,本平台不保证其合规性,请您在使用前慎重考虑,确保合法合规使用并遵守第三方的要求。