模型简介

Chinese-Alpaca-2-13B模型是基于 Meta 开源的 LLaMA 模型系列进行训练和优化的中文大模型。它在原版 LLaMA 模型的基础上扩充了中文词表，并使用大规模中文数据进行增量预训练，进一步提高了中文的基本语义理解。与第一代模型相比，性能有了显着提高。此外，该模型支持处理长达4K的文本上下文，并且可以通过先进的NTK或其他技术手段进一步扩展到处理超过18K的文本上下文。

使用场景

Chinese-Alpaca-2-13B特别针对中文问答和对话任务进行了深度优化，旨在更好地适应中文使用者的语言习惯、偏好及需求。因此，它广泛适用于多种指令理解应用场景，包括但不限于：问答系统、写作辅助、聊天机器人、交互式应用。

评测效果

客观效果评测：C-Eval

LLaMA Models	Valid	Test	Alpaca Models	Valid	Test
Chinese-LLaMA-2-13B	40.6 / 42.7	38.0 / 41.6	Chinese-Alpaca-2-13B	44.3 / 45.9	42.6 / 44.0
Chinese-LLaMA-2-7B	28.2 / 36.0	30.3 / 34.2	Chinese-Alpaca-2-7B	41.3 / 42.9	40.3 / 39.5
Chinese-LLaMA-Plus-33B	37.4 / 40.0	35.7 / 38.3	Chinese-Alpaca-Plus-33B	46.5 / 46.3	44.9 / 43.5
Chinese-LLaMA-Plus-13B	27.3 / 34.0	27.8 / 33.3	Chinese-Alpaca-Plus-13B	43.3 / 42.4	41.5 / 39.9
Chinese-LLaMA-Plus-7B	27.3 / 28.3	26.9 / 28.4	Chinese-Alpaca-Plus-7B	36.7 / 32.9	36.4 / 32.3

客观效果评测：CMMLU

LLaMA Models	Test (0/few-shot)	Alpaca Models	Test (0/few-shot)
Chinese-LLaMA-2-13B	38.9 / 42.5	Chinese-Alpaca-2-13B	43.2 / 45.5
Chinese-LLaMA-2-7B	27.9 / 34.1	Chinese-Alpaca-2-7B	40.0 / 41.8
Chinese-LLaMA-Plus-33B	35.2 / 38.8	Chinese-Alpaca-Plus-33B	46.6 / 45.3
Chinese-LLaMA-Plus-13B	29.6 / 34.0	Chinese-Alpaca-Plus-13B	40.6 / 39.9
Chinese-LLaMA-Plus-7B	25.4 / 26.3	Chinese-Alpaca-Plus-7B	36.8 / 32.6

长上下文版模型评测

Models	单文档QA	多文档QA	摘要	Few-shot学习	代码补全	合成任务	Avg
Chinese-Alpaca-2-7B-64K	44.7	28.1	14.4	39.0	44.6	5.0	29.3
Chinese-LLaMA-2-7B-64K	27.2	16.4	6.5	33.0	7.8	5.0	16.0
Chinese-Alpaca-2-13B-16K	47.9	26.7	13.0	22.3	46.6	21.5	29.7
Chinese-Alpaca-2-13B	38.4	20.0	11.9	17.3	46.5	8.0	23.7
Chinese-Alpaca-2-7B-16K	46.4	23.3	14.3	29.0	49.6	9.0	28.6
Chinese-Alpaca-2-7B	34.0	17.4	11.8	21.3	50.3	4.5	23.2
Chinese-LLaMA-2-13B-16K	36.7	17.7	3.1	29.8	13.8	3.0	17.3
Chinese-LLaMA-2-13B	28.3	14.4	4.6	16.3	10.4	5.4	13.2
Chinese-LLaMA-2-7B-16K	33.2	15.9	6.5	23.5	10.3	5.3	15.8
Chinese-LLaMA-2-7B	19.0	13.9	6.4	11.0	11.0	4.7	11.0

投机采样加速效果评测

草稿模型	草稿模型速度	目标模型	目标模型速度	投机采样速度（加速比）
Chinese-LLaMA-2-1.3B	7.6	Chinese-LLaMA-2-7B	49.3	36.0（1.37x）
Chinese-LLaMA-2-1.3B	7.6	Chinese-LLaMA-2-13B	66.0	47.1（1.40x）
Chinese-Alpaca-2-1.3B	8.1	Chinese-Alpaca-2-7B	50.2	34.9（1.44x）
Chinese-Alpaca-2-1.3B	8.2	Chinese-Alpaca-2-13B	67.0	41.6（1.61x）

技术亮点

在 LLaMA-2 的基础上扩展了新的中文词汇，并开源了支持中文的 LLaMA-2 模型以及基于此优化的 Alpaca-2 LLM
开源了预训练和指令微调（SFT）的脚本，这些脚本允许用户进一步利用自己的数据对模型进行调整和优化
提供了在个人电脑的CPU/GPU上快速部署和体验量化LLM（大型语言模型）的解决方案
支持广泛的LLaMA生态系统工具，如transformers库、llama.cpp、text-generation-webui、LangChain、vLLM等，使得用户能够轻松地将这些模型集成到现有的工作流程或项目中
模型采用了简化的中英双语系统提示语设计，并遵循了类似Llama-2-Chat的指令模板，这样的设计旨在更好地适配相关的LLaMA生态系统工具和应用场景

免责声明

Chinese-Alpaca-2-13B模型来源于第三方，本平台不保证其合规性，请您在使用前慎重考虑，确保合法合规使用并遵守第三方的要求。

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

查看所有产品

慧聚一站式智算服务平台

慧聚一站式智算服务平台

模型简介

使用场景

评测效果

客观效果评测：C-Eval

客观效果评测：CMMLU

长上下文版模型评测

投机采样加速效果评测

技术亮点

相关引用

免责声明

活动

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

查看所有产品

慧聚一站式智算服务平台

慧聚一站式智算服务平台

模型简介

使用场景

评测效果

客观效果评测：C-Eval

客观效果评测：CMMLU

长上下文版模型评测

投机采样加速效果评测

技术亮点

相关引用

免责声明