模型简介

Baichuan 2 是百川智能推出的新一代开源大语言模型，在多个权威的中文和英文基准测试（benchmark）上均取得了同尺寸模型中的最佳效果。此次发布，Baichuan 2 提供了7B和13B的Base版本以及Chat版本，同时，为了提升部署效率和降低资源消耗，还特别为Chat版本提供了4-bit量化的版本。

使用场景

在实际应用方面，Baichuan 2在垂直领域如医学和法律方面表现突出。这种规模的模型可以更加人性化地执行各种自然语言任务，如问答、翻译、摘要生成等。此外，Baichuan 2还可以应用于智能客服、智能助手等场景，提高用户体验和满意度。

评测效果

百川智能在通用、法律、医疗、数学、代码理解以及多语言翻译这六个领域的中英文权威数据集上，对Baichuan 2模型进行了全面的测试。更多详细的测评结果，请访问GitHub上的相关仓库进行查看。

技术亮点

在预训练方面，Baichuan 2采用了广泛的数据来源，并注重数据频率和质量。通过构建大规模去重和聚类系统，Baichuan 2实现了高效的数据处理，确保每个token都得到充分训练。此外，Baichuan 2的分词器也进行了优化，实现了高压缩率和适当大小的词汇表，以提高模型的推理效率和训练效果。
在应用方面，Baichuan 2支持多种任务类型，包括文本生成、文本分类、实体识别等。通过监督预训练和强化学习从人类反馈中获得的方法，Baichuan 2实现了模型对齐，获得了Baichuan 2-7B-Chat和Baichuan 2-13B-Chat两个会话模型，进一步提升了模型在自然语言处理任务中的性能。

声明与协议

声明

百川智能的开发团队并未基于 Baichuan 2 模型开发任何应用，无论是在 iOS、Android、网页或任何其他平台。强烈呼吁所有使用者，不要利用 Baichuan 2 模型进行任何危害国家社会安全或违法的活动。另外，百川智能也要求使用者不要将 Baichuan 2 模型用于未经适当安全审查和备案的互联网服务。希望所有的使用者都能遵守这个原则，确保科技的发展能在规范和合法的环境下进行。

百川智能已经尽可能确保模型训练过程中使用的数据的合规性。但由于模型和数据的复杂性，仍有可能存在一些无法预见的问题。因此，如果由于使用 Baichuan 2 开源模型而导致的任何问题，包括但不限于数据安全问题、公共舆论风险，或模型被误导、滥用、传播或不当利用所带来的任何风险和问题，百川智能不承担任何责任。

协议

使用 Baichuan 2 模型需要遵循 Apache 2.0 和《Baichuan 2 模型社区许可协议》。Baichuan 2 模型支持商业用途，如果您计划将 Baichuan 2 模型或其衍生品用于商业目的，请您确认您的主体符合以下情况：

您或您的关联方的服务或产品的日均用户活跃量（DAU）低于100万。
您或您的关联方不是软件服务提供商、云服务提供商。
您或您的关联方不存在将授予您的商用许可，未经百川许可二次授权给其他第三方的可能。

在符合以上条件的前提下，您需要通过以下联系邮箱 opensource@baichuan-inc.com，提交《Baichuan 2 模型社区许可协议》要求的申请材料。审核通过后，百川将特此授予您一个非排他性、全球性、不可转让、不可再许可、可撤销的商用版权许可。

免责声明

Baichuan2-7B模型来源于第三方，本平台不保证其合规性，请您在使用前慎重考虑，确保合法合规使用并遵守第三方的要求。

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

查看所有产品

慧聚一站式智算服务平台