模型简介
Baichuan 2 是百川智能推出的新一代开源大语言模型,在多个权威的中文和英文基准测试(benchmark)上均取得了同尺寸模型中的最佳效果。此次发布,Baichuan 2 提供了7B和13B的Base版本以及Chat版本,同时,为了提升部署效率和降低资源消耗,还特别为Chat版本提供了4-bit量化的版本。
使用场景
在实际应用方面,Baichuan 2在垂直领域如医学和法律方面表现突出。 这种规模的模型可以更加人性化地执行各种自然语言任务,如问答、翻译、摘要生成等。 此外,Baichuan 2还可以应用于智能客服 、智能助手等场景,提高用户体验和满意度。
评测效果
百川智能在通用、法律、医疗、数学、代码理解以及多语言翻译这六个领域的中英文权威数据集上,对Baichuan 2模型进行了全面的测试。更多详细的测评结果,请访问GitHub上的相关仓库进行查看。
技术亮点
- 在预训练方面,Baichuan 2采用了广泛的数据来源,并注重数据频率和质量。通过构建大规模去重和聚类系统,Baichuan 2实现了高效的数据处理,确保每个token都得到充分训练。此外,Baichuan 2的分词器也进行了优化,实现了高压缩率和适当大小的词汇表,以提高模型的推理效率和训练效果。
- 在应用方面,Baichuan 2支持多种任务类型,包括文本生成、文本分类、实体识别等。通过监督预训练和强化学习从人类反馈中获得的方法,Baichuan 2实现了模型对齐,获得了Baichuan 2-7B-Chat和Baichuan 2-13B-Chat两个会话模型,进一步提升了模型在自然语言处理任务中的性能。
声明与协议
声明
百川智能的开发团队并未基于 Baichuan 2 模型开发任何应用,无论是在 iOS、Android、网页或任何其他平台。强烈呼吁所有使用者,不要利用 Baichuan 2 模型进行任何危害国家社会安全或违法的活动。另外,百川智能也要求使用者不要将 Baichuan 2 模型用于未经适当安全审查和备案的互联网服务。希望所有的使用者都能遵守这个原则,确保科技的发展能在规范和合法的环境下进行。
百川智能已经尽可能确保模型训练过程中使用的数据的合规性。但由于模型和数据的复杂性,仍有可能存在一些无法预见的问题。因此,如果由于使用 Baichuan 2 开源模型而导致的任何问题,包括但不限于数据安全问题、公共舆论风险,或模型被误导、滥用、传播或不当利用所带来的任何风险和问题,百川智能不承担任何责任。
协议
使用 Baichuan 2 模型需要遵循 Apache 2.0 和《Baichuan 2 模型社区许可协议》。Baichuan 2 模型支持商业用途,如果您计划将 Baichuan 2 模型或其衍生品用于商业目的,请您确认您的主体符合以下情况:
- 您或您的关联方的服务或产品的日均用户活跃量(DAU)低于100万。
- 您或您的关联方不是软件服务提供商、云服务提供商。
- 您或您的关联方不存在将授予您的商用许可,未经百川许可二次授权给其他第三方的可能。
在符合以上条件的前提下,您需要通过以下联系邮箱 opensource@baichuan-inc.com,提交《Baichuan 2 模型社区许可协议》要求的申请材料。审核通过后,百川将特此授予您一个非排他性、全球性、不可转让、不可再许可、可撤销的商用版权许可。
免责声明
Baichuan2-7B模型来源于第三方,本平台不保证其合规性,请您在使用前慎重考虑,确保合法合规使用并遵守第三方的要求。