一、概述
DeepSeek-R1 是幻方量化旗下 AI 公司深度求索(DeepSeek)研发的一款高性能推理模型。该模型使用强化学习技术进行后训练,专注于提升在数学、代码和自然语言推理等复杂任务上的表现。
DeepSeek-R1 在需要逻辑推理、思维链推理和实时决策的任务中表现出色,如解决高级数学问题、生成复杂代码、解析复杂科学问题等。在类似Codeforces的挑战场景中获得了2029 Elo评分;在复杂推理基准测试中,表现与OpenAI的o1模型相当。尽管总共有6710亿的庞大参数,但每次前向传递时仅激活370亿个参数,比大多数大模型更加高效的利用资源。
算力互联调度平台的应用托管基于异构算力统一调度引擎,实现应用对算力芯片、算力架构无差异化的分布式应用部署,客户无需关心底层算力与应用程序间的架构适配和资源协调等问题,实现开箱即用,提升应用的健壮性。
本最佳实践在算力互联调度平台的应用市场中,通过应用托管为您提供专属集群资源场景下的DeepSeek-R1-Distill-Qwen-7B服务部署和使用,方便您即刻体验。
二、前置说明
该文档为算力互联调度平台控制台通过应用市场部署和使用DeepSeek-R1-Distill-Qwen-7B服务的说明,通过算力互联调度平台控制台,打开应用市场,部署对应的DeepSeek-R1-7B模型服务,通过API调用或open-webui的方式使用DeepSeek-R1-7B服务。
本产品中的模型由第三方主体提供,尽管云公司已尽最大努力进行识别和维护,但仍无法保证模型的可用性。请客户按照该产品的服务协议使用该产品,做好甄别并对自行选择的服务负责。
本模式下DeepSeek服务是部署在您的专属集群资源上,集群资源您需提前准备并付费,故应用的部署不产生费用,应用的价格显示为0元。
三、使用前准备
天翼云账号注册
使用算力互联调度平台须具备天翼云官网账号。已有天翼云账号的直接登录即可,如无天翼云账号需先注册,注册流程可参考:注册账号。
使用前提
如需使用服务请先完成实名认证,请参考账号中心-实名认证。
集群资源准备
通过天翼云新建业务需求单的形式,联系运营人员创建部署DeepSeek-R1的集群资源。
按工单要求填写信息,并提交需求单。
说明
咨询场景:算力互联调度平台;
业务需求描述:专属集群资源场景下的DeepSeek-R1服务部署和使用。可以补充填写您所需要的集群资源规格需求,如CPU、GPU和内存的需求。集群需至少预留1台4核8G (建议8核16G)的可用机器资源。
需求单提交后,会有专属人员为您进行处理,可在 管理中心-工单-业务需求单 栏目查询咨询进度。
四、部署DeepSeek-R1服务
1、应用市场部署服务
进入算力互联调度平台租户控制台。
选择【通用服务】->【应用市场】,进入应用市场页面
选择DeepSeek-R1-7B(专属集群)应用服务,点击【查看】,进入应用部署页面。
说明
DeepSeek-R1-7B(专属集群API服务)部署后提供可调用的API服务,DeepSeek-R1-7B(专属集群WebUI)部署后可通过open-webui页面直接访问。
点击【立即订购】,勾选同意用户协议,即可完成DeepSeek-R1模型推理服务的部署。
2、服务详情查看
进入算力互联调度平台租户控制台。
选择【通用服务】->【应用列表】,进入应用列表页面。
刷新应用列表,等待新创建的应用进入到【运行中】状态后点击右侧操作栏【应用详情】。进入应用详情页面。
点击【去管理应用实例】,进入应用实例管理页面。通过基本信息中的【公网地址】,可以查看通过应用托管部署的DeepSeek-R1专属服务的访问地址和端口信息。
点击【资源实例】,可查看资源实例的具体使用情况。
日志:支持查看资源实例运行的日志信息。
终端:支持登录实例执行命令。支持实例和容器的切换、命令模式的切换。
监控:支持实例监控数据的查看,包含CPU和内存的监控指标数据,支持选择时间区域筛选图表数据。
五、通过open-webui使用DeepSeek-R1服务
进入算力互联调度平台租户控制台。
选择【通用服务】->【应用列表】,进入应用列表页面,进入应用详情页面。
点击【去使用】,DeepSeek-R1-7B(专属集群WebUI)应用可以进入open-webui界面。
a.首次登录页面如下:
b.注册管理员账号。
c.使用设置:刷新进入首页,在模型下拉列表中,选择刚部署的DeepSeek-r1:7b 模型。
点击左下角进入设置页面,如果您不想开放其他用户注册使用,则需要关闭“允许用户注册”功能。如果您允许用户注册,还可以设置用户注册之后的行为,例如选择新用户注册后默认用户角色为“用户”/“待激活”等,需要管理员手动激活。
设置模型可见性。多用户模式下,建议把模型设置为"Public"。
d.使用DeepSeek模型进行模型推理。
六、通过API调用DeepSeek-R1服务
1、使用curl调到api服务
前置说明
已安装curl可执行程序。
操作步骤
1、shell控制台输入curl调用服务指令,输入问题,DeepSeek将给出答复。
2、使用postman请求api服务
前置说明
已安装postman软件。
操作步骤
打开postman。
选择请求方式POST,输入api调用路径:{{api服务地址}}/api/generate,填入请求body,发送请求,DeepSeek将给出答复。
3、本地搭建open-webui连接api服务
前置说明
本地已安装docker。
操作步骤
使用docker本地部署open-webui。
docker run -d -e OLLAMA_BASE_URL={{api服务地址}} --name open-webui ghcr.io/open-webui/open-webui:main
待容器处于运行中状态,打开open-webui本地地址,进入web对话页面。
在对话框里输入问题后点击【发送消息】图标,DeepSeek将给出答复。