1、概述
DeepSeek-R1
DeepSeek-R1 是幻方量化旗下 AI 公司深度求索(DeepSeek)研发的一款高性能推理模型。该模型使用强化学习技术进行后训练,专注于提升在数学、代码和自然语言推理等复杂任务上的表现。
DeepSeek-R1 在需要逻辑推理、思维链推理和实时决策的任务中表现出色,如解决高级数学问题、生成复杂代码、解析复杂科学问题等。在类似 Codeforces 的挑战场景中获得了2029 Elo 评分;在复杂推理基准测试中,表现与 OpenAI 的 o1 模型相当。尽管总共有6710亿的庞大参数,但每次前向传递时仅激活370亿个参数,比大多数大模型更加高效的利用资源。
Dify
Dify 是一站式大模型应用开发平台,降低开发门槛,集成数据管理、Prompt 工程等功能,支持多模型,可云端和本地部署,适用于智能客服、内容生成、智能助手等场景,显著提升开发效率。
当前在科研助手的社区镜像中,我们已经为您提前部署好了基于 Dify 搭建的DeepSeek-R1:7B模型,方便您即刻体验,开箱即用。
2、前置说明
- 该文档为在科研助手上使用 Dify 快速搭建 DeepSeek 知识库的说明;
- 本产品中的模型由第三方主体提供,尽管云公司已尽最大努力进行识别和维护,但仍无法保证模型的可用性。请客户按照该产品的服务协议使用该产品,做好甄别并对自行选择的服务负责。
3、环境准备
本地文档准备
在搭建知识库过程中,如需要引用本地文档,请提前在科研助手中通过【数据存储】功能,将本地数据传至开发机上。此处以数据集管理为例,演示如何创建及挂载。
步骤1:进入科研助手控制台,点击左上角,切换“科研版”;
步骤2:在【数据存储】弹出的选项中,选择【数据集管理】。在【数据集管理】页面中切换至【个人数据集】,点击左上角的【创建数据集】按钮。
此处需注意,数据集选用的可用区和后续开发机的可用区应在同一个可用区,否则无法跨区挂载。此处选择中卫4。其余请按照实际需求选择。
步骤3:刷新页面,可以在列表中看到创建的数据集bc-manual。
步骤4:在数据集右侧单击【查看】按钮,进入文件管理页面,点击右上角【本地上传】-【上传文件】,选择您所创建知识库需要的文档。
上传完成后,进行下一步开发机准备。
开发机准备
步骤1:进入科研助手控制台,点击左上角,切换“科研版”;
步骤2:点击当前科研版"概览"页,点击快捷入口【找镜像】,进入镜像商城;
步骤3:在“镜像商城”中,找到名为“Dify模型应用开发平台”的镜像,点击【使用此镜像】,进入开发机购买界面;
步骤4:在购买页面中,【基础信息】-【主机规格】一栏,用户可以按照如下配置选择:
配置 | 算力型号 | 可用区 |
---|---|---|
最低配置 | GPU.gn3.m1 | 厦门4、扬州7 |
推荐配置 | GPU.gn4.2xl1 | 贵阳2 |
高端配置 | NVIDIA A100 40G | 中卫4 |
这里以可用区中卫4的NVIDIA-A100-40G为例,可以看到,【存储配置】中已经挂载了在中卫4创建的数据集bc-manual,【镜像框架】中框架版本已默认选好【社区镜像】的“dify-deepseek-r1-cuda11.3”,其余【计费模式】、【可用区】等可按照实际需要选择。
步骤5:点击【确认订单】,完成开发机创建并启动。
4、启动开发机并登录VNC远程桌面
步骤1:购买完成后,可以看见开发机状态显示为【启动中】,等待新创建的开发机状态进入到【运行中】,然后点击右侧操作栏【打开】;
步骤2:点击【打开】跳转到开发机,成功进入到VNC远程桌面页面中,如下图所示,可看见在桌面中有 Dify 应用图标;
步骤3:点击启动 Dify 图标,将自动部署 Dify 服务,需等待1分钟左右。启动完成后将自动弹出 Dify 页面。
5、在科研助手开发机中通过Dify使用DeepSeek模型搭建知识库
对话DeepSeek
步骤1:镜像中已经预置,直接点击图中 deepseek-r1 选项卡;
步骤2:进入到 deepseek-r1 聊天助手中,可以在页面中设置提示词、上下文、聊天等;
步骤3:可以尝试与 DeepSeek 模型对话;
对话输出结果如下:
搭建本地知识库
用户也可以尝试通过预置提示词、知识库,生成独立的 AI 应用。我们这里以使用ollama添加DeepSeek模型搭建本地知识库为例。
步骤1:点击上方【知识库】,点击【创建知识库】,添加相关知识库文档;
步骤2:进入知识库编辑页面,上传需要处理的文档(支持 TXT、 MARKDOWN、 MDX、 PDF、 HTML、 XLSX、 XLS、 DOCX、 CSV、 MD、 HTM,每个文件不超过 15MB)。
此处选择在创建开发机时挂载的数据集文件,目录为/home/dataset-fs-0/tmp中。
步骤3:进入文本分段与清洗页面,选择默认配置,点击【保存并处理】。完成配置后,系统会自动对上传的文档进行解释和向量化处理;
步骤7:返回Dify聊天应用编排页面,在上下文中添加我们刚才导入的知识库。现在我们可以在测试页面中输入问题进行提问,系统将会基于本地知识库返回答案。至此,我们已成功使用Dify+DeepSeek模型构建私有知识库,Dify还具备工具、函数等强大能力,请用户自行探索相关功能。
注意您也可以部署自己的DeepSeek推理服务,详细步骤请参考最佳实践通过应用市场部署DeepSeek推理API服务