概述
前言
大模型私有知识库,作为大语言模型技术与企业、组织自有数据深度融合的创新知识管理及应用解决方案,能够为特定用户群体提供更为精准、专业且安全的知识服务。具体来讲,它是借助大语言模型搭建而成,专门为特定组织或个人定制的知识存储与检索系统。此系统会对组织内部的专业知识、业务数据、历史文档等各类信息进行深度整合与精细化处理,从而构建出独一无二的专属知识集合。依托大模型强大的语言理解与生成能力,用户能够在此基础上实现高效的知识查询与问答交互。
在本教程中,我们将为您详细介绍基于Dify和DeepSeek-R1模型搭建私有知识库的方案。利用该方案,您可以在本地便捷地搭建起相应的私有知识库,大幅提升文本检索能力。
DeepSeek-R1介绍
DeepSeek-R1 是幻方量化旗下 AI 公司深度求索(DeepSeek)研发的一款高性能推理模型。该模型使用强化学习技术进行后训练,专注于提升在数学、代码和自然语言推理等复杂任务上的表现。
本最佳实践在算力互联调度平台的应用市场中,您可快速部署应用,并对外提供API调用服务,方便您即刻体验,开箱即用。
Dify介绍
Dify 是一站式大模型应用开发平台。它能便捷接入各类数据并管理,支持模型微调与多模型调用。通过可视化界面和低代码工具,用户无需深厚技术背景,就能快速搭建如聊天机器人、智能客服等应用。可用于客户服务、内容创作等场景,具有降低开发门槛、提升效率、灵活可扩展等优势,助力企业高效落地大模型应用。
前置说明
该文档为算力互联调度平台控制台通过应用市场体验Dify+DeepSeek-R1模型搭建私有知识库的说明,通过算力互联调度平台控制台,打开应用市场,创建对应的Dify应用,使用 Dify构建本地知识库。
本产品中的模型由第三方主体提供,尽管云公司已尽最大努力进行识别和维护,但仍无法保证模型的可用性。请客户按照该产品的服务协议使用该产品,做好甄别并对自行选择的服务负责。
使用前准备
天翼云账号注册
使用算力互联调度平台须具备天翼云官网账号。已有天翼云账号的直接登录即可,如无天翼云账号需先注册,注册流程可参考:注册账号。
使用前提
(1)如需使用服务请先完成实名认证,请参考账号中心-实名认证。
(2)如需使用按需服务,请确认账号余额≥100 元。
操作指引
部署Dify应用
订购应用
在应用市场页面,选择目标应用,点击【查看】,进入应用部署页面。
点击【立即订购】,勾选同意用户协议,支付订单,即可完成Dify应用服务部署。
服务详情查看
进入算力互联调度平台租户控制台。
选择【通用服务】->【应用列表】,进入应用列表页面。
刷新应用列表,等待新创建的应用进入到【运行中】状态后点击右侧操作栏【应用详情】。
进入应用详情页面,点击【去使用】。
进入Dify应用界面。可使用初始账号密码登录Dify,登陆后用户可自行进行更改。账号:admin@admin.com 密码:ZvMeP%#Ubi)Y1
在Dify中添加DeepSeek模型
Dify支持多模型管理与调用,可以便捷的添加我们所需的模型,我们这里以使用ollama添加DeepSeek模型为例。
在Dify控制台点击设置进入模型供应商编辑页面。
通过Ollama分别添加一个LLM模型和Text Embedding模型,Text Embedding模型用于知识库的向量化处理。
添加LLM模型,输入Ollama上部署的DeepSeek模型名称和基础URL,点击保存添加模型。输入示例,实际使用时请按情况替换:模型名称:deepseek-r1:7b;基础URL:http://35.**.***.166:8088
注意
添加模型前需要使用Ollama部署专属的DeepSeek模型推理服务,详细操作请参考最佳实践通过应用市场部署DeepSeek推理API服务。部署完成后可在推理服务详情界面获取调用URL。
同样的方式,添加一个Text Embedding模型用于文档向量化处理。Text Embedding模型可以与LLM模型使用同一个模型和基础URL。
在系统模型配置页面设置系统推理模型和Embedding模型,一般系统会默认选择第一个可用模型,若模型显示为空,请刷新页面后重试。
系统模型配置完毕后,即可在应用编排界面配置模型参数和使用模型。模型参数会影响模型的输出效果,用户可自行探索,这里不再详细描述。
补充说明:Dify同时支持使用API方式添加模型,在模型供应商界面找到OpenAI-API-compatible,点击输入模型名称、API key、API endpoint URL即可添加模型。API key、API endpoint URL获取方式请查看具体服务厂商的API使用说明。
在Dify中搭建本地知识库
使用Dify 的 RAG 管道功能,企业可以快速搭建本地知识库,系统会基于本地知识库返回准确的答案。搭建本地知识库前请先完成前置步骤:使用Ollama添加DeepSeek模型。
创建聊天助手:选择聊天助手,输入应用名称,点击创建,进入应用编排页面。
在Dify顶部导航栏找到“知识库”按钮,点击进入知识库编辑页面,上传需要处理的文档(支持 TXT、 MARKDOWN、 MDX、 PDF、 HTML、 XLSX、 XLS、 DOCX、 CSV、 MD、 HTM,每个文件不超过 15MB)。
进入文本分段与清洗页面,选择我们刚才配置的Embedding 模型并配置其他参数。完成配置后,系统会自动对上传的文档进行解释和向量化处理。
返回Dify聊天应用编排页面,在上下文中添加我们刚才导入的知识库。现在我们可以在测试页面中输入问题进行提问,系统将会基于本地知识库返回答案。至此,我们已成功使用Dify+DeepSeek模型构建私有知识库,Dify还具备工具、函数等强大能力,请用户自行探索相关功能。
在Dify中发布编排好的应用,对外开放使用
在应用编排界面,点击发布-运行,即可生成网站应用。
2、复制生成的应用链接,其他用户可通过链接登录进行体验。请勿大量用户同时使用,否则可能会造成访问失败。