前言——私有知识库作用简介
大模型私有知识库是结合大语言模型技术与企业或组织自有数据的一种知识管理和应用方案,旨在为特定用户群体提供更精准、专业且安全的知识服务。
大模型私有知识库是基于大语言模型构建的,专门服务于特定组织或个人的知识存储和检索系统。它整合组织内部的专业知识、业务数据、历史文档等,形成专属知识集合,借助大模型的强大语言理解和生成能力,为用户提供高效的知识查询和问答服务。
本教程提供一种基于开源框架的私有知识库搭建方案。如果需要构建企业级服务且对数据安全有需求,则需相关企业对该服务进行定制,以完成私有知识库的搭建。
本文介绍的方法采用了开源框架自带的数据库服务,但该方法不保证相关数据在开源框架下的安全性。请务必在上传前对敏感数据进行脱敏处理。
本教程使用的GPU云主机规格如下所示,用于部署 DeepSeek-r1:70b 模型,配置仅供参考。
cpu 32核
内存 128G
GPU: NVIDIA A10*2 (48GB)
如需体验其它模型版本,请参考在天翼云使用Ollama运行 DeepSeek的最佳实践-7b版-弹性云主机-最佳实践-AIGC实践 - 天翼云--自定义部署DeepSeek--步骤二:规格选型,选择合适的云主机。
优势
知识准确性:让模型访问定制的信息,从而提高回答的准确性和可靠性。
可解释性:检索过程可以明确指出回答所依据的信息来源,增强了回答的可解释性。
减少幻觉:降低了语言模型生成无事实依据内容(即 “幻觉”)的可能性。
一、环境准备
1.参考在天翼云使用Ollama运行 DeepSeek的最佳实践-7b版-弹性云主机-最佳实践-AIGC实践 - 天翼云--快速体验DeepSeek,准备相关设备及模型资源。
2.待模型启动后,通过访问http://{公网ip地址}:3000进入 OpenWebUI 界面。按照界面提示完成账号注册,开启私有知识库搭建之旅。
二、私有数据准备
搭建私有知识库需提前准备相应的数据材料。OpenWebUI 支持多种文本格式,包括但不限于:
● Markdown:轻量级标记语言格式,便于快速书写和阅读,能清晰呈现文本结构,常用于文档撰写、笔记记录等场景。
● PDF:通用文档格式,可保留文档原始排版、字体、图像等元素,广泛应用于正式文档、书籍、报告的分发与存储。
● TXT:最基本的文本格式,仅包含文本内容,无复杂格式设置,适用于纯文本信息的存储和传输。
● HTML:超文本标记语言格式,用于创建网页,包含文本内容和网页元素标记信息,可被浏览器解析显示。
● docx:是 Microsoft Word 的文档格式,能包含丰富的文本格式、图表、样式等内容,OpenWebUI 可以借助相关的文档解析库来提取其中的文本信息,用于知识库的构建和查询。
对于结构简单的纯文本材料,可直接通过 OpenWebUI 进行解析。若需了解除纯文本外其他文件格式的支持情况,请查阅 OpenWebUI 官方文档。
三、私有知识库搭建教程
1、登录 OpenWebUI 后,点击左上角 “工作空间”。
2、在“工作空间”中找到“知识库”选项,点击右侧的“+”号新建知识库。
3、在新建知识库页面,填写知识库名称、描述,设置可见性等信息,完成后点击“创建知识库”。
4、新建知识库成功后,再次点击右侧的“+”号,选择要添加的知识文档(可一次性添加多个)。添加成功后,点击对应文档查看加载的语料内容,验证知识解析是否准确。
四、私有知识模型推理验证
1、点击左上角 “新对话”,选择已部署的推理模型。
2、在输入对话内容时,以 “#” 号开头,可选择对应知识库或知识文档作为推理参考。
3、若不想继续使用某个知识库,可按照特定操作流程将其移除,具体操作可参考相关图示。
通过以上步骤,您即可完成一个简单的私有知识库搭建,赶紧动手尝试吧!
五、推荐使用场景
1、智能客服训练 AI 回答公司政策、产品 FAQ,减少人工客服负担。
2、企业内部搜索让员工直接向AI提问,无需翻遍公司Wiki或文档库。
3、智能助手帮助销售整理客户信息,协助HR处理面试反馈,助力研发自动生成技术文档。
4、智能营销策划协助市场团队分析市场趋势和竞争对手数据,生成针对性的营销活动方案,提升营销效果。
5、财务智能分析工具帮助财务人员自动完成财务报表分析,预测财务风险,为企业决策提供数据支持。
6、生产流程优化系统利用AI实时监测生产设备运行状况,预测设备故障,提前安排维护,减少生产中断。
7、培训内容生成助手,为培训部门快速生成员工培训课件、在线课程内容,满足不同岗位的培训需求。
8、供应链管理智能助手,根据销售数据、库存水平和供应商信息,辅助优化采购计划。
返回DeepSeek专区导航。