概述
RAGFlow介绍
RAGFlow 是一款开源的检索增强生成(RAG)引擎,基于深度文档理解技术,能将信息检索与生成式 AI 深度融合。它可从复杂的非结构化数据中精准提取知识,在海量数据里迅速定位关键信息。面对多种格式的数据源,如 Word、PPT、Excel、图片、网页等都能兼容处理。其工作流程主要含检索和生成环节,先运用搜索引擎技术筛选关联信息,再借助生成式模型整合加工生成回复。它能为各规模企业及个人,提供精简可靠的问答及有理有据的引用 ,助力提升工作效率。
前置说明
该文档为算力互联调度平台控制台通过应用市场体验RAGFlow +QWQ:32b模型搭建本地知识库的说明,通过算力互联调度平台控制台,打开应用市场,创建对应的RAGFlow应用,构建本地知识库。
本产品中的模型由第三方主体提供,尽管天翼云已尽最大努力进行识别和维护,但仍无法保证模型的可用性。请客户按照该产品的服务协议使用该产品,做好甄别并对自行选择的服务负责。
使用前准备
天翼云账号注册
使用算力互联调度平台须具备天翼云官网账号。已有天翼云账号的直接登录即可,如无天翼云账号需先注册,注册流程可参考:注册账号。
使用前提
(1)如需使用服务请先完成实名认证,请参考账号中心-实名认证。
(2)如需使用按需服务,请确认账号余额≥100 元。
操作指引
部署RAGFlow应用
订购应用
在应用市场页面,选择目标应用,点击【查看】,进入应用部署页面。
点击【立即订购】,勾选同意用户协议,支付订单,即可完成RAGFlow应用服务部署。
服务详情查看和应用登录
进入算力互联调度平台租户控制台。
选择【通用服务】->【应用管理】,进入应用列表页面。
刷新应用列表,等待新创建的应用进入到【运行中】状态后点击右侧操作栏【应用详情】。
进入应用详情页面,点击【去使用】,即可打开RAGFlow应用。
注册账号:点击登陆界面【注册】,输入邮箱、用户名、密码即可完成注册。
登录应用:输入注册的账号密码进行登陆。
为RAGFlow添加QWQ32B模型或DeepSeek模型
RAGFlow支持多模型管理与调用,可以便捷的添加我们所需的模型,我们这里以使用OpenAI-API-Compatible添加QWQ:32b模型为例。
注意
添加模型前可使用应用市场部署专属的qwq:32b或deepseek:r1模型推理服务,详细操作请参考最佳实践通过应用市场部署DeepSeek推理API服务。部署完成后可在推理服务详情界面获取调用URL。
1.部署专属QWQ32B模型(API服务)
1)在应用市场找到QwQ-32B(API)应用服务,点击查看应用详情并完成购买,等待应用部署完成。因模型文件较大,部署模型需10-15分钟,在应用运行前服务不会计费,请耐心等待。
2)在“我的应用”查看应用,等待QwQ-32B(API)部署完成,当应用状态显示为“运行中”时,点击“应用详情”进入应用详情页。点击“去管理应用实例”进入应用实例详情页,获取并记录调用地址、APIkey两个关键参数。调用地址对应模型配置的基础URL参数,模型名称固定为:qwq:32b。RAGFlow使用期间请勿关闭QwQ-32B(API)模型服务,否则会导致模型服务请求失败无法生成回答。
注意
基础URL需要在调用地址后加上对应的服务版本,如调用地址为:http://140.***.***.180:19363 基础URL地址需在调用地址后加上/V1如:http://140.***.***.180:19363/v1
2.回到RAGFlow软件界面,点击右上角头像,选择“模型供应商”进入模型配置界面。
3.我们需要通过OpenAI-API-Compatible分别添加一个LLM模型和Text Embedding模型,Text Embedding模型用于知识库的向量化处理。找到“OpenAI-API-Compatible”,点击添加模型进入模型配置界面。
4.添加Chat模型,在模型类型中选择“Chat”,填写模型名称、基础URL、API-Key、最大Token数。其中模型名称、基础URL、API-key可在我们部署的qwq:32b模型API服务的实例详情中查询,最大Token数建议设置为512或1024,点击"确定"添加模型。首次添加模型耗时较长,请耐心等待。
5.添加embedding模型,同样的操作,我们在模型类型中选择“embedding”,填写模型名称、基础URL、API-Key、最大Token数,点击“确定”添加。
6.配置系统默认模型:点击“系统模型设置”,选择qwq:32B为我们默认的chat和embedding模型。
使用RAGFlow构建问答知识库
创建知识库:进入知识库,点击“创建知识库”按钮,输入知识库名称创建一个新的知识库。
配置知识库详细信息,包括文档语言、文档解析器、块Token数等,这里使用默认参数,文档语言可根据原始数据类型选择,Token数设置为1024。
在数据集中上传本地文档配置知识库,RAGFlow支持本地和S3上传文档,我们这里以本地上传文件为例:点击新增文件,添加我们的本地文档,点击确定。
解析我们添加的文档,解析状态显示为“成功”后即可引用该文档进行问答了。
新建聊天助理进行问答测试:进入聊天界面,点击新建助理。填写基本信息后和选择关联知识库,点击“确定”即可创建聊天助手。聊天助手可以配置开场白、提示引擎、模型设置等参数,不同参数会影响聊天助手的性能表现。我们这里使用系统默认配置不做更改,用户可根据自己需要进行探索和设置。
创建新会话,进行聊天测试,可见聊天机器人能够正常引用我们的知识库内容进行问答。至此我们就简单完成了一个本地知识库问答助手的搭建,更多RAGFlow实践内容我们将在后续逐步更新,敬请期待。