RAGFlow之Agentic工作流与Workflow双模式知识体系RAGFlow知识体系 | -- Agent定义层 | -- Workflow人工规划 | -- Agentic WorkflowLLM自动规划 | -- Anthropic Building effective agents理念 | -- 模式对比层 | -- Workflow模式详解 | -- Agentic Workflow模式详解 | -- 双模式统一画布 | -- 决策实践层 | -- 模式选择决策树 | -- 混合编排策略 | -- 实际应用场景前言双模式架构的设计哲学在企业级RAGRetrieval-Augmented Generation落地过程中,工作流编排是最核心的挑战之一。传统的编排方式往往陷入两个极端要么完全依赖人工配置的可视化流程,要么完全依赖LLM的自主决策。RAGFlow 0.20.0提出的双模式架构——Workflow与Agentic Workflow——巧妙地平衡了可控性与灵活性,成为业界首个在同一画布上支持两种模式的RAG编排平台。本文将从架构设计、模式对比、实践决策三个维度,深入解析RAGFlow的双模式工作流体系,并结合实际案例说明如何在生产环境中做出最佳选择。一、RAGFlow Agent定义双模式融合的Agent抽象1.1 Agent的统一抽象在RAGFlow中,Agent不仅仅是一个简单的对话机器人,而是一个完整的任务执行单元。与LangChain的Agent概念不同,RAGFlow的Agent同时支持两种执行模式Workflow模式人工规划,机器执行通过低代码画布定义执行流程每个节点明确指定功能检索、重排序、生成、条件判断等变量传递、分支判断、循环迭代完全可控类似于传统的工作流引擎,但节点能力由LLM提供Agentic Workflow模式LLM规划与执行LLM根据任务描述自主生成执行计划动态拆解任务、选择工具、调整策略支持多轮自我反思和错误恢复体现了Anthropic在Building effective agents中倡导的理念1.2 Anthropic理念在RAGFlow中的实践Anthropic在2024年发布的Building effective agents白皮书中提出了几个核心观点,这些观点在RAGFlow的设计中得到了充分体现观点1Agentic工作流优于单个Agent“The most powerful agents are not single prompts, but workflows that orchestrate multiple tools and reasoning steps.”RAGFlow的Agentic Workflow正是这一理念的落地。当用户给出一个开放性任务如分析这份财报并生成投资建议,Agentic Workflow不会直接给出答案,而是先生成执行计划1. 识别财报中的关键财务指标 2. 使用检索工具获取行业平均水平 3. 对比分析并生成初步结论 4. 使用评估工具验证结论的合理性 5. 生成最终投资建议报告每个步骤都可能涉及工具调用、条件判断、甚至嵌套子任务。观点2确定性任务应使用显式编排“For well-defined tasks, explicit workflows are more reliable and efficient.”RAGFlow的Workflow模式为此提供了完美支撑。对于结构化文档提取、数据清洗、标准化报告生成等确定性任务,Workflow模式通过可视化画布清晰定义每一步骤,消除了LLM的不确定性。观点3两种模式应无缝融合“The future of agent systems lies in hybrid approaches that combine explicit workflows with agentic capabilities.”RAGFlow 0.20.0最大的创新在于Workflow和Agentic Workflow可以在同一画布上混合编排。你可以先用Workflow定义标准流程,在关键环节插入Agentic节点处理开放性子任务也可以用Agentic Workflow处理主要逻辑,在需要确定性的地方用Workflow节点保证稳定性。二、Workflow模式确定性任务的理想选择2.1 低代码画布的节点编排Workflow模式的核心是RAGFlow的可视化编排画布。与传统ETL工具如Apache Airflow或低代码平台如Mendix类似,RAGFlow的画布支持拖拽式节点编排,但节点的语义完全围绕RAG场景设计。基础节点类型检索类节点Vector Search: 向量检索,支持语义搜索Keyword Search: 基于关键词的精确检索Hybrid Search: 向量关键词混合检索RRF融合Rerank: 对检索结果进行重排序,提升相关性生成类节点LLM Generation: 调用大语言模型生成文本Template Fill: 使用模板填充生成结构化输出Chain Generation: 多轮对话式生成逻辑控制节点Condition: 条件判断,支持多种逻辑运算Loop: 循环执行,支持固定次数和条件终止Switch: 多路分支选择数据处理节点Extract Field: 从文本中提取特定字段Filter: 根据条件过滤结果Transform: 数据格式转换和清洗2.2 变量传递与状态管理Workflow模式的一个关键优势是变量传递的显式性和可追踪性。每个节点都有明确的输入输出接口,变量在节点之间的流动路径一目了然。# Workflow的变量传递伪代码context{user_query:分析华为2023年营收情况,knowledge_base:company_reports}# 节点1: 向量检索vector_resultvector_search(querycontext[user_query],kbcontext[knowledge_base])context[vector_hits]vector_result# 节点2: 关键词检索补充keyword_resultkeyword_search(query华为 营收 2023,kbcontext[knowledge_base])context[keyword_hits]keyword_result# 节点3: 结果融合fused_resultsrrf_fusion(vector_result[hits],keyword_result[hits])context[final_hits]fused_results# 节点4: 条件判断iflen(context[final_hits])5:context[need_expansion]Trueelse:context[need_expansion]False# 节点5: LLM生成根据条件分支ifcontext[need_expansion]:answerllm_generate(context检索结果不足,请基于常识回答,querycontext[user_query])else:answerllm_generate(contextcontext[final_hits],querycontext[user_query])context[final_answer]answer通过可视化画布,上述逻辑会表现为清晰的节点连接图,开发者可以随时查看变量在每一步的值,便于调试和优化。2.3 Workflow模式的典型应用场景场景1标准化报告生成某金融机构需要每周生成《市场风险分析报告》,报告结构完全固定从风险数据库提取上周风险指标调用LLM生成风险趋势分析检索相关新闻事件进行关联分析生成结构化Markdown报告这种场景下,Workflow模式是最佳选择流程明确,不需要LLM自主规划输出格式固定,模板化生成效率高可追溯每一步的数据来源,满足合规要求场景2多轮QA对话系统客服系统需要处理标准化问题如如何修改密码、“如何绑定手机号”,这类问题的回答流程固定识别问题类型密码/手机号/邮箱调用相应的知识库检索操作指南提取步骤并格式化为清单生成友好的客服话术Workflow模式可以确保回答的一致性和准确性,避免LLM胡乱发挥导致客服口径混乱。场景3数据清洗与预处理在构建RAG系统时,文档的预处理往往需要多个步骤文档切分按章节/段落实体识别与标注关键信息提取向量化存储这些步骤高度结构化,Workflow模式可以高效编排,且易于监控每个环节的性能指标。三、Agentic Workflow模式开放性任务的新范式3.1 LLM自动规划的工作流Agentic Workflow模式的核心思想是让LLM不仅是任务执行者,更是任务规划者。当用户提出一个开放性或复杂任务时,Agentic Workflow会执行以下步骤Step 1: 任务理解与规划LLM首先分析用户任务,生成执行计划。例如,用户提问分析特斯拉2024年财报并评估其投资价值,Agentic Workflow可能生成如下计划任务拆解: 1. 获取特斯拉2024年财报关键数据 - 营收、净利润、毛利率 - 现金流状况 - 研发投入占比 2. 获取行业对比数据 - 对比传统汽车厂商 - 对比新能源车企 3. 分析风险因素 - 市场竞争风险 - 政策监管风险 - 技术路线风险 4. 生成投资评估 - 综合评分 - 投资建议买入/持有/卖出 - 风险提示Step 2: 动态执行与调整LLM按照计划逐步执行,但不是机械执行,而是根据实际情况动态调整如果检索结果不足,自动调整检索策略更换关键词、扩大检索范围如果发现新的重要信息,临时增加分析维度如果某个步骤出错,自动尝试恢复或重试Step 3: 自我反思与验证在生成最终答案前,Agentic Workflow会进行自我检查检查关键信息是否缺失验证推理逻辑是否合理确认结论是否有充分的证据支持如果发现问题,会回溯到相关步骤进行修正。3.2 工具调用与决策机制Agentic Workflow模式最强大的能力在于工具调用。RAGFlow提供了丰富的工具接口,Agentic Workflow可以根据任务需求自主选择和组合使用这些工具。核心工具类型检索工具{tool_name:hybrid_search,description:向量关键词混合检索,parameters:{query:string,kb_name:string,top_k:integer,min_score:float}}数据分析工具{tool_name:analyze_trend,description:时间序列趋势分析,parameters:{data:array,method:linear|exponential|moving_average,period:integer}}文本分析工具{tool_name:extract_entities,description:实体识别与提取,parameters:{text:string,entity_types:[PERSON,ORG,DATE,MONEY]}}评估工具{tool_name:evaluate_answer,description:评估答案质量,parameters:{question:string,answer:string,context:string}}工具调用示例用户任务“对比分析华为和中兴在5G技术上的专利布局差异”Agentic Workflow的执行过程[LLM思考]: 需要获取两家公司的5G专利数据 → 调用工具: search_patent(company华为, keyword5G, year2020-2024) → 返回: 3254条专利记录 [LLM思考]: 还需要中兴的数据 → 调用工具: search_patent(company中兴, keyword5G, year2020-2024) → 返回: 1821条专利记录 [LLM思考]: 需要分析专利的技术领域分布 → 调用工具: classify_patents(patents华为专利集合) → 返回: 网络架构45%, 核心网32%, 终端设备15%, 其他8% → 调用工具: classify_patents(patents中兴专利集合) → 返回: 网络架构38%, 核心网40%, 终端设备12%, 其他10% [LLM思考]: 需要识别重点专利和高价值专利 → 调用工具: identify_high_value_patents(patents华为专利集合) → 返回: 发现127件高价值专利,主要在MIMO和大规模天线领域 → 调用工具: identify_high_value_patents(patents中兴专利集合) → 返回: 发现89件高价值专利,主要在网络切片和边缘计算领域 [LLM思考]: 现在有足够信息进行对比分析了 → 生成综合对比报告整个过程中,LLM自主决定何时调用哪个工具,使用什么参数,以及调用顺序。这就是Agentic Workflow的核心优势任务分解和工具选择的智能化。3.3 Agentic Workflow模式的典型应用场景场景1开放性研究任务市场分析师需要研究生成式AI对广告行业的影响,这是一个高度开放性的任务需要检索不同维度的信息技术、市场、案例、监管研究方向需要根据初步结果动态调整最终输出可能是报告、PPT、数据可视化等多种形式Agentic Workflow可以自主探索,从技术原理到市场数据,从成功案例到风险分析,形成完整的认知。场景2复杂问题诊断工业设备出现故障时,工程师可能描述“注塑机压力异常波动,但未报警”。Agentic Workflow可以检索类似故障案例分析可能的根本原因传感器、控制系统、机械结构、工艺参数提供排查步骤和解决方案如果方案无效,根据反馈调整诊断策略这种场景下,问题本身就是不确定的,需要AI进行推理和探索。场景3创意内容生成市场部需要为新产品制作宣传文案,要求“风格要年轻化,突出差异化,避免过度承诺”。Agentic Workflow可以分析竞品文案风格研究目标受众的偏好尝试不同风格和角度根据反馈迭代优化这种创意类任务没有标准答案,需要AI不断探索和调整。四、双模式统一画布灵活性的终极体现4.1 RAGFlow 0.20.0的创新架构RAGFlow 0.20.0最令人兴奋的特性是Workflow模式和Agentic Workflow模式可以在同一画布上混合编排。这意味着你不需要在两种模式之间做非此即彼的选择,而是可以根据任务的不同部分选择最适合的模式。统一画布界面[用户输入节点] ↓ [条件判断: 任务类型?] ↓ ├─→ 简单任务分支 (Workflow模式) │ ↓ │ [向量检索节点] → [重排序节点] → [LLM生成节点] │ └─→ 复杂任务分支 (Agentic Workflow模式) ↓ [Agentic执行节点] ↓ [结果验证节点]在一个工作流中,你可以使用Workflow节点处理标准流程使用Agentic节点处理需要智能决策的环节两者之间可以自由传递变量和结果4.2 混合编排的三种模式模式1: Workflow为主,Agentic为辅适用于整体流程固定,但某些环节需要AI自主决策例如智能客服系统用户问题 → [意图识别: Workflow节点] ↓ ┌─────┴─────┐ ↓ ↓ 简单查询 复杂分析 (Workflow) (Agentic) ↓ ↓ [检索节点] [Agentic节点] ↓ ↓ └─────┬─────┘ ↓ [答案生成: Workflow节点]意图识别使用Workflow模式分类任务明确简单查询使用Workflow模式流程固定复杂问题使用Agentic模式需要推理和探索答案生成使用Workflow模式格式可控模式2: Agentic为主,Workflow为辅适用于整体任务开放,但某些环节必须保证确定性例如投资研究报告生成研究主题 → [Agentic节点: 自主规划研究路径] ↓ 数据收集阶段 ↓ ┌─────┴─────┐ ↓ ↓ 财务数据提取 行业数据获取 (Workflow) (Agentic) ↓ ↓ └─────┬─────┘ ↓ [Agentic节点: 分析与推理] ↓ 报告生成 (Workflow模板填充)财务数据提取使用Workflow模式格式明确,容错率低行业数据获取使用Agentic模式来源多样,需要探索分析推理使用Agentic模式需要综合判断报告生成使用Workflow模式格式统一,合规要求模式3: 动态选择模式根据任务特征动态选择使用哪种模式例如企业知识问答系统用户问题 → [问题复杂度评估: Workflow节点] ↓ ┌─────┴─────┐ ↓ ↓ 复杂度阈值 复杂度≥阈值 ↓ ↓ Workflow模式 Agentic模式 ↓ ↓ [检索生成] [自主规划]简单问题走Workflow路径快速、稳定复杂问题走Agentic路径深入、全面4.3 双模式的协同优势优势1可控性与灵活性的平衡Workflow保证了关键环节的可控性和可追溯性,Agentic提供了应对复杂场景的灵活性。两者结合,既避免了纯Workflow的僵化,也避免了纯Agentic的不可控。优势2成本与性能的优化对于简单任务,Workflow模式直接执行,不需要LLM做规划,节省token和时间。对于复杂任务,Agentic模式虽然消耗更多资源,但能提供更好的答案质量。双模式允许系统根据任务复杂度自动选择最优方案。优势3开发效率与用户体验的兼顾开发者可以先用Workflow快速搭建核心流程,然后用Agetic增强薄弱环节。用户在简单问题下获得快速响应,在复杂问题下获得深入分析。五、模式选择决策树实际应用指南5.1 决策树设计任务特征判断 ↓ 任务确定性高 ──否──→ Agentic Workflow ↓是 探索性强 ──是──→ Agentic Workflow ↓否 简单任务 ──是──→ Workflow配置工具即可 ↓否 复杂编排 ──→ 统一画布混合编排5.2 决策规则详解规则1确定性判断任务确定性高的特征输入输出格式明确执行步骤固定结果可验证有明确的正确答案示例数据提取“从发票中提取金额和日期”格式转换“将JSON转换为CSV”标准问答“公司的报销政策是什么”任务确定性低的特征目标模糊“帮我优化这个产品”路径不明确“分析为什么转化率下降”结果多样“写一篇有创意的广告文案”需要推理和探索“找出文档中的矛盾点”规则2探索性判断探索性强的任务特征需要多维度分析可能需要尝试不同方法中途可能发现新的研究方向没有固定的正确答案示例市场机会分析“评估进入东南亚市场的可行性”根本原因分析“为什么用户留存率下降”竞品对比“我们产品相比竞品的优势在哪里”规则3简单与复杂判断简单任务特征步骤少于5步不需要复杂的条件判断不需要循环或递归使用工具类型单一示例单次检索生成“查询产品价格”简单数据转换“提取邮件中的手机号”固定模板填充“生成日报”复杂任务特征步骤超过5步需要多重条件判断需要循环处理需要多种工具协同示例完整的数据处理流水线多轮对话的上下文管理跨系统的数据集成5.3 实际应用决策示例示例1合同审查助手需求审查合同中的风险条款并生成修改建议分析确定性中等合同结构固定,但风险判断需要理解上下文探索性中等风险类型可枚举,但具体条款需要分析复杂度高需要多步处理决策混合编排模式[节点1: 提取条款 - Workflow] ↓ [节点2: 识别条款类型 - Workflow] ↓ [节点3: 风险评估 - Agentic] ↓ [节点4: 修改建议生成 - Agentic] ↓ [节点5: 格式化输出 - Workflow]示例2销售数据分析需求分析上季度销售数据,找出增长驱动因素分析确定性低数据分析路径不固定探索性高需要多角度分析,可能发现意外结论复杂度高决策Agentic Workflow为主[Agentic节点: 自主分析] - 检索历史数据 - 对比同期数据 - 分析产品维度 - 分析地域维度 - 识别异常点 - 归因分析 ↓ [Workflow节点: 可视化呈现]示例3知识库问答需求用户提问,从企业知识库中找到答案分析确定性高问答流程固定探索性低复杂度中低决策Workflow模式[用户输入] → [意图识别] → [检索] → [重排序] → [生成答案]示例4竞品分析报告需求分析竞品A、B、C的功能差异,给出我们的产品定位建议分析确定性低分析维度和结论都不固定探索性高需要多角度探索复杂度高决策Agentic Workflow[Agentic节点: 自主规划分析路径] - 收集竞品信息 - 功能对比分析 - 用户评价分析 - 市场定位分析 - 生成我们的定位建议六、最佳实践与注意事项6.1 Workflow模式的最佳实践实践1充分利用低代码配置Workflow模式的优势在于不需要写代码就能完成大部分任务。充分利用可视化变量配置拖拽式节点连接内置模板和示例实践2明确变量命名和文档虽然Workflow是可视化的,但良好的命名和文档仍然重要使用有意义的变量名revenue_2024而非data1为关键节点添加注释记录设计决策和业务逻辑实践3监控与告警为Workflow设置监控指标每个节点的执行时间检索结果的相关性分数LLM生成的Token消耗异常和错误率6.2 Agentic Workflow模式的最佳实践实践1提供清晰的任务描述Agentic Workflow的效果高度依赖于任务描述的质量明确任务目标说明输出格式要求提供必要的上下文限制探索范围避免过度发散实践2设置合理的Token预算Agentic Workflow会消耗较多Token规划执行验证设置单次调用的Token上限监控总Token消耗在预算不足时降级到Workflow模式实践3提供工具使用指南虽然LLM能自主选择工具,但提供工具使用指南可以提高效率每个工具的功能说明参数的含义和取值范围工具之间的依赖关系典型使用场景6.3 混合编排的最佳实践实践1明确模式边界在设计混合工作流时,明确哪些部分用Workflow,哪些用AgenticWorkflow流程明确、容错率低的环节Agentic需要推理、探索、决策的环节在边界处设计清晰的接口变量传递格式、错误处理机制实践2提供降级方案当Agentic节点失败时,提供Workflow降级方案[Agentic节点] ↓ ├─→ 成功 → 继续 └─→ 失败 → [Workflow降级节点] → 继续这样可以保证系统的可用性和稳定性。实践3渐进式演进从纯Workflow开始,逐步引入Agentic节点初期全Workflow,快速上线优化在关键瓶颈处引入Agentic完善根据效果调整模式分配6.4 常见陷阱与避免方法陷阱1过度使用Agentic表现连简单任务都用Agentic处理后果成本高、速度慢、不可控避免使用决策树评估,简单任务坚决用Workflow陷阱2Workflow过于复杂表现单个Workflow包含几十个节点后果难以维护、调试困难避免拆分为多个子Workflow,保持每个Workflow的简洁性陷阱3忽略错误处理表现Agentic节点失败后直接中断后果用户体验差避免设计降级方案,保证基本功能可用陷阱4缺乏监控表现不知道工作流的性能表现后果无法优化,问题难以发现避免记录关键指标,定期分析七、未来展望Agentic与Workflow的深度融合7.1 技术趋势趋势1自动模式选择未来的RAGFlow可能提供自动模式选择功能系统根据任务特征自动判断应该用Workflow还是Agentic在执行过程中根据效果动态切换模式学习历史数据,优化模式选择策略趋势2Workflow的AI辅助Workflow模式的配置可能引入AI辅助根据自然语言描述自动生成Workflow智能推荐节点连接方式自动优化变量传递路径趋势3Agentic的可视化Agentic Workflow的执行过程可能部分可视化展示LLM的规划思路高亮关键的工具调用支持人工干预和修正7.2 应用展望展望1企业级智能工作流平台RAGFlow的双模式架构可以扩展为通用企业级智能工作流平台不仅支持RAG场景,也支持其他AI场景提供更丰富的节点类型和工具支持多租户、权限管理、审计日志等企业级特性展望2人机协同的流程编排未来的工作流编排将更加强调人机协同人类负责定义目标和监督结果AI负责具体执行和优化在关键节点提供人类审核接口展望3自适应工作流工作流将具备自适应能力根据数据特征自动调整参数根据执行效果优化流程从历史数据中学习最佳实践结语RAGFlow的双模式架构——Workflow与Agentic Workflow——代表了AI工作流编排的未来方向。它不是在两种模式之间做选择,而是提供了一种灵活融合的机制,让开发者可以根据任务的特性和需求,选择最适合的编排方式。在实际应用中,建议从以下三个层面来理解和应用双模式战略层面明确业务场景的特征,选择合适的主模式确定性高的业务如客服问答、数据提取→ Workflow为主探索性强的业务如分析研究、诊断推理→ Agentic为主战术层面在具体流程中灵活运用两种模式核心流程用Workflow保证稳定性关键节点用Agentic提升能力执行层面持续监控和优化收集性能指标分析模式选择的效果迭代优化工作流设计通过这种分层思考,你可以在RAGFlow上构建出既稳定又强大的AI应用,充分发挥双模式架构的优势。关键词Agentic, Workflow, 工作流编排, 低代码平台, LLM自动规划, 智能体, RAGFlow, Agent