简介
本文介绍了AI工作流框架的概念、类型及优势,重点讲解了字节跳动扣子(Coze)平台。该平台通过可视化节点式工作流,让用户无需编写代码即可快速构建大模型应用,提供丰富组件和插件生态。文章对比了Dify、N8n等同类产品,展望了AI工作流框架在提升研发效率、实现"工作流即服务"方面的潜力,为开发者提供了从创意到应用的全链路解决方案。
一、 背景
1.1 为什么现在AI工作流这么火热?
生成式AI技术飞速发展,正在重构各领域的底层技术范式。
各种新模型、创意工具的更新节奏也越来越快,这一趋势迫使我们必须开始思考:如何能更高效的跟踪、验证并上线各种新AI能力。
而基于GUI的AI工作流框架,也许是能帮助我们应对这一挑战的解决方案之一:
优势1:提升效率
AI工作流框架把重复性“胶水代码”封装为可复用组件节点,省去各种重复开发。这种"更高层次的抽象"让开发者能够将精力聚焦于业务逻辑和基座模型训练,而非脚本串联,大幅度降低从创意提出到原型效果验证的周期。
****优势2:****高效复刻社区优秀工具
基于GUI的AI工作流框架,大幅度降低AI模型应用的门槛,大量非技术人员(导演/设计师等)直接参与到这场AI创新实践中,社区沉淀很多最佳实践(爆款玩法、AIGC创意等),通过AI工作流框架作为中介,可以快速的学习并复用这些优秀的方案。
1.2 常见的AI工作流框架
****工作流(Workflow)****是一组由多个节点按特定顺序编排而成的可执行指令集合,旨在实现特定业务逻辑或完成既定任务。
随着AI技术的不断发展,为降低AI技术的使用门槛,基于图形用户界面(GUI)的零代码或低代码节点式AI工作流框架逐渐兴起。
本质上,GUI节点式工作流 = 可视化 DAG 编排 + 零/低代码封装 + 及时执行
| 不同类型 | 说明 |
| 静态工作流 | ****特点:****面向传统软件开发中的节点集成,工作流中的节点编排都是预编排好的(没有AI参与) ****例如:****最初的 N8N框架(开源,2019.06) |
| AI 工作流 | ****特点:****面向大模型应用开发的,LLM作为特殊节点,为工作流的编排引入动态性。 ****例如:****Dify(开源,2023.05) |
| Agentic 工作流 | ****特点:****面向智能体应用开发的,在LLM基础上新增Agent开发能力,提供AI模型应用/智能助手等开发能力。 ****例如:****扣子 Coze(闭源-2024.02,开源2025.07) |
| 生成式AI工作流 | ****特点:****面向生成式AI技术应用开发的,聚焦生图、生视频等场景,提供丰富插件生态,极大拓展创作的自由度。 例如:comfyUI(2023.01),一款基于 节点式工作流 的开源 AI 图像生成工具,专为 Stable Diffusion 等扩散模型设计。 |
本次重点介绍以扣子(Coze)为代表的基于GUI的AI工作流框架,最后从IT从业者的角度思考:如何借助AI工作流框架,提升从“创意发现 → 离线原型验证 → 上线应用”的全链路的效率,如何拥抱AI工作流(Workflow AS Service)的新时代?
二、扣子(Coze)
****扣子(Coze)****是字节-抖音推出的一款基于GUI的低代码大模型应用工具开发平台,该平台以其直观的可视化界面和丰富的功能模块,让用户能够轻松创建各种类型的智能体应用。
- Coze(海外版本):2023.11,面向海外开发者推出的AI 应用开发平台(支持GPT4等国外模型)
- 扣子(国内版):2024.02,推出国内版本Coze(Web端/移动端)****,****主要面向非开发者提供零代码构建 AI Agent的应用框架,2025.07推出开源版本coze-studio(阉割版)。
2.1 核心能力说明
网址:https://space.coze.cn/space-intro
核心能力分为三部分:
(1)扣子空间
****定位:****AI办公助手,提供官方内置的一些优秀AI工具(闭源的工作流)。
测试一下最近比较火的AI播客的功能:
最终生成的音频:
效果上,大家自己可以去与 ListenHub等AI播客产品进行对比一下…
(2)扣子开发空间
定位:Coze提供的基于GUI的零代码AI工作流开发框架(云服务版本)
整体开发空间结构:
核心概念:
| 节点 | 工作流框架的核心在于节点,每个节点是一个具有特定功能的独立组件,代表一个独立的步骤或逻辑。 框架内置大量灵活可组合的节点,包括大语言模型 LLM、自定义代码、判断逻辑等,可以通过拖拉拽的方式快速搭建一个工作流。 * ****基础节点:****开始、结束、大模型节点、插件节点、工作流节点等 *逻辑节点:********代码节点(python/JS)、选择器节点、意图识别、循环等 * ****多媒体处理节点:****图像处理、音视频处理等 * ****知识&数据节点:****RAG节点、长短期记忆等 * ****组件:****HTTP请求节点(快速集成外部API能力)自定义代码节点示例: |
| 工作流 | 工作流是一系列可执行节点的集合,用于实现业务逻辑或完成特定任务。 * 工作流(Workflow):用于处理功能类的请求,可通过顺序执行一系列节点实现某个功能。 * 对话流(Chatflow):是基于对话场景的特殊工作流,更适合处理对话类请求。对话流适用于 Chatbot 等需要在响应请求时进行复杂逻辑处理的对话式应用程序,例如个人助手、智能客。 扣子提供了一个可视化的画布,可以通过拖拽节点迅速搭建工作流。 |
| 插件/组件社区 | ****插件是一系列工具的集合(一个工作流也可以发布为一个插件),****每个工具都是一个可调用的 API (分为官方的、非官方的、收费三大类),社区内丰富的插件是提升工作流开发效果的关键。 基于当前的MCP协议,我们也可以快速接入其他平台的插件能力: ****其它MCP社区 :****ModelScope MCP 广场、千帆平台的MCP广场等 |
2.2 动手实践搭建AI工作流
动手搭建一个能实现AI播客能力的工作流。
整个流程非常的简单:利用大模型节点、AI播客插件、封面图生成插件,快速搭建工作流:
生成的AI播客示例:
****测试指令 =****对比一下几款AI工作流框架 Coze、Dify、N8N
| * 生成的封面图: | * 生成的AI播客音频 |
可以对比一下,与上面扣子官方提供的插件生成的AI播客的效果,基本是差不多的!
还有更多生图、生成动漫视频的能力,大家可以自己去动手尝试一下~
(3)开源版本Coze
2025.07 扣子推出其工作流框架的开源版本 - Coze Studio,整体框架后端采用 Go语言开发,前端使用React+TypeScript,支持私有化部署,满足企业数据安全需求(详情)
整个服务框架采用Go作为主体,在部分复杂的数据处理场景中,引入Python来承担特定任务,例如文件解析处理。
与Dify、RAGFlow 等项目采用纯 Python 实现,在实际生产环境中,可以提供更好的高性能和稳定性
但是目前很遗憾的是,开源版本在整体功能上与云服务版本阉割较多,期待官方后面能继续补全吧。
三、常见工作流产品对比
Dify、n8n等AI工作流都采基于GUI的编程范式(可视化的流程编辑器),但它们的诞生背景、核心使命和根本设计理念却存在着许多差异。
| 产品 | 说明 |
| Dify(2023.05) 限制性商用,禁止提供SaaS服务 | 适用人群:有一定技术背景 产品定位:面向LLM应用开发的,集成式、一站式的AI应用开发框架。 在架构设计,集成化平台,在一个统一的平台内,提供构建一个完整AI应用所需的所有工具链:从数据处理(RAG)、模型编排(Workflow)、到后端服务(BaaS)和持续运维(LLMOps),为LLM应用开发提供一个从开发到运营的全栈解决方案。更简单,但不灵活。 |
| N8N(2019.06) 源码可用,禁止提供SaaS服务 | 适用人群:专业开发者 产品定位:定位为面向技术团队,本质上是一个开源工作流自动化工具,而非纯粹的 LLM 平台。 近年底层与LangChain等深度集成,实现AI应用开发能力(在AI应用开发方面稍微不足) |
整体技术框架选型的对比:
更多框架比对:Agent workflow的综述论文
4.未来展望
毫无疑问,当前AI技术正在模糊各个技术工种(前端、后端、算法等)之间的工作分工…
作为一个算法工程师,个人分享几点如何通过积极拥抱AI工作流框架,提升研发中端到端的效率:
1. 从插件能力沉淀开始,探索&建设面向生成式AI的工作流框架基座。
- ****高频能力插件化:****实现“一次封装、多处复用”,无需重复造轮子,可直接在特定场景的工作流中引入,显著提升代码复用率与工程一致性,同时降低维护成本。
- 从基于GUI的工作流编排->AI生成工作流:进一步降低从“创意→原型”的工作量,缩短 MVP版本的周期。
- 提升框架的整合能力:在易用性与高并发等方面参考开源Coze框架,在生成式模型接入上结合ComfyUI框架的优势等,快速集成各社区沉淀的优秀工作流、创意工具等,提升产品的竞争力。
- 工作流即服务(Workflow as Service),在部分实际任务上,打造端到端的AI工作流闭环,实现从『离线开发->效果验证 -> 在线服务』的一键式切换,全面提升研发效率。
四、如何系统的学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
01.大模型风口已至:月薪30K+的AI岗正在批量诞生
2025年大模型应用呈现爆发式增长,根据工信部最新数据:
国内大模型相关岗位缺口达47万
初级工程师平均薪资28K(数据来源:BOSS直聘报告)
70%企业存在"能用模型不会调优"的痛点
真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!
02.大模型 AI 学习和面试资料
1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工
📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。