宣城市网站建设_网站建设公司_无障碍设计_seo优化
2025/12/31 15:31:51 网站建设 项目流程

本文介绍了基于Agno框架的生产级Agent搭建方法,对比了Agno与LangGraph的架构差异,详细讲解了如何使用Milvus构建知识层,实现了高性能语义检索。文章从单Agent到多Agent协同架构,完整展示了从开发到部署的全流程,包括系统分层设计、资源共享策略和质量监控要点,为快速落地生产级Agent提供了实用指导。


今天还是聊聊生产级agent怎么搭这回事。

前面几期内容,我们聊了agent 常见的坑有哪些,memory怎么管理,还有一些rerank细节,今天从部署层面看看怎么选一个不错的agent框架。

现如今,针对复杂场景,多agent架构已经成为默认选择,相应的框架也已经数不胜数,但它们多多少少都存在两个问题,要么重demo,轻生产,稳定性有待提升;要么过于灵活,导致在需要快速交付、迭代的场景中,略显笨重。

针对这个问题,国产框架Agno 靠着高性能,以及快速落地生产,短短几个月,就拿下了30K+star。

那么它与LangGraph的区别是什么?怎么将其快速在生产环境部署?

本文将一一解答。

01

Agno是什么?与LangGraph的多智能体架构有什么区别?

Agno是专为生产环境设计的多智能体框架。它的架构分为两层:Agno框架层负责定义智能体的逻辑,AgentOS运行时层负责把这些逻辑变成可对外服务的HTTP接口。

其中,Agno框架层提供了三个核心抽象:Agent(智能体单元)、Team(多智能体协同)、Workflow(工作流编排)。开发者用纯Python代码定义智能体的能力、工具和知识源,框架负责LLM调用、工具执行、上下文管理。整个过程没有复杂的图编排,没有额外的DSL,都是直接的函数调用。

AgentOS运行时层则是生产部署的关键。它是异步优先、无状态的执行引擎,内置FastAPI集成,可以把本地开发的Agent直接转化为生产级HTTP服务。AgentOS提供了会话管理、流式响应、监控端点、水平扩展能力。开发者不需要自己写API层代码,也不需要考虑多线程和并发控制,AgentOS在底层已经处理好了这些问题。

整体的架构详情如下:

不难发现,与目前的主流多agent 框架LangGraph 相比,LangGraph 采用的是图状态机设计,将智能体系统建模为节点和边的组合,适合需要精确控制执行流程的场景。

Agno 则是独立的端到端解决方案,从框架层到运行时层提供完整的技术栈。开发者无需自行集成 API服务、会话管理和监控工具,AgentOS 已内置这些能力,强调的是快速从开发到生产的路径。

维度LangGraphAgno
编排方式显式图定义(节点+边)声明式 Workflow
状态管理自定义 State 类内置 Memory 系统
调试工具LangSmith(付费)AgentOS UI(开源)
运行时需自行集成独立 FastAPI 服务
部署复杂度需配置 LangServe开箱即用

整体来看,LangGraph 重灵活控制,Agno 重快速交付

在做选型时,我们可以根据项目阶段、技术栈和定制化需求权衡,必要时通过 POC 验证。

02

为什么选Milvus做知识层

确定了框架层的选型后,在记忆层,我们依然推荐选择Milvus,主要出于几个考虑。

Agno官方文档提供了Milvus的一级集成,agno.vectordb.milvus模块封装了连接管理、嵌入生成、批量写入等生产必需的功能。相比需要自己处理连接池和错误重试的方案,原生支持大幅降低了集成成本。

Milvus还能提供三种部署模式(Lite/Standalone/Distributed),可以从本地文件(./milvus.db)逐步升级到分布式集群。虽然切换过程需要数据迁移和配置调整,但代码层面的API接口保持一致,对于需要快速验证原型、然后逐步扩展到生产的团队来说比较实用。

我们先用单Agent演示基础流程,然后在生产环境的关键设计部分展示如何扩展到多智能体协同。这个demo构建一个知识库助手,并通过AgentOS提供HTTP服务。

03

快速开始:知识库助手的完整实现

1.部署 Milvus Standalone(Docker)

1.1下载部署文件

wget <https://github.com/Milvus-io/Milvus/releases/download/v2.5.12/Milvus-standalone-docker-compose.yml> -O docker-compose.yml

1.2启动Milvus服务

docker-compose up -d
docker-compose ps -a

2.核心实现

import os from pathlib import Path from agno.os import AgentOS from agno.agent import Agent from agno.models.openai import OpenAIChat from agno.knowledge.knowledge import Knowledge from agno.vectordb.milvus import Milvus from agno.knowledge.embedder.openai import OpenAIEmbedder from agno.db.sqlite import SqliteDb os.environ["OPENAI_API_KEY"] = "you-key-here" data_dir = Path("./data") data_dir.mkdir(exist_ok=True) knowledge_base = Knowledge( contents_db=SqliteDb( db_file=str(data_dir / "knowledge_contents.db"), knowledge_table="knowledge_contents", ), vector_db=Milvus( collection="agno_knowledge", uri="http://192.168.x.x:19530", embedder=OpenAIEmbedder(id="text-embedding-3-small"), ), ) # 创建Agent agent = Agent( name="Knowledge Assistant", model=OpenAIChat(id="gpt-4o"), instructions=[ "你是一个知识库助手,帮助用户查询和管理知识库的内容。", "使用中文回答问题。", "在回答问题之前,始终先搜索知识库。", "如果知识库为空,友好地提示用户上传文档。" ], knowledge=knowledge_base, search_knowledge=True, db=SqliteDb( db_file=str(data_dir / "agent.db"), session_table="agent_sessions", ), add_history_to_context=True, markdown=True, ) agent_os = AgentOS(agents=[agent]) app = agent_os.get_app() if __name__ == "__main__": print("\n🚀 启动服务...") print("📍 http://localhost:7777") print("💡 请在UI中上传文档到知识库\n") agent_os.serve(app="knowledge_agent:app", port=7777, reload=False)

2.1运行Agent

python knowledge_agent.py

3.连接AgentOS控制台

https://os.agno.com/

3.1注册登录

3.2选择连接AgentOS

3.3输入OS暴露的端口并自定义name

3.4进入知识库菜单添加文档并嵌入到Milvus

3.5测试效果

Milvus在这里的作用是提供高性能的语义检索能力。当知识库助手收到一个技术问题,它会通过search_knowledge工具把问题转换为向量,在Milvus中找到最相关的文档片段,然后基于这些片段生成回答。Milvus提供了三种部署模式,可以根据业务需求选择合适的方案,代码层面的接口保持一致。

上面的demo展示了基本用法,但如果要用于生产环境,还有几个架构层面的问题需要理解。

4.多智能体如何共享检索结果

Agno的Team模式支持share_member_interactions=True配置,这会把前序智能体的完整交互历史传递给后续智能体。如果第一个智能体从Milvus检索了某些数据,后面的智能体可以直接使用,不需要重复检索。这有两个效果:检索成本被摊销(一次查询,多次使用),以及检索质量被放大(如果第一次查询的结果不准确,错误会在整个团队中传播)。所以在多智能体系统中,Milvus的检索准确率比单智能体场景更重要。

补充Team代码示例:

from agno.team import Team analyst = Agent( name="数据分析师", model=OpenAIChat(id="gpt-4o"), knowledge=knowledge_base, search_knowledge=True, instructions=["分析数据并提取关键指标"] ) writer = Agent( name="报告撰写者", model=OpenAIChat(id="gpt-4o"), knowledge=knowledge_base, search_knowledge=True, instructions=["基于分析结果撰写报告"] ) team = Team( agents=[analyst, writer], share_member_interactions=True, # 共享知识检索结果 )

5.架构设计:Agno与Milvus的分层

Agno的AgentOS是无状态的,可以水平扩展多个实例。会话历史存储在关系型数据库中,但这些是流程状态(谁说了什么)。真正的领域知识(向量化的文档、报告)完全存储在Milvus中。这种架构解耦的好处是:Agno层压力大了,加实例;Milvus压力大了,扩查询节点。两者互不影响,可以独立优化资源配置。Agno需要CPU和内存(LLM推理),Milvus需要磁盘I/O和GPU(向量计算),硬件需求也完全不同。

6.Agent运行质量监控

Agno本身有持续评估能力,但引入Milvus后需要扩展监控范围。实际运行中,你需要关注检索准确率(返回的文档是不是真的相关)、答案忠实度(回答是基于检索内容还是LLM瞎编的),以及端到端延迟的拆解——把总耗时分解到查询嵌入、向量检索、上下文构建、LLM推理这几个阶段,才能定位具体瓶颈。

监控这些指标的目的是及时发现系统退化。比如你的Milvus数据量从100万涨到1000万,如果发现检索延迟明显变长,就该考虑调整索引参数或者升级部署模式了。

​最后

我在一线科技企业深耕十二载,见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。


智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200%,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

​​

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询