随着 Model Context Protocol (MCP) 的快速普及,开发者已经不再满足于简单的本地 Stdio 进程通讯。在生产环境中,如何构建高可用、可水平扩展的 MCP 服务集群成为了核心挑战。
Solon AI 在最近的 v3.8 版本更新中,针对 MCP 服务集群化痛点,推出了一系列重磅特性,特别是 STREAMABLE_STATELESS(无状态流传输) 通道的引入,为 MCP 迈向云原生集群时代铺平了道路。
一、 MCP 集群化的拦路虎:状态依赖
传统的 MCP 传输协议(如 SSE 或标准的 STREAMABLE)通常是有状态的。
1. 为什么“有状态”难以集群?
在 MCP 协议中,为了支持反向调用(Server 调用 Client 的采样请求 Sampling)或原语变更通知(Notifications),Server 和 Client 之间必须建立长链接。
- 连接绑定:Client 的短链接请求(发送指令)必须与长链接(接收通知)路由到同一台服务器。
- 运维复杂:在负载均衡器(如 Nginx)上,必须配置 ip_hash 或粘性会话(Sticky Sessions),否则请求会因为找不到上下文而失败。
2. Solon AI 的解题思路
Solon AI v3.8 引入了 McpChannel.STREAMABLE_STATELESS,其核心理念是:放弃不常用的反向调用,换取极致的水平扩展能力。
二、 核心突破:STREAMABLE_STATELESS 通道
这是 Solon AI 为集群友好性专门设计的模式。它通过将长链接转变为短链接通讯,彻底消除了服务端的状态依赖。
| 特性 | STREAMABLE (有状态) | STREAMABLE_STATELESS (无状态) |
|---|---|---|
| 链接类型 | 有长链接 (Long Connection) | 只用短链接 (Short Connection) |
| 集群路由 | 需要 ip_hash | 任意路由 |
| 反向通讯 | 支持 (Server -> Client) | 不支持 |
| 适用场景 | 需要实时监控 Tool 变化的复杂应用 | 80% 的标准工具调用、高并发集群 |
开发者体验一致性: 无论底层通道如何变化,Solon AI 的开发代码几乎不需要修改,仅需在注解中切换 channel:
@McpServerEndpoint(channel=McpChannel.STREAMABLE_STATELESS,mcpEndpoint="/mcp/weather")publicclassMcpServerTool{@ToolMapping(description="查询天气预报")publicStringgetWeather(@Param(description="城市位置")Stringlocation){return"晴,14度";}}三、 异步性能优化:CompletableFuture 与 Publisher
在集群环境下,IO 密集型任务(如请求第三方 API)如果阻塞线程,会极大降低集群的吞吐量。Solon AI v3.8.0 全面增强了 异步支持。
1. CompletableFuture 支持
现在,MCP 工具可以直接返回异步结果,完美适配现代 Java 的异步编程模型:
@ToolMapping(description="异步查询天气",returnDirect=true)publicCompletableFuture<String>getWeatherAsync(Stringlocation){returnCompletableFuture.supplyAsync(()->"异步返回:多云");}2. 响应式流支持
针对更高级的场景,Solon AI 适配了 org.reactivestreams.Publisher,使得 MCP 工具、资源(Resource)和提示词(Prompt)都能以非阻塞的方式工作。
@ToolMapping(description="异步查询天气",returnDirect=true)publicPublisher<String>getWeatherAsync(Stringlocation){returnMono.just("异步返回:多云");}四、 传输方式全景对比
Solon AI 目前支持四种主流传输通道,覆盖了从本地到云端的全场景:
| 服务端通道 | 客户端通道 | 通讯方式 | 集群友好度 | 备注 |
|---|---|---|---|---|
| STDIO | STDIO | 进程间管道 | N/A | 本地开发首选 |
| SSE | SSE | HTTP | 需 ip_hash | 官方已标记弃用 |
| STREAMABLE | STREAMABLE | HTTP | 需 ip_hash | 用于替代 SSE |
| STREAMABLE_STATELESS | STREAMABLE | HTTP | 极高 | 集群推荐 |
注意:使用 STREAMABLE_STATELESS 时,客户端依然配置为 STREAMABLE 即可,服务端会自动处理握手降级。
五、 总结与展望
Solon AI 通过对 MCP 协议的深度解耦,不仅实现了对最新 2025-06-18 版本协议的支持,更通过无状态通道和全链路异步化,解决了 MCP 服务在大规模并发下的“落地难”问题。
对于追求高性能和易扩展的 AI 应用架构师来说,Solon AI 提供了一套“开发一致、部署灵活”的工具链,让 MCP 服务真正具备了工业级集群的能力。