概述
智能路由是 MCPHub 的智能工具发现系统,它使用向量语义搜索来自动找到与任何给定任务最相关的工具。AI 客户端无需手动指定使用哪些工具,只需描述他们想要完成的任务,智能路由就会识别并提供对最合适工具的访问。智能路由的工作原理
1. 工具索引
当服务器启动时,智能路由会自动:- 从 MCP 服务器发现所有可用工具
- 提取工具元数据(名称、描述、参数)
- 将工具信息转换为向量嵌入
- 使用 pgvector 将嵌入存储在 PostgreSQL 中
2. 语义搜索
当进行查询时:- 用户查询被转换为向量嵌入
- 相似性搜索使用余弦相似度找到匹配的工具
- 动态阈值过滤掉不相关的结果
- 结果按相关性得分排序
3. 智能过滤
智能路由应用多个过滤器:- 相关性阈值:只返回高于相似性阈值的工具
- 上下文感知:考虑对话上下文
- 工具可用性:确保工具当前可访问
- 权限过滤:尊重用户访问权限
4. 工具执行
找到的工具可以直接执行:- 参数验证确保正确的工具使用
- 错误处理提供有用的反馈
- 响应格式保持一致性
- 日志记录跟踪工具使用情况进行分析
前置条件
智能路由需要比基础 MCPHub 使用更多的设置:必需组件
- 带有 pgvector 的 PostgreSQL:用于嵌入存储的向量数据库
- 嵌入服务:OpenAI API 或兼容服务
- 环境配置:正确的配置变量
使用智能路由
智能路由端点
通过特殊的$smart 端点访问智能路由:
- HTTP MCP
- SSE (Legacy)
分组范围的智能路由
智能路由支持分组范围的搜索,允许您将工具发现限制在特定分组内的服务器:使用分组范围的智能路由
使用分组范围的智能路由
将您的 AI 客户端连接到特定分组的智能路由端点:此端点只会搜索属于 “production” 分组的服务器中的工具。优势:
- 聚焦结果:只返回相关服务器的工具
- 更好的性能:减少搜索空间以加快查询速度
- 环境隔离:将开发、预发布和生产工具分开
- 访问控制:根据用户权限限制工具发现
工作原理
工作原理
当使用
$smart/{group} 时:- 系统识别指定的分组
- 获取属于该分组的所有服务器
- 将工具搜索过滤到仅限那些服务器
- 返回限定在该分组服务器范围内的结果
渐进式披露模式
渐进式披露是一个优化功能,可以减少使用智能路由时的 Token 消耗。启用后,工具发现工作流从 2 步变为 3 步。什么是渐进式披露?
什么是渐进式披露?
默认情况下,智能路由在
search_tools 结果中返回完整的工具信息,包括完整的参数模式。当处理具有复杂输入模式的工具时,这会消耗大量 Token。渐进式披露 改变了这种行为:search_tools只返回工具名称和描述(最少信息)- 新的
describe_tool端点按需提供完整的参数模式 call_tool像以前一样执行工具
- 处理具有复杂模式的大量工具
- Token 使用优化很重要的场景
- AI 客户端需要浏览多个工具后再选择
启用渐进式披露
启用渐进式披露
通过设置页面或环境变量启用渐进式披露:通过设置界面:
- 导航到 设置 → 智能路由
- 启用”渐进式披露”开关
- 更改立即生效
标准模式(默认)
标准模式(默认)
当渐进式披露禁用(默认)时,智能路由提供两个工具:工作流:
这种模式更简单,但由于搜索结果中包含完整模式,会使用更多 Token。
search_tools → call_tool| 工具 | 用途 |
|---|---|
search_tools | 按查询查找工具,返回包含 inputSchema 的完整工具信息 |
call_tool | 使用提供的参数执行工具 |
渐进式披露模式
渐进式披露模式
当渐进式披露启用时,智能路由提供三个工具:工作流:
示例工作流:
search_tools → describe_tool → call_tool| 工具 | 用途 |
|---|---|
search_tools | 按查询查找工具,只返回名称和描述 |
describe_tool | 获取特定工具的完整模式(新增) |
call_tool | 使用提供的参数执行工具 |
- AI 使用查询 “文件操作” 调用
search_tools - 结果显示工具名称和描述(最少 Token)
- AI 为特定工具调用
describe_tool获取完整的inputSchema - AI 使用正确的参数调用
call_tool
响应格式对比
响应格式对比
标准模式 search_tools 响应:渐进式披露模式 search_tools 响应:describe_tool 响应:
故障排除
数据库连接问题
数据库连接问题
症状:
- 智能路由不可用
- 数据库连接错误
- 嵌入存储失败
- 验证 PostgreSQL 是否正在运行
- 检查 DB_URL 格式
- 确保安装了 pgvector 扩展
- 手动测试连接:
嵌入服务问题
嵌入服务问题
症状:
- 工具索引失败
- 查询处理错误
- API 速率限制错误
- 验证 API 密钥有效性
- 检查网络连接
- 监控速率限制
- 测试嵌入服务:
搜索结果不佳
搜索结果不佳
症状:
- 返回不相关的工具
- 相关性得分低
- 缺少预期的工具
- 调整相似性阈值
- 使用更好的描述重新索引工具
- 使用更具体的查询
- 检查工具元数据质量
性能问题
性能问题
症状:
- 查询响应缓慢
- 数据库负载高
- 内存使用激增
- 优化数据库配置
- 增加缓存大小
- 减少批处理大小
- 监控系统资源
最佳实践
查询编写
工具描述
系统维护
定期重新索引:定期重新索引工具以确保嵌入质量。
监控性能:跟踪查询模式并根据使用情况进行优化。
更新模型:随着新嵌入模型的出现,考虑更新到更新的模型。