每个时代的基础设施
都是介于应用和底层服务之间的中立层 — AI 时代到现在还没有这层
一次 API,六项能力
每条请求 Conductor pipeline 自动跑完。客户感知 = 一个调用 = 完整结果。内部 = 9 步可见决策,模型厂商结构性做不了 3 项关键能力。
本地语义 cache
省 30-50% token
pgvector 单向量粗筛 + Voyage Rerank-2.5 精排,sim ≥ 0.95 才命中。跨 provider 通用,per-user + options 双重隔离。Pre-warm cron 让新用户首访就 hit。
跨模型 memory 自动注入
换模型不丢上下文
切 model_id 时自动 prepend Recall + 差分注入(token -60%)。Per-family 格式自适应:Claude XML、GPT markdown、Gemini fenced YAML、Llama plaintext — 每个模型读自己最舒服的语法。
反幻觉 verify
intent 白名单触发
legal / medical / financial / security / code_critical 5 类高风险 intent 自动用 cheap judge 交叉验 — 不浪费简单聊天的钱,只保高敏场景。fabricated 还可触发 auto-retry 换更强 model 重答。
Agent-on-demand
按需多步,不是独立产品
agent=auto-if-multi-step 时自动判:简单一问一答直接答,任务复杂(规划 / tool 调用 / 多步推理)自动转 agent 沙箱迭代。max_cost_usd 硬中断防 loop 失控。
Per-call X-Ray trace
每次调用都透明
X-Ray 徽章显:pipeline 决策 / cache 命中 / memory 注入 / cost 估算 / latency。黑盒变白盒,每条请求都能复盘到模型 / 决策 / 成本明细。
Sticky session + break-even
成本智能优化
同会话锁定 model 避免随机抖动;切 model 前算 break-even — 如果 attach memory 比留在原 model 贵 1.3x,自动建议 sticky。决策可见、日志可审计、Q2 可选 enforce。
Conductor 包含 Quorum + Recall
Conductor 的 verify=auto 用 Quorum 双 AI 互查机制做反幻觉。也可独立作为 MCP widget 调,适合人工深度审查关键决策。
Conductor 切 model 时自动注入的 memory,胶囊存储就是 Recall。也可独立作为 MCP widget,任何 AI 对话都能查、能复盘。
你在哪用 AI,Conductor 就在哪
不是又一个 web playground。MCP 1 个 tool(conductor_ask)让 Claude Desktop / Cursor / 任意 MCP 客户端原生接入,跟它们的对话或编辑器无缝集成。
Claude Desktop
1 个 tool: conductor_ask
- config 加 nexevo MCP server → Claude 自动有 conductor_ask 工具
- mode 参数:chat / save_memory / search_memory — 内部自动路由
- Claude 调时跟它原生 tool 一样,无感切换
Cursor / VSCode
代码上下文自动注入
- MCP server 监听 IDE 选择 / 当前文件
- conductor_ask mode=chat 时自动含代码上下文
- 代码评审 / 重构建议 / bug 检查全自动接 Conductor
Nexevo Desktop App
本地 AI 工作台
- 一键切 Claude / GPT-4o / Gemini,memory 自动跨过去
- X-Ray 实时显 cache 命中 + 省下的 token + saved $
- Recall capsule 桌面级管理 + 跨 conversation 复用
我们让你不被任何一家锁死
模型厂商的天然激励是把你锁进自己的生态 — API、cache、memory、agent 都在他们手里。应用层的现实是:今天 Claude 强、明天 GPT-5 出、后天 Gemini 反超。Nexevo 站在你的角度做事 — 跨厂商、可切换、记忆不丢,让选模型回到"看效果"而不是"看锁定成本"。
对比同类
路由 + 缓存 + 记忆 + 反幻觉 + agent + X-Ray = 一个产品。
| 能力 | Conductor | OpenRouter | Portkey | Letta |
|---|---|---|---|---|
| OpenAI 兼容 API | ✓ | ✓ | ✓ | — |
| 多 model 路由 | ✓ | ✓ | ✓ | — |
| 本地语义 cache(跨 provider) | ✓ | — | — | — |
| 跨模型 memory + format 自适应 | ✓ 独有 | — | — | 部分 |
| Pre-warm cluster 首访命中 | ✓ 独有 | — | — | — |
| 反幻觉 verify(高风险 intent) | ✓ | — | guardrails | — |
| Per-call X-Ray trace UI | ✓ 独有 | — | 部分 | — |
| MCP 原生 + 桌面应用 | ✓ | — | — | 部分 |
| 中立 / 不锁定某家 | ✓ | ✓ | ✓ | — |
对比基于 2026-05 公开资料。具体能力可能演进,详见各家文档。