Nexevo Conductor / 智枢

AI Runtime,不是又一个 router

一次调用 = 路由 + 缓存 + 跨模型记忆 + 反幻觉 + 按需 agent

不卖你模型 — 让你不被任何一家锁死。MCP / 桌面应用为核心,Claude Desktop / Cursor 一行 config 接入,模型厂商结构性做不了的中立运行时层。

免费开始 MCP 接入文档

OpenAI 兼容 · 主入口 POST /v1/conductor/chat

Tokens saved

511,776,365

USD value saved

$1,275.92

Hallucinations caught

11,358

每个时代的基础设施

都是介于应用和底层服务之间的中立层 — AI 时代到现在还没有这层

Web

Cloudflare

可观测

Datadog

前端

Vercel

AI Runtime

Nexevo

一次 API,六项能力

每条请求 Conductor pipeline 自动跑完。客户感知 = 一个调用 = 完整结果。内部 = 9 步可见决策,模型厂商结构性做不了 3 项关键能力。

本地语义 cache

省 30-50% token

pgvector 单向量粗筛 + Voyage Rerank-2.5 精排,sim ≥ 0.95 才命中。跨 provider 通用,per-user + options 双重隔离。Pre-warm cron 让新用户首访就 hit。

跨模型 memory 自动注入

换模型不丢上下文

切 model_id 时自动 prepend Recall + 差分注入(token -60%)。Per-family 格式自适应:Claude XML、GPT markdown、Gemini fenced YAML、Llama plaintext — 每个模型读自己最舒服的语法。

反幻觉 verify

intent 白名单触发

legal / medical / financial / security / code_critical 5 类高风险 intent 自动用 cheap judge 交叉验 — 不浪费简单聊天的钱,只保高敏场景。fabricated 还可触发 auto-retry 换更强 model 重答。

Agent-on-demand

按需多步,不是独立产品

agent=auto-if-multi-step 时自动判:简单一问一答直接答,任务复杂(规划 / tool 调用 / 多步推理)自动转 agent 沙箱迭代。max_cost_usd 硬中断防 loop 失控。

Per-call X-Ray trace

每次调用都透明

X-Ray 徽章显:pipeline 决策 / cache 命中 / memory 注入 / cost 估算 / latency。黑盒变白盒,每条请求都能复盘到模型 / 决策 / 成本明细。

Sticky session + break-even

成本智能优化

同会话锁定 model 避免随机抖动;切 model 前算 break-even — 如果 attach memory 比留在原 model 贵 1.3x,自动建议 sticky。决策可见、日志可审计、Q2 可选 enforce。

内置组件

Conductor 包含 Quorum + Recall

Quorum · 反幻觉 verify

Conductor 的 verify=auto 用 Quorum 双 AI 互查机制做反幻觉。也可独立作为 MCP widget 调,适合人工深度审查关键决策。

Recall · 跨模型 memory 存储

Conductor 切 model 时自动注入的 memory,胶囊存储就是 Recall。也可独立作为 MCP widget,任何 AI 对话都能查、能复盘。

MCP / 桌面应用为核心

你在哪用 AI,Conductor 就在哪

不是又一个 web playground。MCP 1 个 tool(conductor_ask)让 Claude Desktop / Cursor / 任意 MCP 客户端原生接入,跟它们的对话或编辑器无缝集成。

Claude Desktop

1 个 tool: conductor_ask

config 加 nexevo MCP server → Claude 自动有 conductor_ask 工具
mode 参数:chat / save_memory / search_memory — 内部自动路由
Claude 调时跟它原生 tool 一样,无感切换

Cursor / VSCode

代码上下文自动注入

MCP server 监听 IDE 选择 / 当前文件
conductor_ask mode=chat 时自动含代码上下文
代码评审 / 重构建议 / bug 检查全自动接 Conductor

Nexevo Desktop App

本地 AI 工作台

一键切 Claude / GPT-4o / Gemini,memory 自动跨过去
X-Ray 实时显 cache 命中 + 省下的 token + saved $
Recall capsule 桌面级管理 + 跨 conversation 复用

MCP 完整接入文档

不卖你模型

我们让你不被任何一家锁死

模型厂商的天然激励是把你锁进自己的生态 — API、cache、memory、agent 都在他们手里。应用层的现实是:今天 Claude 强、明天 GPT-5 出、后天 Gemini 反超。Nexevo 站在你的角度做事 — 跨厂商、可切换、记忆不丢,让选模型回到"看效果"而不是"看锁定成本"。

对比同类

路由 + 缓存 + 记忆 + 反幻觉 + agent + X-Ray = 一个产品。

能力	Conductor	OpenRouter	Portkey	Letta
OpenAI 兼容 API	✓	✓	✓	—
多 model 路由	✓	✓	✓	—
本地语义 cache(跨 provider)	✓	—	—	—
跨模型 memory + format 自适应	✓ 独有	—	—	部分
Pre-warm cluster 首访命中	✓ 独有	—	—	—
反幻觉 verify(高风险 intent)	✓	—	guardrails	—
Per-call X-Ray trace UI	✓ 独有	—	部分	—
MCP 原生 + 桌面应用	✓	—	—	部分
中立 / 不锁定某家	✓	✓	✓	—

对比基于 2026-05 公开资料。具体能力可能演进,详见各家文档。

开始用 Conductor

5 分钟接入。OpenAI SDK 兼容 = 改一行 base_url。或 MCP 接 Claude Desktop / Cursor。

免费开始看定价 MCP 文档

新用户免费额度 · OpenAI 兼容 SDK · 中文 + English 文档