Nexevo.aiNexevo.ai

参考

错误处理

错误格式对齐 OpenAI:单个 `error` 对象包含 `message` / `type` / `code` 三个字段。常见 code: `invalid_api_key` (401)、`insufficient_balance` (402)、`rate_limit_exceeded` (429)、`tenant_monthly_quota_exceeded` (429)、`upstream_error` (502)。上游 5xx 我们会透明重试;只有所有重试都失败你才会看到最终错误。

json
{
  "error": {
    "message": "Account balance depleted. Please top up to continue.",
    "type": "insufficient_balance",
    "code": "account_suspended"
  }
}

速率限制

每 key 默认 60 RPM。超限返回 429,附 `X-RateLimit-Remaining` 和 `X-RateLimit-Reset` 头。企业方案可放宽上限——联系我们定制。

响应头

每次响应都附带实用元数据头:

X-Trace-ID请求唯一 ID,反馈问题时附上
X-Usage-Input-Tokens本次计费的输入 token 数
X-Usage-Output-Tokens本次计费的输出 token 数
X-RateLimit-Remaining当前窗口剩余请求数
X-RateLimit-Reset距窗口重置的秒数

价格

所有内部模型统一扁平价:输入 $3.00 / 百万 token,输出 $12.00 / 百万 token。缓存命中(精确 + 语义)按正常价 25% 计费。重试和对冲路径的成本由我们内部吸收——你只为最终看到的回答付费。

下一步

参考 — Nexevo Docs | Nexevo.ai