参考 — Nexevo Docs

#错误处理

错误格式对齐 OpenAI:单个 `error` 对象包含 `message` / `type` / `code` 三个字段。常见 code: `invalid_api_key` (401)、`insufficient_balance` (402)、`rate_limit_exceeded` (429)、`tenant_monthly_quota_exceeded` (429)、`upstream_error` (502)。上游 5xx 我们会透明重试;只有所有重试都失败你才会看到最终错误。

json

{
  "error": {
    "message": "Account balance depleted. Please top up to continue.",
    "type": "insufficient_balance",
    "code": "account_suspended"
  }
}

#速率限制

每 key 默认 60 RPM。超限返回 429,附 `X-RateLimit-Remaining` 和 `X-RateLimit-Reset` 头。企业方案可放宽上限——联系我们定制。

#响应头

每次响应都附带实用元数据头:

X-Trace-ID	请求唯一 ID,反馈问题时附上
X-Usage-Input-Tokens	本次计费的输入 token 数
X-Usage-Output-Tokens	本次计费的输出 token 数
X-RateLimit-Remaining	当前窗口剩余请求数
X-RateLimit-Reset	距窗口重置的秒数

#价格

所有内部模型统一扁平价:输入 $3.00 / 百万 token,输出 $12.00 / 百万 token。缓存命中(精确 + 语义)按正常价 25% 计费。重试和对冲路径的成本由我们内部吸收——你只为最终看到的回答付费。

Pricing page

参考

#错误处理

#速率限制

#响应头

#价格

下一步

获取 API Key

浏览模型库

Cookbook 示例