错误处理
错误格式对齐 OpenAI:单个 `error` 对象包含 `message` / `type` / `code` 三个字段。常见 code: `invalid_api_key` (401)、`insufficient_balance` (402)、`rate_limit_exceeded` (429)、`tenant_monthly_quota_exceeded` (429)、`upstream_error` (502)。上游 5xx 我们会透明重试;只有所有重试都失败你才会看到最终错误。
json
{
"error": {
"message": "Account balance depleted. Please top up to continue.",
"type": "insufficient_balance",
"code": "account_suspended"
}
}速率限制
每 key 默认 60 RPM。超限返回 429,附 `X-RateLimit-Remaining` 和 `X-RateLimit-Reset` 头。企业方案可放宽上限——联系我们定制。
响应头
每次响应都附带实用元数据头:
| X-Trace-ID | 请求唯一 ID,反馈问题时附上 |
| X-Usage-Input-Tokens | 本次计费的输入 token 数 |
| X-Usage-Output-Tokens | 本次计费的输出 token 数 |
| X-RateLimit-Remaining | 当前窗口剩余请求数 |
| X-RateLimit-Reset | 距窗口重置的秒数 |
价格
所有内部模型统一扁平价:输入 $3.00 / 百万 token,输出 $12.00 / 百万 token。缓存命中(精确 + 语义)按正常价 25% 计费。重试和对冲路径的成本由我们内部吸收——你只为最终看到的回答付费。