更新日誌
發版歷史與值得關注的改動
v0.10.222026-04-25功能 團隊管理上線
/dashboard/organization 支援創建團隊 / 邀請郵箱成員 / 分配角色 / 轉讓 owner;後端 31 tests。
v0.10.212026-04-25功能 公開服務狀態頁
/status 頁即時顯示各 provider 可用性,含 24h 可用率、P50/P95 延遲、斷路器狀態。
v0.10.202026-04-25功能 Provider 資料政策透明化
GET /v1/providers 公開每家 provider 的資料保留政策(unknown/public/anonymous/private)及上游 ToS 連結。
v0.10.192026-04-25功能 Generation 詳情端點
GET /v1/generation?id=<gen_id> 可查任意請求 30 天內的詳細元資料(provider/延遲/usage/成本估算)。
v0.10.182026-04-25基礎設施 代理主部署改至大陸深圳
代理主部署遷至阿里雲深圳 Region(VPC 內網),解鎖僅大陸 IP 可調的模型(Moonshot / Doubao / 部分 Zhipu)。 HK 保留為合規備份。
v0.10.102026-04-25功能 @nexevo/sdk TypeScript SDK v0.1.0
官方 TS SDK,完整類型涵蓋所有擴充字段(models[]、max_price、provider、X-Nexevo-* 元資料)及流式 async iterator。
v0.10.92026-04-25功能 seed / logprobs / n 跨 provider 行為歸一化
上游不支援的語意字段會帶 X-Nexevo-Params-Warnings header,客戶能感知到被剝離或被 clamp。
v0.10.82026-04-25功能 參數相容矩陣
按 provider 維護黑名單,自動剝離會導致上游 400 的參數(logit_bias / 部分 provider 的 logprobs/seed)。
v0.10.72026-04-25功能 按 end-user 限流
OpenAI 標準 `user` 字段透傳給上游 + 按租戶隔離的 per-user 限流,響應帶 X-Nexevo-RateLimit-* header。
v0.10.62026-04-24功能 max_price 單一請求成本上限
請求等級 `max_price: {prompt, completion, total}` 過濾超價 provider + 估算最壞成本,超限直接 400。
v0.10.52026-04-24功能 Provider 路由偏好
OpenRouter 風格的 `provider: {order, allow_fallbacks, data_collection}` 控制路由順序與合規選項。
v0.10.42026-04-24功能 :fast / :cheap / :quality 模型後綴
透過 model 名後綴(如 `deepseek-chat:fast`)給路由提示,無需重組請求體。
v0.10.32026-04-24功能 Generation ID + 延遲 header
每個回應都帶 X-Nexevo-Generation-Id 用於追溯 + X-Nexevo-(Total|Upstream)-Latency-Ms 用於效能調試。
v0.10.22026-04-24修復 串流自動開啟 include_usage
代理自動注入 stream_options.include_usage=true,客戶忘傳也能拿到最後一幀的 token 計數。
v0.10.12026-04-24功能 models[] 用戶端 fallback 鏈
傳 `models: ['deepseek-chat', 'qwen-plus', 'glm-4-air']`,代理從左到右逐個 try,第一個成功即返回。